鱼C论坛

 找回密码
 立即注册
查看: 3007|回复: 1

pytesser tesseract-ORC 汉字识别求助

[复制链接]
发表于 2016-12-28 16:21:03 | 显示全部楼层 |阅读模式
36鱼币
打算用Image、pytesser3、tesseract-ORC实现图片汉字识别

python版本:3.5.2
tesseract-ORC版本:3.02.02

现完成:
  • tesseract-ORC:EXE安装,一路默认
  • chi_sim.traineddata: 下载解压置于Tesseract-OCR\tessdata文件夹下


出现问题:
1.CMD中输入tesseracttesseract.exe无输出内容,tesseract --list-langs同样,这是否对程序有影响?
2.tesseract.exe number.jpg result也没有输出内容,也没有result.txt文件生成
3.只把chi_sim.traineddata添加到tessdata文件夹下,没有效果,如果要实现pytesser3识别中文,该如何做或如何修改配置文件?
4.出现识别有较大出入,如“3”“0”“8”识别成“a"或“A",可有解决办法提高准确度或有其他识别模块?


注:
tesseract-ORC下载地址:http://download.csdn.net/download/whatday/7740469
chi_sim.traineddata下载地址:http://vdisk.weibo.com/s/C9iEyURSBSqmk

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2016-12-28 16:35:41 | 显示全部楼层
本帖最后由 ycgzs98789 于 2016-12-28 16:41 编辑

重开一贴
链接
http://bbs.fishc.com/thread-80796-1-1.html
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-2-24 18:04

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表