pytesser tesseract-ORC 汉字识别求助

ycgzs98789 · 发表于 2016-12-28 16:21:03

打算用Image、pytesser3、tesseract-ORC实现图片汉字识别

python版本：3.5.2
tesseract-ORC版本：3.02.02

现完成：

tesseract-ORC：EXE安装，一路默认
chi_sim.traineddata: 下载解压置于Tesseract-OCR\tessdata文件夹下

出现问题：
1.CMD中输入tesseract或tesseract.exe无输出内容，tesseract --list-langs同样，这是否对程序有影响？
2.tesseract.exe number.jpg result也没有输出内容，也没有result.txt文件生成
3.只把chi_sim.traineddata添加到tessdata文件夹下，没有效果，如果要实现pytesser3识别中文，该如何做或如何修改配置文件？
4.出现识别有较大出入，如“3”“0”“8”识别成“a"或“A"，可有解决办法提高准确度或有其他识别模块？

注：
tesseract-ORC下载地址：http://download.csdn.net/download/whatday/7740469
chi_sim.traineddata下载地址：http://vdisk.weibo.com/s/C9iEyURSBSqmk

ycgzs98789 · 发表于 2016-12-28 16:35:41

本帖最后由 ycgzs98789 于 2016-12-28 16:41 编辑

重开一贴
链接
http://bbs.fishc.com/thread-80796-1-1.html

账号		自动登录	找回密码
密码			立即注册