鱼C论坛

 找回密码
 立即注册
查看: 1863|回复: 5

[已解决]tesserocr安装后测试报错

[复制链接]
发表于 2023-8-3 21:32:43 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
tesserocr已安装
Snipaste_2023-08-03_21-27-23.png
在测试是否安装成功是报错了,代码如下:
import tesserocr
from PIL import Image
image = Image.open('image.png')
print(tesserocr.image_to_text(image))

报错如下
Snipaste_2023-08-03_21-29-21.png

尝试了将tessraco-ocr 放在lib同目录下,还有把tessdata放在Scripts目录下还是没用

Snipaste_2023-08-03_21-30-24.png Snipaste_2023-08-03_21-30-41.png
最佳答案
2023-8-3 21:33:03
问题分析:

根据你提供的信息,tesserocr安装成功后,在测试时出现了错误。可能的原因是缺少Tesseract OCR的语言数据文件或者Tesseract OCR的环境变量配置有问题。

解决方案:

尝试按照以下步骤解决问题:

1. 确保你已经正确安装了Tesseract OCR,并且将其加入系统的环境变量中。

2. 检查你使用的语言是否在Tesseract OCR的语言数据文件中存在。Tesseract OCR需要相应语言的数据文件才能正确识别图像中的文字。你可以从[Tesseract OCR的官方GitHub仓库](https://github.com/tesseract-ocr/tessdata)下载对应语言的数据文件,并将其放置在Scripts目录下。

3. 确保image.png文件存在,并且位于当前工作目录下。

4. 确保你的Python环境中安装了tesserocrPillow库。你可以使用以下命令安装它们:

   `
   pip install tesserocr Pillow
   `

5. 尝试使用绝对路径来打开image.png文件。例如,如果image.png文件位于C:\images目录下,可以使用以下代码来打开文件:

   [code]   image = Image.open('C:/images/image.png')
   `

6. 如果上述方法还没有解决问题,可以尝试重新安装tesserocr库。首先卸载已安装的库,然后再重新安装:

   `
   pip uninstall tesserocr
   pip install tesserocr
   `

如果以上步骤都没有解决问题,请提供完整的报错信息,以便我们更好地帮助你解决问题。

希望以上解答对你有帮助。如有更多疑问,请随时追问。

如果回答对你有帮助,请给我一个最佳答案!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-8-3 21:32:58 | 显示全部楼层
根据您提供的信息,您在使用tesserocr进行图像识别时遇到了错误。根据错误信息,可能是缺少语言数据文件导致的。

为了解决这个问题,您可以尝试以下步骤:

1. 确保您已经正确安装了tesseract OCR引擎。您可以在命令行中运行 tesseract --version 来检查安装情况。如果没有正确安装,请根据您的操作系统和安装方式进行安装。

2. 确保您已经下载了所需的语言数据文件。tesseract需要语言数据文件来进行图像识别。您可以从tesseract官方网站下载这些文件。请确保您下载了适用于您所需语言的数据文件,并将其放置在tesseract的 tessdata 目录下。

3. 确保您的代码中指定了正确的语言。在使用 tesserocr.image_to_text() 时,您可以通过将 lang 参数设置为所需的语言来指定要识别的语言。请确保指定的语言与您下载的语言数据文件相对应。

如果您已经按照上述步骤进行操作,但仍然遇到问题,请提供更详细的错误信息以便我们更好地帮助您解决问题。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-8-3 21:33:03 | 显示全部楼层
本帖最后由 Mike_python小 于 2023-8-4 04:58 编辑

问题分析:

根据你提供的信息,tesserocr安装后测试代码报错。可能的原因有以下几点:

1. Tesseract OCR库未正确安装或者安装版本不兼容。
2. 缺少Tesseract OCR所需的语言包文件。
3. 图片路径错误或图片格式不支持。

解决方案:

根据以上分析,我给出以下解决方案:

1. 确保你已经正确安装了tesserocr和Tesseract OCR库。你可以通过以下命令来安装:
shell
pip install tesserocr

另外,为了能够使用Tesseract OCR,你还需要在系统中安装Tesseract OCR引擎。你可以从[Tesseract OCR官方网站](https://github.com/tesseract-ocr/tesseract)下载并安装适合你操作系统的版本。

2. 确保你已经下载并配置了Tesseract OCR所需的语言包文件。你需要将语言包文件(以.traineddata为扩展名)放置在tessdata目录下。你可以从[Tesseract OCR官方网站的tessdata库](https://github.com/tesseract-ocr/tessdata)下载你需要的语言包。

3. 确保提供的图片路径是正确的,并且图片格式被Tesseract OCR所支持。常见的支持格式包括JPEG、PNG、BMP等。

下面是修正后的代码示例:
import tesserocr
from PIL import Image

image = Image.open('image.png')
text = tesserocr.image_to_text(image)
print(text)

请确保image.png文件存在,并且是Tesseract OCR所支持的图片格式。

希望以上解决方案能够帮助到你。如果问题仍然存在,请提供完整的错误信息以便我进行进一步的分析和帮助。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-8-3 21:33:03 | 显示全部楼层    本楼为最佳答案   
问题分析:

根据你提供的信息,tesserocr安装成功后,在测试时出现了错误。可能的原因是缺少Tesseract OCR的语言数据文件或者Tesseract OCR的环境变量配置有问题。

解决方案:

尝试按照以下步骤解决问题:

1. 确保你已经正确安装了Tesseract OCR,并且将其加入系统的环境变量中。

2. 检查你使用的语言是否在Tesseract OCR的语言数据文件中存在。Tesseract OCR需要相应语言的数据文件才能正确识别图像中的文字。你可以从[Tesseract OCR的官方GitHub仓库](https://github.com/tesseract-ocr/tessdata)下载对应语言的数据文件,并将其放置在Scripts目录下。

3. 确保image.png文件存在,并且位于当前工作目录下。

4. 确保你的Python环境中安装了tesserocrPillow库。你可以使用以下命令安装它们:

   `
   pip install tesserocr Pillow
   `

5. 尝试使用绝对路径来打开image.png文件。例如,如果image.png文件位于C:\images目录下,可以使用以下代码来打开文件:

   [code]   image = Image.open('C:/images/image.png')
   `

6. 如果上述方法还没有解决问题,可以尝试重新安装tesserocr库。首先卸载已安装的库,然后再重新安装:

   `
   pip uninstall tesserocr
   pip install tesserocr
   `

如果以上步骤都没有解决问题,请提供完整的报错信息,以便我们更好地帮助你解决问题。

希望以上解答对你有帮助。如有更多疑问,请随时追问。

如果回答对你有帮助,请给我一个最佳答案!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-8-3 22:06:33 | 显示全部楼层
isdkz 发表于 2023-8-3 21:32
根据您提供的信息,您在使用tesserocr进行图像识别时遇到了错误。根据错误信息,可能是缺少语言数据文件导 ...

Snipaste_2023-08-03_22-04-38.png

Snipaste_2023-08-03_22-05-05.png

第一个第二个方法应该没用
lang 参数设置为所需的语言来指定要识别的语言具体怎么设置?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-8-4 07:59:44 | 显示全部楼层
本帖最后由 Mike_python小 于 2023-8-4 14:21 编辑


PS C:\Users\Qin\Desktop\41243> & C:/Users/Qin/AppData/Local/Programs/Python/Python310/python.exe c:/Users/Qin/Desktop/41243/2.py
在使用 tesserocr 进行图像识别时,您可以通过将 lang 参数设置为所需的语言来指定要识别的语言。具体的设置方法取决于您使用的编程语言和 tesserocr 的版本。

一般来说,可以通过在调用 tesserocr.image_to_text() 方法时传入 lang 参数来指定识别语言。例如,在 Python 中,可以这样设置:
import tesserocr

# 设置识别语言为英文
result = tesserocr.image_to_text(image, lang='eng')

# 设置识别语言为中文
result = tesserocr.image_to_text(image, lang='chi_sim')

在上面的示例中,lang 参数被设置为 'eng' 表示英文识别,或者设置为 'chi_sim' 表示中文识别。根据您下载的语 言数据文件以及 tesserocr 支持的语言,您可以相应地设置 lang 参数来指定您要进行识别的语言。

请注意,在设置 lang 参数之前,确保已经正确安装了 tesseract OCR 引擎并下载了所需的语言数据文件,且它们位于正确的位置。

如果您使用的是其他编程语言或 tesserocr 版本,请参考相关文档或示例代码来了解如何设置 lang 参数。

希望这能帮助到您。如果您还有其他问题,请随时提问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-25 22:14

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表