lslslsls12 发表于 2021-3-17 16:08:44

利用opencv-python+度娘ocr完成图片中文字的识别

本帖最后由 lslslsls12 于 2021-3-17 16:53 编辑

背景:关注一公众号每日发布的猪价信息。带水印效果。无法直接使用。每天都一个个打到excel中
水印已打码


目的:利用Python一键将图片中的内容保保存到excel中
混过鱼C的人,抛弃现成工具,制作一个专属的转换器

设计内容:
小甲鱼——python基础
小甲鱼——python爬虫(会resquests就行)
小甲鱼——进阶OpenCV(网络上就搜索了一些文档进行学习)
参考视频 小甲鱼OpenCV篇    <--B站传送门。


逻辑:      1.保存公众号图片→cv2灰度打开——去除水印——连接在线ocr——返回结果保存——处理文档信息。

第一部分代码: 图像的处理——方便AI识别




得到效果:



第二部分代码: 利用免费的AI接口识别图片——转换成文字

分别对比了阿里家的华为家的 度娘家的三种orc接口,比较识别效果和价格,最终选择了度娘{:10_247:}
简单通过个人认证后。获取免费的调用量。

虽然不多,但练手基本够用了。
接下来就是上传刚刚的灰度图片,识别了。
官方有Python文档,可以直接复制使用:
使用API接口需要 API Key(AK) 、Secret Key (SK) (注册后就会看见)
获取access_token示例代码





打开一下文档,确认下内容:

还是挺满意的。

第三部分代码:就是将文本内容排版了。


偷懒,先不写了。。。。。。


对比下整个效果:





欢迎大神多多指正。第二次发帖,如有违规,见谅。。。

wp231957 发表于 2021-3-17 17:52:55

这个接口可以免费无限次使用吗

lslslsls12 发表于 2021-3-18 08:20:51

wp231957 发表于 2021-3-17 17:52
这个接口可以免费无限次使用吗

每天有免费的次数。超出免费次数可以付费增加:包月计费/按数量计费。每条几分钱左右,具体可以比较下各个云平台的ocr功能资费。

逃兵 发表于 2021-5-25 10:15:09

可惜了,要限制免费使用次数了
页: [1]
查看完整版本: 利用opencv-python+度娘ocr完成图片中文字的识别