利用opencv-python+度娘ocr完成图片中文字的识别
本帖最后由 lslslsls12 于 2021-3-17 16:53 编辑背景:关注一公众号每日发布的猪价信息。带水印效果。无法直接使用。每天都一个个打到excel中
水印已打码
目的:利用Python一键将图片中的内容保保存到excel中
混过鱼C的人,抛弃现成工具,制作一个专属的转换器
设计内容:
小甲鱼——python基础
小甲鱼——python爬虫(会resquests就行)
小甲鱼——进阶OpenCV(网络上就搜索了一些文档进行学习)
参考视频 小甲鱼OpenCV篇 <--B站传送门。
逻辑: 1.保存公众号图片→cv2灰度打开——去除水印——连接在线ocr——返回结果保存——处理文档信息。
第一部分代码: 图像的处理——方便AI识别
得到效果:
第二部分代码: 利用免费的AI接口识别图片——转换成文字
分别对比了阿里家的华为家的 度娘家的三种orc接口,比较识别效果和价格,最终选择了度娘{:10_247:}
简单通过个人认证后。获取免费的调用量。
虽然不多,但练手基本够用了。
接下来就是上传刚刚的灰度图片,识别了。
官方有Python文档,可以直接复制使用:
使用API接口需要 API Key(AK) 、Secret Key (SK) (注册后就会看见)
获取access_token示例代码
打开一下文档,确认下内容:
还是挺满意的。
第三部分代码:就是将文本内容排版了。
偷懒,先不写了。。。。。。
对比下整个效果:
欢迎大神多多指正。第二次发帖,如有违规,见谅。。。
这个接口可以免费无限次使用吗 wp231957 发表于 2021-3-17 17:52
这个接口可以免费无限次使用吗
每天有免费的次数。超出免费次数可以付费增加:包月计费/按数量计费。每条几分钱左右,具体可以比较下各个云平台的ocr功能资费。 可惜了,要限制免费使用次数了
页:
[1]