鱼C论坛

 找回密码
 立即注册
查看: 1867|回复: 15

[已解决]百度aip文字识别问题

[复制链接]
发表于 2020-5-2 20:47:39 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
APP_ID = '19699070'
API_KEY = 'L9BNPAgFmP7RRB4D0cFlhGUi'
SECRET_KEY = 'eqE1iCj0kcMk53lpjMv3KbBoItX5MrkG'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
session = requests.session()
""" 调用网络图片文字识别, 图片参数为远程url图片 """
image_url = "https://so.gushiwen.org/user/collect.aspx"
image_page_text = session.get(image_url).text
tree = etree.HTML(image_page_text)
image_src = 'https://so.gushiwen.org' + tree.xpath('//*[@id="imgCode"]/@src')[0]
image_code = client.webImageUrl(image_src)

这是我在百度云里头找的api接口,是哪里有问题吗,我看的是网络url地址调用方法  但是print打印的时候会报这个错误
最佳答案
2020-5-4 09:13:22
本帖最后由 suchocolate 于 2020-5-4 09:18 编辑
czh1303541051 发表于 2020-5-3 19:21
貌似还是不对啊

我把转换代码加到这里了,有什么问题吗


照官方API手册来就行,我这里可以识别出来,token你换成你自己的。
import requests
from PIL import Image

url = 'https://so.gushiwen.org/RandCode.ashx'
headers = {'user-agent': 'firefox'}
r = requests.get(url, headers=headers)
with open('r.gif', 'wb') as f:
    f.write(r.content)
Image.open('r.gif').save('r.png')


import base64

'''
通用文字识别
'''

request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"
# 二进制方式打开图片文件
f = open('r.png', 'rb')
img = base64.b64encode(f.read())

params = {"image":img}
access_token = '自己的token'
request_url = request_url + "?access_token=" + access_token
headers = {'content-type': 'application/x-www-form-urlencoded'}
response = requests.post(request_url, data=params, headers=headers)
if response:
    print (response.json())
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-5-2 20:48:11 | 显示全部楼层
{'log_id': 8488323799504620546, 'error_code': 282113, 'error_msg': 'url response invalid'}  报这个错误
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-3 07:26:23 | 显示全部楼层
代码贴全
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-3 16:39:54 | 显示全部楼层

知道问题了  是百度云的问题  还有没有什么平台可以识别  尽量免费  测试个东西不想花钱
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-3 17:32:34 | 显示全部楼层
czh1303541051 发表于 2020-5-3 16:39
知道问题了  是百度云的问题  还有没有什么平台可以识别  尽量免费  测试个东西不想花钱

tesserocr
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-3 18:01:07 | 显示全部楼层
APP_ID = '19699070'
API_KEY = 'L9BNPAgFmP7RRB4D0cFlhGUi'
SECRET_KEY = 'eqE1iCj0kcMk53lpjMv3KbBoItX5MrkG'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)


headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36',
}

session = requests.session()

image_url = "https://so.gushiwen.org/user/collect.aspx"
image_page_text = session.get(image_url).text
tree = etree.HTML(image_page_text)
image_src = 'https://so.gushiwen.org' + tree.xpath('//*[@id="imgCode"]/@src')[0]
page_url = requests.get(image_src).content
with open('./test.jpg','wb')as fp:
    fp.write(page_url)
""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return base64.b64encode(fp.read())

image = get_file_content('test.jpg')

""" 调用通用文字识别, 图片参数为本地图片 """
image_code = client.webImage(image);
print(image_code)

{'log_id': 2726567232459694083, 'error_code': 216201, 'error_msg': 'image format error'}
这是错误   头大  不是百度云问题  我的问题  我看他们说转换为base64  但是还是不行  也不知道是不是我转换的额不对
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-3 18:32:04 | 显示全部楼层
czh1303541051 发表于 2020-5-3 18:01
{'log_id': 2726567232459694083, 'error_code': 216201, 'error_msg': 'image format error'}
这是 ...

你的这个网站我看到了,他的验证码图片是gif格式,你需要转成png格式,百度的这个api说不支持gif。
你下载图片,把图片转个格式:
from PIL import Image
Image.open('tu.gif').save('tu.png')
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-3 19:21:35 | 显示全部楼层
suchocolate 发表于 2020-5-3 18:32
你的这个网站我看到了,他的验证码图片是gif格式,你需要转成png格式,百度的这个api说不支持gif。
你下 ...

貌似还是不对啊
with open('./test.gif','wb')as fp:
    fp.write(page_url)

Image.open('test.gif').save('test.png')
""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return base64.b64encode(fp.read())

image = get_file_content('test.png')

""" 调用通用文字识别, 图片参数为本地图片 """
image_code = client.webImage(image);
print(image_code)
我把转换代码加到这里了,有什么问题吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-3 20:21:57 | 显示全部楼层
czh1303541051 发表于 2020-5-3 16:39
知道问题了  是百度云的问题  还有没有什么平台可以识别  尽量免费  测试个东西不想花钱

百度云 有API文档 不想动手写 直接复制文档中的代码 改一下token就行了

阿里云 腾讯云都是有免费次数的 但是你可能会看不懂他们的API文档 如果看不懂更不可能知道怎么用了

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-4 00:03:09 | 显示全部楼层
admintest166 发表于 2020-5-3 20:21
百度云 有API文档 不想动手写 直接复制文档中的代码 改一下token就行了

阿里云 腾讯云都是有免费次数 ...

报错,麻烦你看下我和别的楼层的对话  里面有错误信息  不知道怎么改
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-4 09:13:22 | 显示全部楼层    本楼为最佳答案   
本帖最后由 suchocolate 于 2020-5-4 09:18 编辑
czh1303541051 发表于 2020-5-3 19:21
貌似还是不对啊

我把转换代码加到这里了,有什么问题吗


照官方API手册来就行,我这里可以识别出来,token你换成你自己的。
import requests
from PIL import Image

url = 'https://so.gushiwen.org/RandCode.ashx'
headers = {'user-agent': 'firefox'}
r = requests.get(url, headers=headers)
with open('r.gif', 'wb') as f:
    f.write(r.content)
Image.open('r.gif').save('r.png')


import base64

'''
通用文字识别
'''

request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"
# 二进制方式打开图片文件
f = open('r.png', 'rb')
img = base64.b64encode(f.read())

params = {"image":img}
access_token = '自己的token'
request_url = request_url + "?access_token=" + access_token
headers = {'content-type': 'application/x-www-form-urlencoded'}
response = requests.post(request_url, data=params, headers=headers)
if response:
    print (response.json())
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-4 20:02:39 | 显示全部楼层
suchocolate 发表于 2020-5-4 09:13
照官方API手册来就行,我这里可以识别出来,token你换成你自己的。

这是哪个接口  我用的通用文字识别接口  你这个是哪个
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-4 21:13:31 | 显示全部楼层
czh1303541051 发表于 2020-5-4 20:02
这是哪个接口  我用的通用文字识别接口  你这个是哪个

代码里写着呢。
就是在百度提供的代码的基础之上加了你的图片下载。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-5 14:53:33 | 显示全部楼层
suchocolate 发表于 2020-5-4 21:13
代码里写着呢。
就是在百度提供的代码的基础之上加了你的图片下载。

。。不是大佬    我想知道这个接口在百度云控制台哪里找的  我以后也好找。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-5 17:10:58 | 显示全部楼层
czh1303541051 发表于 2020-5-5 14:53
。。不是大佬    我想知道这个接口在百度云控制台哪里找的  我以后也好找。。

https://ai.baidu.com/ai-doc/OCR/zk3h7xz52
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-5 19:40:09 | 显示全部楼层
suchocolate 发表于 2020-5-5 17:10
https://ai.baidu.com/ai-doc/OCR/zk3h7xz52

我草我看的sdk文档。。 太脑残了。。  sdk文档和api文档有啥区别吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-6-12 07:23

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表