鱼C论坛

 找回密码
 立即注册
查看: 1378|回复: 8

[已解决]求助爬虫教程

[复制链接]
发表于 2022-6-14 16:50:02 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import urllib.request
import urllib.parse

url = 'https://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'
data = {}
data['i'] = 'i love fish c'
data['from'] = 'AUTO'
data['to'] = 'AUTO'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '16551919254276'
data['sign'] = '41f562cd693998cccd9e490e84640f7b'
data['lts'] = '1655191925427'
data['bv'] = 'b0ff5d17f404993192085bf8b1e93587'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'FY_BY_REALTlME'
data = urllib.parse.urlencode(data).encode('utf-8')

response = urllib.request.urlopen(url, data)
html = response.read().decode('utf-8')

print(html)


我的网页有道不显示解码我就默认打上了UTF-8,跑程序显示了{"errorCode":50}怎么办
最佳答案
2022-6-14 17:09:39
将translate_o改为translate
import urllib.request
import urllib.parse

url = 'https://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
data = {}
data['i'] = 'i love fish c'
data['from'] = 'AUTO'
data['to'] = 'AUTO'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '16551919254276'
data['sign'] = '41f562cd693998cccd9e490e84640f7b'
data['lts'] = '1655191925427'
data['bv'] = 'b0ff5d17f404993192085bf8b1e93587'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'FY_BY_REALTlME'
data = urllib.parse.urlencode(data).encode('utf-8')

response = urllib.request.urlopen(url, data)
html = response.read().decode('utf-8')

print(html)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-6-14 17:08:06 | 显示全部楼层
将链接里的translate_o改成translate
import urllib.request
import urllib.parse

url = 'https://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
data = {}
data['i'] = 'i love fish c'
data['from'] = 'AUTO'
data['to'] = 'AUTO'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '16551919254276'
data['sign'] = '41f562cd693998cccd9e490e84640f7b'
data['lts'] = '1655191925427'
data['bv'] = 'b0ff5d17f404993192085bf8b1e93587'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'FY_BY_REALTlME'
data = urllib.parse.urlencode(data).encode('utf-8')

response = urllib.request.urlopen(url, data)
html = response.read().decode('utf-8')

print(html)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-6-14 17:09:39 | 显示全部楼层    本楼为最佳答案   
将translate_o改为translate
import urllib.request
import urllib.parse

url = 'https://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
data = {}
data['i'] = 'i love fish c'
data['from'] = 'AUTO'
data['to'] = 'AUTO'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '16551919254276'
data['sign'] = '41f562cd693998cccd9e490e84640f7b'
data['lts'] = '1655191925427'
data['bv'] = 'b0ff5d17f404993192085bf8b1e93587'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'FY_BY_REALTlME'
data = urllib.parse.urlencode(data).encode('utf-8')

response = urllib.request.urlopen(url, data)
html = response.read().decode('utf-8')

print(html)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-6-14 17:29:57 | 显示全部楼层
临时号 发表于 2022-6-14 17:09
将translate_o改为translate

感谢大佬
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-6-14 17:33:49 | 显示全部楼层

如果问题解决了,不要忘了设置最佳答案哦
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-6-15 08:39:34 | 显示全部楼层
临时号 发表于 2022-6-14 17:33
如果问题解决了,不要忘了设置最佳答案哦

问题解决了,能否讲一下为什么呢,我是直接复制的网址为啥会出问题
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-6-15 12:39:52 | 显示全部楼层
pythonleelee 发表于 2022-6-15 08:39
问题解决了,能否讲一下为什么呢,我是直接复制的网址为啥会出问题

这是有道的反爬机制,而我给你的网址是有道的后门网址
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-6-19 07:47:29 | 显示全部楼层
临时号 发表于 2022-6-15 12:39
这是有道的反爬机制,而我给你的网址是有道的后门网址

哦哦,强
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-17 20:39

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表