鱼C论坛

 找回密码
 立即注册
查看: 2246|回复: 16

为什么这个爬虫打印的html中没有翻译结果?(第54讲)

[复制链接]
发表于 2021-8-19 13:05:25 | 显示全部楼层 |阅读模式
5鱼币
跟着小甲鱼敲的:
import urllib.request
import urllib.parse

url = 'https://fanyi.sogou.com/api/transpc/text/result'
data = {}
data['client'] = "pc"
data['exchange'] = 'false'
data['fr'] = "browser_pc"
data['from']="en"
data['needQc'] = '1'
data['s'] = "09a257a14c00e5191eab21deeb4c786e"
data['text'] = "I love you"
data['to'] = "zh-CHS"
data['uuid'] = "05b21b08-b33e-41e1-8761-ee9cea4eb88e"
data = urllib.parse.urlencode(data).encode('utf-8')

response = urllib.request.urlopen(url,data)
html = response.read().decode('utf-8')

print(html)

运行结果:
{"data":{"detect":{"detect":"en","language":"英语"},"translate":{"errorCode":"s10","dit":""}},"info":"success","node":"1","status":0,"zly":"zly"}

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-19 13:44:36 | 显示全部楼层
小甲鱼的视频很久之前的了,现在不一定有用
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-19 13:46:28 | 显示全部楼层
我当时也遇到了这个问题,后来自己改写了一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-19 13:47:19 | 显示全部楼层
  1. import urllib.request
  2. import urllib.parse
  3. import json

  4. while True:
  5.     content = input("请输入你要翻译的内容:")
  6.     if content == "exit" or content == "退出":
  7.         break

  8.     url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/"

  9.     head = {}
  10.     head['User-Agent'] = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36'

  11.     data = {}
  12.     data['i'] = content
  13.     data['from'] = 'AUTO'
  14.     data['to'] = 'AUTO'
  15.     data['smartresult']  = 'dict'
  16.     data['client'] = 'fanyideskweb'
  17.     data['salt'] = '16248971446526'
  18.     data['sign'] = 'c2419f171ee58cb900aec5df720a8322'
  19.     data['lts'] = '1624897144652'
  20.     data['bv'] = '6c7a52ace17deb79388e05719a7255b8'
  21.     data['doctype'] = 'json'
  22.     data['Version'] = '2.1'
  23.     data['keyfrom'] = 'fanyi.web'
  24.     data['action'] = 'FY_BY_CLICKBUTTION'
  25.     data["ue"] = 'UTF-8'
  26.     data['typoResult'] = 'true'
  27.     data = urllib.parse.urlencode(data).encode('utf-8')

  28.     req = urllib.request.Request(url,data,head)
  29.     response = urllib.request.urlopen(url,data)
  30.     html = response.read().decode("utf-8")

  31.     target = json.loads(html)
  32.     print("翻译结果:%s"%(target['translateResult'][0][0]['tgt']))
复制代码

只能给你参考一下,这个是有道翻译的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-8-19 15:27:06 | 显示全部楼层
3236654291 发表于 2021-8-19 13:47
只能给你参考一下,这个是有道翻译的

试了一下,好像可以,但是为什么要把url的_o去掉呢?加上好像就不行了,这是什么原理?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-19 15:30:33 | 显示全部楼层
哪一行?
很久之前写的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-8-19 15:34:29 | 显示全部楼层
3236654291 发表于 2021-8-19 13:47
只能给你参考一下,这个是有道翻译的

还有那个head随便标识(只要是电脑)都可以吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-19 15:52:14 | 显示全部楼层
恩,是谷歌浏览器的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-8-19 15:57:27 | 显示全部楼层
3236654291 发表于 2021-8-19 15:30
哪一行?
很久之前写的

第十行
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-8-19 15:58:33 | 显示全部楼层
3236654291 发表于 2021-8-19 15:52
恩,是谷歌浏览器的

在谷歌浏览器的哪里看?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-8-19 15:59:18 | 显示全部楼层
3236654291 发表于 2021-8-19 15:52
恩,是谷歌浏览器的

好像我改了版本号他报错
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-19 16:16:08 | 显示全部楼层
飞花落尽 发表于 2021-8-19 15:58
在谷歌浏览器的哪里看?

这个小甲鱼说了呀
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-8-19 16:28:43 | 显示全部楼层
3236654291 发表于 2021-8-19 16:16
这个小甲鱼说了呀

哦,下一讲,我还没看hhh,谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-8-19 16:29:17 | 显示全部楼层
3236654291 发表于 2021-8-19 16:16
这个小甲鱼说了呀

所以为什么要把url的_o去掉呢?加上好像就不行了,这是什么原理?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-8-19 16:37:24 | 显示全部楼层
3236654291 发表于 2021-8-19 16:16
这个小甲鱼说了呀

啊这,好像Typeerror了,不修改useragent反而不会
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-19 18:03:14 | 显示全部楼层
飞花落尽 发表于 2021-8-19 16:29
所以为什么要把url的_o去掉呢?加上好像就不行了,这是什么原理?

主要是因为时间相隔太久了,我已经记不清为什么要这么做了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-19 18:04:06 | 显示全部楼层
也没看到有_o
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-6-5 13:39

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表