鱼C论坛

 找回密码
 立即注册
查看: 2548|回复: 8

看视屏爬虫实战,还能照猫画虎吗?是不是过期了,就是爬有道翻译

[复制链接]
发表于 2020-7-23 16:14:53 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
有道翻译审查元素 date 里面跟视频里的都不一样了
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-7-23 16:20:07 | 显示全部楼层
本帖最后由 sunrise085 于 2020-7-23 16:25 编辑

的确不一样了。
应该是有道更新了
我写的和小甲鱼的就不完全一样
  1. import urllib.request
  2. import urllib.parse
  3. import json

  4. content=input("请输入需要翻译的内容:")

  5. url="http://fanyi.youdao.com/translate?smartresult=dict&smartresult=ugc#=&sessionFrom=http://www.youdao.com"

  6. data={}
  7. data['i']=content
  8. #data['from']='AUTO'
  9. #data['to']='AUTO'
  10. #data['smartresult']='dict'
  11. #data['client']='fanyideskweb'
  12. #data['salt']='15923615349312'
  13. #data['sign']='6d92a73f864706b1d88f777eb0861b26'
  14. #data['ts']='1592361534931'
  15. #data['bv']='37074a7035f34bfbf10d32bb8587564a'
  16. data['doctype']='json'
  17. #data['version']='2.1'
  18. #data['keyfrom']='fanyi.web'
  19. #data['action']='FY_BY_CLICKBUTTION'
  20. data= urllib.parse.urlencode(data).encode('utf-8')

  21. req = urllib.request.Request(url,data)
  22. req.add_header ('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36')

  23. response=urllib.request.urlopen(req)
  24. html = response.read().decode('utf-8')

  25. target=json.loads(html)

  26. print("翻译结果:%s"%(target['translateResult'][0][0]['tgt']))

复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

发表于 2020-7-23 16:21:28 | 显示全部楼层


建议新手可以看这篇文章,一步步来,这里总结了两种爬有道的方法:

https://blog.csdn.net/Mr_blueD/article/details/90581634

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2020-7-23 16:59:06 | 显示全部楼层
sunrise085 发表于 2020-7-23 16:20
的确不一样了。
应该是有道更新了
我写的和小甲鱼的就不完全一样

兄弟是不是需要学后面的反爬内容啊!还有 那个print(html)为什么只出来 errro:50????
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-23 17:00:32 | 显示全部楼层
zhucrokes 发表于 2020-7-23 16:59
兄弟是不是需要学后面的反爬内容啊!还有 那个print(html)为什么只出来 errro:50????

因为有道反爬了,链接中的_o 去掉就好了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-9 08:25:17 | 显示全部楼层
sunrise085 发表于 2020-7-23 16:20
的确不一样了。
应该是有道更新了
我写的和小甲鱼的就不完全一样

谢谢谢谢
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-9 14:59:19 | 显示全部楼层
貌似确实是这样
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-10-21 06:12:16 | 显示全部楼层
我有源码
  1. 分享有道翻译爬虫,::

  2. import urllib.request
  3. import urllib.parse
  4. import json
  5. from time import sleep
  6. while 1:
  7.     url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
  8.     data = {}
  9.     data【'i'】 = input("输入待翻译的文字:")
  10.     data【'from'】= 'AUTO'
  11.     data【'to'】= 'AUTO'
  12.     data【'smartresult'】= 'dict'
  13.     data【'client'】= 'fanyideskweb'
  14.     data【'salt'】= '16029936230111'
  15.     data【'sign'】= '08714420b7b24624cdc1b9539ac3b9de'
  16.     data【'lts'】= '1602993623011'
  17.     data【'bv'】= 'a1cbc92f4166e300df7d5089e67d53ed'
  18.     data【'doctype'】= 'json'
  19.     data【'version'】= '2.1'
  20.     data【'keyfrom'】= 'fanyi.web'
  21.     data【'action'】= 'FY_BY_REALTlME'
  22.     data = urllib.parse.urlencode(data).encode('utf-8')

  23.     reponse = urllib.request.urlopen(url,data)
  24.     html = reponse.read().decode('utf-8')
  25.     htmls = json.loads(html)
  26.     print(htmls【'translateResult'】【0】【0】【'src'】 + '的翻译结果是:' + htmls【'translateResult'】【0】【0】【'tgt'】)
  27.     for i in range(0,3):
  28.         print(f'为了防止造成服务器拥堵,请等待{3 - i}秒后继续翻译!')
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-10-21 06:13:11 | 显示全部楼层
我有源码
  1. 分享有道翻译爬虫,::

  2. import urllib.request
  3. import urllib.parse
  4. import json
  5. from time import sleep
  6. while 1:
  7.     url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
  8.     data = {}
  9.     data【'i'】 = input("输入待翻译的文字:")
  10.     data【'from'】= 'AUTO'
  11.     data【'to'】= 'AUTO'
  12.     data【'smartresult'】= 'dict'
  13.     data【'client'】= 'fanyideskweb'
  14.     data【'salt'】= '16029936230111'
  15.     data【'sign'】= '08714420b7b24624cdc1b9539ac3b9de'
  16.     data【'lts'】= '1602993623011'
  17.     data【'bv'】= 'a1cbc92f4166e300df7d5089e67d53ed'
  18.     data【'doctype'】= 'json'
  19.     data【'version'】= '2.1'
  20.     data【'keyfrom'】= 'fanyi.web'
  21.     data【'action'】= 'FY_BY_REALTlME'
  22.     data = urllib.parse.urlencode(data).encode('utf-8')

  23.     reponse = urllib.request.urlopen(url,data)
  24.     html = reponse.read().decode('utf-8')
  25.     htmls = json.loads(html)
  26.     print(htmls【'translateResult'】【0】【0】【'src'】 + '的翻译结果是:' + htmls【'translateResult'】【0】【0】【'tgt'】)
  27.     for i in range(0,3):
  28.         print(f'为了防止造成服务器拥堵,请等待{3 - i}秒后继续翻译!')
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-5-18 08:47

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表