鱼C论坛

 找回密码
 立即注册
查看: 958|回复: 7

关于爬去百度翻译的问题

[复制链接]
发表于 2018-10-22 09:33:14 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 康小泡 于 2018-10-22 16:12 编辑

求助各位大神
按照小甲鱼的视频,爬取百度翻译结果显示 {"error":997,"from":"zh","to":"en","query":"\u4f60\u597d"} ,可是我用同样的方法爬取有道就可以 ,请各位带佬讲解一哈,感激不尽
代码:
import urllib.request
import urllib.parse
import json

url = 'https://fanyi.baidu.com/v2transapi'

data = {}
data['from'] = 'zh'
data['to'] =  'en'
data['query']= '你好'
data['transtype'] = 'enter'
data['simple_means_flag'] = '3'
data['sign']= '232427.485594'
data['token']='2d586e7b1e04049b3d8603a73ba4aaf4'

data = urllib.parse.urlencode(data).encode('utf-8')

trans = urllib.request.urlopen(url,data)

html = trans.read().decode('utf-8')

print(html)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-10-22 10:30:55 | 显示全部楼层
设置一下请求头里面的User-Agent属性试一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-22 11:24:22 | 显示全部楼层
header也不行,有反扒措施

玩玩selenium吧
from selenium import webdriver
import time
options = webdriver.ChromeOptions()
options.add_argument('--headless')
options.add_argument('--disable-gpu')
browser=webdriver.Chrome(chrome_options = options)
browser.get('https://fanyi.baidu.com/#auto/zh/')
input_area=browser.find_element_by_css_selector('#baidu_translate_input')
content=input('请输入你需要翻译的内容:')
input_area.send_keys(content)
time.sleep(2)
output_area=browser.find_element_by_css_selector('#main-outer > div > div > div.translate-wrap > div.translateio > div.translate-main.clearfix > div.trans-right > div > div > div.output-bd > p.ordinary-output.target-output.clearfix > span')
print('翻译结果:',output_area.text)
browser.close()
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-10-22 14:09:51 | 显示全部楼层
opserve123 发表于 2018-10-22 10:30
设置一下请求头里面的User-Agent属性试一下

试过了 没有用
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-10-22 14:10:22 | 显示全部楼层
塔利班 发表于 2018-10-22 11:24
header也不行,有反扒措施

玩玩selenium吧

看起来好复杂啊,研究研究
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-22 14:14:41 | 显示全部楼层
还好,搜文档看看就行,
导入模块2行
3行设置Chrome无头,即不真正打开浏览器界面
后面是找到浏览器的控件,即输入翻译,和输出翻译
审查元素复制css selector就行
剩下就是输入和获取了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-10-22 21:34:01 | 显示全部楼层
塔利班 发表于 2018-10-22 14:14
还好,搜文档看看就行,
导入模块2行
3行设置Chrome无头,即不真正打开浏览器界面

嗯嗯
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-12-1 18:17:49 | 显示全部楼层
百度的坑好大,都不给Response回应
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-10-6 23:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表