爬取360翻译发现post出 ' '(空),Python交流,编程语言专区,鱼C论坛

Pythonnewers 发表于 2020-5-11 16:20:39

爬取360翻译发现post出 ' '(空)

import requests
data = {
'eng': 0,
'validate': '',
'ignore_trans': 0,
'query':'你好',
}
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.14 Safari/537.36 Edg/83.0.478.13"}
url = "http://fanyi.so.com/index/search?eng=0&validate=&ignore_trans=0&query=%E4%BD%A0%E5%A5%BD"
print(requests.post(url = url,headers=headers,data=data).content.decode("utf-8"))

我发现这个运行只能弄出来空,要怎么办(我发现url后面的query=那串%东西好像与需要翻译的query有关{:10_249:} )

suchocolate 发表于 2020-5-11 16:20:40

headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.14 Safari/537.36 Edg/83.0.478.13",
"pro": "fanyi"}

Pythonnewers 发表于 2020-5-11 17:07:15

suchocolate 发表于 2020-5-11 16:39

能说一下pro为什么加吗,正常只要uesr的

Pythonnewers 发表于 2020-5-11 17:19:31

suchocolate 发表于 2020-5-11 16:39

确实爬出来了,很感谢,但是pro是为什么呢

suchocolate 发表于 2020-5-11 17:35:48

Pythonnewers 发表于 2020-5-11 17:19
确实爬出来了,很感谢,但是pro是为什么呢

我也不太清楚，浏览器f12观察真实headers有几个看起来像是有用的，一个一个去掉尝试出来的。

Pythonnewers 发表于 2020-5-11 19:29:50

suchocolate 发表于 2020-5-11 17:35
我也不太清楚，浏览器f12观察真实headers有几个看起来像是有用的，一个一个去掉尝试出来的。

那我要是一股脑全部写上呢(我想知道原理)

永恒的蓝色梦想 发表于 2020-5-11 20:31:41

Pythonnewers 发表于 2020-5-11 19:29
那我要是一股脑全部写上呢(我想知道原理)

都解决了就赶紧给人设最佳吧，有什么问题之后再说

suchocolate 发表于 2020-5-11 20:47:54

Pythonnewers 发表于 2020-5-11 19:29
那我要是一股脑全部写上呢(我想知道原理)

可以都写上，也可以只写上面2个。
具体为什么要写pro，这个得问360了，我只是抄实际headers。

Pythonnewers 发表于 2020-5-11 21:33:29

永恒的蓝色梦想发表于 2020-5-11 20:31
都解决了就赶紧给人设最佳吧，有什么问题之后再说

那是肯定滴

页: [1]

鱼C论坛's Archiver

爬取360翻译发现post出 ' '(空)