Pythonnewers 发表于 2020-5-11 16:20:39

爬取360翻译发现post出 ' '(空)

import requests
data = {
    'eng': 0,
    'validate': '',
    'ignore_trans': 0,
    'query':'你好',
}
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.14 Safari/537.36 Edg/83.0.478.13"}
url = "http://fanyi.so.com/index/search?eng=0&validate=&ignore_trans=0&query=%E4%BD%A0%E5%A5%BD"
print(requests.post(url = url,headers=headers,data=data).content.decode("utf-8"))

我发现这个运行只能弄出来空,要怎么办(我发现url后面的query=那串%东西好像与需要翻译的query有关{:10_249:} )

suchocolate 发表于 2020-5-11 16:20:40

headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.14 Safari/537.36 Edg/83.0.478.13",
"pro": "fanyi"}

Pythonnewers 发表于 2020-5-11 17:07:15

suchocolate 发表于 2020-5-11 16:39


能说一下pro为什么加吗,正常只要uesr的

Pythonnewers 发表于 2020-5-11 17:19:31

suchocolate 发表于 2020-5-11 16:39


确实爬出来了,很感谢,但是pro是为什么呢

suchocolate 发表于 2020-5-11 17:35:48

Pythonnewers 发表于 2020-5-11 17:19
确实爬出来了,很感谢,但是pro是为什么呢

我也不太清楚,浏览器f12观察真实headers有几个看起来像是有用的,一个一个去掉尝试出来的。

Pythonnewers 发表于 2020-5-11 19:29:50

suchocolate 发表于 2020-5-11 17:35
我也不太清楚,浏览器f12观察真实headers有几个看起来像是有用的,一个一个去掉尝试出来的。

那我要是一股脑全部写上呢(我想知道原理)

永恒的蓝色梦想 发表于 2020-5-11 20:31:41

Pythonnewers 发表于 2020-5-11 19:29
那我要是一股脑全部写上呢(我想知道原理)

都解决了就赶紧给人设最佳吧,有什么问题之后再说

suchocolate 发表于 2020-5-11 20:47:54

Pythonnewers 发表于 2020-5-11 19:29
那我要是一股脑全部写上呢(我想知道原理)

可以都写上,也可以只写上面2个。
具体为什么要写pro,这个得问360了,我只是抄实际headers。

Pythonnewers 发表于 2020-5-11 21:33:29

永恒的蓝色梦想 发表于 2020-5-11 20:31
都解决了就赶紧给人设最佳吧,有什么问题之后再说

那是肯定滴
页: [1]
查看完整版本: 爬取360翻译发现post出 ' '(空)