鱼C论坛

 找回密码
 立即注册
查看: 1314|回复: 6

[已解决]关于Python课程第54讲爬虫有道,只能爬到网页代码。

[复制链接]
发表于 2021-8-15 11:13:18 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
代码完全是按照小甲鱼的来弄的,也去掉了_o,就是得不到小甲鱼的效果。
最佳答案
2021-8-15 16:25:04
本帖最后由 白two 于 2021-8-15 16:26 编辑

没有加请求头,ua和cookie

小甲鱼效果

小甲鱼效果

我的效果

我的效果
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-15 11:29:17 From FishC Mobile | 显示全部楼层
放代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-8-15 16:22:52 | 显示全部楼层

import urllib.request

import urllib.parse

url = "https://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"

data = {}

data["i"]:" i love fishc.com"
data["from"]: "AUTO"
data["to"]: "AUTO"
data["smartresult"]: "dict"
data["client"]: "fanyideskweb"
data["salt"]: "16289478560301"
data["sign"]: "50f56d58392d0eeb8554f16b02746b3d"
data["lts"]: "1628947856030"
data["bv"]: "eda468fc64295ecf2810ab8a672c2db1"
data["doctype"]: "json"
data["version"]: "2.1"
data["keyfrom"]: "fanyi.web"
data["action"]: "FY_BY_CLICKBUTTION"

data = urllib.parse.urlencode(data).encode("utf-8")

response = urllib.request.urlopen(url,data)

html = response.read().decode("utf-8")
                              
print(html)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-15 16:25:04 | 显示全部楼层    本楼为最佳答案   
本帖最后由 白two 于 2021-8-15 16:26 编辑

没有加请求头,ua和cookie
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-8-15 16:25:49 | 显示全部楼层
白two 发表于 2021-8-15 16:25
没有加请求头和cookies

谢谢大佬解答,我去查阅一下相关资料
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-8-15 16:49:03 | 显示全部楼层
白two 发表于 2021-8-15 16:25
没有加请求头,ua和cookie

还是不行呢

from urllib import request
import urllib.parse

url = "https://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"
header = {}
data = {}

header["User-Agent"]="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36"
header["Cookie"]="OUTFOX_SEARCH_USER_ID=-1404491642@10.108.160.101; OUTFOX_SEARCH_USER_ID_NCOO=847436334.4984028; JSESSIONID=aaaai22Oo32k9_PctWhTx; ___rl__test__cookies=1629016383535"

data["i"]=" i love fishc.com"
data["from"]= "AUTO"
data["to"]= "AUTO"
data["smartresult"]= "dict"
data["client"]= "fanyideskweb"
data["salt"]= "16289478560301"
data["sign"]= "50f56d58392d0eeb8554f16b02746b3d"
data["lts"]= "1628947856030"
data["bv"]= "eda468fc64295ecf2810ab8a672c2db1"
data["doctype"]= "json"
data["version"]= "2.1"
data["keyfrom"]= "fanyi.web"
data["action"]= "FY_BY_CLICKBUTTION"

data = urllib.parse.urlencode(data).encode("utf-8")

response = request.Request(url,headers = header)

res = request.urlopen(response)

html = res.read().decode("utf-8")
                              
print(html)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-15 17:18:49 | 显示全部楼层
from urllib import request
import urllib.parse

url = "https://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"
header = {}
data = {}

header[
    "User-Agent"] = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36"
header[
    "Cookie"] = "OUTFOX_SEARCH_USER_ID=-1404491642@10.108.160.101; OUTFOX_SEARCH_USER_ID_NCOO=847436334.4984028; JSESSIONID=aaaai22Oo32k9_PctWhTx; ___rl__test__cookies=1629016383535"

data["i"] = " i love fishc.com"
data["from"] = "AUTO"
data["to"] = "AUTO"
data["smartresult"] = "dict"
data["client"] = "fanyideskweb"
data["salt"] = "16289478560301"
data["sign"] = "50f56d58392d0eeb8554f16b02746b3d"
data["lts"] = "1628947856030"
data["bv"] = "eda468fc64295ecf2810ab8a672c2db1"
data["doctype"] = "json"
data["version"] = "2.1"
data["keyfrom"] = "fanyi.web"
data["action"] = "FY_BY_CLICKBUTTION"

data = urllib.parse.urlencode(data).encode("utf-8")

response = request.Request(url,data, headers=header)

res = request.urlopen(response)

html = res.read().decode("utf-8")

print(html)

emmm,第29行,你data根本没提交
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-26 00:45

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表