|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
import urllib.request
url='https://blog.csdn.net/Jurbo/article/details/52313636'
req=urllib.request.Request(url)
req.add_header("User-Agent:","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/66.0.3359.170 Safari/537.36")
data=urllib.request.urlopen(req).read()
fina=open('C:/Users/xuwei/Desktop/22.html','wb')
fina.write(data)
fina.close()
一跑就报错~~
本帖最后由 久疤K 于 2018-5-14 21:55 编辑
额,我把你的add_header中的 10.0 该成 6.3 就成功了。
- import urllib.request
- url='https://blog.csdn.net/Jurbo/article/details/52313636'
- req=urllib.request.Request(url)
- #req.add_header("User-Agent:","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/66.0.3359.170 Safari/537.36")
- req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.65 Safari/537.36')
- res = urllib.request.urlopen(req)
- data = res.read()
- fina=open('22.html','wb')
- fina.write(data)
- fina.close()
复制代码
得到的html文件,直接点击在浏览器中不能完全显示,应该是跨域的原因。
但是可以通过记事本查看,能够得到有效信息。
|
|