本帖最后由 Twilight6 于 2020-4-27 11:01 编辑
你如果没加UA到请求里去,设置个head完全是虚设呀,你导入urllib的Request 吧 这个可以把UA加进去
帮你稍微修改了下~可以爬了
- import urllib.request as ur
- head={}
- head['User-Agent']='Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
- request = ur.Request('http://www.chinacdc.cn/',headers=head)
- response=ur.urlopen(request)
- html = response.read().decode()
- print(html)
复制代码
还有推荐去安一个fake_useragent库 ,这个模块含有大量的UA,各种浏览器都有,也就不用你天天去复制UA了
- from fake_useragent import UserAgent
- headers = {
- 'User-Agent':UserAgent().random
- }
- 这样headers里面的UA就会随机使用,或者你可以把random改成ie,chrome,等浏览器名字,随机浏览器UA
复制代码