urllib.request.urlopen错误
各位热心的高手帮我看看>>>a=urllib.request.urlopen('https://www.toutiao.com/a6791675673078399502/')
>>> a.read().decode('utf-8')
'<html><head></head><body>error</body></html>'
网页的内容有好多呢,为啥就返回这么点东西。
8成被反爬了 换一个网站试试,如果能爬,就说明这个网站反爬虫 liuzhengyuan 发表于 2020-5-4 09:16
换一个网站试试,如果能爬,就说明这个网站反爬虫
可能是,别的网站可以,怎么破解呢,我加了user-agent隐藏也没用 反爬的,换个 liuzhengyuan 发表于 2020-5-4 09:16
换一个网站试试,如果能爬,就说明这个网站反爬虫
应该是,加user-agent 也没用,怎么破解呢。 看了论坛里的爬虫几乎都是爬妹子图网站的,难道就是因为她的反扒能力弱吗?遇到反扒能力强的我们就没辙了吗?
页:
[1]