关于爬虫的问题
从知乎爬取问题和答案,为什么出来的代码突然成这样了,昨天还不是了 我的代码import requests
from lxml import etree
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)'
' Chrome/70.0.3538.102 Safari/537.36 Edge/18.18363) '
}
text = requests.get('https://www.zhihu.com/hot',headers = headers).text
print(text) 正常,网页源代码就是这样 zltzlt 发表于 2020-4-26 13:04
正常,网页源代码就是这样
可是从网页上看是这样的啊 Siren0327 发表于 2020-4-26 13:12
可是从网页上看是这样的啊
审查元素看到的不一定是爬取下来的 {:10_249:}所以,问题是什么?
页:
[1]