Siren0327 发表于 2020-4-26 13:03:10

关于爬虫的问题

从知乎爬取问题和答案,为什么出来的代码突然成这样了,昨天还不是了

Siren0327 发表于 2020-4-26 13:03:53

我的代码
import requests
from lxml import etree
headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)'
               ' Chrome/70.0.3538.102 Safari/537.36 Edge/18.18363) '
}
text = requests.get('https://www.zhihu.com/hot',headers = headers).text
print(text)

zltzlt 发表于 2020-4-26 13:04:42

正常,网页源代码就是这样

Siren0327 发表于 2020-4-26 13:12:59

zltzlt 发表于 2020-4-26 13:04
正常,网页源代码就是这样

可是从网页上看是这样的啊

老八秘制 发表于 2020-4-26 13:26:10

Siren0327 发表于 2020-4-26 13:12
可是从网页上看是这样的啊

审查元素看到的不一定是爬取下来的

可乐西瓜 发表于 2020-4-26 20:49:38

{:10_249:}所以,问题是什么?
页: [1]
查看完整版本: 关于爬虫的问题