wtfitis 发表于 2021-6-9 17:40:59

为什么用xpath无法爬出这个网址的ip

https://api.ip.sb/ip
r = requests.get("https://api.ip.sb/ip", headers=headers, proxies=proxy, verify=False, allow_redirects=False)
print(r.status_code)
html3=etree.HTML(r.text)
ipdizhi=html3.xpath('/html/body//text()')
如果把ipdizhi=html3.xpath('/html/body/pre/text()')替换成这样就不行。。

wp231957 发表于 2021-6-9 17:41:00

因为<pre> 被解析成了<p>   不要问我为什么

r = requests.get("https://api.ip.sb/ip")
print(r.status_code)
html3=etree.HTML(r.text)
ipdizhi=html3.xpath('/html/body/p/text()')
print(ipdizhi)

wtfitis 发表于 2021-6-9 17:41:45

不能用pre节点。。只能直接跳过获取最终的text()

wtfitis 发表于 2021-6-9 18:03:48

wp231957 发表于 2021-6-9 17:41
因为 被解析成了   不要问我为什么

谢谢大佬。。真神奇
页: [1]
查看完整版本: 为什么用xpath无法爬出这个网址的ip