[已解决]为什么用xpath无法爬出这个网址的ip

wtfitis · 发表于 2021-6-9 17:40:59

r = requests.get("https://api.ip.sb/ip", headers=headers, proxies=proxy, verify=False, allow_redirects=False)
print(r.status_code)
html3=etree.HTML(r.text)
ipdizhi=html3.xpath('/html/body//text()')

复制代码

如果把ipdizhi=html3.xpath('/html/body/pre/text()')替换成这样就不行。。

最佳答案

wp231957

2021-6-9 17:41:00

因为<pre> 被解析成了<p> 不要问我为什么

复制代码

wp231957 · 发表于 2021-6-9 17:41:00

因为<pre> 被解析成了<p> 不要问我为什么

复制代码

wtfitis · 发表于 2021-6-9 17:41:45

不能用pre节点。。只能直接跳过获取最终的text()

wtfitis · 发表于 2021-6-9 18:03:48

wp231957 发表于 2021-6-9 17:41
因为被解析成了不要问我为什么

谢谢大佬。。真神奇

账号		自动登录	找回密码
密码			立即注册