[已解决]xpath节点选择问题！！

kerwin_lui · 发表于 2018-5-16 23:13:00

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import requests
import urllib
import re
from lxml import etree
url = "http://zj.offcn.com/zg/skzcj/"
url_html = requests.get(url).text
treeurl = etree.HTML(url_html)
#final_url = etree.tostring(treeurl).decode('utf-8')
condition = "//div[@class='xc'][1]//a[1]/@href"
xx = treeurl.xpath(condition)
print(xx)

复制代码

以下是输出：

['http://zj.offcn.com/html/2018/03/225510.html',
'http://zj.offcn.com/html/2018/03/225509.html',
'http://zj.offcn.com/html/2018/03/225508.html',
'http://zj.offcn.com/html/2018/03/225507.html',
'http://zj.offcn.com/html/2018/03/225506.html',
'http://zj.offcn.com/html/2018/03/225505.html',
'http://zj.offcn.com/html/2018/03/225504.html',
'http://zj.offcn.com/html/2018/03/225503.html',
'http://zj.offcn.com/html/2018/03/225502.html',
'http://zj.offcn.com/html/2018/03/225501.html',
'http://zj.offcn.com/html/2018/03/225500.html',
'http://zj.offcn.com/html/2018/03/225499.html',
'http://zj.offcn.com/html/2018/03/225498.html']

为什么选出这么多条？我明明写了a[1]

最佳答案

月排行榜 / 总排行榜

mongoole

2018-5-17 09:52:38

condition = "//div[@class='xc'][1]//a[1]/@href"

复制代码

此处的下一级应该是：

//div[@class='xc'][1]//li[1]/a/@href

复制代码

非常欣赏楼主自己写xpath路径

！要是觉得自己写的稍微有点出入的话，可以借助浏览器的xpath插件来对比验证一下

跳转到最佳答案楼层

mongoole · 发表于 2018-5-17 09:52:38

这个最佳答案由 mongoole 给出，感谢 mongoole 的回答。

单击隐藏图章

condition = "//div[@class='xc'][1]//a[1]/@href"

复制代码

此处的下一级应该是：

//div[@class='xc'][1]//li[1]/a/@href

复制代码

非常欣赏楼主自己写xpath路径

！要是觉得自己写的稍微有点出入的话，可以借助浏览器的xpath插件来对比验证一下

kerwin_lui · 发表于 2018-5-17 10:39:03

感谢感谢，这个方法可以正确筛选！！

自己刚学的xpath，感觉自己犯了很低级的错误，见笑啦哈哈哈哈哈哈哈哈哈

不知道您说的浏览器xpath插件是什么意思？

mongoole · 发表于 2018-5-18 06:43:58

这个插件能帮助你更快捷的找出目标的'xpath'

账号		自动登录	找回密码
密码			立即注册