|
发表于 2023-9-19 21:03:27
|
显示全部楼层
根据您提供的代码,需要注意的是 ht.xpath() 方法中使用的 XPath 表达式存在问题。具体来说,//*[@id="newest" and @class="column-list"]/li 这个 XPath 表达式是不正确的。
为了解决问题,您可以尝试使用以下更新后的代码:
- from lxml import etree
- def geturl(r):
- ht = etree.HTML(r.content)
- li = ht.xpath('//*[@id="newest" and contains(@class, "column-list")]/li')
- print(li)
- for i in range(1, 3):
- r = s.get('https://news.fx678.com/author/159/' + str(i) + '.html')
- geturl(r)
复制代码
更新后的代码遵循以下几点:
1. 引入了 lxml 库,用于解析 HTML 内容。
2. 修正了 ht.xpath() 中的 XPath 表达式,使用 contains() 函数来进行部分匹配。
3. 将 print(ht) 移动到 geturl() 方法中,以便在处理每个请求时打印正确的结果。
请注意确认您是否已正确安装了 lxml 库,并根据需要进行其他必要的导入和初始化。此外,确保您的网络连接正常,且网页内容在指定路径下有效。
此内容为ChatGPT(AI)回答,若有错误多多包涵,如果对你有帮助,请设置一个最佳答案! |
|