如何通过xpath来获取网页中没有属性的字段呢,Python交流,编程语言专区,鱼C论坛

cdzjf 发表于 2020-6-6 15:37:40

如何通过xpath来获取网页中没有属性的字段呢

<td>

56

</td>

类似这样的，试过用定位/td/text()或者*都得不到任何数据

Twilight6 发表于 2020-6-6 15:39:46

往上找父节点应该有

你网站发下看看

xiaosi4081 发表于 2020-6-6 15:40:30

本帖最后由 xiaosi4081 于 2020-6-6 15:43 编辑

用BeautifulSoup
from bs4 import BeautifulSoup
soup = BeautifulSoup(res.text,'html-parser')
target = soup.find("td")

xiaosi4081 发表于 2020-6-6 15:42:05

发下网站看看

cdzjf 发表于 2020-6-6 15:43:24

Twilight6 发表于 2020-6-6 15:39
往上找父节点应该有

你网站发下看看

</td>
<td><a href="show.php?uid=3011" class="bl">劈柴</a><div class="f12"><span class="s3" title="7 小時前 - 2020-06-06">今天 08:13</span></div></td>
<td>

23

</td>
<td><a href="read.php?tid=907040&fpage=1#a" class="f10"> 2020-06-06 15:27 </a><br />by: 我足</td>
</tr>

<tr class="tr3 t_one tac">
<td>

<span class='s3'>66</span>

</td>

cdzjf 发表于 2020-6-6 15:44:09

......

xiaosi4081 发表于 2020-6-6 15:45:34

soup = BeautifulSoup(res.text,'lxml')
target = soup.find("td").next_sibling

Twilight6 发表于 2020-6-6 15:46:15

cdzjf 发表于 2020-6-6 15:44
......

发网址吧...是不方便吗？

Twilight6 发表于 2020-6-6 15:50:05

cdzjf 发表于 2020-6-6 15:43
劈柴今天 08:13

你在往上找肯定有父节点你开头都是</td> 上面肯定还有内容

xiaosi4081 发表于 2020-6-6 15:59:56

测试....(为什么老被审{:10_266:})

suchocolate 发表于 2020-6-6 16:00:49

发网址

qiuyouzhi 发表于 2020-6-6 16:49:09

/td//text()

页: [1]

鱼C论坛's Archiver

如何通过xpath来获取网页中没有属性的字段呢