cdzjf 发表于 2020-6-6 15:37:40

如何通过xpath来获取网页中没有属性的字段呢

        <td>

        56

        </td>



类似这样的,试过用定位/td/text()或者*都得不到任何数据

Twilight6 发表于 2020-6-6 15:39:46

往上找父节点应该有

你网站发下看看

xiaosi4081 发表于 2020-6-6 15:40:30

本帖最后由 xiaosi4081 于 2020-6-6 15:43 编辑

用BeautifulSoup
from bs4 import BeautifulSoup
soup = BeautifulSoup(res.text,'html-parser')
target = soup.find("td")

xiaosi4081 发表于 2020-6-6 15:42:05

发下网站看看

cdzjf 发表于 2020-6-6 15:43:24

Twilight6 发表于 2020-6-6 15:39
往上找父节点应该有

你网站发下看看

</td>
        <td><a href="show.php?uid=3011" class="bl">劈柴</a><div class="f12"><span class="s3" title="7 小時前 - 2020-06-06">今天 08:13</span></div></td>
        <td>

        23

        </td>
        <td><a href="read.php?tid=907040&fpage=1#a" class="f10"> 2020-06-06 15:27 </a><br />by: 我足</td>
        </tr>

        <tr class="tr3 t_one tac">
        <td>

        <span class='s3'>66</span>


        </td>

cdzjf 发表于 2020-6-6 15:44:09

......

xiaosi4081 发表于 2020-6-6 15:45:34

soup = BeautifulSoup(res.text,'lxml')
target = soup.find("td").next_sibling

Twilight6 发表于 2020-6-6 15:46:15

cdzjf 发表于 2020-6-6 15:44
......

发网址吧...是不方便吗?

Twilight6 发表于 2020-6-6 15:50:05

cdzjf 发表于 2020-6-6 15:43
劈柴今天 08:13
       



你在往上找 肯定有父节点 你开头都是</td> 上面肯定还有内容

xiaosi4081 发表于 2020-6-6 15:59:56

测试....(为什么老被审{:10_266:})

suchocolate 发表于 2020-6-6 16:00:49

发网址

qiuyouzhi 发表于 2020-6-6 16:49:09

/td//text()
页: [1]
查看完整版本: 如何通过xpath来获取网页中没有属性的字段呢