马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
当网页结构是这样子的<tr class="tr_2">
<td><div>...2020-2-5</div></td>
<td>...</td>
<td>...</td>
</tr>
<tr>
<td><div>...2020-2-4</div></td>
<td>...</td>
<td>...</td>
</tr>
<tr class="tr_2">
<td><div>...2020-2-3</div></td>
<td>...</td>
<td>...</td>
</tr>
<tr>
<td><div>...2020-2-2</div></td>
<td>...</td>
<td>...</td>
</tr>
怎么爬取内容不遗漏呢
我是这么写的 daily = html.xpath('//tr[contains(@class,"tr_2")]/td[1]/div/text()')
print(daily)
但是只能爬取到<tr class="tr_2">内的内容,相当于爬取一个跳一个了,求助各位大佬
最常用的就是 //tr 这样的呀,匹配所有叫 tr 的标签(节点)。
方括号[...]是起到 进一步过滤的作用……
|