[已解决]爬虫问题

wtfitis · 发表于 2021-9-14 16:24:21

oresp=requests.get(url="https://www.ncbi.nlm.nih.gov/biosample/SAMEA1030995",headers=headers)
print(oresp.text)
html1=etree.HTML(oresp.content)
htmldata1=html1.xpath('//div[@id="maincontent"]/div/div[5]/div/div[1]/dl[3]/dd/table/tbody/tr[2]/td/text()')

复制代码

为什么爬不出中间的'GP580'

最佳答案

suchocolate

2021-9-14 16:24:22

我尝试了etree，貌似读这个html会报错，用re取到了。

复制代码

suchocolate · 发表于 2021-9-14 16:24:22

我尝试了etree，貌似读这个html会报错，用re取到了。

复制代码

wtfitis · 发表于 2021-9-14 17:25:57

自己顶一下有没有帮帮我~

wtfitis · 发表于 2021-9-14 17:42:36

suchocolate 发表于 2021-9-14 16:24
我尝试了etree，貌似读这个html会报错，用re取到了。

其实我也用re解决了。。但还是想试试etree这种结构找到。。不过我没去试beautifulsoup。。应该可以

账号		自动登录	找回密码
密码			立即注册