a870950142 发表于 2022-11-13 13:08:44

爬爬爬虫反回空列表

import requests
from lxml import etree
url='网址baishan.zbj.com/search/service/?l=0&kw=saas&r=2'
resp=requests.get(url)
#print(resp.status_code)
html=etree.HTML(resp.text)
divs=html.xpath('/html/body/div/div/div/div/div/div/div')
print(divs)

返回空列表怎么解决啊

Twilight6 发表于 2022-11-13 13:21:12



你的 url 网址都不正确,肯定返回的空列表

a870950142 发表于 2022-11-13 13:27:26

Twilight6 发表于 2022-11-13 13:21
你的 url 网址都不正确,肯定返回的空列表

没权限发链接,汉字’网址‘改成https://

Twilight6 发表于 2022-11-13 13:58:43

a870950142 发表于 2022-11-13 13:27
没权限发链接,汉字’网址‘改成https://


你可以将代码写在代码块里,就是编辑器的 <> 图标处插入代码,你想爬这个网站的哪部分内容?爬取标题参考代码:

import requests
from lxml import etree

url = 'https://baishan.zbj.com/search/service/?l=0&kw=saas&r=2'
resp = requests.get(url)
# print(resp.status_code)
html = etree.HTML(resp.text)
divs = html.xpath('//div[@class="name-pic-box"]/a')
print(divs)

for i in divs:
    print(i.xpath('string(.)'))

a870950142 发表于 2022-11-13 14:30:03

Twilight6 发表于 2022-11-13 13:58
你可以将代码写在代码块里,就是编辑器的图标处插入代码,你想爬这个网站的哪部分内容?爬取标题参考 ...

明白了,我还刚开始学,只是在练习。
也就是说我刚才的问题出现在路径定位上了吗?
我看我的路径选择是没错的啊,为什么输出空列表了呢?

Twilight6 发表于 2022-11-14 11:14:09

a870950142 发表于 2022-11-13 14:30
明白了,我还刚开始学,只是在练习。
也就是说我刚才的问题出现在路径定位上了吗?
我看我的路径选择是 ...



返回空内容大概率是定位上出问题了,另外还有可能是因为 html 内容是异步加载的

页: [1]
查看完整版本: 爬爬爬虫反回空列表