鱼C论坛

 找回密码
 立即注册
查看: 1625|回复: 3

[已解决]请问为什么一直返回空列表

[复制链接]
发表于 2021-6-6 17:13:33 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import requests
from lxml import etree

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36"}

def main(x):
    response = requests.get(f"https://shenzhen.qfang.com/sale/f{x}",headers=headers)
    response.encoding="utf-8"
    selectors=etree.HTML(response.text)

    ul_li_div_div_a_text=selectors.xpath("//ul/li/div/div/a/text()")

    print(ul_li_div_div_a_text)


请问为什么一直显示返回的是空列表   网页代码中没有tbody。我用的也是相对路径。 百思不得其解


                               
登录/注册后可看大图
最佳答案
2021-6-6 19:56:03


你打印下 print(response.text) 就知道了,页面是通过 JS 加载的

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-6-6 17:14:25 | 显示全部楼层
https://shenzhen.qfang.com/sale/f1
爬取的是这个网站的二手房的标题
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-6-6 19:56:03 | 显示全部楼层    本楼为最佳答案   


你打印下 print(response.text) 就知道了,页面是通过 JS 加载的

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-6-6 20:21:54 | 显示全部楼层
初步判断 是cookie加密  不是简单爬取
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-15 13:08

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表