鱼C论坛

 找回密码
 立即注册
查看: 2790|回复: 3

Python爬虫获取超链接遇到的问题

[复制链接]
发表于 2020-1-9 22:16:54 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
图片:
微信图片_20200109215335.png


代码:
href_list = xmlContent.xpath("//ul[@id='pins']/li/a/@href")


如图所示,我是爬虫爬到的超链接,但是完整的超链接应该是https://www.5aav.com/xgmv/1953.htm,请问怎么样才能获取完整的超链接,爬取的超链接的类型是<class 'lxml.etree._ElementUnicodeResult'>,不能直接字符串相加

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-1-13 14:09:18 | 显示全部楼层
不拼接,恐怕是不行吧
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-1-13 14:23:49 | 显示全部楼层
只能拼接,你说的需要转换  而且你也没有代码  
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-1-13 17:20:33 | 显示全部楼层
数据最终都不处理的吗?   采集下来拼接,很正常的啊,你说对象是<class 'lxml.etree._ElementUnicodeResult'>,哪你最终保存数据,请求的url都是这个对象吗?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-21 18:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表