Python爬虫获取超链接遇到的问题

18200792307 · 发表于 2020-1-9 22:16:54

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

图片:

代码:
href_list = xmlContent.xpath("//ul[@id='pins']/li/a/@href")

如图所示，我是爬虫爬到的超链接，但是完整的超链接应该是https://www.5aav.com/xgmv/1953.htm，请问怎么样才能获取完整的超链接，爬取的超链接的类型是<class 'lxml.etree._ElementUnicodeResult'>，不能直接字符串相加

快速收敛 · 发表于 2020-1-13 14:09:18

不拼接，恐怕是不行吧

wp231957 · 发表于 2020-1-13 14:23:49

只能拼接，你说的需要转换而且你也没有代码

Stubborn · 发表于 2020-1-13 17:20:33

数据最终都不处理的吗？

采集下来拼接，很正常的啊，你说对象是<class 'lxml.etree._ElementUnicodeResult'>，哪你最终保存数据，请求的url都是这个对象吗？

账号		自动登录	找回密码
密码			立即注册

Python爬虫获取超链接遇到的问题

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块