设为首页收藏本站

切换到窄版

鱼C论坛»论坛 › 编程语言专区 › Python交流 › 爬取免费简历模板

发新帖

查看: 2630|回复: 5

[已解决]爬取免费简历模板

发表于 2021-5-23 22:33:41 | 显示全部楼层本楼为最佳答案

这个最佳答案由 YunGuo 给出，感谢 YunGuo 的回答。

单击隐藏图章

你试下这段代码看能不能获取到url，如果可以获取到，那要么就是你代码问题，要么是多线程请求太频繁被网站限制了。

import requests
from lxml import etree
url = 'https://sc.chinaz.com/jianli/free.html'
headers = {
'User-Agent': 'Mozilla/5.0'
}
res = requests.get(url, headers=headers)
sel = etree.HTML(res.text)
urls = sel.xpath('//div[@id="main"]/div/div/a/@href')
for url_ in urls:
res1 = requests.get('https:'+url_, headers=headers)
sel1 = etree.HTML(res1.text)
down_url = sel1.xpath('//div[@id="down"]/div[2]/ul/li[1]/a/@href')[0]
print(down_url)
break

复制代码

小甲鱼最新课程 -> https://ilovefishc.com

回复支持反对

使用道具举报

发新帖

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-10-29 10:00

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表