|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
最近刚开始接触爬虫这块,要学的东西还是挺多的,好多库都要用到,包括正则,乍一看就头大
不过还好,感觉挺好玩的,起码有点儿兴趣作支撑
当然代码很简单,就是随(故)便(意)找了个排行榜练练手。。。
(鱼哥好像有说过不能爬咱论坛来着 )
- # -*- coding: utf-8 -*-
- """
- Created on Wed Mar 3 18:26:35 2021
- 首次使用xpath
- @author: 昨非
- """
- import requests
- from fake_useragent import UserAgent
- from lxml import etree
- url = "https://fishc.com.cn/misc.php?mod=ranklist&type=member&view=credit&orderby=5"
- headers = {
- "User-Agent": UserAgent().chrome
- }
- response = requests.get(url, headers=headers)
- e = etree.HTML(response.text)
- #由网页源码而定*
- names = e.xpath('//div[@class="xld xlda hasrank"]/dl/dt/a/text()')
- values = e.xpath('//div[@class="xld xlda hasrank"]/dl/dd[3]/p/text()')
- #print(names)
- #print(values)
- for name, value in zip(names, values):
- print(name, value)
复制代码
|
评分
-
查看全部评分
|