鱼C论坛

 找回密码
 立即注册
查看: 2187|回复: 3

[原创] 爬取高考网历年分数线并可视化

[复制链接]
发表于 2020-5-1 12:54:09 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import requests
from lxml import etree
from pyecharts import options
from pyecharts.charts import Bar
from pypinyin import lazy_pinyin
def get(url):
    response = requests.get(url).content.decode('gbk')
    #print(response)
    html = etree.HTML(response)
    year=html.xpath('//th[@width="72"]/text()')[0:11]
    wenke=html.xpath('//tr[@class="c_blue"]/td/text()')[0:12]+html.xpath('//tr[@class="c_white"]/td/text()')[0:12]
    wen = []
    for i in wenke:
        i = i.replace('\r','').replace('\n','').replace('\t','')
        wen.append(i)
    like = html.xpath('//div[@class="cjArea tm15"]/table[last()]/tr[@class="c_blue"]/td/text()')[0:12]+html.xpath('//div[@class="cjArea tm15"]/table[last()]/tr[@class="c_white"]/td/text()')[0:12]
    li = []
    for i in like:
        i = i.replace('\r', '').replace('\n', '').replace('\t', '')
        li.append(i)
    visulize(pro,li,wen,year)
    pass
def visulize(pro,li,wen,year):
    wen1 = wen[1:12]
    wen2 = wen[13:24]
    li1 = li[1:12]
    li2 = li[13:24]
    c = Bar()  #生成条形图
    #添加x,y
    c.add_xaxis(year)
    c.add_yaxis('文科一本',wen1)
    c.add_yaxis('文科二本', wen2)
    c.add_yaxis('理科一本', li1)
    c.add_yaxis('理科二本', li2)
    c.set_global_opts(title_opts=options.TitleOpts(title=pro+"历年高考分数线",subtitle="2009-2019年"))
    c.render(pro+"历年高考分数线.html")
    pass
if __name__ == '__main__':
    pro = input('想要获得的省份:')
    prov = lazy_pinyin(pro)
    prov = "".join(prov)
    url = 'http://www.gaokao.com/'+prov+'/fsx/'
    get(url)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-7-10 16:34:04 | 显示全部楼层
我估计这是离我最近的可视化数据了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 16:46:19 | 显示全部楼层
想要获得的省份:湖南
C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\site-packages\pyecharts\charts\chart.py:14: PendingDeprecationWarning: pyecharts 所有图表类型将在 v1.9.0 版本开始强制使用 ChartItem 进行数据项配置 :)
  super().__init__(init_opts=init_opts)

Process finished with exit code 0
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-3 14:53:53 | 显示全部楼层
抱错呀,跑不起来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-22 11:57

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表