鱼C论坛

 找回密码
 立即注册
查看: 1859|回复: 3

[原创] 爬取高考网历年分数线并可视化

[复制链接]
发表于 2020-5-1 12:54:09 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import requests
  2. from lxml import etree
  3. from pyecharts import options
  4. from pyecharts.charts import Bar
  5. from pypinyin import lazy_pinyin
  6. def get(url):
  7.     response = requests.get(url).content.decode('gbk')
  8.     #print(response)
  9.     html = etree.HTML(response)
  10.     year=html.xpath('//th[@width="72"]/text()')[0:11]
  11.     wenke=html.xpath('//tr[@class="c_blue"]/td/text()')[0:12]+html.xpath('//tr[@class="c_white"]/td/text()')[0:12]
  12.     wen = []
  13.     for i in wenke:
  14.         i = i.replace('\r','').replace('\n','').replace('\t','')
  15.         wen.append(i)
  16.     like = html.xpath('//div[@class="cjArea tm15"]/table[last()]/tr[@class="c_blue"]/td/text()')[0:12]+html.xpath('//div[@class="cjArea tm15"]/table[last()]/tr[@class="c_white"]/td/text()')[0:12]
  17.     li = []
  18.     for i in like:
  19.         i = i.replace('\r', '').replace('\n', '').replace('\t', '')
  20.         li.append(i)
  21.     visulize(pro,li,wen,year)
  22.     pass
  23. def visulize(pro,li,wen,year):
  24.     wen1 = wen[1:12]
  25.     wen2 = wen[13:24]
  26.     li1 = li[1:12]
  27.     li2 = li[13:24]
  28.     c = Bar()  #生成条形图
  29.     #添加x,y
  30.     c.add_xaxis(year)
  31.     c.add_yaxis('文科一本',wen1)
  32.     c.add_yaxis('文科二本', wen2)
  33.     c.add_yaxis('理科一本', li1)
  34.     c.add_yaxis('理科二本', li2)
  35.     c.set_global_opts(title_opts=options.TitleOpts(title=pro+"历年高考分数线",subtitle="2009-2019年"))
  36.     c.render(pro+"历年高考分数线.html")
  37.     pass
  38. if __name__ == '__main__':
  39.     pro = input('想要获得的省份:')
  40.     prov = lazy_pinyin(pro)
  41.     prov = "".join(prov)
  42.     url = 'http://www.gaokao.com/'+prov+'/fsx/'
  43.     get(url)
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-7-10 16:34:04 | 显示全部楼层
我估计这是离我最近的可视化数据了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 16:46:19 | 显示全部楼层
  1. 想要获得的省份:湖南
  2. C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\site-packages\pyecharts\charts\chart.py:14: PendingDeprecationWarning: pyecharts 所有图表类型将在 v1.9.0 版本开始强制使用 ChartItem 进行数据项配置 :)
  3.   super().__init__(init_opts=init_opts)

  4. Process finished with exit code 0
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-3 14:53:53 | 显示全部楼层
抱错呀,跑不起来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-25 07:59

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表