鱼C论坛

 找回密码
 立即注册
查看: 1392|回复: 3

[已解决]关于爬取 新冠病毒疫情网的几个小问题

[复制链接]
发表于 2020-8-10 06:50:52 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
1、我想要 全球几个大的国家的 历史数据(包含中国) 应该去哪个网站
2、具体数据格式大致如下:
国家名   日期     确诊数   死亡数  治愈数   死亡率  治愈率   等等
              2月1日   (不一定是这个日期,举个例子)
              2月2日
              2月3日
              。。。
              。。。
              8月10日
最佳答案
2020-8-10 09:11:05
百度、腾讯网疫情页面上自己爬,网站中有个大神写过爬取腾讯里边的程序(当时疫情数据腾讯的是在js文件中,百度是在源代码中),你可以看看。
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-8-10 08:52:34 | 显示全部楼层
只能帮助你第一个问题
全历史
https://www.allhistory.com/
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-10 09:11:05 | 显示全部楼层    本楼为最佳答案   
百度、腾讯网疫情页面上自己爬,网站中有个大神写过爬取腾讯里边的程序(当时疫情数据腾讯的是在js文件中,百度是在源代码中),你可以看看。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-8-10 09:26:31 | 显示全部楼层
Chysial 发表于 2020-8-10 09:11
百度、腾讯网疫情页面上自己爬,网站中有个大神写过爬取腾讯里边的程序(当时疫情数据腾讯的是在js文件中, ...

好吧,自己写了一个

  1. import xlwt
  2. import pandas as pd
  3. import requests

  4. urla="https://api.inews.qq.com/newsqa/v1/automation/foreign/daily/list?country="
  5. ct=["美国","巴西","秘鲁","印度","俄罗斯","南非","墨西哥"]

  6. lst=[]
  7. for x in range(len(ct)):
  8.     url=urla+ct[x]+"&"
  9.     res=requests.get(url)
  10.     base=res.json()["data"]
  11.     for k in range(len(base)):
  12.         zd={}
  13.         zd["国家"]=ct[x]
  14.         zd["日期"]=base[k]["date"]
  15.         zd["确诊增加"]=base[k]["confirm_add"]
  16.         zd["累计确诊数"]=base[k]["confirm"]
  17.         zd["治愈数"]=base[k]["heal"]
  18.         zd["死亡数"]=base[k]["dead"]
  19.         lst.append(zd)

  20. pf = pd.DataFrame(lst)
  21. file_path = pd.ExcelWriter('新冠海外历史数据.xlsx')
  22. pf.to_excel(file_path,encoding = 'utf-8',index = False)
  23. file_path.save()
  24. print("数据导出完毕 ")
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-25 04:45

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表