关于爬取 新冠病毒疫情网的几个小问题
1、我想要 全球几个大的国家的 历史数据(包含中国) 应该去哪个网站2、具体数据格式大致如下:
国家名 日期 确诊数 死亡数治愈数 死亡率治愈率 等等
2月1日 (不一定是这个日期,举个例子)
2月2日
2月3日
。。。
。。。
8月10日 只能帮助你第一个问题
全历史
https://www.allhistory.com/ 百度、腾讯网疫情页面上自己爬,网站中有个大神写过爬取腾讯里边的程序(当时疫情数据腾讯的是在js文件中,百度是在源代码中),你可以看看。 Chysial 发表于 2020-8-10 09:11
百度、腾讯网疫情页面上自己爬,网站中有个大神写过爬取腾讯里边的程序(当时疫情数据腾讯的是在js文件中, ...
好吧,自己写了一个
import xlwt
import pandas as pd
import requests
urla="https://api.inews.qq.com/newsqa/v1/automation/foreign/daily/list?country="
ct=["美国","巴西","秘鲁","印度","俄罗斯","南非","墨西哥"]
lst=[]
for x in range(len(ct)):
url=urla+ct+"&"
res=requests.get(url)
base=res.json()["data"]
for k in range(len(base)):
zd={}
zd["国家"]=ct
zd["日期"]=base["date"]
zd["确诊增加"]=base["confirm_add"]
zd["累计确诊数"]=base["confirm"]
zd["治愈数"]=base["heal"]
zd["死亡数"]=base["dead"]
lst.append(zd)
pf = pd.DataFrame(lst)
file_path = pd.ExcelWriter('新冠海外历史数据.xlsx')
pf.to_excel(file_path,encoding = 'utf-8',index = False)
file_path.save()
print("数据导出完毕 ")
页:
[1]