wp231957 发表于 2020-8-10 06:50:52

关于爬取 新冠病毒疫情网的几个小问题

1、我想要 全球几个大的国家的 历史数据(包含中国) 应该去哪个网站
2、具体数据格式大致如下:
国家名   日期   确诊数   死亡数治愈数   死亡率治愈率   等等
            2月1日   (不一定是这个日期,举个例子)
            2月2日
            2月3日
            。。。
            。。。
            8月10日

shouzhuabing 发表于 2020-8-10 08:52:34

只能帮助你第一个问题
全历史
https://www.allhistory.com/

Chysial 发表于 2020-8-10 09:11:05

百度、腾讯网疫情页面上自己爬,网站中有个大神写过爬取腾讯里边的程序(当时疫情数据腾讯的是在js文件中,百度是在源代码中),你可以看看。

wp231957 发表于 2020-8-10 09:26:31

Chysial 发表于 2020-8-10 09:11
百度、腾讯网疫情页面上自己爬,网站中有个大神写过爬取腾讯里边的程序(当时疫情数据腾讯的是在js文件中, ...

好吧,自己写了一个

import xlwt
import pandas as pd
import requests

urla="https://api.inews.qq.com/newsqa/v1/automation/foreign/daily/list?country="
ct=["美国","巴西","秘鲁","印度","俄罗斯","南非","墨西哥"]

lst=[]
for x in range(len(ct)):
    url=urla+ct+"&"
    res=requests.get(url)
    base=res.json()["data"]
    for k in range(len(base)):
      zd={}
      zd["国家"]=ct
      zd["日期"]=base["date"]
      zd["确诊增加"]=base["confirm_add"]
      zd["累计确诊数"]=base["confirm"]
      zd["治愈数"]=base["heal"]
      zd["死亡数"]=base["dead"]
      lst.append(zd)

pf = pd.DataFrame(lst)
file_path = pd.ExcelWriter('新冠海外历史数据.xlsx')
pf.to_excel(file_path,encoding = 'utf-8',index = False)
file_path.save()
print("数据导出完毕 ")
页: [1]
查看完整版本: 关于爬取 新冠病毒疫情网的几个小问题