关于爬取新冠病毒疫情网的几个小问题,Python交流,编程语言专区,鱼C论坛

wp231957 发表于 2020-8-10 06:50:52

关于爬取新冠病毒疫情网的几个小问题

1、我想要全球几个大的国家的历史数据（包含中国）应该去哪个网站
2、具体数据格式大致如下：
国家名日期确诊数死亡数治愈数死亡率治愈率等等
         2月1日（不一定是这个日期，举个例子）
         2月2日
         2月3日
         。。。
         。。。
         8月10日

shouzhuabing 发表于 2020-8-10 08:52:34

只能帮助你第一个问题
全历史
https://www.allhistory.com/

Chysial 发表于 2020-8-10 09:11:05

百度、腾讯网疫情页面上自己爬，网站中有个大神写过爬取腾讯里边的程序（当时疫情数据腾讯的是在js文件中，百度是在源代码中），你可以看看。

wp231957 发表于 2020-8-10 09:26:31

Chysial 发表于 2020-8-10 09:11
百度、腾讯网疫情页面上自己爬，网站中有个大神写过爬取腾讯里边的程序（当时疫情数据腾讯的是在js文件中， ...

好吧，自己写了一个

import xlwt
import pandas as pd
import requests

urla="https://api.inews.qq.com/newsqa/v1/automation/foreign/daily/list?country="
ct=["美国","巴西","秘鲁","印度","俄罗斯","南非","墨西哥"]

lst=[]
for x in range(len(ct)):
url=urla+ct+"&"
res=requests.get(url)
base=res.json()["data"]
for k in range(len(base)):
   zd={}
   zd["国家"]=ct
   zd["日期"]=base["date"]
   zd["确诊增加"]=base["confirm_add"]
   zd["累计确诊数"]=base["confirm"]
   zd["治愈数"]=base["heal"]
   zd["死亡数"]=base["dead"]
   lst.append(zd)

pf = pd.DataFrame(lst)
file_path = pd.ExcelWriter('新冠海外历史数据.xlsx')
pf.to_excel(file_path,encoding = 'utf-8',index = False)
file_path.save()
print("数据导出完毕 ")

页: [1]

鱼C论坛's Archiver

关于爬取 新冠病毒疫情网的几个小问题

关于爬取新冠病毒疫情网的几个小问题