鱼C论坛

 找回密码
 立即注册
查看: 1183|回复: 3

[已解决]关于爬取 新冠病毒疫情网的几个小问题

[复制链接]
发表于 2020-8-10 06:50:52 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
1、我想要 全球几个大的国家的 历史数据(包含中国) 应该去哪个网站
2、具体数据格式大致如下:
国家名   日期     确诊数   死亡数  治愈数   死亡率  治愈率   等等
              2月1日   (不一定是这个日期,举个例子)
              2月2日
              2月3日
              。。。
              。。。
              8月10日
最佳答案
2020-8-10 09:11:05
百度、腾讯网疫情页面上自己爬,网站中有个大神写过爬取腾讯里边的程序(当时疫情数据腾讯的是在js文件中,百度是在源代码中),你可以看看。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-8-10 08:52:34 | 显示全部楼层
只能帮助你第一个问题
全历史
https://www.allhistory.com/
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-10 09:11:05 | 显示全部楼层    本楼为最佳答案   
百度、腾讯网疫情页面上自己爬,网站中有个大神写过爬取腾讯里边的程序(当时疫情数据腾讯的是在js文件中,百度是在源代码中),你可以看看。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-8-10 09:26:31 | 显示全部楼层
Chysial 发表于 2020-8-10 09:11
百度、腾讯网疫情页面上自己爬,网站中有个大神写过爬取腾讯里边的程序(当时疫情数据腾讯的是在js文件中, ...

好吧,自己写了一个
import xlwt
import pandas as pd
import requests

urla="https://api.inews.qq.com/newsqa/v1/automation/foreign/daily/list?country="
ct=["美国","巴西","秘鲁","印度","俄罗斯","南非","墨西哥"]

lst=[]
for x in range(len(ct)):
    url=urla+ct[x]+"&"
    res=requests.get(url)
    base=res.json()["data"]
    for k in range(len(base)):
        zd={}
        zd["国家"]=ct[x]
        zd["日期"]=base[k]["date"]
        zd["确诊增加"]=base[k]["confirm_add"]
        zd["累计确诊数"]=base[k]["confirm"]
        zd["治愈数"]=base[k]["heal"]
        zd["死亡数"]=base[k]["dead"]
        lst.append(zd)

pf = pd.DataFrame(lst)
file_path = pd.ExcelWriter('新冠海外历史数据.xlsx')
pf.to_excel(file_path,encoding = 'utf-8',index = False)
file_path.save()
print("数据导出完毕 ")
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-19 11:29

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表