夏煜哥 发表于 2022-3-19 20:20:28

Python 爬虫:今天空气怎样?

        本人小菜鸟一个,今天无意瞥到中华人民共和国生态环境部网站(http://data.rmtc.org.cn:8080/gis/listtype0M.html),于是做了个爬虫爬取表格,用了requests(可以用urllib.request代替,要改部分代码)、bs4、openpyxl 3个第三方库,请提前用pip下载。
        注:openpyxl是用来编写表格的,不想太麻烦,可以用print直接输出
        from requests import *
from bs4 import BeautifulSoup
from openpyxl import *
import time
#获取网页(源代码),处理乱码
resp = get('http://data.rmtc.org.cn:8080/gis/listtype0M.html')
resp.encoding = 'utf-8'


#筛选数据
s = BeautifulSoup(resp.text, 'html.parser')

l1 =
l2 =
l3 =
#不想保存为表格,去掉引号,直接打印
'''
for i in range(len(l1)):
    print(l1, l2, l3)
'''
#保存为表格
wb = Workbook()
ws = wb.active
#表头
ws['A1'] = '地点'
ws['B1'] = '空气质量'
ws['C1'] = '时间'
#数据
bl = []
for i in range(len(l1)):
    bl.append((l1, l2, l3))

for x in bl:
    ws.append(x)

#文件名:因为每天都有数据,得做好区分(time)
st = list(time.localtime(time.time())[:3])
st[-1] = st[-1] - 1
#保存
wb.save('C://pythons(3.9)//hjzl//hjz1(1)' + str(tuple(st)) +'.xlsx')



        求大神指点、修改。同时感谢小甲鱼,把我从“0分小白”,变成小菜鸟,我会在编程领域更加努力,不负小甲鱼的期望!!!
页: [1]
查看完整版本: Python 爬虫:今天空气怎样?