鱼C论坛

 找回密码
 立即注册
查看: 2366|回复: 1

怎么定时爬取纯文字网页的特定数字

[复制链接]
发表于 2020-10-28 17:48:31 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
因为工作需要,我想每3分钟就提取一次这两个数字,代码写到这里就不会了,希望各位大佬指点指点

这是目前我写的代码

Screenshot 2020-10-28 173819.png

这是我要提取的数字
1603878205(1).png

目前只会把网页的所有字符都打印出来,尝试用re.compile提取想要的内容却一直报错

还有每三分钟提取一次也不会,希望大家教教我
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-10-28 18:24:46 | 显示全部楼层
这样试试?用time来休眠
import requests
import re
import time

url='https://filscoutv3api.ipfsunion.cn/network/overview/'
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36'}

while True:
    response = requests.get(url, headers=headers)
    html_str=response.content.decode()
    # print(html_str)
    p1=re.compile('"current_fil_str":"(.*?) FIL"')
    result1=p1.findall(html_str)[0]
    p2=re.compile('"pledge_collateral":"(.*?)",')
    result2=p2.findall(html_str)[0]
    print(result1,result2)
    time.sleep(10)#设定休眠十秒,十秒后重新运行获取数据

评分

参与人数 1荣誉 +1 收起 理由
小甲鱼的铁粉 + 1 鱼C有你更精彩^_^

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-18 04:40

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表