怎么定时爬取纯文字网页的特定数字

我找甲鱼学py · 发表于 2020-10-28 17:48:31

您需要登录才可以下载或查看，没有账号？立即注册

x

因为工作需要，我想每3分钟就提取一次这两个数字，代码写到这里就不会了，希望各位大佬指点指点

这是目前我写的代码
Screenshot 2020-10-28 173819.png

这是我要提取的数字

目前只会把网页的所有字符都打印出来，尝试用re.compile提取想要的内容却一直报错

还有每三分钟提取一次也不会，希望大家教教我

疾风怪盗 · 发表于 2020-10-28 18:24:46

这样试试？用time来休眠

import requests
import re
import time
url='https://filscoutv3api.ipfsunion.cn/network/overview/'
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36'}
while True:
response = requests.get(url, headers=headers)
html_str=response.content.decode()
# print(html_str)
p1=re.compile('"current_fil_str":"(.*?) FIL"')
result1=p1.findall(html_str)[0]
p2=re.compile('"pledge_collateral":"(.*?)",')
result2=p2.findall(html_str)[0]
print(result1,result2)
time.sleep(10)#设定休眠十秒，十秒后重新运行获取数据

复制代码

账号		自动登录	找回密码
密码			立即注册