怎么定时爬取纯文字网页的特定数字
因为工作需要,我想每3分钟就提取一次这两个数字,代码写到这里就不会了,希望各位大佬指点指点这是目前我写的代码
这是我要提取的数字
目前只会把网页的所有字符都打印出来,尝试用re.compile提取想要的内容却一直报错
还有每三分钟提取一次也不会,希望大家教教我 这样试试?用time来休眠
import requests
import re
import time
url='https://filscoutv3api.ipfsunion.cn/network/overview/'
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36'}
while True:
response = requests.get(url, headers=headers)
html_str=response.content.decode()
# print(html_str)
p1=re.compile('"current_fil_str":"(.*?) FIL"')
result1=p1.findall(html_str)
p2=re.compile('"pledge_collateral":"(.*?)",')
result2=p2.findall(html_str)
print(result1,result2)
time.sleep(10)#设定休眠十秒,十秒后重新运行获取数据
页:
[1]