我找甲鱼学py 发表于 2020-10-28 17:48:31

怎么定时爬取纯文字网页的特定数字

因为工作需要,我想每3分钟就提取一次这两个数字,代码写到这里就不会了,希望各位大佬指点指点

这是目前我写的代码


这是我要提取的数字


目前只会把网页的所有字符都打印出来,尝试用re.compile提取想要的内容却一直报错

还有每三分钟提取一次也不会,希望大家教教我

疾风怪盗 发表于 2020-10-28 18:24:46

这样试试?用time来休眠
import requests
import re
import time

url='https://filscoutv3api.ipfsunion.cn/network/overview/'
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36'}

while True:
    response = requests.get(url, headers=headers)
    html_str=response.content.decode()
    # print(html_str)
    p1=re.compile('"current_fil_str":"(.*?) FIL"')
    result1=p1.findall(html_str)
    p2=re.compile('"pledge_collateral":"(.*?)",')
    result2=p2.findall(html_str)
    print(result1,result2)
    time.sleep(10)#设定休眠十秒,十秒后重新运行获取数据
页: [1]
查看完整版本: 怎么定时爬取纯文字网页的特定数字