|
发表于 2021-11-15 15:38:35
|
显示全部楼层
本楼为最佳答案
估计操作太频繁了,每次操作不要太频繁。
用下面的代码试了下,如果不加time.sleep, 15次之后就拿不到了,你的代码如果有重复的get操作,记得加time.sleep.
- import requests
- import re
- import time
- url = 'https://sz.fang.lianjia.com/loupan/'
- headers = {
- 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36'}
- for i in range(100):
- print('='*50, i, '='*50)
- time.sleep(0.3)
- r = requests.get(url, headers=headers) # headers要调用
- money = re.findall(r'<span class="number">([^%]*?)</span>', r.text)
- print(money)
复制代码 |
|