|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
import requests
import re
url='https://hf.lianjia.com/ershoufang/pg1' #链家网第一页
headers={'User-Agent':'Mozilla/5.0'}
respone=requests.get(url,headers=headers)
respone.encoding='utf-8'
s=respone.text #将爬取到的页面赋值给s
#print(s)
p=re.compile('<div class="info clear">.*?</div>(.*?)<div class="positionInfo">.*?<span class="taxfreen">.*?</div>(.*?)<div class="totalPrice">',re.S) #正则匹配二手房的小区和价格
print(re.findall(s))
#这是爬取链家网第一页的房源和价格 写出正则表达式之后,一直出现这个错误 TypeError: findall() missing 1 required positional argument: 'string' 但是findall里面明显给了s,s也是个字符串啊,为啥啊 |
|