|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
我在爬取一个股票编号的网站中,用正则匹配在空列表中添加获取的编号的时候,开始和最后一直会存入一些空的列表,这是为什么,空列表没法匹配吧?还有为什么存进去的是列表不是字符串呢?求助
- import requests
- from bs4 import BeautifulSoup
- import re
- url = 'http://quote.eastmoney.com/stocklist.html'
- head = {"user-agent":"Mozilla/5.0"}
- r = requests.get(url,headers = head)
- r.raise_for_status()
- r.encoding = r.apparent_encoding
- demo = r.text
- soup = BeautifulSoup(demo,'html.parser')
- a = soup.find_all('a')
- list = []
- for each in a:
- try:
- href = each.attrs['href']
- list.append(re.findall(r'[s][z]\d{6}',href))
- except:
- continue
- for each in list:
- print(str(each))
- print('打印完毕!')
- input()
复制代码 |
-
输出结果
-
|