[已解决]为何soup.find()无法找到<td></td>标签？

John2430 · 发表于 2017-10-21 14:42:54

您需要登录才可以下载或查看，没有账号？立即注册

x

import requests
import bs4
hd = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}
res = requests.get('http://sc.hkexnews.hk/TuniS/www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=hk',headers = hd)
html = res.text
soup = bs4.BeautifulSoup(html,'html.parser')
soup.prettify()
node = soup.find('td',attrs = {'class':'arial12black'},string = '长和')
print(node)

复制代码

运行结果为None，为何找不到含有字符串"长和"的td标签？

最佳答案

chakyam

2017-10-21 17:00:17

复制代码

import requests
import bs4
import re
hd = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}
res = requests.get('http://sc.hkexnews.hk/TuniS/www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=hk',headers = hd)
html = res.text
soup = bs4.BeautifulSoup(html,'html.parser')
soup.prettify()
node = soup.find('td',attrs = {'class':'arial12black'},string = re.compile('长和'))
print(node)

复制代码

chakyam · 发表于 2017-10-21 17:00:17

复制代码

import requests
import bs4
import re
hd = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}
res = requests.get('http://sc.hkexnews.hk/TuniS/www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=hk',headers = hd)
html = res.text
soup = bs4.BeautifulSoup(html,'html.parser')
soup.prettify()
node = soup.find('td',attrs = {'class':'arial12black'},string = re.compile('长和'))
print(node)

复制代码

John2430 · 发表于 2017-10-23 14:36:50

chakyam 发表于 2017-10-21 17:00

请问高手，为什么要用正则表达式去匹配，是不是字符串里面含有空格？

chakyam · 发表于 2017-10-23 17:22:24

John2430 发表于 2017-10-23 14:36
请问高手，为什么要用正则表达式去匹配，是不是字符串里面含有空格？

我猜如果填字符串而不是正则表达式的话需要完全匹配才会返回结果，我学bs不是很久，不是很清楚它的匹配机制

账号		自动登录	找回密码
密码			立即注册