用BeautifulSoup如何快速获取想要的文本值？

dequantianhe · 发表于 2020-6-1 12:40:37

先上图：

我想分别获取图中红圈圈中的文本值，但显然这些值并不在具体的小标签内，而是在一个大标签内混着，我用的BeautifulSoup，
如果不考虑用正则表达式，有什么好的办法么？

xiaosi4081 · 发表于 2020-6-1 13:16:43

本帖最后由 xiaosi4081 于 2020-6-1 13:49 编辑

from bs4 import BeautifulSoup
soup = BeautifulSoup(res.text,'html-parser')
target = soup.find_all("span",class_="pl")
a = []
for each in target:
each = each.replace('&nbsp','')
a.append(each.text)
for i in a:
print(i)

复制代码

如果帮助到你了，记得给个最佳哦

xiaosi4081 · 发表于 2020-6-1 13:21:21

发个网址吧

Twilight6 · 发表于 2020-6-1 13:29:24

把这些全部匹配出来，然后for循环迭代匹配到的数据用 replace 函数替换为空字符串

new_response_list = []

for i in response:

temp = i.replace(' ','') # 注意这里的分号，我不懂是中文还是英文的，你自己换着试试看

new_response_list.append(temp)
复制代码

账号		自动登录	找回密码
密码			立即注册