dequantianhe 发表于 2020-6-1 12:40:37

用BeautifulSoup如何快速获取想要的文本值?

先上图:


我想分别获取图中红圈圈中的文本值,但显然这些值并不在具体的小标签内,而是在一个大标签内混着,我用的BeautifulSoup,
如果不考虑用正则表达式,有什么好的办法么?

xiaosi4081 发表于 2020-6-1 13:16:43

本帖最后由 xiaosi4081 于 2020-6-1 13:49 编辑

from bs4 import BeautifulSoup
soup = BeautifulSoup(res.text,'html-parser')
target = soup.find_all("span",class_="pl")
a = []
for each in target:
        each = each.replace('&nbsp','')
        a.append(each.text)
for i in a:
        print(i)


如果帮助到你了,记得给个最佳哦 {:10_287:}

xiaosi4081 发表于 2020-6-1 13:21:21

发个网址吧

Twilight6 发表于 2020-6-1 13:29:24

把这些全部匹配出来,然后for循环迭代匹配到的数据 用 replace 函数替换为 空字符串
new_response_list = []
for i in response:
    temp = i.replace(' ','')# 注意这里的分号,我不懂是中文还是英文的,你自己换着试试看
    new_response_list.append(temp)
页: [1]
查看完整版本: 用BeautifulSoup如何快速获取想要的文本值?