遥控电香蕉 发表于 2020-5-10 20:06:28

python爬虫正则表达式、bs4用法

    for each in soup.find_all(href=re.compile("view")):
      print(each.text)
这段代码中href=re.compile("view")让我很迷惑。re.compile("view")是匹配规则,那么匹配出来的应该只是view为什么会返回整条内容,href=re.compile("view")这么看不应该是href被赋予了匹配规则么?为什么换成class或是其他的就不行了。
是不是可以理解成find_all找到所有的href中含有pa的内容?
正则和bs看的我很迷惑,真心求助

Twilight6 发表于 2020-5-10 22:10:49

emmm 没怎么用compile,python 的正则里面不是现在都自带compile了嘛,

qiangqiang1 发表于 2020-5-11 14:08:42

href=re.compile("view")
for each in soup.find_all(href):
      print(each.text)
这样试一下呢

遥控电香蕉 发表于 2020-5-11 19:56:30

qiangqiang1 发表于 2020-5-11 14:08
href=re.compile("view")
for each in soup.find_all(href):
      print(each.text)


不行哦,什么都没有

遥控电香蕉 发表于 2020-5-11 19:57:02

Twilight6 发表于 2020-5-10 22:10
emmm 没怎么用compile,python 的正则里面不是现在都自带compile了嘛,

还真不知道,刚开始学这部分,学傻了
页: [1]
查看完整版本: python爬虫正则表达式、bs4用法