jump_p 发表于 2020-6-7 10:25:05

beautiful soup和 lxml

本帖最后由 jump_p 于 2020-6-8 12:31 编辑

from bs4 import BeautifulSoup
import lxml

soup = BeautifulSoup('<p>Hello</p>','lxml')
print(soup.p.string)

既然beautiful soup和 lxml 都是解析库,为什么beautiful soup对象还需要lxml来解析呢?如以上这个例子

qiuyouzhi 发表于 2020-6-7 10:32:57

那个是选择用什么解析器解析,bs4其实就是一个封装好的更高级的解析器。

jump_p 发表于 2020-6-7 10:50:45

qiuyouzhi 发表于 2020-6-7 10:32
那个是选择用什么解析器解析,bs4其实就是一个封装好的更高级的解析器。

嗯,我知道是选择lxml解析器,但bs4自己不就是解析器吗,为啥还要选择别的解析器

qiuyouzhi 发表于 2020-6-7 12:52:24

jump_p 发表于 2020-6-7 10:50
嗯,我知道是选择lxml解析器,但bs4自己不就是解析器吗,为啥还要选择别的解析器

bs4是基于别的解析器的解析器(应该是这样)

jump_p 发表于 2020-6-8 11:01:20

qiuyouzhi 发表于 2020-6-7 12:52
bs4是基于别的解析器的解析器(应该是这样)

嗯嗯,我查了一下,解释是“Beautiful Soup 的 HTML 和 XML 解析器是依赖于 lxml 库的”
页: [1]
查看完整版本: beautiful soup和 lxml