beautiful soup和 lxml
本帖最后由 jump_p 于 2020-6-8 12:31 编辑from bs4 import BeautifulSoup
import lxml
soup = BeautifulSoup('<p>Hello</p>','lxml')
print(soup.p.string)
既然beautiful soup和 lxml 都是解析库,为什么beautiful soup对象还需要lxml来解析呢?如以上这个例子 那个是选择用什么解析器解析,bs4其实就是一个封装好的更高级的解析器。 qiuyouzhi 发表于 2020-6-7 10:32
那个是选择用什么解析器解析,bs4其实就是一个封装好的更高级的解析器。
嗯,我知道是选择lxml解析器,但bs4自己不就是解析器吗,为啥还要选择别的解析器 jump_p 发表于 2020-6-7 10:50
嗯,我知道是选择lxml解析器,但bs4自己不就是解析器吗,为啥还要选择别的解析器
bs4是基于别的解析器的解析器(应该是这样) qiuyouzhi 发表于 2020-6-7 12:52
bs4是基于别的解析器的解析器(应该是这样)
嗯嗯,我查了一下,解释是“Beautiful Soup 的 HTML 和 XML 解析器是依赖于 lxml 库的”
页:
[1]