|
发表于 2020-7-29 20:31:04
|
显示全部楼层
本楼为最佳答案
本帖最后由 zltzlt 于 2020-7-29 20:32 编辑
注:先安装 BS4 再使用下面的代码;BeautifulSoup 的 prettify() 方法会格式化 HTML 代码。
另外你的代码不够整洁,帮你美化了一下
- from lxml import etree
- from pyquery import PyQuery as py
- from bs4 import BeautifulSoup
- import requests
- url = 'https://www.zhihu.com/explore'
- headers = {
- 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
- '(KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'
- }
- html = requests.get(url, headers=headers).text
- soup = BeautifulSoup(html, 'html.parser')
- print(soup.prettify())
复制代码 |
|