关于html,Python交流,编程语言专区,鱼C论坛

tiger吴 发表于 2020-7-29 20:19:29

关于html

用requests得到的一个html只有一行，看的难受，用pprint.pprint打印成这样了，怎么让他有缩进的摆的好看点?

Twilight6 发表于 2020-7-29 20:23:31

代码发上来试试{:7_139:}

zltzlt 发表于 2020-7-29 20:26:21

把代码发上来，帮你改改

tiger吴 发表于 2020-7-29 20:28:34

Twilight6 发表于 2020-7-29 20:23
代码发上来试试

from lxml import etree
from pyquery import PyQuery as py
import requests

import pprint

url='https://www.zhihu.com/explore'
headers={
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'
}
html=requests.get(url,headers=headers).text
pprint.pprint(html)

tiger吴 发表于 2020-7-29 20:29:04

zltzlt 发表于 2020-7-29 20:26
把代码发上来，帮你改改

from lxml import etree
from pyquery import PyQuery as py
import requests

import pprint

url='https://www.zhihu.com/explore'
headers={
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'
}
html=requests.get(url,headers=headers).text
pprint.pprint(html)

zltzlt 发表于 2020-7-29 20:31:04

本帖最后由 zltzlt 于 2020-7-29 20:32 编辑

tiger吴发表于 2020-7-29 20:29

注：先安装 BS4 再使用下面的代码；BeautifulSoup 的 prettify() 方法会格式化 HTML 代码。

另外你的代码不够整洁，帮你美化了一下

from lxml import etree
from pyquery import PyQuery as py
from bs4 import BeautifulSoup
import requests

url = 'https://www.zhihu.com/explore'
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
'(KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'
}
html = requests.get(url, headers=headers).text
soup = BeautifulSoup(html, 'html.parser')
print(soup.prettify())

tiger吴 发表于 2020-7-29 20:42:11

zltzlt 发表于 2020-7-29 20:31
注：先安装 BS4 再使用下面的代码；BeautifulSoup 的 prettify() 方法会格式化 HTML 代码。

另外你 ...

nice,拜谢大佬

页: [1]

鱼C论坛's Archiver

关于html