唯爱丶雪 发表于 2022-1-1 10:50:15

使用beautifulsoup解析不了文档

htm文档在附件中,代码如下:

header = {
    'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'}
r = requests.get('https://cc.4lbt.com/htm_data/2112/7/4850055.html', headers= header)
r.encoding = 'utf-8'
soup = bs4.BeautifulSoup(r.text, 'xml')
print(soup.text)




解析后显示不全!

suchocolate 发表于 2022-1-1 17:19:21

这个url本身就无法访问。
页: [1]
查看完整版本: 使用beautifulsoup解析不了文档