nijiaosb 发表于 2020-8-21 15:46:13

求助 bs4 的 find_all 方法 抓去内容丢失部分html

求助 bs4 的 find_all 方法 抓去内容丢失部分html,源代码如下
url='xxx'
res=requests.get(url,headers)
res.encoding="utf-8"
soup=bs4.BeautifulSoup(res.text,"html.parser")
targets=soup.find_all("div",class_="classList")
print(res.text)
print('---------------------------------------------------------------------------------------------------------')
print(targets)

打印 res.text 的时候,整个html 的代码都出来了。整个是正常的,但是打印 targets 的时候,整个div 里面的html 代码的 ul 部分就没了,就打印不出来了。但是ul 之前的 h2 标签什么的,都能打印出来,这个是为什么啊,我的 find_all方法用错了嘛

xiaosi4081 发表于 2020-8-21 15:46:53

可能是js渲染的

nijiaosb 发表于 2020-8-21 15:48:21

xiaosi4081 发表于 2020-8-21 15:46
可能是js渲染的

嗯,鼠标右键查看网页代码的时候,确定过眼神,不是js 渲染,我直接 find_all("ul")就可以吧ul 的代码给打印出来,

1q23w31 发表于 2020-8-21 15:50:49

nijiaosb 发表于 2020-8-21 15:48
嗯,鼠标右键查看网页代码的时候,确定过眼神,不是js 渲染,我直接 find_all("ul")就可以吧ul 的代码给 ...

把网址贴出来

nijiaosb 发表于 2020-8-21 15:53:31

1q23w31 发表于 2020-8-21 15:50
把网址贴出来

{:10_266:}网站地址,直接发会被和谐的,有什么其他的办法能发嘛,要么,加个微信?

1q23w31 发表于 2020-8-21 15:53:54

本帖最后由 1q23w31 于 2020-8-21 15:55 编辑

nijiaosb 发表于 2020-8-21 15:53
网站地址,直接发会被和谐的,有什么其他的办法能发嘛,要么,加个微信?

转成图片?或者在网址中间加符号

nijiaosb 发表于 2020-8-21 15:59:53

1q23w31 发表于 2020-8-21 15:53
转成图片?或者在网址中间加符号

应该不行,可能会被封号,要么,你qq 多少,我加你qq

1q23w31 发表于 2020-8-21 16:00:44

nijiaosb 发表于 2020-8-21 15:59
应该不行,可能会被封号,要么,你qq 多少,我加你qq

私聊

nijiaosb 发表于 2020-8-21 16:03:04

1q23w31 发表于 2020-8-21 16:00
私聊

嗯,我私聊不了你啊,应该我的账号权限不够,你不方便的话,我把我的qq 帖给你好了。我的qq 2862090

1q23w31 发表于 2020-8-21 16:03:21

nijiaosb 发表于 2020-8-21 16:03
嗯,我私聊不了你啊,应该我的账号权限不够,你不方便的话,我把我的qq 帖给你好了。我的qq 2862090

1260121341
页: [1]
查看完整版本: 求助 bs4 的 find_all 方法 抓去内容丢失部分html