柿子饼同学 发表于 2021-2-26 13:24:16

爬取B站视频的弹幕遇到的问题

目标URL:https://www.bilibili.com/video/BV1LX4y157Rc
踩点如图所示
想爬取视频中的弹幕
写的代码如下import requests as r
import bs4 as b
headers={"User-Agent":
      "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:85.0) Gecko/20100101 Firefox/85.0"}
url = 'https://www.bilibili.com/video/BV1LX4y157Rc'
res = r.get(url, headers=headers)
soup = b.BeautifulSoup(res.text, 'html.parser')
danmu = soup.find_all('div', class_="billibilli-player-video-danmaku")
for i in danmu:
      print(i.div.text)
   
可为啥它什么都没出来,是不是我哪里做错了{:10_245:}

柿子饼同学 发表于 2021-2-26 13:27:44

只是随便选的一个练练手的,不是歧视也不是广告(此处省略500字)只是遇到了问题{:10_277:}

51Arduino32 发表于 2021-2-26 13:45:14

本帖最后由 51Arduino32 于 2021-2-26 13:48 编辑

获取弹幕有通用的 接口 https://comment.bilibili.com/cid号.xml

cid 号可以再 视频网页源代码中找的,
你提供的 视频网址 cid我找的是294745649
那就是https://comment.bilibili.com/294745649.xml

柿子饼同学 发表于 2021-2-26 14:36:41

51Arduino32 发表于 2021-2-26 13:45
获取弹幕有通用的 接口 https://comment.bilibili.com/cid号.xml

cid 号可以再 视频网页源代码中找的,
...

咦,居然这么方便{:10_257:}

柿子饼同学 发表于 2021-2-26 14:37:25

51Arduino32 发表于 2021-2-26 13:45
获取弹幕有通用的 接口 https://comment.bilibili.com/cid号.xml

cid 号可以再 视频网页源代码中找的,
...

那如果想下载视频该怎么办呢{:10_297:}

51Arduino32 发表于 2021-2-26 14:58:07

柿子饼同学 发表于 2021-2-26 14:37
那如果想下载视频该怎么办呢

我选择用 唧唧down {:10_277:}
不过好像也有API,没搞过{:10_333:}

qiuyouzhi 发表于 2021-2-26 15:04:03

柿子饼同学 发表于 2021-2-26 14:37
那如果想下载视频该怎么办呢

可以参考下我写的帖子:
https://fishc.com.cn/thread-190147-1-1.html

柿子饼同学 发表于 2021-2-26 15:10:36

qiuyouzhi 发表于 2021-2-26 15:04
可以参考下我写的帖子:
https://fishc.com.cn/thread-190147-1-1.html

.rar文件要用什么软件打开啊{:10_297:}

qiuyouzhi 发表于 2021-2-26 15:32:20

柿子饼同学 发表于 2021-2-26 15:10
.rar文件要用什么软件打开啊


解压缩软件

柿子饼同学 发表于 2021-2-26 15:51:15

qiuyouzhi 发表于 2021-2-26 15:32

解压缩软件

他说你这包里有病毒,不给下怎么办

柿子饼同学 发表于 2021-2-26 15:54:32

qiuyouzhi 发表于 2021-2-26 15:32

解压缩软件

你的压缩包它不给下载,说有    病    毒

柿子饼同学 发表于 2021-2-26 15:55:23

那怎么办

Daniel_Zhang 发表于 2021-2-26 16:10:25

柿子饼同学 发表于 2021-2-26 15:54
你的压缩包它不给下载,说有    病    毒

那就关掉杀毒软件{:10_272:}

柿子饼同学 发表于 2021-2-26 16:11:29

Daniel_Zhang 发表于 2021-2-26 16:10
那就关掉杀毒软件

是浏览器说的,就是不给下载{:10_266:}

Daniel_Zhang 发表于 2021-2-26 16:12:43

柿子饼同学 发表于 2021-2-26 16:11
是浏览器说的,就是不给下载

那就换一个浏览器

辣鸡玩意儿,还不给下载?

感觉是发现里面有爬虫代码?{:10_272:}

柿子饼同学 发表于 2021-2-26 16:18:29

我用的Edge现在,我也想用谷歌浏览器,但是那个好像搜不了东西,我也不知道怎么翻墙到外网去

柿子饼同学 发表于 2021-2-26 16:19:26

Daniel_Zhang 发表于 2021-2-26 16:12
那就换一个浏览器

辣鸡玩意儿,还不给下载?


我现在用的Edge,也想用谷歌但是好像搜不了东西

Daniel_Zhang 发表于 2021-2-26 16:27:04

柿子饼同学 发表于 2021-2-26 16:19
我现在用的Edge,也想用谷歌但是好像搜不了东西

怎么说呢,chrome 只是一个浏览器

被禁的是 google 而不是 chrome

chrome 依旧可以访问国内的网站

而且我觉得应该是可以设置,默认的主页或者搜索引擎

柿子饼同学 发表于 2021-2-26 16:28:48

Daniel_Zhang 发表于 2021-2-26 16:27
怎么说呢,chrome 只是一个浏览器

被禁的是 google 而不是 chrome


那你用什么浏览器

Daniel_Zhang 发表于 2021-2-26 16:36:06

柿子饼同学 发表于 2021-2-26 16:28
那你用什么浏览器

当然是 chrome 和 safari 啊

safari 是 macos 的,win 搞不了,但是 chrome 是多平台的

chrome 确实挺好用的,只是因为 谷歌 在国内被禁了,很多相关联的应用或功能用不了,比如说 谷歌邮箱,谷歌文档,云端硬盘等

但是功能依旧是强劲的

可能有人会推荐你使用 Firefox,我没使用过,这里不予置评

IE 嘛,哈哈哈哈哈哈哈,懂的人都懂,奇卡无比

Edge 应该是 微软自带的那个?没怎么用过
页: [1] 2
查看完整版本: 爬取B站视频的弹幕遇到的问题