1205768305 发表于 2022-2-20 17:13:00

爬取b站任意番剧!!!

本帖最后由 1205768305 于 2022-2-20 17:20 编辑

先说一下我写代码是遇到的一些问题吧:

1.爬取b站的视频很简单,爬取vip视频其实也很简单(就是加个cookies,必须是VIP账号的),但是cookies是会过期的(也不能每次都重新复制一次呀),所以我就想要模拟登陆,自动获取cookies
2.开始是走了弯路,想用requests一路走到黑(我是抱着学习的态度去写代码的),所以有点看不上selenium,不想用selenium,后来在验证码的时候卡住了(模拟登陆),才换了思路。
3.本来是学了逆向解密的,b站的是RSA加密为了锻炼自己,熟悉一下,就想试试手,后来发现密码是破解了,但是验证码卡住了(当时很不爽),迫不得已换了思路
4.验证码问题,超级鹰识别图片是有限制的,要将图片进行缩小,再按一定比例修改坐标,才能识别好。
5.还有就是b站的html还是js很烦人,防爬虫真是无所不用
6.超级鹰账号用自己的(没有的去注册呦),b站账号(要vip,不然可爬不了vip视频)应该都有吧!!!
下面是我的源码,希望有不足的地方能给与指正,我也没学多久,还有很多不足,不好的地方提的越多也好,共同进步!
写代码不容易,希望多多指正

shiyouroc 发表于 2022-2-20 18:17:10

大佬可以呦

shiyouroc 发表于 2022-2-20 18:18:23

能不能免费。

tomok 发表于 2022-2-20 22:33:02

{:5_108:}

hornwong 发表于 2022-2-20 23:18:27

{:5_95:}

一只魈咸鱼 发表于 2022-2-21 14:53:55

{:10_254:}这是真的大佬,我爬虫就学了个一般的反爬,后来被JS逆向给劝退了

Passepartout 发表于 2022-2-22 10:50:32

{:5_108:}

小程奋发图强 发表于 2022-2-22 11:01:41

{:10_254:}
页: [1]
查看完整版本: 爬取b站任意番剧!!!