爬取b站任意番剧!!!
本帖最后由 1205768305 于 2022-2-20 17:20 编辑先说一下我写代码是遇到的一些问题吧:
1.爬取b站的视频很简单,爬取vip视频其实也很简单(就是加个cookies,必须是VIP账号的),但是cookies是会过期的(也不能每次都重新复制一次呀),所以我就想要模拟登陆,自动获取cookies
2.开始是走了弯路,想用requests一路走到黑(我是抱着学习的态度去写代码的),所以有点看不上selenium,不想用selenium,后来在验证码的时候卡住了(模拟登陆),才换了思路。
3.本来是学了逆向解密的,b站的是RSA加密为了锻炼自己,熟悉一下,就想试试手,后来发现密码是破解了,但是验证码卡住了(当时很不爽),迫不得已换了思路
4.验证码问题,超级鹰识别图片是有限制的,要将图片进行缩小,再按一定比例修改坐标,才能识别好。
5.还有就是b站的html还是js很烦人,防爬虫真是无所不用
6.超级鹰账号用自己的(没有的去注册呦),b站账号(要vip,不然可爬不了vip视频)应该都有吧!!!
下面是我的源码,希望有不足的地方能给与指正,我也没学多久,还有很多不足,不好的地方提的越多也好,共同进步!
写代码不容易,希望多多指正
大佬可以呦 能不能免费。 {:5_108:} {:5_95:} {:10_254:}这是真的大佬,我爬虫就学了个一般的反爬,后来被JS逆向给劝退了 {:5_108:} {:10_254:}
页:
[1]