[更新2020.2.17]爬虫:一只爬取yande.re的妹子图爬虫(15禁)
本帖最后由 拉了盏灯 于 2020-2-17 12:02 编辑今天闲来无事,就写个小爬虫,来爬取Y站上那些嘿嘿嘿{:10_279:} {:10_279:} 的图片,
需要准备一个F盘,文件存在F://good_imgs里。
之前论坛上也有一个爬取Y站的帖子,但那都是15年的了,而且每次爬相同的,功能较少,我就重新写了个小爬虫,
可以自选页数,指定爬取页数,从指定页数爬就设置s_page选项,默认为1。
写的不好勿喷,{:10_254:}
8/23:添加了time,还加了headers,把如果删除文件夹给去掉了。然鹅不知道什么原因现在yande爬不了。
8/25:经过这两天研究发现,yande.re的服务器时常抽,因为架设在海外,这种小问题还是可以理解的,
如果大家遇到Timeout 或者远程主机关闭了一个连接的话,最好的方法还是等,也许睡一觉第二天又OK了,
8/31:又修复了个小BUG,体验更佳。
PS:今天是初音生日伐,一整页都是关于初音。{:10_279:}
2018.9/12:优化了代码,
在这提醒大家一句,
小爬怡情,
大爬伤身,
强爬灰飞烟灭,
2020.2.17在家呆了这么久突然想起来这个,不知道还有没有人用,还是维护一下吧,今天测试了下,要翻墙才能下,没有梯子会无响应,
所以有节制的爬才能可持续发展,
**** Hidden Message ***** 流量 学习一下 {:5_106:} 老铁没毛病 {:5_106:}好简洁,66666 楼主好牛逼啊
niub 好
666 学习 来参观参观 1111111111111111111111111 参考一下 E:\python_pycharm\venv\Scripts\python.exe E:/python_pycharm/p2.py
File "E:/python_pycharm/p2.py", line 26
SyntaxError: Non-ASCII character '\xe8' in file E:/python_pycharm/p2.py on line 26, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
Process finished with exit code 1
不知道这个是什么错误,请指教 战机智 发表于 2018-8-17 16:12
E:\python_pycharm\venv\Scripts\python.exe E:/python_pycharm/p2.py
File "E:/python_pycharm/p2.py", ...
不怎么看得懂,好像是你那一段检测到非ASCII吗的东西, 拉了盏灯 发表于 2018-8-17 16:17
不怎么看得懂,好像是你那一段检测到非ASCII吗的东西,
26行是
main(input('请输入要爬取的页数:'))
????是不是要配置些什么啊 你在第0行输入
# coding:utf-8
配置一下
学习一下 {:5_109:}