鱼C论坛

 找回密码
 立即注册
查看: 3125|回复: 2

[作品展示] 网络小说爬虫之---庆余年

[复制链接]
发表于 2020-9-29 23:56:51 | 显示全部楼层 |阅读模式
去年国内的网络小说《庆余年》改变的电视剧很火很火,曾经去本地的图书馆去借书怎奈所有的书都被外借了出去,闲来无事找到了网络小说全篇的。手机看总会误触广告,很是烦人。所以研究了一些时日写了这么个程序。用最简单的代码爬取了全套小说。爬取网站为笔趣阁,默认情况下该网站的所有小说应该是都是可以正常爬取的,更换小说的目录地址即可。。。小白初学如有大神还请多多指点其中优化之道。

购买主题 已有 2 人购买  本主题需向作者支付 5 鱼币 才能浏览
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-30 15:44:09 | 显示全部楼层
你是用2.0版本???
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-10-1 20:52:02 | 显示全部楼层
自为其主 发表于 2020-9-30 15:44
你是用2.0版本???

什么2.0版本?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-10-2 12:48:33 | 显示全部楼层
我是新手,请问一下 为什么你们发的代码我复制回去却运行不了呢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-10-2 14:12:18 | 显示全部楼层
675583320 发表于 2020-10-2 12:48
我是新手,请问一下 为什么你们发的代码我复制回去却运行不了呢

有什么报错提示么?注意代码开头的import导入的包。默认状态下python是没有urllib和bs4这两个包的。需要用配置环境变量之后用pip install urllib和pip install bs4安装这两个第三方的包之后才可以的。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-11-14 22:37:19 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-11-15 01:34:14 | 显示全部楼层
U7IN$_B_LNTU8(4BZB{7I84.png

兄弟我用你的爬虫爬到一半就被服务器终止了,有没有办法防止这个问题?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-11-15 12:58:31 | 显示全部楼层
深山小兽 发表于 2020-11-15 01:34
兄弟我用你的爬虫爬到一半就被服务器终止了,有没有办法防止这个问题?

根据您的建议已经修正了一下代码。另外之前存储每一章节的文档时对于目录的管理没有考虑到,现在也进行了一下修正。您可以复制现在的代码重新试一下。如果有问题可以在进行讨论探讨。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-17 21:36

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表