鱼C论坛

 找回密码
 立即注册
查看: 721|回复: 4

关于精通Python网络爬虫

[复制链接]
发表于 2018-9-25 18:28:34 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
有没有小伙伴买了《精通Python网络爬虫》这本书,有没有一个小群可以讨论一下遇到的问题
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-9-26 14:35:44 | 显示全部楼层
我好像之前买过,不过扔给我表弟了。  
学爬虫不需要看书吧。  
因为里面举的例子好多都不能用了。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-27 14:27:24 | 显示全部楼层
wongyusing 发表于 2018-9-26 14:35
我好像之前买过,不过扔给我表弟了。  
学爬虫不需要看书吧。  
因为里面举的例子好多都不能用了。

稍作修改还是可以的,自己分析一下网页结构修改一下,
还是请问大佬你是怎么学习爬虫的呢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-27 15:28:20 | 显示全部楼层
柚子ABC 发表于 2018-9-27 14:27
稍作修改还是可以的,自己分析一下网页结构修改一下,
还是请问大佬你是怎么学习爬虫的呢

定一个小目标。  
例如,我喜欢古龙的小说,那我就去找个古龙的小说网站爬。  
把小说按照书名保存成txt文件,爬取下来。  

我想要一堆图片,例如我要乐谱。  
我就去找个网站爬取。  

在这个过程中,你只需要寻找出,你不会的地方。  
例如说:怎么保存?怎么获取按书名来保存txt文件,图片。  

一开始代码肯定很难看,不过没关系,你只需要爬取下来即可。  

然后,思考代码中哪里有值得优化的地方,不断的修改。  

你也可以看一下,我之前发过的提问贴。里面的代码也是很样衰的。  
但,今时不同往日,我可以写出非常简洁的代码。  
这都是靠自己不断的碰壁才写成的。

建议你先从requests学起吧,爬取几本你自己喜欢的小说。然后爬取图片。
最后,思考怎么优化代码。怎么提高爬取的速度。

有空的话,我可能写一个爬虫教学
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-30 08:44:39 | 显示全部楼层
wongyusing 发表于 2018-9-27 15:28
定一个小目标。  
例如,我喜欢古龙的小说,那我就去找个古龙的小说网站爬。  
把小说按照书名保存成tx ...

谢谢你
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-10-7 10:23

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表