鱼C论坛

 找回密码
 立即注册
查看: 2619|回复: 4

[技术交流] 反爬虫与论坛爬虫相关问题求助

[复制链接]
发表于 2020-4-24 11:36:45 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
- 学爬虫也一年多了,我学习爬虫除了B站各种视频课,主要是跟着崔庆才的书走了一遍。
- 我觉得python基础和爬虫我也学了一些东西,最近开始回复一些自己能回答的求助。

我实在想吐槽一下
1. 学爬虫请先补充一下前端的知识,回复爬虫问题我看到最多的就是,“反爬!”,“你换ip”,“headers写全”。
        - 推荐一个我自己看过的,有讲爬虫必要的前端知识的课,Python网络爬虫(基础篇)
2. 分明是xpath没写对,还偏听偏信以为自己遇到了反爬?!哪有那么多反爬?
        - 常见反爬,崔庆才的书里都有讲,而且全面,系统。
        - 如果真觉得自己需要强大的发爬虫能力,推荐《Python3反爬虫原理与绕过实战》—韦世东

3. 回答问题的同学,你不想看人家代码就不要回答,张口就来反爬!他连css选择器是什么都不知道,你教他反爬,典型的误人子弟!

爬虫学习思路:
- 基础的,不再详述。我上面推荐的视频系列有进阶和高级,自己搜索,里面的内容崔庆才的书都有涉及。
- 爬虫进阶有两个方向,一个是使用别人的框架,例如最多的Scrapy。功能强大,框架庞杂,需要时间适应。
- 另一个就是Python学习,自己构造框架,想Python更上一步的可以看一下《流畅的Python》

本帖被以下淘专辑推荐:

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-24 13:23:03 | 显示全部楼层
听说《流畅的Python》不错,下载一份看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2020-4-25 22:19:19 | 显示全部楼层
永恒的蓝色梦想 发表于 2020-4-24 13:23
听说《流畅的Python》不错,下载一份看看

确实写的很不错!虽然我只看了流程控制和协程那一部分。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-26 19:12:15 | 显示全部楼层
想问问楼主,一般不反爬的网站我写个爬虫也基本OK,小甲鱼好像推荐requests 而摒弃urllib库,我大概看了一下这个B站的基础篇视频,他还是在用urllib,我有必要跟着学吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-4-27 19:49:00 | 显示全部楼层
shenlingdong203 发表于 2020-4-26 19:12
想问问楼主,一般不反爬的网站我写个爬虫也基本OK,小甲鱼好像推荐requests 而摒弃urllib库,我大概看了一下这 ...

requests是把urllib进行了封装,爬虫基本上没人用urllib,但是在初学的时候都会学一遍的。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-23 17:58

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表