流浪的杰 发表于 2020-3-23 21:41:39

爬虫系列

是不是我学艺不精,还是现在爬虫门槛高,为毛我一样东西都爬不了

一个账号 发表于 2020-3-23 22:08:10

什么叫一样东西都爬不了?

wp231957 发表于 2020-3-23 22:26:26

现在各大网站都在做反爬
所以静态爬取已经日落西山了
会几行正则,会写点xpath表达式,就狠威武的时代已经过去式了

admintest166 发表于 2020-3-23 22:43:26

看你爬什么网站了 如果说想找史诗级难度的 可以去12306试一试

如果只是简单前期学习爬虫的 你可以去爬取妹子图这些网站 基本反爬等于形同虚设 但是你的知道如何破解这个反爬

爬点那种别人自己搭建小说网站 你可以拿来试试手 基本很简单的 一个请求库 一个解析库 一个文件保存就完事了

不要去网上找那些别人做的 你只能做个参考 别人写代码都是以自己的理解方式 和自己的写代码风格写的 所以仅供参考

爬虫讲实话学的东西很多但是如果你现在属于刚接触的话 爬点那些小网站肯定是可以的 不要气馁! 现在先不要去挑战那些有反爬的

流浪的杰 发表于 2020-3-24 09:12:52

admintest166 发表于 2020-3-23 22:43
看你爬什么网站了 如果说想找史诗级难度的 可以去12306试一试

如果只是简单前期学习爬虫的 你可以去爬 ...

ojbk,我去爬小说去

流浪的杰 发表于 2020-3-24 09:13:38

wp231957 发表于 2020-3-23 22:26
现在各大网站都在做反爬
所以静态爬取已经日落西山了
会几行正则,会写点xpath表达式,就狠威武的时代已 ...

看来我技术还不行,{:10_243:}
页: [1]
查看完整版本: 爬虫系列