看到好多爬虫的帖子,说一些我的建议。
学Python有点点时间,蛮屏幕的爬虫帖子,记得我刚学会的时候,爬了草榴的图片,也开心坏了,觉的自己很厉害。但当时很多东西,我只不过是照葫芦画瓢,其实很多原理我都不懂,多线程,头部信息,get或者post请求,cookies等等。
最近在学习计算机网络编程,建议大家有空可以先看一下计算机网络分层。当你了解到了,http请求只不过是tcp协议的应用层。
先学习socket编程,再回头来学习爬虫,就会有一览众山小的感觉。
最近有空在学C语言,后期准备学习UNIX网络编程。
或者码一些《Python 网络编程》的书中代码。
个人学习经历,共勉。 不了解网络原理和网络技术的话,我们只能是模仿,知其然知其所以然
页:
[1]