|
发表于 2020-7-8 09:54:32
|
显示全部楼层
网络爬虫
爬虫,指的是从互联网采集数据的程序脚本 。
爬天爬地爬空气 ,无聊的时候爬一爬吃鸡数据、b站评论,能得出很多有意思的结论。知乎有个很有意思的问题——"利用爬虫技术能做到哪些很酷很有趣很有用的事情",感兴趣的朋友可以自行搜索。
目前正值各大企业的秋季招聘期,没有合适的简历模板,用Python爬一波就搞定。
附代码如下,感兴趣的小伙伴可以尝试下:
数据分析
爬取大量的数据只是第一步,要让这些数据发挥价值,就需要学会数据分析。
对数据进行诸如清洗 、去重 、存储 、分析 、可视化等处理 ,将大量的数据以易读的形式呈现出来 ,才能高效的获取到需要的信息 。
这方面重点推荐学习 Numpy 、Pandas 、Matpoltlib 等 Python 库。
 高效便捷,例如对爬取的近 20000 样本进行分析得到如下可视化结果。
人工智能
其实,Python 无论是在传统机器学习还是深度学习领域都占有不可替代的地位。许多诸如 Scikit-learn 等机器学习库使得 Python 极具优势 ;
Keras 、TensorFlow 、Pytorch 等深度学习主流框架也决定了 Python 在深度学习领域的天选之子地位。
|
|