鱼C论坛

 找回密码
 立即注册
查看: 8555|回复: 25

[见证历程] 我的python数据分析学习之路

[复制链接]
发表于 2016-2-1 15:37:32 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 Lnan95 于 2016-2-1 15:58 编辑

鉴于自身是个严重“热情不超过3天”的学生,特别是在枯燥的学习中。每次回来一看才发现,“要是当时坚持下去了多好。”,但是,想要做出一番事情,不彻底走出这种“就做我能做的事情的”舒服区肯定是不行的,因此用整个寒假,希望能触碰到python数据分析的边缘。

学习路线:统计知识->金融知识->编程python(基础)->python(numpy,pandas....)->量化知识->matlab、java...->考研->实习->.....->P Quant

        当然,理想很丰满,现实很骨感。不过小弟我一直都提倡,做事情不能只想着结果,投入全身心享受这个学习的过程,一样能收获颇多。何况趁着还年轻,不尝试一下就只有后悔的份了吧。本帖子算是自己学习路上的一把鞭子,不断督促着自己的前进,同时,也希望以后的以后,能给鱼c论坛留下些财产,像别人帮助自己一样帮助其他人就再好不过了。(因为马上回老家了,不带电脑,不定期更新不是偷懒噢
#本人可以说是这个号注册开始,才开始学习编程和才开始接触python的 水平很低,不要嫌弃
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2016-2-1 15:38:09 | 显示全部楼层
本帖最后由 Lnan95 于 2016-2-1 15:43 编辑

说一下为什么自己会学习python,楼主是个某大学统计学的学生,大学学得很杂也很渣,各种软件学了好多,什么spss,eviews,r学得很杂,而且学得很基础(也是因为自己没好好学),只能满足基本的统计需要。因此为了能在以后能有一个“吃饭的工具”(说好听叫:为了职业道路上有更大的竞争力),学习了python,python是个很好的工具,特别是在大数据相关方向的行业,python在处理大规模数据上比R有较大的优势,而且就业岗基本都是要求python为主。当然,随着深入的学习,SQL、matlab、java等等工具以后也会好好研究的。


python学习的教材:《小甲鱼零基础学python》、《Python for Data Analysis》、《量化分析师的Python日记》、以及uqer上的基础教材

最后:本人not 玻璃心,非常乐意接受大家的指点!大家有什么建议都可以告诉我,小弟我必会虚心请教!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-1 15:47:28 | 显示全部楼层
本帖最后由 Lnan95 于 2016-2-2 13:49 编辑

day1:
安装numpy、pandas、matplotlib包
安利个网站http://www.lfd.uci.edu/~gohlke/pythonlibs/
简直太牛了,各种包都有,包的安装方法靠百度和小甲鱼0基础扩展阅读中easygui的安装研究的,瞎摸索安上去。
【先滚去学习了,当前是时间序列+numpy包学习,还要翻看以前的高代课本(当时不好好学习,现在有罪受了)】
靠教材学习东西真的好累,感觉了解了很多,但面对东西时候不能举一反三,囧
零基础:昨天做完了36、37的习题。
numpy包:进行了入门的学习,不知识还很零碎,刚把索引和矩阵看完,还算颇有收获吧。上传很多图片不是很方便,那分享些学习中收藏的东西吧。话说array和mitrix的索引真的好牛逼啊,虽然还不知道有什么用。

Numpy.arrange和range的区别
http://jingyan.baidu.com/article/e6c8503c1e89d6e54f1a188c.html
Numpy 的random模块
http://www.cnblogs.com/plwang1990/p/3842073.html
http://www.mamicode.com/info-detail-507676.html
Matrix和array的区别
http://www.mamicode.com/info-detail-502860.html
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-2 13:52:58 | 显示全部楼层
本帖最后由 Lnan95 于 2016-2-3 11:30 编辑

day2:
由于昨晚一直在做0基础那道乌龟吃鱼的动手题,结果做到2点多钟,然后又看到新的python区新的小练习上线了。。又研究了一会,所以导致今天起床就是12点了
今天的学习目标,把书里numpy的第一章给过了+python0基础38、39。感觉到后面要恶补很多数学知识啊。
【今日效果不佳】有点事情出门了,38、39get了,但是后面的numpy还没动 感觉任务量有点大,要是时间不充裕很难完成啊。。不管了。。不能找借口明天加油
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-3 11:31:11 | 显示全部楼层
本帖最后由 Lnan95 于 2016-2-5 18:27 编辑

day3:
【任务】:40+numpy开始努力
任务完成,前来画勾
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-5 18:31:53 | 显示全部楼层
day4:
有点拖延症啊,不好不好。
numpy包研究了一遍,不过没有实例操作,感觉没怎么消化。等到后面找几道统计学习题做做吧。
今天一直在鼓搞pandas和matplotlib,感觉好神奇。不过有些操作还是无法完成,希望后面的学习能解决。pandas包东西有点多,春节内把它吃完,gogogo
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-9 00:21:32 | 显示全部楼层
春节没电脑哈 暂时偷个懒,这几天一直在cousera上看南大的一个python数据分析的课程,略有收获,安利一下。其次在看两本概率的读物,《随机漫步的傻瓜》和《黑天鹅》,对小概率的黑天鹅事件有些作者的看法。有些内容接收地太早,感觉以后还需要再看一遍。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-11 00:07:37 From FishC Mobile | 显示全部楼层
本帖最后由 Lnan95 于 2016-2-11 00:10 编辑

《随机漫步的傻瓜》确实写得不错,有些语句值得让人琢磨和思考。近似随机事件下的经验科学和纯科学,哪个会更合适呢?又把python基础手册下了回来,很多基本的逻辑弄不弄清楚还是不行啊。 安利一下这两天在看的文章:《量化分析师的Python日记》,写的挺好,准备打印成纸质,放在桌上。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-2-14 23:02:05 | 显示全部楼层
楼主辛苦了,关注一下。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-18 18:15:39 | 显示全部楼层
painx 发表于 2016-2-14 23:02
楼主辛苦了,关注一下。

感谢~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-18 18:22:14 | 显示全部楼层
本帖最后由 Lnan95 于 2016-2-18 18:24 编辑

最近没在学一些量化知识和《python for data analysis》这本书加上有些应酬,都懒得更新。快开学了,事情肯定便超多,好烦。
这几天有点着急了,一直在做自己的回测模型,但是发现,如果pandas包掌握不好,很难把自己的想法给做到,dataframe的处理总是把人弄得晕头转向,不能急。
安利文章→https://uqer.io/community/share/54d83bb3f9f06c276f651a6e
安利视频→http://www.bilibili.com/video/av3635746/
这两个系列都可以看看,最后10天把最后150页啃完,在本《量化的黑箱》这本看两遍吧嘿嘿嘿

今天遇到了个概念挺有意思的,关于numpy.random.seed(),叫伪随机数
http://baike.baidu.com/view/1127.htm
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-21 00:55:45 | 显示全部楼层
正在建设自己的数据库,不过tushare包太慢了,抓了好久才抓了1000个股票,还特么是08年开始的。。为了以后的数据库整理,于是乎又做了一个数据更新的脚本。。不过还可以打磨一下,提高下速度,不然好菜让他慢慢抓,睡觉去喽,明天开始研究github
360截图20160221005418265.jpg
360截图20160221005510244.jpg
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-25 23:43:08 | 显示全部楼层
本帖最后由 Lnan95 于 2016-2-25 23:44 编辑

快要开学了,开学后时间主要肯定在学专业课和英语,估计碰python的时间变得很短了。所以这几天呕心沥血爆肝学python。
回测脚本已经从30分钟回测加速到了3分钟以内,而且仍然有几个地方可以提高速度。分享一下提速心得①并行计算②ufunc和广播(会快很多)③数据库←减少I/O费时,从原来一个个csv打开到从一个pickle里一个个拿出来,体速了6分钟,当然会有更快的方法,还待学习。④dataframe格式直接运算速度好像不是很好,下次试试用.values+numexpr包看看能不能体速⑤最后当然是避免无意义的操作咯

稍稍研究下多线程,但是好像不能在fun里面加for循环,不然就崩了?接下来再研究吧。
在ricequant的文档里再次巩固了一下pandas。(pandas包博大精深啊,值得研究。到学校试试pandas包的ols和eviews的有没有差)
seaborn包有点意思,画的图很好看。
360截图20160225232729940.jpg ←其实很简单哈哈
love python
好好学习  
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-25 23:50:30 | 显示全部楼层
分享几个收藏~
https://www.ricequant.com/community/topic/558/资源总结贴-ricequant量化策略-技术姿势总结帖-持续更新中
https://www.ricequant.com/community/topic/449/学习资料-python-r语言-计量经济学-投资书籍-研究报告等-book-video/5

http://stackoverflow.com/questions/12269528/using-python-pandas-to-parse-csv-with-date-in-format-year-day-hour-min-sec  ←待解决的问题

话说,07年那本R语言实战的翻译者居然是三个人大统计大一、大二的学生,太牛了,这人生轨迹真的是让人羡慕又佩服。记住,是羡慕又佩服。
whatever
继续努力吧。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2016-2-26 22:18:50 | 显示全部楼层
http://mooc.study.163.com/course/NJU-1000031001#/info
概率论与统计基础课程,结合python,复习一遍。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-28 22:28:48 | 显示全部楼层
明天就要去学校了 烦躁。。刚看了下课本,居然都是R语言的....
感觉有点贪快了。知识不扎实。
http://mooc.study.163.com/learn/NJU-1000031001?tid=2001223001#/learn/content?type=detail&id=2001413013&cid=2001402055
先把数统补起来!!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-3-1 18:19:58 | 显示全部楼层
关注一下... lz 加油.. 做个好软件.
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-3-2 11:51:09 | 显示全部楼层
cjfj114 发表于 2016-3-1 18:19
关注一下... lz 加油.. 做个好软件.

感谢 但是路还长
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-3-2 11:57:52 | 显示全部楼层
滚回学校结果4门R语言一门SAS的课程..哭瞎 狂补R语言中。R语言对于统计来说确实是挺方便的语言,很多可以使用的包。大三专业课好重,每天3点一线,英语+统计知识+软件,剩下时间都给了社团休息时间都没有了。
嘛 吃得苦中苦方为人上人。
啃了本《r for beginner》说实话,感觉不是很好,还是乖乖啃700页的那套啄木鸟吧,还好有python基础,英文版一天啃个40页还是可以的,加油加油,疯狂读书
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-28 20:47:03 | 显示全部楼层
楼长能交流交流吗,我是零基础学习,想用python进行生物信息学分析,现在感觉很盲目,什么不懂。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-20 11:41

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表