Lnan95 发表于 2016-2-1 15:37:32

我的python数据分析学习之路

本帖最后由 Lnan95 于 2016-2-1 15:58 编辑

{:10_258:}鉴于自身是个严重“热情不超过3天”的学生,特别是在枯燥的学习中。每次回来一看才发现,“要是当时坚持下去了多好。”,但是,想要做出一番事情,不彻底走出这种“就做我能做的事情的”舒服区肯定是不行的,因此用整个寒假,希望能触碰到python数据分析的边缘。

学习路线:统计知识->金融知识->编程python(基础)->python(numpy,pandas....)->量化知识->matlab、java...->考研->实习->.....->P Quant

        当然,理想很丰满,现实很骨感。不过小弟我一直都提倡,做事情不能只想着结果,投入全身心享受这个学习的过程,一样能收获颇多。何况趁着还年轻,不尝试一下就只有后悔的份了吧。本帖子算是自己学习路上的一把鞭子,不断督促着自己的前进,同时,也希望以后的以后,能给鱼c论坛留下些财产,像别人帮助自己一样帮助其他人就再好不过了。(因为马上回老家了,不带电脑,不定期更新不是偷懒噢{:10_254:} )
#本人可以说是这个号注册开始,才开始学习编程和才开始接触python的{:10_266:} 水平很低,不要嫌弃

Lnan95 发表于 2016-2-1 15:38:09

本帖最后由 Lnan95 于 2016-2-1 15:43 编辑

说一下为什么自己会学习python,楼主是个某大学统计学的学生,大学学得很杂也很渣,各种软件学了好多,什么spss,eviews,r学得很杂,而且学得很基础(也是因为自己没好好学),只能满足基本的统计需要。因此为了能在以后能有一个“吃饭的工具”(说好听叫:为了职业道路上有更大的竞争力),学习了python,python是个很好的工具,特别是在大数据相关方向的行业,python在处理大规模数据上比R有较大的优势,而且就业岗基本都是要求python为主。当然,随着深入的学习,SQL、matlab、java等等工具以后也会好好研究的。{:10_279:}


python学习的教材:《小甲鱼零基础学python》、《Python for Data Analysis》、《量化分析师的Python日记》、以及uqer上的基础教材

最后:{:10_279:}本人not 玻璃心,非常乐意接受大家的指点!大家有什么建议都可以告诉我,小弟我必会虚心请教!

Lnan95 发表于 2016-2-1 15:47:28

本帖最后由 Lnan95 于 2016-2-2 13:49 编辑

day1:
安装numpy、pandas、matplotlib包
安利个网站http://www.lfd.uci.edu/~gohlke/pythonlibs/
简直太牛了,各种包都有,包的安装方法靠百度和小甲鱼0基础扩展阅读中easygui的安装研究的,瞎摸索安上去。
【先滚去学习了,当前是时间序列+numpy包学习,还要翻看以前的高代课本(当时不好好学习,现在有罪受了)】
靠教材学习东西真的好累,感觉了解了很多,但面对东西时候不能举一反三,囧
零基础:昨天做完了36、37的习题。
numpy包:进行了入门的学习,不知识还很零碎,刚把索引和矩阵看完,还算颇有收获吧。上传很多图片不是很方便,那分享些学习中收藏的东西吧。话说array和mitrix的索引真的好牛逼啊,虽然还不知道有什么用。

Numpy.arrange和range的区别
http://jingyan.baidu.com/article/e6c8503c1e89d6e54f1a188c.html
Numpy 的random模块
http://www.cnblogs.com/plwang1990/p/3842073.html
http://www.mamicode.com/info-detail-507676.html
Matrix和array的区别
http://www.mamicode.com/info-detail-502860.html

Lnan95 发表于 2016-2-2 13:52:58

本帖最后由 Lnan95 于 2016-2-3 11:30 编辑

day2:
由于昨晚一直在做0基础那道乌龟吃鱼的动手题,结果做到2点多钟,然后又看到新的python区新的小练习上线了。。又研究了一会,所以导致今天起床就是12点了{:10_245:}
今天的学习目标,把书里numpy的第一章给过了+python0基础38、39。{:10_280:}感觉到后面要恶补很多数学知识啊。
【今日效果不佳】有点事情出门了,38、39get了,但是后面的numpy还没动{:10_299:} 感觉任务量有点大,要是时间不充裕很难完成啊。。不管了。。不能找借口明天加油

Lnan95 发表于 2016-2-3 11:31:11

本帖最后由 Lnan95 于 2016-2-5 18:27 编辑

day3:
【任务】:40+numpy{:10_258:}开始努力
任务完成,前来画勾

Lnan95 发表于 2016-2-5 18:31:53

day4:
{:10_334:}有点拖延症啊,不好不好。
numpy包研究了一遍,不过没有实例操作,感觉没怎么消化。等到后面找几道统计学习题做做吧。
今天一直在鼓搞pandas和matplotlib,感觉好神奇。不过有些操作还是无法完成,希望后面的学习能解决。pandas包东西有点多,春节内把它吃完,gogogo{:10_256:}

Lnan95 发表于 2016-2-9 00:21:32

{:10_249:}春节没电脑哈 暂时偷个懒,这几天一直在cousera上看南大的一个python数据分析的课程,略有收获,安利一下。其次在看两本概率的读物,《随机漫步的傻瓜》和《黑天鹅》,对小概率的黑天鹅事件有些作者的看法。有些内容接收地太早,感觉以后还需要再看一遍。

Lnan95 发表于 2016-2-11 00:07:37

本帖最后由 Lnan95 于 2016-2-11 00:10 编辑

《随机漫步的傻瓜》确实写得不错,有些语句值得让人琢磨和思考。近似随机事件下的经验科学和纯科学,哪个会更合适呢?{:10_291:}又把python基础手册下了回来,很多基本的逻辑弄不弄清楚还是不行啊。 安利一下这两天在看的文章:《量化分析师的Python日记》,写的挺好,准备打印成纸质,放在桌上。

painx 发表于 2016-2-14 23:02:05

楼主辛苦了,关注一下。

Lnan95 发表于 2016-2-18 18:15:39

painx 发表于 2016-2-14 23:02
楼主辛苦了,关注一下。

感谢~

Lnan95 发表于 2016-2-18 18:22:14

本帖最后由 Lnan95 于 2016-2-18 18:24 编辑

{:10_281:}最近没在学一些量化知识和《python for data analysis》这本书加上有些应酬,都懒得更新。{:10_266:}快开学了,事情肯定便超多,好烦。
这几天有点着急了,一直在做自己的回测模型,但是发现,如果pandas包掌握不好,很难把自己的想法给做到,dataframe的处理总是把人弄得晕头转向,不能急。
安利文章→https://uqer.io/community/share/54d83bb3f9f06c276f651a6e
安利视频→http://www.bilibili.com/video/av3635746/
这两个系列都可以看看,最后10天把最后150页啃完,在本《量化的黑箱》这本看两遍吧{:10_260:}嘿嘿嘿

今天遇到了个概念挺有意思的,关于numpy.random.seed(),叫伪随机数
http://baike.baidu.com/view/1127.htm

Lnan95 发表于 2016-2-21 00:55:45

{:10_258:}正在建设自己的数据库,不过tushare包太慢了,抓了好久才抓了1000个股票,还特么是08年开始的。。为了以后的数据库整理,于是乎又做了一个数据更新的脚本。。不过还可以打磨一下,提高下速度,不然好菜{:10_280:}让他慢慢抓,睡觉去喽,明天开始研究github

Lnan95 发表于 2016-2-25 23:43:08

本帖最后由 Lnan95 于 2016-2-25 23:44 编辑

{:10_275:} 快要开学了,开学后时间主要肯定在学专业课和英语,估计碰python的时间变得很短了。所以这几天呕心沥血爆肝学python。
回测脚本已经从30分钟回测加速到了3分钟以内,而且仍然有几个地方可以提高速度。分享一下提速心得①并行计算②ufunc和广播(会快很多)③数据库←减少I/O费时,从原来一个个csv打开到从一个pickle里一个个拿出来,体速了6分钟,当然会有更快的方法,还待学习。④dataframe格式直接运算速度好像不是很好,下次试试用.values+numexpr包看看能不能体速⑤最后当然是避免无意义的操作咯

稍稍研究下多线程,但是好像不能在fun里面加for循环,不然就崩了?接下来再研究吧。
在ricequant的文档里再次巩固了一下pandas。(pandas包博大精深啊,值得研究。到学校试试pandas包的ols和eviews的有没有差)
seaborn包有点意思,画的图很好看。
←其实很简单哈哈
love python
好好学习

Lnan95 发表于 2016-2-25 23:50:30

分享几个收藏~
https://www.ricequant.com/community/topic/558/资源总结贴-ricequant量化策略-技术姿势总结帖-持续更新中
https://www.ricequant.com/community/topic/449/学习资料-python-r语言-计量经济学-投资书籍-研究报告等-book-video/5

http://stackoverflow.com/questions/12269528/using-python-pandas-to-parse-csv-with-date-in-format-year-day-hour-min-sec←待解决的问题

话说,07年那本R语言实战的翻译者居然是三个人大统计大一、大二的学生,太牛了,这人生轨迹真的是让人羡慕又佩服。记住,是羡慕又佩服。
whatever
继续努力吧。

Lnan95 发表于 2016-2-26 22:18:50

http://mooc.study.163.com/course/NJU-1000031001#/info
概率论与统计基础课程,结合python,复习一遍。

Lnan95 发表于 2016-2-28 22:28:48

{:10_266:}明天就要去学校了 烦躁。。刚看了下课本,居然都是R语言的....
感觉有点贪快了。知识不扎实。
http://mooc.study.163.com/learn/NJU-1000031001?tid=2001223001#/learn/content?type=detail&id=2001413013&cid=2001402055
先把数统补起来!!

cjfj114 发表于 2016-3-1 18:19:58

关注一下... lz 加油.. 做个好软件.

Lnan95 发表于 2016-3-2 11:51:09

cjfj114 发表于 2016-3-1 18:19
关注一下... lz 加油.. 做个好软件.

{:5_100:}感谢 但是路还长

Lnan95 发表于 2016-3-2 11:57:52

{:10_250:}滚回学校结果4门R语言一门SAS的课程..哭瞎 狂补R语言中。R语言对于统计来说确实是挺方便的语言,很多可以使用的包。大三专业课好重,每天3点一线,英语+统计知识+软件,剩下时间都给了社团休息时间都没有了。
嘛 吃得苦中苦方为人上人。
啃了本《r for beginner》说实话,感觉不是很好,还是乖乖啃700页的那套啄木鸟吧{:10_266:},还好有python基础,英文版一天啃个40页还是可以的,加油加油,疯狂读书

大大琪 发表于 2017-2-28 20:47:03

楼长能交流交流吗,我是零基础学习,想用python进行生物信息学分析,现在感觉很盲目,什么不懂。{:10_266:}
页: [1] 2
查看完整版本: 我的python数据分析学习之路