机器学习001之理论篇--初识机器
本帖最后由 moc 于 2018-4-14 20:49 编辑初识机器学习-理论篇
机器学习的概念:
利用计算机从历史数据中寻找出规律,并把这些规律运用到未来不确定场景中的决策。
主体是计算机,而不是人。
目标是寻找规律,并且利用这些规律来作决策。
相比传统的数据分析是靠数据分析师根据自身的经验和知识水平,机器学习是通过一套算法或框架来对历史数据进行运算,寻找出规律。机器学习并不能做无米之炊,他需要历史数据作为学习资料来找出规律,规律的落地是通过数学函数或数学模型表达出来的,该规律也是由算法自动生成的,这样我们就可以通过数据现象知道背后的本质,对事件作出合理的预测。
数据中寻找规律
从数据中寻找规律,可以说人类在没有计算机的时候就已经在做啦。大学学的概率论及数理统计就是干这个的,只不过他用的方法和机器学习不大一样而已。在没有计算机的帮助,靠人工去对大量的所有的数据做统计分析几乎是不可能的,统计学采用的方法是抽样—描述统计—结论—假设检验。
在做数据分析时候,我们通常需要量化,去找到合适关于研究对象与影响变量之间的数学函数关系。在影响变量只有一个的时候,可以画在坐标中,去寻找这些散点更加趋近的函数。但在较多数据维度的时候,经常不能用可视化(图形)的方式,就只能用数学运算的方式。
机器学习发展得原动力
机器学习可以利用从数据中寻找规律,并利用这些规律自动作出决策。
1、用数据代替expert
就是说可以利用机器学习的规律,去代替以前由专家根据自身经验和知识所制定的规则。比如网商可以让机器学习去根据用户的性别,年龄,收入水平,购买习惯等自动给用户推荐商品,而不是像以前由专家来制定规则,程序员编写代码来实现。
2、经济驱动,数据变现
大数据的出现,许多公司在互联网经济发展中积累了大量的数据,如何让他们这些数据产生价值。这需要靠机器学习来实现。
业务系统发展得历史
1、基于专家经验 就是根据公司内部专业人员进过讨论,提出他们得出的最优业务逻辑,然后进过程序员实现出来。2、基于统计 分维度统计;就是数据分析师们作出各类数据报表,根据数据报表得出响应业务逻辑来实现。3、机器学习 通过机器学习自动来实现业务逻辑;分为离线学习和在线学习,离线学习就是累计一定的数据量,在通过这些数据优化模型优化。在线学习就是根据用户得学习实时进行模型调整优化。
本文为学习慕课网初识机器学习-理论篇第二章的学习笔记。 学到了,小弟最近也是再看西瓜书,感觉自己的理论和数学功底还差一些{:10_266:} 了解过,其实就是用相关数据来不断训练模型,就是数据要怎么去建立,模型要怎么去养,比较难懂 溯影 发表于 2018-4-14 21:08
学到了,小弟最近也是再看西瓜书,感觉自己的理论和数学功底还差一些
一起加油!
页:
[1]