机器学习案例:心血管疾病预测
这一个案例是我期末考试题目,网上有大概的内容,我通过网上的内容和论坛大佬的帮助,最终也是大概成功实现了题目要求,分享给大家,也在此感谢回答我问题的各位的帮助。题目要求如下:
1、利用自己的专业知识对数据进行整理
2、要求用正确的方式完成数据清洗
3、对数据采用正确的可视化方式显示数据的类别分布(年龄段、体脂、性别)
4、建立正确的模型预测是否有心血管疾病,并用语言对模型进行解释
首先对数据的预处理(数据清洗)无非就哪几种
(1)重复值处理
(2)缺失值处理
(3)异常数据的处理
然后可视化采用的是seaborn库来实现,就是很简单的几种图
最后采用随机森林模型来进行预测。
由于我自己是个新手,所以代码中我有大量的注释。可能会有同样学习机器学习的人,分享有需要的各位。
页:
[1]