Hello,大家好,我是augustqi。今天手把手带大家做一个机器学习实战项目:基于机器学习的心脏病预测研究。多的不说,少的不唠,下面开始今天的教程。
以下内容,完全是我根据参考资料和个人理解撰写出来的,不存在滥用原创的问题。
1. 项目介绍
这是一个基于机器学习的二分类任务,根据给定“患者”的某些属性信息,预测是否患有心脏病。本项目使用的数据来源于UCI机器学习库。
UCI机器学习库中,一共包含4个关于心脏病诊断的数据集,分别是:
1、cleveland.data
2、hungarian.data
3、long-beach-va.data
4、switzerland.data
每个数据集都包含76个属性,但是所有已发布的实验都只使用了其中14个属性。其中,cleveland.data是机器学习研究人员最常使用的数据集。
2. 数据获取
2.1 获取方式1
UCI网站获取:
https://archive.ics.uci.edu/ml/datasets/heart+disease