本书探讨了统计学、机器学习、数据挖掘方法在疾病辅助诊断中的应用,通过实地调研获得了某医院心脏病超声心动图报告和500多份样本数据。首先,运用数据分析和挖掘的有关方法对数据进行预处理、数据筛选等操作;其次,选取了机器学习中的朴素贝叶斯、决策树、BP神经网络、随机森林等方法进行模型学习并对模型参数进行调优;最后,分析了实验的结果,对各个模型的性能进行比较,本书在特征选取时进行统计学检验分析,利用机器学习技术进行智能辅助诊断预测分析,提出了针对心脏病患者病情严重程度分级策略和入院治疗风险的预测方法。
本书共分7章,各章组织如下:第1章介绍医疗数据挖掘与智能辅助诊断系统概述;第2章介绍医疗数据挖掘方法及关键技术;第3章介绍基于统计方法的医疗数据分析与挖掘;第4章介绍基于BP神经网络模型的医疗分类预测;第5章介绍基于随机森林模型的入院风险预测;第6章介绍心脏病辅助诊断原型系统实现;第7章是对本书的总结与展望。
展开