本书主要总结著者多年学习、实践、探索、研究和应用Python语言机器学习的基本算法,系统全面地介绍了机器学习Scikit-learn库、数据预处理、模型评估和模型选择方法、分类、回归、聚类、降维,以及图像处理和图像识别等内容。全书重点介绍了30多种Python语言机器学习基本算法在卫生健康领域的实践。分类算法包括逻辑回归分类、线性判别分析、朴素贝叶斯分类、K近邻分类、决策树分类、随机森林分类、支持向量机分类和多层感知机分类8种;回归算法包括普通线性回归、多项式回归、岭回归、Lasso回归、K近邻回归、决策树回归、随机森林回归、支持向量回归和多层感知机回归9种;聚类算法包括K-means聚类、加速K-means聚类、谱聚类、均值转换聚类、DBSCAN聚类、层次聚类和近邻传播算法7种;降维算法包括主成分分析、核主成分分析、独立成分分析、非负矩阵分解、截断奇异值分解、线性判别分析、因子分析和特征选择8种。各种方法的实践部分主要按照基本原理简介、实践数据、实践任务、语法、实践程序和实践结果六部分进行编写。本书的案例主要来源于卫生健康相关专题调查数据摘编和著者为本书专门创建的数据,具有较好的代表性。本书的案例实践程序是在Anaconda Spyder集成开发环境中完成的。在程序部分,各条语句均有较为详尽的注释,便于读者学习理解。各案例的实践程序均具有较好的可复用性。
本书通俗易懂,注重Python语言机器学习的技术路线和基本方法实践,易学好用。主要读者对象包括卫生健康行业从业人员、高等院校预防医学和临床医学等专业本科生和研究生,以及其他对机器学习预测和评估技术有需求的人员。本书可以作为Python语言机器学习技术培训的入门级教材或参考书。
展开