《偏最小二乘法优化及其在中医药领域的应用研究》作者针对多成分、多靶点、多药效指标以及非线性等特点的中医药数据专门建立偏最小二乘法改良方法。作者从数据预处理、特征选择、非线性特征提取和非线性回归研究四个方面,系统阐述了优化模型的建模原理及系统操作方法,在解决中医药数据分析中的实际问题方面有很重要的参考意义。
全书框架合理,科学性、学术性强,内容阐述系统详实,结合实际数据集验证分析方法的优势,科学严谨,能使读者全面、系统地掌握偏最小二乘的优化方法在中医药数据分析方面的应用。全书内容丰富,文笔流畅,是医药数理统计方面的专业学术论著,具有很好的社会效益。
《偏最小二乘法优化及其在中医药领域的应用研究》内容是在充分利用偏最小二乘原理优势的基础上,重点研究改进与优化偏最小二乘的不足方面,使其更好地适应中医药数据分析。主要内容包括分别引入非径向数据包络分析和降噪稀疏自编码器优化偏最小二乘的噪声处理,使其处理缺失值和噪声更有效;分别引入特征相关、L1正则项和灰色关联优化偏最小二乘的特征提取,实现有效降维和提取特征子集;分别融合受限玻尔兹曼机、稀疏自编码器、深度置信网络提取非线性成分,优化偏最小二乘线性提取;采用模型树、随机森林和softmax实现偏最小二乘非线性回归,使非线性领域模型构建更有效。
目 录
第1章 绪论 001
第2章 数据基本表述 005
2.1 数据基本知识 005
2.2 度量中心趋势 006
2.3 度量离散程度 010
2.4 正态分布 011
2.5 本章小结 012
第3章 数据常规预处理 013
3.1 数据清理 013
3.1.1 缺失值处理 013
3.1.2 噪声数据处理 015
3.2 数据标准化 016
3.2.1 数据中心化处理 017
3.2.2 数据的无量纲化处理 018
3.2.3 标准化处理 018
3.3 本章小结 019
第4章 线性回归分析 021
4.1 线性回归模型 021
4.1.1 一元线性回归 021
4.1.2 多元线性回归 022
4.2 最小二乘法原理 023
4.2.1 计算方法的推导 023
4.2.2 总体参数估计量的性质 027
4.3 多重共线性问题 028
4.3.1 问题的提出 028
4.3.2 多重共线性的影响 029
4.3.3 多重共线性的诊断 031
4.3.4 解决多重共线性的方法 033
4.4 模型效果评价指标 035
4.4.1 测定系数 035
4.4.2 均方根误差 037
4.5 本章小结 038
第5章 偏最小二乘线性回归模型 039
5.1 基本思路与算法原理 039
5.1.1 基本思路 039
5.1.2 算法原理 040
5.1.3 交叉有效性 043
5.2 算法的基本性质 044
5.3 主要分析技术 048
5.3.1 主成分分析 048
5.3.2 典型相关性分析 051
5.3.3 T2椭圆图辅助分析 054
5.3.4 变量投影重要性辅助分析技术 055
5.4 本章小结 056
第6章 偏最小二乘在中医药领域应用的思路 057
6.1 中医药实验数据 057
6.1.1 数据来源 057
6.1.2 数据特点 061
6.2 总体思路与分析策略 061
6.2.1 总体思路与目标 061
6.2.2 分析策略 063
6.3 本章小结 065
第7章 优化偏最小二乘的数据预处理方法 066
7.1 问题的提出 066
7.2 基于降噪稀疏自编码器的偏最小二乘缺失值处理 067
7.2.1 降噪稀疏自编码器 067
7.2.2 优化模型的建立 070
7.2.3 实验设计与结果分析 071
7.3 基于非径向数据包络分析的偏最小二乘噪声处理 074
7.3.1 非径向数据包络分析 074
7.3.2 优化模型的建立 076
7.3.3 实验设计与结果分析 080
7.4 本章小结 083
第8章 优化偏最小二乘辅助特征选择研究 084
8.1 问题的提出 084
8.2 特征选择方法 084
8.2.1 相关定义 085
8.2.2 特征选择的过程 086
8.2.3 方法的类型 087
8.3 基于特征相关的偏最小二乘特征选择 088
8.3.1 基于相关性的特征选择方法 088
8.3.2 优化模型的建立 089
8.3.3 实验设计与结果分析 091
8.4 基于L1正则项的偏最小二乘特征选择 094
8.4.1 LASSO方法 094
8.4.2 优化模型的建立 098
8.4.3 实验设计与结果分析 102
8.5 基于灰色关联的偏最小二乘特征选择 111
8.5.1 灰色关联分析 111
8.5.2 优化模型的建立 112
8.5.3 实验设计与结果分析 116
8.6 本章小结 118
第9章 偏最小二乘成分提取的非线性优化模型 120
9.1 问题的提出 120
9.2 融合受限玻尔兹曼机的偏最小二乘优化模型 121
9.2.1 受限玻尔兹曼机 121
9.2.2 优化模型的建立 124
9.2.3 实验设计与结果分析 126
9.3 融合稀疏自编码器的偏最小二乘优化模型 129
9.3.1 自编码器 129
9.3.2 稀疏自编码器的构造 131
9.3.3 优化模型的建立 131
9.3.4 实验设计与结果分析 134
9.4 融合深度置信网络的偏最小二乘优化模型 137
9.4.1 深度置信网络 137
9.4.2 优化模型的建立 139
9.4.3 实验设计与结果分析 141
9.5 本章小结 144
第10章 偏最小二乘回归的非线性优化模型 146
10.1 问题的提出 146
10.2 融合模型树的偏最小二乘优化 146
10.2.1 模型树 147
10.2.2 非线性模型的建立 149
10.2.3 实验设计与结果分析 151
10.3 融合随机森林的偏最小二乘优化 154
10.3.1 随机森林 154
10.3.2 非线性模型的建立 156
10.3.3 实验设计与结果分析 159
10.4 融合softmax的偏最小二乘优化 162
10.4.1 softmax 162
10.4.2 非线性模型的建立 163
10.4.3 实验设计与结果分析 166
10.5 本章小结 170
第11章 总结与展望 173
11.1 偏最小二乘的优势 173
11.2 偏最小二乘的不足 174
11.3 偏最小二乘的展望 176
附录A 专业术语 178
附录B 优化偏最小二乘的多功能数据分析系统使用指南 179
附录C 中医药实验数据表 202
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录