概述篇
第1章 数据建模与计算概述
徐定华
(浙江理工大学理学院,浙江省杭州市,310018)
宇宙之大,粒子之微,火箭之速,化工之巧,地球之变,生物之谜,日用之繁,无处不用数学.
——华罗庚,中国科学院院士、著名数学家
科学工作者必须具备的素养第一是数学,第二是数学,第三还是数学.
——伦琴,德国物理学家、X射线发现者、首届诺贝尔物理学奖获得者应用数学发展与国家实力正相关;模型、算法是核心.
——张平文,中国科学院院士、北京大学教授
重视培养数据建模能力,提高数据计算精度.工科做不成的事情,数学能做成.
——郑志明,中国科学院院士、北京航空航天大学教授模型+数据,双轮驱动AI.数据不够模型补;模型不精数据补;机理启发与知识融入为上策.
——徐宗本,中国科学院院士、西安交通大学教授
华为5G标准是源于十多年前土耳其Arikan教授的一篇数学论文;P30手机的照相功能依赖数学把微弱的信号还原;如今华为终端每三个月换一代,主要是数学家的贡献.
——任正非,中国华为公司CEO
1.1 数智时代的数据工程、人工智能与数据建模
我们步入了科技发展呈现多学科交叉融通、大数据深度应用、人工智能快速发展的崭新时代, 数据科技与数字经济快速发展.
从工业革命发展历程看, 当今处于Industry 4.0智能化时代, 称为数智化时代, 它远高于机械化时代 (Industry 1.0)、电气化时代(Industry 2.0)、数字化时代(Industry 3.0), 并以前所未有的速度迈进数智化时代(Industry 5.0), 实现万物互联、智慧世界的愿景.
数据在数智化时代是比石油更宝贵的资源.从数据中提取价值、获得智能,是高科技、大学问.数据链的中间段是极其重要的数据计算与分析,数学大有作为!
在数据驱动人工智能的新时代,人工智能的基石在数学,核心关键是算法.“可是,我们有多少数学家投身进去了!”2019年4月,上海市市长、中国工程院院士徐匡迪在上海市第94期院士沙龙“人工智能助力城市安全”专题活动上发问,点中当前国内人工智能发展之要害(被称为“徐匡迪之问”).
在数智时代,以数启智、驱动AI.AI对几乎所有产业具有重要的影响力和推动作用,特别是医疗行业、自动化行业、金融服务行业、零售业技术、通信和娱乐领域、AI+制造业、AI+能源、智能物流等领域.AI的发展水平从弱人工智能(人工化)到强人工智能(自动化),再到超人工智能(自主化),每次飞跃都依靠模型与算法的创新.
数据建模与数据计算点亮了数据的光芒!多学多用数学,活学活用数学,培养数据建模与计算能力,并拥有逻辑思维、具体问题概念化素养,这才是人美丽、灿烂的智慧和核心竞争力!
这正如CSIAM理事长、北京大学张平文院士所言:要大力发展应用数学!他断言:应用数学的发展,时刻伴随着对于追求简洁与美、追求科学意义以及追求社会和经济价值这几种不同价值观的平衡与综合.
郑志明院士倡导数据建模能力培养,打通“数据感知、认知、决策”全过程;数据感知“感而不全”,用的是线性统计方法,“颗粒度”太大;数据认知提高数据理解的精确性,它融合数学方法和统计方法,让“颗粒度”小下来;提高数据计算的精度,工科做不成的事情我们能做成.
1.2 数据建模与计算, 属于多学科交叉融合的新领域
数学、统计学、数据科学、人工智能交叉融合呈现新的发展趋势, 这是一个大应用数学迅猛发展的新时代!
一是数学与统计学、数学与大数据、数学与人工智能诸多领域深度融合, 孕育新发现、新理论、新方法、新技术! 根据应用领域未来的重要性与活跃程度, 有研究指出: 将数据科学、网络科学、量子信息与信息安全、不确定现象的数学方法、反问题、统计学、计算生物学、经济中的数学问题等热点专题列入了应用数学的重点研究领域.
二是数学发展拥有新的动力源! 美国科学院国家研究理事会编著的《2025年的数学科学》指出: 数学学科覆盖范围不断扩大, 两个主要驱动力是无处不在的计算建模、很多企业产生的呈指数级增长的数据量. 互联网使这些海量数据能随时随地被利用, 放大了这两个驱动力的影响.
三是人工智能的迅速发展深刻改变着人类社会生活、改变世界, 但人工智能诸多领域的发展归根到底是数据驱动核心算法创新! 在移动互联网、大数据、超级计算、传感网、脑科学等新理论、新技术以及经济社会发展强烈需求的共同驱动下, 人工智能迅速呈现出深度学习、跨界融合、人机协同等新特征. 国务院2017年7月印发的《新一代人工智能发展规划》明确指出:“推动人工智能与神经科学、认知科学、量子科学、心理学、数学、经济学、社会学等相关基础学科的交叉融合, 加强引领人工智能算法、模型发展的数学基础理论研究.”如何适应、引领新时代, 是每一个科学领域必须要面对的问题, 尤其给基础科学, 特别是数学带来了新机遇、新挑战.
1.3 坚持数据建模的多模型融合思路
万物皆数, 万物皆变. 描述数量关系、几何关系及其变化过程的数学模型、数据模型是客观世界的近似表述.
传统的数学模型往往是基于机理(Mechanism)的模型; 传统的统计模型往往是基于数据的统计推断模型. 当今数据建模, 应坚持机理模型与统计生成性模型融合, 即基于机理和数据的混合建模.
基于机理的建模,更多地表达因果关系,如CT技术(计算机断层扫描术)中的积分方程模型、热传导方程模型、流体动力模型等.由于涉及的物理背景往往具有各向异性、非均匀性、奇异性、高维、多尺度、不确定性等特征,故常在合理简化假设下进行数学建模,这种模型是物理过程或者变化的近似反映,能够达到预设精算精度要求,常称为可计算模型.
基于数据的建模,更多地表达关联关系.在大数据情况下,数据后面的规律性并不能由物理规律表示出来,往往以相关联方式呈现出来,故需要先对数据进行建模及计算,如数据拟合、数据分类、数据聚类、基于机器学习的参数识别模型等.这种模型能够基于大数据、训练集获得解的信息,在没有机理模型的前提下提升数据价值.此所谓模型不清数据补.
模型不准数据补.前期建立的机理模型不完善或者舍弃了相关影响因素的考虑,此时的机理模型可能是个不适定、不精确的模型.现实场景中的数据是具有价值的,基于数据可获知模型参数信息或者解得部分信息,实现解的全部信息重构.
数据不全模型补.在数据工程与人工智能中,数据往往不是大数据情形,数据的获取往往代价大、成本高、危险性强,数据的存储也要占用物理设备.
目录
前言让模型和算法点亮数据光芒
概述篇
第1章数据建模与计算概述3
1.1数智时代的数据工程、人工智能与数据建模3
1.2数据建模与计算,属于多学科交叉融合的新领域5
1.3坚持数据建模的多模型融合思路6
1.4坚持数据计算的多算法集成策略7
1.5坚持数据思维、数据建模与计算综合训练8
共性算法篇
第2章基于径向基函数隐式表示的几何模型重建13
2.1背景与问题13
2.2几何模型的表示14
2.3数学模型与求解17
2.4模型的修正及求解20
2.5结果与讨论21
参考文献22
第3章交替方向乘子法求解若干图像处理问题23
3.1背景介绍23
3.2符号说明和基本优化模型24
3.3图像去噪问题26
3.3.1加性噪声26
3.3.2乘性噪声、泊松噪声31
3.3.3混合噪声问题33
3.3.4结构噪声问题36
3.4图像去卷积38
3.5图像填补40
3.6图像缩放42
3.7图像分解问题45
3.7.1基于Sobolev空间负范数的图像分解模型46
3.7.2基于矩阵低秩优化的图像分解模型48
3.8监视器视频数据背景提取问题51
3.9图像retinex问题53
3.10瑕疵检测问题56
3.11案例小结58
参考文献59
第4章数值微分的计算方法及应用63
4.1背景知识63
4.2差商型数值微分方法与不适定性64
4.2.1差商型数值微分公式64
4.2.2误差估计与不适定性65
4.2.3差商型数值微分方法的数值实验.66
4.3数值微分的积分求导方法67
4.3.1积分求导方法(Lanczos方法)67
4.3.2数值实验70
4.4基于三次样条拟合的数值微分方法70
4.4.1数值微分方法71
4.4.2数值实验及应用74
4.5案例小结及进一步发展.74
参考文献76
第5章基于分数阶协方差的主成分分析推广方法78
5.1背景介绍78
5.1.1研究背景和现状78
5.1.2符号说明79
5.2概念及算法介绍80
5.2.1分数阶协方差的定义80
5.2.2主成分分析及其推广方法81
5.2.3基于分数阶协方差的特征提取算法82
5.3数据计算实验85
5.3.1分数阶协方差与传统协方差85
5.3.2特征提取算法87
5.4案例小结和展望90
参考文献90
第6章数据拟合的梯度型优化算法92
6.1背景介绍92
6.2正则化思想93
6.3梯度型迭代算法94
6.3.1*速下降法94
6.3.2随机梯度下降法95
6.3.3动量法95
6.3.4Nesterov梯度加速法97
6.3.5自适应梯度算法98
6.3.6均方根传递算法100
6.3.7自适应矩估计算法101
6.4算法实现与精度比较102
6.5案例小结105
参考文献106
数据建模与计算篇
第7章基于深度学习的低剂量CT成像算法研究109
7.1引言109
7.2CT成像原理111
7.3重建算法112
7.3.1迭代重建法112
7.3.2滤波反投影重建算法113
7.3.3低剂量CT重建算法113
7.4基于深度学习的低剂量CT后处理算法与计算模拟114
7.4.1损失函数114
7.4.2主流的网络框架115
7.4.3DAU-Net网络115
参考文献119
第8章心电图识别的ELM-LRF和BLSTM算法121
8.1背景介绍121
8.2ECG基础知识122
8.3基于ELM-LRF-BLSTM的ECG分类算法136
8.3.1网络结构136
8.3.2复杂度分析137
8.4实验过程及结果分析137
8.4.1数据预处理137
8.4.2算法设计与参数优化139
8.4.3实验结果及分析140
8.5案例小结141
参考文献142
第9章基于高斯隐马尔可夫模型的择时策略研究143
9.1背景介绍143
9.2隐马尔可夫理论模型145
9.2.1马尔可夫链与隐马尔可夫模型145
9.2.2HMM基本问题及其解决算法146
9.2.3改进的隐马尔可夫模型149
9.3HMM应用合理性讨论150
9.4实验数据实证分析151
9.5案例小结156
参考文献157
第10章盐酸与氨气化学反应的pH值变化回归模型158
10.1问题背景158
10.1.1pH值测定的实验方法158
10.1.2实验数据情况159
10.2实验数据与问题分析159
10.3数据隐含的扩散机理165
10.4数学模型参数的数据推断168
10.4.1Logistic模型168
10.4.2非线性回归的程序实现168
10.4.3运用软件交互进行回归分析168
10.5模型的评价与改进171
10.6案例小结与展望172
参考文献173
第11章音乐流派分类案例174
11.1背景介绍174
11.2音乐特征与数据预处理175
11.2.1音乐特征介绍175
11.2.2实验数据来源及数据处理178
11.3分类模型的数学原理182
11.3.1K近邻182
11.3.2逻辑回归182
11.3.3支持向量机185
11.3.4神经网络模型187
11.4实验结果189
11.5集成学习分类器190
11.6案例创新点及下一步发展191
11.6.1创新点191
11.6.2改进与发展191
参考文献191
第12章基于MRMR算法和代价敏感分类的财务预警模型与实证分析192
12.1背景介绍192
12.2符号说明194
12.3采样方法194
12.3.1欠采样方法195
12.3.2过采样方法196
12.3.3混合采样方法196
12.4特征选择算法197
12.4.1Relief算法197
12.4.2MRMR算法197
12.4.3改进的MRMR算法199
12.5分类模型200
12.5.1支持向量机200
12.5.2L2-逻辑回归200
12.5.3CART决策树200
12.6实证研究与结果分析.201
12.6.1数据来源与预处理201
12.6.2模型和参数设置203
12.6.3模型降维与预测结果的分析203
12.6.4特征选择算法分析与重要财务指标206
12.7创新点及模型改进208
12.8案例小结209
参考文献209
第13章融合数据推断和热传递机理的热防护服装参数优化210
13.1背景介绍210
13.2实验数据及统计推断211
13.2.1数据获取211
13.2.2数据统计推断213
13.3热防护服装参数优化决定问题的数学描述215
13.3.1热防护服装的热传递机制模型(正问题)215
13.3.2热防护服装参数优化决定问题的数学归结(反问题)217
13.4数值算法与算例218
13.4.1数值算法218
13.4.2数值算例218
13.4.3结论分析220
13.5创新点及模型改进221
13.5.1创新点221
13.5.2改进与发展221
13.6案例小结221
参考文献221
第14章数据驱动下新冠肺炎基本再生数的计算方法223
14.1背景介绍223
14.2建模与计算224
14.2.1SIR模型224
14.2.2SEIR模型227
14.2.3SEIAR模型229
14.3案例小结与展望230
参考文献231
第15章交互融合特征表示与选择性集成的DNA结合蛋白质预测233
15.1背景介绍233
15.2案例内容235
15.2.1假设236
15.2.2模型237
15.2.3算法241
15.3实验243
15.3.1实验数据与评价指标243
15.3.2二信息交互融合特征表示的评估244
15.3.3参数敏感性分析与模型比较246
15.3.4基于参数扰动的选择性集成的评估248
15.3.5与现有方法的进一步比较250
15.4案例小结252
附录253
参考文献254
第16章测量数据的建模与计算257
16.1背景介绍257
16.2预备知识258
16.2.1*小二乘法258
16.2.2矩阵的奇异值分解260
16.3案例内容261
16.3.1平差模型261
16.3.2处理随机数据的Gibbs采样算法264
16.3.3处理冗余数据的KLT算法266
16.4案例小结269
参考文献269
第17章基于后疫情时代与地域特征的消防救援优化问题的建模与计算270
17.1问题叙述270
17.1.1问题背景270
17.1.2问题提出271
17.2问题分析272
17.3模型建立与求解273
17.3.1问题一的模型建立与求解273
17.3.2问题二的模型建立与求解275
17.3.3问题三的模型建立与求解280
17.3.4问题四的模型建立与求解282
17.3.5问题五的模型建立与求解287
17.3.6问题六的模型建立与求解289
17.4模型的评价298
17.4.1模型优点298
17.4.2模型缺点298
17.5模型改进与推广298
17.5.1模型改进298
17.5.2模型推广299
17.6案例小结299
参考文献299
后记模型融合和算法集成是上策301
索引303
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录