第一部分 商务数据分析基本概念与框架
第一章 商务数据分析基本概念 / 3
第一节 商务数据分析概述 / 3
1.数据类型 / 3
2.数据分析类型 / 4
3.数据分析方法 / 5
第二节 商务分析理论 / 6
1. 4P理论 / 6
2.用户画像 / 8
3.用户点击流分析 / 9
4.顾客价值 / 9
第三节 数据分析主要应用 / 10
1.市场营销 / 10
2.运营管理 / 11
3.产品研发 / 12
第二章 商务数据分析框架 / 13
1.问题明确 / 13
2.数据理解 / 13
3.数据预处理 / 14
4.模型建立 / 15
5.模型评价 / 19
6.模型发布 / 19
第二部分 商务数据分析常用方法
第三章 数据获取与数据理解 / 23
第一节 数据获取 / 23
1.直接获取 / 23
2.间接获取 / 24
第二节 数据描述 / 25
1.集中趋势分析 / 26
2.离散程度分析 / 29
3.分布形状分析 / 31
习题 / 33
第四章数据预处理 / 34
第一节数据预处理 / 34
1.数据预处理的目的 / 34
2.数据预处理的主要任务 / 34
3.数据清洗 / 35
4.数据集成 / 39
5.数据变换 / 40
6.数据规约 / 44
第二节特征工程 / 46
1.特征选择的目的 / 47
2.特征选择的过程 / 48
3.子集搜索 / 49
4.子集评价 / 51
5.特征选择的方法 / 51
习题 / 55
第五章计量模型 / 56
第一节时间序列分析 / 56
1.时间序列分析简介 / 56
2.时间序列建模:平稳性检验 / 57
3.平稳时间序列常用模型:AR,MA与ARMA / 59
4.非平稳时间序列 / 62
第二节回归模型 / 66
1.回归模型评价标准 / 67
2.线性回归 / 69
3.非线性回归 / 71
4.回归模型和回归系数的显著性 / 72
5.多重共线性的检验 / 73
习题 / 75
第六章数据挖掘分类预测模型 / 76
第一节分类模型评价标准 / 76
第二节逻辑回归 / 79
1.从线性回归到逻辑回归 / 79
2.逻辑回归的参数优化 / 80
3.逻辑回归小结 / 81
4.二分类算法应用于多分类问题 / 81
第三节决策树 / 82
1.信息熵 / 82
2.信息熵、不确定性与集合纯度 / 84
3.信息增益 / 85
4.常见的决策树算法 / 87
5.决策树的剪枝 / 89
6.决策树小结 / 89
第四节贝叶斯算法 / 90
1.贝叶斯概率 / 90
2.贝叶斯公式 / 90
3.朴素贝叶斯算法 / 92
4.非朴素贝叶斯算法 / 93
5.贝叶斯算法小结 / 94
第五节 k最近邻算法 / 94
1.基本k最近邻算法 / 94
2.k最近邻算法的三个基本要素 / 94
3.改进最近邻算法:kd树的构造 / 96
4.k最近邻算法小结 / 99
第六节支持向量机 / 99
1.SVM基本原理 / 99
2.软间隔 / 101
3.SVM中的核函数 / 102
4.SVM算法的特点 / 104
第七节人工神经网络 / 104
1.神经网络基本结构 / 105
2.神经元模型 / 106
3.BP神经网络 / 108
4.BP神经网络特点 / 110
第八节分类和预测算法扩展 / 111
1.数据不平衡问题 / 111
2.集成学习 / 112
习题 / 115
第七章数据挖掘聚类与关联规则模型 / 116
第一节聚类 / 116
1.聚类概念 / 116
2.K-Means聚类 / 117
3.基于密度的聚类方法 / 120
4.层级凝聚聚类(HAC) / 121
5.聚类效果评价指标 / 122
第二节关联规则 / 124
1.关联规则的基本概念 / 124
2.关联规则常用评价标准 / 125
3.关联规则挖掘基础:频繁项集与强规则 / 126
4.关联规则挖掘算法Apriori / 126
5.关联规则挖掘算法FP-growth / 128
6.关联规则挖掘算法ECLAT / 131
7.关联规则的其他评价标准 / 133
习题 / 135
第八章社会网络分析模型 / 136
第一节社会网络分析基本概念 / 136
1.基本结构 / 136
2.网络的表示 / 137
3.路径 / 137
4.距离 / 138
5.连通图与连通分量 / 139
6.割点、桥、结构洞 / 139
第二节社会网络的度量方法 / 140
1.网络规模和密度 / 140
2.中心性 / 141
第三节 社会网络的性质 / 147
1.同质性 / 148
2.三元闭包 / 148
3.强弱关系 / 149
4.平衡网络 / 149
5.网络级联 / 150
第四节 社会网络分析在商务问题中的应用 / 152
1.基于社区识别的推荐 / 152
2.病毒营销 / 153
3.基于商品网络的推荐 / 153
习题 / 154
第九章复杂数据分析方法 / 155
第一节文本处理 / 155
1.文本预处理 / 155
2.文本特征提取 / 156
3.文本情感分析 / 160
第二节图像处理 / 162
1.颜色特征 / 162
2.纹理特征 / 163
3.形状特征 / 164
4.空间关系特征 / 164
5.关键特征 / 165
6.视觉词袋特征 / 165
7.SentiBank语义特征 / 166
8.其他特征 / 166
习题 / 167
第十章数据可视化 / 168
第一节可视化的作用 / 168
第二节数据可视化的常用图表 / 168
1.适合单特征展示的图形 / 169
2.适合多个特征展示的图形 / 171
第三节用图形展示模型结果 / 173
1.模型结果展示 / 173
2.模型与变量间关系展示 / 174
3.模型间对比展示 / 175
第四节 常用的可视化工具 / 175
1. Excel / 175
2.语言代码内作图工具 / 175
3.界面化可视化工具 / 176
4.社会网络可视化工具 / 177
习题 / 177
第三部分商业应用
第十一章预测模型应用 / 181
第一节 购买预测 / 181
1.问题描述 / 181
2.数据理解 / 181
3.数据预处理 / 182
4.模型建立 / 183
5.模型评价 / 183
6.案例小结 / 183
第二节 流失预测 / 184
1.问题描述 / 184
2.数据理解 / 184
3.数据预处理 / 184
4.模型建立 / 185
5.模型评价 / 185
6.案例小结 / 185
第三节 销量预测 / 185
1.问题描述 / 185
2.数据理解 / 186
3.数据预处理:数据清洗 / 186
4.数据预处理:特征工程 / 187
5.模型建立 / 188
6.模型评价 / 188
7.案例小结 / 189
第十二章 分类模型应用 / 191
第一节 客户细分 / 191
1.问题描述 / 191
2.数据理解 / 191
3.数据预处理 / 192
4.模型建立 / 194
5.模型评价 / 195
6.案例小结 / 196
第十三章 推荐系统应用 / 197
1.问题描述 / 197
2.数据理解 / 197
3.模型建立 / 198
4.模型评价 / 199
5.案例小结 / 200
参考文献 / 201
展开