作者背景资深:作者是云计算、大数据和AI领域的知名专家,云创大数据总裁、中国大数据应用联盟人工智能专家委员会主任。
写作经验丰富:作者团队写作经验丰富,不仅深谙数据挖掘技术和金融行业,而且有丰富的出版经验,能准确把握读者需求。
零基础快入门:即便读者没有Python经验,没有数据挖掘和分析经验,也能快速掌握常见金融应用场景的数据挖掘和分析。
实战性强:本书配有大量精心设计的案例、讲解视频、实现代码、数据资源、习题及其答案。
前 言
第1章 Python工作环境准备 1
1.1 Anaconda环境安装 1
1.2 常用Python 交互工具 4
1.3 Jupyter Notebook简介 6
1.4 习题 9
第2章 Python入门 10
2.1 Python基础知识 10
2.2 Python基础语法 11
2.3 Python变量类型 15
2.4 Python运算符 20
2.4.1 算术运算符 20
2.4.2 比较运算符 22
2.4.3 赋值运算符 23
2.4.4 按位运算符 24
2.4.5 逻辑运算符 25
2.4.6 成员运算符 26
2.4.7 身份运算符 27
2.4.8 运算符优先级 28
2.5 Python条件与循环语句 29
2.5.1 条件语句 29
2.5.2 循环语句 31
2.6 Python函数 38
2.7 Python模块 43
2.8 Python 文件处理 46
2.9 Python异常 48
2.10 数据分析相关库 50
2.10.1 NumPy 50
2.10.2 Matplotlib 51
2.10.3 PySpark 53
2.10.4 其他常用库 54
2.11 习题 55
第3章 数据预处理 56
3.1 数据分析工作流程 56
3.2 数据预处理 58
3.2.1 数据集导入 59
3.2.2 数据概览 60
3.2.3 数据清洗 61
3.2.4 类别变量转换 66
3.2.5 数据分割 67
3.2.6 特征缩放 68
3.3 鸟瞰机器学习 71
3.4 习题 72
第4章 数据挖掘方法 74
4.1 分类分析 74
4.1.1 决策树 75
4.1.2 支持向量机 75
4.1.3 分类算法的选择 76
4.2 聚类分析 76
4.2.1 K均值算法 77
4.2.2 聚类算法和分类算法的区别 78
4.3 回归分析 78
4.3.1 变量间的关系 79
4.3.2 回归分析算法的分类和步骤 79
4.3.3 回归分析算法的选择 81
4.4 关联分析 81
4.4.1 关联规则 82
4.4.2 关联规则的序列模式 82
4.5 时间序列分析 83
4.5.1 时间序列分析方法和步骤 83
4.5.2 时间序列的三种预测模式 85
4.6 异常检测 85
4.7 推荐算法 86
4.8 习题 89
第5章 网络舆情采集与热点分析 90
5.1 网络舆情概述 90
5.1.1 大数据网络舆情背景 90
5.1.2 舆情处理过程 91
5.2 舆情数据采集 94
5.2.1 网络舆情采集工具 95
5.2.2 网络舆情数据爬取实例 100
5.3 实战:微博热点话题聚类 104
5.4 习题 110
第6章 舆情研判之情感分类 112
6.1 情感分析介绍 112
6.1.1 情感分析分类 112
6.1.2 情感分析文本预处理 114
6.1.3 实战:中文文本处理练习 115
6.2 情感分类方法 118
6.2.1 基于词典的情感分类 118
6.2.2 基于机器学习的情感分类 121
6.2.3 基于深度学习模型的情感分类 122
6.3 情感分类实战演练 131
6.3.1 淘宝家电商品评论情感分类预测 131
6.3.2 京东客户评论情感倾向预测 134
6.4 习题 140
第7章 用机器学习方法预测股价 142
7.1 股市数据分析价值 142
7.1.1 案例背景 142
7.1.2 案例价值 143
7.2 ARIMA模型 144
7.3 实战:基于SVM和ARIMA的股价预测 145
7.4 习题 156
第8章 用人工智能方法预测股价 157
8.1 神经网络预测方法 157
8.1.1 门控循环单元 158
8.1.2 VADER情感分析 158
8.2 实战:基于LSTM和GRU的股价预测 159
8.3 实战:股票市场新闻情感分析 165
8.4 习题 172
第9章 个人信用评分 173
9.1 个人信用评分概述 173
9.1.1 需求背景 174
9.1.2 国内外发展状况 175
9.2 信用评分的技术与方法 176
9.2.1 信用评分的简要历史 176
9.2.2 信用评分的主要模型与方法 176
9.3 信用评分卡模型 180
9.3.1 模型介绍 180
9.3.2 数据分箱 180
9.3.3 WOE值 182
9.3.4 IV值 183
9.3.5 逻辑回归算法原理 185
9.3.6 模型评价指标 186
9.3.7 建立信用评分卡 190
9.4 实战:信用评分卡 190
9.4.1 读取数据 191
9.4.2 数据预处理 191
9.4.3 探索性分析 197
9.4.4 模型分析 204
9.4.5 建立信用评分卡 208
9.5 习题 211
第10章 个人信用等级评估 213
10.1 概述 213
10.2 个人信用等级评估方法 215
10.2.1 决策树 215
10.2.2 随机森林 221
10.2.3 XGBoost简介 224
10.2.4 多重共线性 228
10.2.5 数据重采样 229
10.3 实战:个人信用等级评估 232
10.3.1 导入相应包并读取数据 232
10.3.2 查看数据情况 234
10.3.3 数据预处理及相关函数构建 241
10.3.4 模型训练 244
10.3.5 预测并生成结果 251
10.4 习题 253
第11章 企业信用评估 255
11.1 企业信用评估概述 255
11.2 企业信用评估的技术与方法 257
11.2.1 支持向量机 257
11.2.2 朴素贝叶斯 259
11.2.3 感知机 260
11.3 实战:企业信用评估 261
11.3.1 导入相应包并读取数据 261
11.3.2 数据预处理 262
11.3.3 可视化各变量总体分布直方图 264
11.3.4 建模分析预测企业违约情况 271
11.3.5 模型评估 273
11.3.6 模型预测 273
11.4 习题 274
第12章 用户画像 276
12.1 用户画像的价值 276
12.1.1 用户画像的定义 277
12.1.2 标签体系 278
12.1.3 用户画像的意义 282
12.2 用户画像的构建 283
12.2.1 用户画像的构建步骤 283
12.2.2 创建用户画像的方法 287
12.2.3 丰富用户画像 290
12.3 实战:电商用户画像构建 292
12.4 实战:电商用户行为分析 303
12.5 习题 321
第13章 目标客户运营 322
13.1 目标客户运营概述 322
13.2 目标客户运营模型 323
13.2.1 目标客户模型探索 323
13.2.2 目标客户聚类算法 326
13.3 目标客户的挖掘与分类 330
13.3.1 挖掘目标客户 331
13.3.2 目标客户的可视化工具 332
13.3.3 基于RFM模型的客户分类 333
13.3.4 基于LRFMC模型的客户分类 334
13.4 实战:商场客户细分管理 335
13.4.1 导入相关库 335
13.4.2 数据可视化及分析 336
13.4.3 K均值聚类分析 342
13.5 实战:航空公司VIP客户体系管理 345
13.5.1 数据集说明 345
13.5.2 导入相关库 346
13.5.3 数据分析及可视化 347
13.5.4 特征属性的相关性分析 354
13.5.5 属性规约 355
13.5.6 构建聚类模型 357
13.5.7 客户分群可视化 361
13.6 习题 363
第14章 智能推荐 364
14.1 精准营销概述 364
14.1.1 传统营销 365
14.1.2 新时代营销 366
14.2 智能推荐概述 367
14.2.1 Apriori算法 369
14.2.2 FP-Growth算法 374
14.2.3 关联规则的应用实例 378
14.3 实战:火锅店推荐 379
14.3.1 导入相关库 380
14.3.2 数据可视化及分析 381
14.3.3 特色菜推荐 386
14.3.4 K均值聚类分析 387
14.3.5 智能推荐器 388
14.4 实战:基于关联规则的数据挖掘 390
14.4.1 导入相关库 391
14.4.2 数据可视化及分析 392
14.4.3 关联分析—Apriori算法 398
14.5 习题 401
参考文献 403
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录