前言<br/>基础篇<br/>第1章 数据挖掘基础 2<br/>1.1 某知名连锁餐饮企业的困惑 2<br/>1.2 从餐饮服务到数据挖掘 4<br/>1.3 数据挖掘的基本任务 5<br/>1.4 数据挖掘建模过程 5<br/>1.4.1 定义挖掘目标 6<br/>1.4.2 数据取样 6<br/>1.4.3 数据探索 7<br/>1.4.4 数据预处理 8<br/>1.4.5 挖掘建模 8<br/>1.4.6 模型评价 8<br/>1.5 常用数据挖掘建模工具 9<br/>1.6 小结 11<br/>第2章 Python数据分析简介 12<br/>2.1 搭建Python开发平台 14<br/>2.1.1 所要考虑的问题 14<br/>2.1.2 基础平台的搭建 14<br/>2.2 Python使用入门 16<br/>2.2.1 运行方式 16<br/>2.2.2 基本命令 17<br/>2.2.3 数据结构 19<br/>2.2.4 库的导入与添加 24<br/>2.3 Python数据分析工具 26<br/>2.3.1 NumPy 27<br/>2.3.2 SciPy 28<br/>2.3.3 Matplotlib 29<br/>2.3.4 pandas 31<br/>2.3.5 StatsModels 33<br/>2.3.6 scikit-learn 33<br/>2.3.7 Keras 34<br/>2.3.8 Gensim 36<br/>2.4 配套附件使用设置 37<br/>2.5 小结 38<br/>第3章 数据探索 39<br/>3.1 数据质量分析 39<br/>3.1.1 缺失值分析 40<br/>3.1.2 异常值分析 40<br/>3.1.3 一致性分析 44<br/>3.2 数据特征分析 44<br/>3.2.1 分布分析 44<br/>3.2.2 对比分析 48<br/>3.2.3 统计量分析 51<br/>3.2.4 周期性分析 54<br/>3.2.5 贡献度分析 55<br/>3.2.6 相关性分析 58<br/>3.3 Python主要数据探索函数 62<br/>3.3.1 基本统计特征函数 62<br/>3.3.2 拓展统计特征函数 66<br/>3.3.3 统计绘图函数 67<br/>3.4 小结 74<br/>第4章 数据预处理 75<br/>4.1 数据清洗 75<br/>4.1.1 缺失值处理 75<br/>4.1.2 异常值处理 80<br/>4.2 数据集成 80<br/>4.2.1 实体识别 81<br/>4.2.2 冗余属性识别 81<br/>4.2.3 数据变换 81<br/>4.2.4 简单函数变换 81<br/>4.2.5 规范化 82<br/>4.2.6 连续属性离散化 84<br/>4.2.7 属性构造 87<br/>4.2.8 小波变换 88<br/>4.3 数据归约 91<br/>4.3.1 属性归约 91<br/>4.3.2 数值归约 95<br/>4.4 Python主要数据预处理函数 98<br/>4.5 小结 101<br/>第5章 挖掘建模 102<br/>5.1 分类与预测 102<br/>5.1.1 实现过程 103<br/>5.1.2 常用的分类与预测算法 103<br/>5.1.3 回归分析 104<br/>5.1.4 决策树 108<br/>5.1.5 人工神经网络 115<br/>5.1.6 分类与预测算法评价 120<br/>5.1.7 Python分类预测模型特点 125<br/>5.2 聚类分析 125<br/>5.2.1 常用聚类分析算法 126<br/>5.2.2 K-Means聚类算法 127<br/>5.2.3 聚类分析算法评价 132<br/>5.2.4 Python主要聚类分析算法 133<br/>5.3 关联规则 135<br/>5.3.1 常用关联规则算法 136<br/>5.3.2 Apriori算法 136<br/>5.4 时序模式 142<br/>5.4.1 时间序列算法 142<br/>5.4.2 时间序列的预处理 143<br/>5.4.3 平稳时间序列分析 145<br/>5.4.4 非平稳时间序列分析 148<br/>5.4.5 Python主要时序模式算法 156<br/>5.5 离群点检测 159<br/>5.5.1 离群点的成因及类型 160<br/>5.5.2 离群点检测方法 160<br/>5.5.3 基于模型的离群点检测方法 161<br/>5.5.4 基于聚类的离群点检测方法 164<br/>5.6 小结 167<br/>实战篇<br/>第6章 财政收入影响因素分析及预测 170<br/>6.1 背景与挖掘目标 170<br/>6.2 分析方法与过程 171<br/>6.2.1 分析步骤与流程 172<br/>6.2.2 数据探索分析 172<br/>6.2.3 数据预处理 176<br/>6.2.4 模型构建 178<br/>6.3 上机实验 184<br/>6.4 拓展思考 185<br/>6.5 小结 186<br/>第7章 航空公司客户价值分析 187<br/>7.1 背景与挖掘目标 187<br/>7.2 分析方法与过程 188<br/>7.2.1 分析步骤与流程 189<br/>7.2.2 数据探索分析 189<br/>7.2.3 数据预处理 200<br/>7.2.4 模型构建 207<br/>7.2.5 模型应用 212<br/>7.3 上机实验 214<br/>7.4 拓展思考 215<br/>7.5 小结 216<br/>第8章 商品零售购物篮分析 217<br/>8.1 背景与挖掘目标 217<br/>8.2 分析方法与过程 218<br/>8.2.1 数据探索分析 219<br/>8.2.2 数据预处理 224<br/>8.2.3 模型构建 226<br/>8.3 上机实验 232<br/>8.4 拓展思考 233<br/>8.5 小结 233<br/>第9章 基于水色图像的水质评价 234<br/>9.1 背景与挖掘目标 234<br/>9.2 分析方法与过程 235<br/>9.2.1 分析步骤与流程 236<br/>9.2.2 数据预处理 236<br/>9.2.3 模型构建 240<br/>9.2.4 水质评价 241<br/>9.3 上机实验 242<br/>9.4 拓展思考 242<br/>9.5 小结 243<br/>第10章 家用热水器用户行为分析与事件识别 244<br/>10.1 背景与挖掘目标 244<br/>10.2 分析方法与过程 245<br/>10.2.1 数据探索分析 246<br/>10.2.2 数据预处理 249<br/>10.2.3 模型构建 260<br/>10.2.4 模型检验 261<br/>10.3 上机实验 262<br/>10.4 拓展思考 264<br/>10.5 小结 265<br/>第11章 电子商务网站
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录