统计描述、统计推断到探索性分析层层进阶
案例丰富,懂点统计就能做专业的分析
影响了数十万数据分析师的“谁说菜鸟不会数据分析”家族成员,小蚊子团队出品
作为《谁说菜鸟不会数据分析》家族的新成员,本书依然通俗地讲解数据分析的实践。《谁说菜鸟不会数据分析(SPSS篇)》继续采用职场三人行的方式来构建内容,细致梳理了准专业数据分析的常见问题,并且挑选出企业实践中容易碰到的案例,以轻松直白的方式来讲好数据分析的故事。从解决工作中的实际问题出发,从统计描述、统计推断到探索性分析,总结并提炼工作中经常用到并且非常实用的通过SPSS 进行数据处理、数据分析实战方法与技巧。尽可能避免使用晦涩难懂的统计术语或模型公式,如需了解相关的统计学知识,可查阅相关的统计学书籍。
目 录
第1 章 SPSS 概况/ 11
1.1 SPSS 简介/ 12
1.2 SPSS 特点/ 13
1.3 SPSS 安装/ 15
1.4 SPSS 窗口/ 19
1.5 本章小结/ 22
第2 章 数据处理/ 23
2.1 数据变量/ 24
2.1.1 数据类型/ 24
2.1.2 变量尺度/ 25
2.2 数据导入/ 27
2.2.1 Excel 数据导入/ 27
2.2.2 文本数据导入/ 29
2.3 数据清洗/ 33
2.4 数据抽取/ 35
2.4.1 字段拆分/ 35
2.4.2 随机抽样/ 38
2.5 数据合并/ 40
2.5.1 字段合并/ 40
2.5.2 记录合并/ 41
2.6 数据分组/ 43
2.6.1 可视分箱/ 43
2.6.2 重新编码/ 46
2.7 数据标准化/ 48
2.7.1 0-1 标准化/ 48
2.7.2 Z 标准化/ 50
2.8 本章小结/ 50
第3 章 描述性分析/ 52
3.1 频率分析/ 53
3.1.1 分类变量频率分析/ 53
3.1.2 连续变量频率分析/ 56
3.2 描述分析/ 60
3.3 交叉表分析/ 62
3.4 多选题定义/ 64
3.5 数据报表制作/ 67
3.5.1 报表类型简介/ 68
3.5.2 分类变量报表制作/ 69
3.5.3 连续变量报表制作/ 71
3.5.4 多选题报表制作/ 72
3.5.5 报表灵活运用/ 74
3.6 本章小结/ 79
第4 章 相关分析/ 80
4.1 相关分析简介/ 81
4.2 相关分析实践/ 83
4.2.1 散点图绘制/ 84
4.2.2 相关分析操作/ 85
4.3 本章小结/ 86
第5 章 回归分析/ 87
5.1 回归分析简介/ 88
5.1.1 什么是回归分析/ 88
5.1.2 线性回归分析步骤/ 89
5.2 简单线性回归分析/ 90
5.2.1 简单线性回归分析简介/ 90
5.2.2 简单线性回归分析实践/ 91
5.3 多重线性回归分析/ 97
5.3.1 多重线性回归分析简介/ 97
5.3.2 多重线性回归分析实践/ 97
5.4 本章小结/ 104
第6 章 自动线性建模/ 105
6.1 自动建模/ 106
6.2 模型结果解读/ 111
6.3 模型预测/ 119
6.4 本章小结/ 120
第7 章 Logistic 回归/ 121
7.1 Logistic 回归简介/ 122
7.2 Logistic 回归实践/ 125
7.2.1 Logistic 回归操作/ 126
7.2.2 Logistic 回归结果解读/ 127
7.2.3 Logistic 回归预测/ 129
7.3 本章小结/ 133
第8 章 时间序列分析/ 134
8.1 时间序列分析简介/ 135
8.2 季节分解法/ 136
8.3 专家建模法/ 145
8.3.1 时间序列预测步骤/ 145
8.3.2 时间序列分析操作/ 146
8.3.3 时间序列分析结果解读/ 148
8.3.4 时间序列预测应用/ 150
8.4 本章小结/ 154
第9 章 RFM 分析/ 155
9.1 RFM 分析介绍/ 156
9.2 RFM 分析操作/ 158
9.2.1 数据准备/ 158
9.2.2 RFM 分析实践/ 159
9.2.3 RFM 分析结果解读/ 163
9.3 RFM 分析应用/ 166
9.4 本章小结/ 171
第10 章 聚类分析/ 172
10.1 聚类分析介绍/ 173
10.2 快速聚类分析/ 175
10.2.1 快速聚类分析操作/ 175
10.2.2 快速聚类分析结果解读/ 177
10.3 系统聚类分析/ 181
10.3.1 系统聚类分析操作/ 181
10.3.2 系统聚类分析结果解读/ 184
10.4 二阶聚类分析/ 188
10.4.1 二阶聚类分析操作/ 188
10.4.2 二阶聚类分析结果解读/ 190
10.5 聚类方法的对比/ 196
10.6 本章小结/ 197
第11 章 因子分析/ 198
11.1 因子分析简介/ 199
11.2 因子分析实践/ 201
11.2.1 因子分析操作/ 202
11.2.2 因子分析结果解读/ 205
11.3 本章小结/ 212
第12 章 对应分析/ 213
12.1 对应分析简介/ 214
12.2 对应分析实践/ 215
12.2.1 对应分析操作/ 215
12.2.2 对应分析结果解读/ 219
12.3 本章小结/ 222
温馨提示:请使用员工书屋的读者帐号和密码进行登录
——邓凯
数据挖掘与数据分析博主,资深数据分析师
这是一本适合普通大众的“专业”数据分析书,由浅入深,富有体系。既有一口气读完的冲动,又想马上找一台电脑试一试这些“新奇”的分析方法,更想拿一些数据来分析找找其中的规律。
读完本书,你会发现数据分析的乐趣,它并不是那么枯燥的,数据背后的故事简直是太有意思了。从此你将发现:无论是新闻媒体,还是企业报表中的数字,都将不再孤独,因为它们在那里,在和你说着话!
祝愿大家早日练就一颗数据分析的“心”!
——黄成明
数据化管理顾问及培训师,零售及服装企业数据化管理咨询顾问
SPSS 等统计软件的应用是以统计学知识为基础的,而现实是我们的“数据分析人员”,往往不具备统计学基础知识和系统的研究训练。因此大家在应用统计软件解决问题时,哪怕是一个小问题,也会觉得无从入手,并在具体的数据处理和统计分析过程中,处处一头雾水,心里没底。
随着大数据时代的到来,我们*迫切需要的倒不是IT 行业所说的“大数据”,而是在利用好现有数据的条件下,能够掌握统计分析利器进行敏捷深刻的研究思考。
我非常喜欢《谁说菜鸟不会数据分析》系列书籍,“菜鸟”系列的长篇“小说”我都是一口气读完的,享受了在阅读过程中和作者的思路同步的趣味盎然,这本书同样如此。强烈推荐这本SPSS 统计分析软件的入门应用书籍,祝愿大家都和小白一起学有所成。
——马广斌,博士
北京数海时代分析技术有限公司,总经理
析数软件(SPSS China)统计服务事业部,原总经理
当谈到用数据解决问题时,我经常用这样的语言去诠释:“如果你不能量化它,你就不能理解它,如果不理解就不能控制它,不能控制也就不能改变它”。数据无处不在,信息时代*主要的特征就是“数据处理”,数据分析正以我们从未想象过的方式影响着日常生活。
在知识经济与信息技术时代,每个人都面临着如何有效地吸收、理解和利用信息的挑战。那些能够有效利用工具从数据中提炼信息、发现知识的人,*终往往成为各行各业的强者!
这本书向我们清晰又友好地介绍了数据分析方法、技巧与工具,强烈推荐读一读这本书,或许会给你带来更大的惊喜!
——沈浩
中国传媒大学电视与新闻学院,教授
调查统计研究所,副所长
数据挖掘研发中心,主任
IPSOS 公司,首席技术顾问
数据分析理论、公式和方法对部分初学者来说是枯燥、乏味的,或陷入云山雾罩中不得其道。本书*大的特点是使用幽默风趣的语言,结合工作中的典型案例加以分析、解读,是一本数据分析工作者值得一读的好书。
——石军
安徽同徽信息技术有限公司,总经理
数据分析是一种能力,更是一种思想。此书结构有层次、内容全面、通俗易懂,通过SPSS 工具一步步带你走进数据分析的世界,探索数据分析的价值,让数据分析变得既简单又有趣。
——郑来轶
数据分析网创始人,某知名互联网公司数据分析专家