搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
出版时间 :
描述统计与探索性数据分析/数据科学方法及应用系列
0.00     定价 ¥ 75.00
常州市图书馆
此书还可采购60本,持证读者免费借回家
  • ISBN:
    9787030778468
  • 作      者:
    编者:张理|责编:姚莉丽//贾晓瑞
  • 出 版 社 :
    科学出版社
  • 出版日期:
    2025-04-01
收藏
畅销推荐
内容介绍
本书是数据科学方法及应用系列教材之一。本书融合统计学和数据科学的方法,系统介绍描述统计和探索性数据分析的原理和方法。主要内容包括:指标设计、数据预处理、描述统计量计算、数据可视化、相关分析、关联分析、聚类分析、综合指数分析等。重点介绍数据分析的统计流程和软件实现方法,培养学生理解数据、分析数据的基本能力。 本书将基本理论与应用相结合,实用性、操作性较强,可广泛应用在需要开展数据分析的各个领域。本书采用四模块结构:理论与方法+案例分析+R软件应用(含代码)+思考与练习,并提供第3~8章的在线自测习题,习题内容覆盖主要学习要点,题型包括选择题、填空题、计算题、软件应用题等,帮助学习者检验学习效果。通过扫描二维码获取相关在线资源和习题。 本书不仅可作为统计学专业低年级本科生的基础课教材,还可作为经济学、社会学、生物医学等学科开设统计学、数据分析课程的教材或教学参考书。
展开
目录
丛书序
前言
第1章 总论
1.1 数据的定义
1.2 数据的特点
1.3 数据的类型
1.4 本书框架介绍
1.5 R软件应用
初步认识R软件
思考与练习
第2章 统计指标概述
2.1 统计指标的含义
2.1.1 指标与统计指标
2.1.2 统计指标的特点
2.1.3 统计指标的构成要素
2.2 统计指标类型
2.2.1 根据指标形式和作用分类
2.2.2 根据指标值获取方式分类
2.2.3 根据指标反映的数量关系分类
2.2.4 根据指标数值类型分类
2.3 统计指标设计
2.3.1 统计指标设计原则
2.3.2 统计指标设计步骤
2.4 案例分析
可持续发展投入产出效率测度指标设计
2.5 R软件应用
创建数据对象及读入外部数据
思考与练习
第3章 数据采集
3.1 数据采集渠道
3.1.1 调查
3.1.2 观测
3.1.3 实验
3.1.4 网络数据采集
3.1.5 手机APP数据
3.2 数据采集方法及技术
3.2.1 抽样调查方法
3.2.2 网络数据采集方法
3.2.3 APP数据采集方法
3.3 案例分析
抽样方法的具体应用
3.4 R软件应用
抽样方法和八爪鱼软件应用
思考与练习
第4章 数据预处理
4.1 数据审核
4.1.1 直接来源数据审核
4.1.2 间接来源数据审核
4.2 数据清洗
4.2.1 数据筛选
4.2.2 缺失数据处理
4.2.3 异常数据处理
4.2.4 数据脱敏
4.3 数据变换
4.3.1 数据编码
4.3.2 数据标准化
4.4 数据集成
4.5 数据归约
4.6 案例分析
缺失数据插补
4.7 R软件应用
数据采集与预处理
思考与练习
第5章 数据基本特征测度
5.1 数据基本特征概述
5.2 频数统计
5.2.1 频数统计概述
5.2.2 频数统计表及编制
5.2.3 频数统计表的类型
5.3 集中趋势测度
5.3.1 几种常见平均数
5.3.2 中位数
5.3.3 众数
5.4 离散程度测度
5.5 数据分布形态测度
5.5.1 矩
5.5.2 偏度与偏度系数
5.5.3 峰度
5.6 动态趋势测度
5.6.1 发展速度
5.6.2 增长速度
5.7 案例分析
R自带数据集iris(鸢尾花)的描述统计指标计算
5.8 R软件应用
计算描述统计量
思考与练习
第6章 数据可视化
6.1 统计图形的基本要素
6.2 数据规模和结构可视化图
6.2.1 条形图
6.2.2 饼图
6.2.3 玫瑰图
6.2.4 矩形树图
6.2.5 马赛克图
6.3 数据分布可视化图
6.3.1 直方图
6.3.2 箱线图
6.3.3 概率密度图
6.4 数据变化趋势图
6.4.1 点图
6.4.2 线图
6.5 多维数据可视化
6.5.1 雷达图
6.5.2 星图
6.5.3 脸谱图
6.6 文本数据可视化
6.6.1 词云图
6.6.2 社会网络图
6.7 案例分析
R数据集HairEyeColor(头发眼睛颜色)可视化
R数据集iris(鸢尾花)植物特征可视化
R数据集ToothGrowth(豚鼠牙齿生长)特征可视化
6.8 R软件应用
数据可视化
思考与练习
第7章 相关与关联分析
7.1 相关关系
7.1.1 一般相关关系
7.1.2 典型相关分析
7.2 相关关系可视化
7.2.1 二维散点图
7.2.2 三维散点图
7.2.3 气泡图
7.2.4 散点图矩阵
7.2.5 相关系数矩阵
7.3 关联分析
7.3.1 关联规则的基本概念
7.3.2 关联规则的Apriori算法
7.4 案例分析
鸢尾花的外形特征相关关系
科技创新活动投入和产出的典型相关分析
Apriori算法示例
7.5 R软件应用
相关与关联分析
思考与练习
第8章 聚类分析
8.1 聚类分析概述
8.2 距离的计算方法
8.2.1 欧氏距离
8.2.2 曼哈顿距离
8.2.3 明氏距离
8.2.4 兰氏距离
8.2.5 马氏距离
8.2.6 相关距离
8.2.7 余弦相似度
8.2.8 汉明距离
8.3 聚类算法
8.3.1 系统聚类方法
8.3.2 K-means聚类法
8.3.3 K-modes聚类法
8.4 最佳K值的两种确定方法
8.4.1 肘部法
8.4.2 轮廓系数法
8.5 案例分析
红酒质量数据的聚类分析
8.6 R软件应用
聚类函数的应用
思考与练习
第9章 综合指数分析
9.1 综合指数分析概述
9.2 以专家赋权为主的综合指数分析
9.2.1 专家评分法
9.2.2 德尔菲法
9.2.3 层次分析法
9.3 以数据特征赋权为主的综合指数分析
9.3.1 熵权法
9.3.2 变异系数法
9.3.3 主成分分析法
9.3.4 TOPSIS方法
9.3.5 灰色关联分析法
9.4 案例分析
高技术产业创新能力综合评价
9.5 R软件应用
综合指数计算
思考与练习
参考文献
附录
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

温馨提示:请使用常州市图书馆的读者帐号和密码进行登录

点击获取验证码
登录