搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
出版时间 :
无库存
数据科学(第2版)
0.00     定价 ¥ 59.00
泸西县图书馆
此书还可采购1本,持证读者免费借回家
  • ISBN:
    9787302662136
  • 作      者:
    朝乐门
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2024-06-01
收藏
畅销推荐
内容介绍

《数据科学》(第2版)是一部系统阐述数据科学理论与实践的入门教材,内容与时俱进,联系实际,致力于将最新的数据科学动

态、国内外名校的教学经验,以及当前社会对数据科学人才的需求整合到内容中,同时融入思政教育内容,彰显中国

特色。

本书共7 章,主要内容包括数据科学的术语与理念、流程与活动、方法与技术、社会及人文、产品与产业、人才

与职业发展以及应用与实践等,旨在实现理论与实践、基础知识与前沿技术、学术研究与实际应用之间的有机融合,

使之成为一部既实用又富有前瞻性的数据科学教材。

本书适合作为高等学校数据科学与大数据技术、大数据管理与应用、计算机科学与技术、统计学、工商管理、信

息管理与信息系统、商业分析等多个专业本科生数据科学课程的教材,也可供数据科学从业人员参考使用。


展开
目录

第1 章 数据科学的术语与理念  1

1.1 关键术语  2

1.1.1 DIKW 模型  2

1.1.2 大数据  4

1.1.3 数据科学  7

1.2 核心理念  10

1.2.1 数据驱动型决策  10

1.2.2 数据密集型科学发现  12

1.2.3 数据分析式思维  14

1.2.4 数据科学向善  16

1.2.5 概率近似正确  19

1.2.6 数据资产化管理  19

1.3 学科特征  21

1.3.1 Drew Conway 数据科学韦恩图  21

1.3.2 Jeffrey D. Ullman 数据科学韦恩图  23

1.4 典型应用  24

1.4.1 GFT 流感趋势分析  24

1.4.2 Metromile 的汽车保险创新  25

习题  27

第2 章 数据科学的流程与活动  33

2.1 数据加工  36

2.1.1 数据大小及规范化  36

2.1.2 缺失数据及其处理  37

2.1.3 异常数据及其处理  38

2.1.4 数据维度及降维处理  42

2.2 数据管理  44

VIII 数据科学 第2 版 

2.3 数据分析  46

2.3.1 数据分析方法  46

2.3.2 数据分析工具  48

2.4 数据可视化  51

2.4.1 视觉编码与视觉通道  53

2.4.2 可视分析学  56

2.4.3 常用统计图表  58

2.5 数据故事化  62

2.5.1 与数据可视化的关系  62

2.5.2 主要特征  64

2.5.3 故事金字塔模型  67

2.5.4 EEEs 模型  68

习题  70

第3 章 数据科学的方法与技术  76

3.1 人工智能  77

3.1.1 定义及特征  77

3.1.2 主要类型  78

3.1.3 与数据科学的关系  80

3.1.4 主要内容  80

3.2 机器学习  81

3.2.1 定义及特征  82

3.2.2 主要类型  83

3.2.3 与数据科学的关系  84

3.2.4 常用机器学习算法  85

3.3 深度学习  88

3.3.1 定义及特征  88

3.3.2 主要类型  88

3.3.3 与数据科学的关系  89

3.3.4 常用深度学习算法  90

3.4 大数据技术  91

3.4.1 定义与特征  91

3.4.2 主要类型  93

3.4.3 与数据科学的关系  94

 目 录 IX

3.4.4 常用大数据技术  95

3.5 数据科学的编程语言  104

3.5.1 定义与特征  104

3.5.2 主要类型  105

3.5.3 与数据科学的关系  105

3.5.4 常用数据科学编程语言  106

习题  110

第4 章 数据科学的社会及人文  117

4.1 偏见及悖论  118

4.1.1 幸存者偏差  118

4.1.2 辛普森悖论  119

4.1.3 伯克森悖论  121

4.2 伦理及道德  122

4.3 隐私保护  123

4.4 A/B 测试  126

4.5 数据安全保障  128

4.5.1 数据安全法  128

4.5.2 P2DR 模型  130

4.6 解释与信任  130

习题  134

第5 章 数据科学的产品与产业  139

5.1 数据产品  140

5.1.1 数据产品研发的特征  140

5.1.2 数据柔术  141

5.2 数据能力  143

5.2.1 关键过程域  144

5.2.2 成熟度等级  146

5.2.3 成熟度评价  147

5.3 数据治理  148

5.3.1 主要内容  149

5.3.2 参考框架  150

5.4 数据科学平台  152

X 数据科学 第2 版 

5.4.1 数据科学平台的类型  153

5.4.2 数据科学平台的评价  154

5.5 数据科学的产业  156

习题  158

第6 章 数据科学的人才与职业  162

6.1 数据职业的主要类型  163

6.2 数据科学家的岗位职责  166

6.2.1 以数据为中心的解决方案的提出  166

6.2.2 从海量数据中发现有价值的洞察  166

6.2.3 面向具体业务的算法/ 模型研发  167

6.2.4 假设检验与试验设计  168

6.2.5 数据治理与数据质量控制  168

6.2.6 数据产品的研发及基于数据的传统产品的创新  168

6.2.7 数据全流程的参与  169

6.2.8 跨部门和跨领域合作  169

6.3 数据科学家的能力要求  170

6.3.1 与数据科学直接相关的知识和技能  170

6.3.2 与数据科学无直接相关的能力要求  171

习题  173

第7 章 数据科学的应用与实践  178

7.1 业务理解  179

7.2 数据读入  180

7.3 数据理解  180

7.4 数据准备  181

7.5 模型构建  183

7.6 模型预测  187

7.7 模型评价  187

习题  190

参考文献  195

附录A Python 数据分析中常用的语法要点及讲解  197

附录B 例题R 语言版本代码  205


展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录

点击获取验证码
登录