搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
出版时间 :
Hadoop虚拟化
0.00     定价 ¥ 89.00
浙江工贸职业技术学院
  • ISBN:
    9787115497543
  • 作      者:
    作者:(美)乔治·特鲁希略//查尔斯·吉姆//史蒂夫·琼斯//隆美尔·加西亚//贾斯汀·默里|译者:陈鹏//肖明兴
  • 出 版 社 :
    人民邮电出版社
  • 出版日期:
    2019-02-01
收藏
畅销推荐
内容介绍
乔治·特鲁希略、查尔斯·吉姆、史蒂夫·琼斯、隆美尔·加西亚、贾斯汀·默里著的《Hadoop虚拟化》旨在帮助读者了解和掌握Hadoop虚拟化不同选择的优缺点、Hadoop虚拟化的配置及其注意事项。 本书共分15章,主要内容包括。Hadoop平台在企业转型中扮演的重要角色、Hadoop基础概念、YARN与HDFS、现代数据平台、数据提取、Hadoop SQL引擎、Hadoop多租户、虚拟化基础、Hadoop虚拟化最佳实践、Hadoop虚拟化、Hadoop虚拟化主服务器、Hadoop虚拟化工作节点、私有云中部署Hadoop即服务、Hadoop的安装以及为Hadoop配置Linux,还提供了附录“Hadoop集群创建:先决条件检查表”。 本书适合需要了解Hadoop虚拟化基础知识的Hadoop管理员、虚拟化管理员、Linux管理员、架构师、管理人员和开发人员阅读。
展开
目录
第1章 了解大数据的世界
1.1 数据革命
1.2 传统数据系统
1.2.1 半结构化和非结构化数据
1.2.2 因果关系
1.2.3 数据挑战
1.3 现代数据架构
1.4 组织转型
1.5 行业转型
1.6 小结
第2章 Hadoop基础概念
2.1 Hadoop中的数据类型
2.2 使用案例
2.3 什么是Hadoop
2.4 Hadoop发行版本
2.5 Hadoop框架
2.6 NoSQL数据库
2.7 Hadoop集群
2.8 Hadoop软件进程
2.9 Hadoop生态中的角色
2.10 小结
第3章 YARN和HDFS
3.1 Hadoop分布式集群
3.2 Hadoop目录结构
3.3 Hadoop分布式文件系统
3.3.1 YARN日志
3.3.2 NameNode
3.3.3 DataNode
3.3.4 块分布
3.3.5 NameNode配置和元数据管理
3.4 机架感知
3.4.1 块管理
3.4.2 均衡器
3.4.3 群集中的数据完整性维护
3.4.4 配额和垃圾桶
3.5 YARN和YARN处理模型
3.5.1 在YARN上运行应用
3.5.2 资源调度器
3.5.3 基准测试
3.5.4 TeraSort基准测试组件
3.6 小结
第4章 现代数据平台
4.1 设计一个Hadoop集群
4.2 小结
第5章 数据提取
5.1 提取、加载和转化
5.1.1 Sqoop:数据移动和SQL源
5.1.2 Flume:流数据
5.1.3 Oozie:计划和工作流
5.1.4 Falcon:数据生命周期管理
5.1.5 Kafka:实时数据流
5.2 小结
第6章 Hadoop SQL引擎
6.1 SQL的起源
6.2 Hadoop中的SQL
6.3 Hadoop SQL引擎
6.4 感受Hive和Pig的乐趣
6.4.1 Hive
6.4.2 HCatalog
6.5 小结
第7章 Hadoop多租户
7.1 保障访问
7.1.1 认证
7.1.2 审计
7.1.3 授权
7.1.4 数据保护
7.1.5 数据隔离
7.1.6 进程隔离
7.2 小结
第8章 虚拟化基础
8.1 Hadoop虚拟化的原因
8.2 小结
参考文献
第9章 Hadoop虚拟化最佳实践
9.1 有目的、有调理地进行Hadoop虚拟化
9.1.1 目的始于明确的目标
9.1.2 Hadoop不同层次虚拟化
9.1.3 行业最佳实践
9.2 小结
第10章 Hadoop虚拟化
10.1 如何管理Hadoop生态
10.1.1 构建敏捷和弹性的企业Hadoop平台
10.1.2 澄清条款
10.1.3 从裸机到虚拟化的历程
10.2 为何考虑Hadoop虚拟化
10.2.1 Hadoop虚拟化的好处
10.2.2 虚拟化可以跟本地运行一样快甚至更快
10.2.3 协调和交叉目的专业化是未来
10.2.4 障碍可以是在企业之前
10.2.5 虚拟化不是全部或不是一个选项
10.2.6 快速配置并提高开发和测试环境质量
10.2.7 使用虚拟化提升高可用性
10.2.8 使用虚拟化处理Hadoop工作负载
10.2.9 基于云的Hadoop
10.2.10 大数据扩展
10.2.11 虚拟化的途径
10.2.12 软件定义数据中心
10.2.13 虚拟化网络
10.2.14 vRealize Suite
10.3 小结
参考文献
第11章 Hadoop虚拟化主服务器
11.1 Hadoop虚拟化集群服务器
11.1.1 Hadoop周边环境虚拟化
11.1.2 Hadoop主服务器虚拟化
11.1.3 无SAN虚拟化
11.2 小结
第12章 虚拟化工作节点
12.1 Hadoop中的工作节点
12.2 Hadoop集群的部署模式
12.2.1 组合模式
12.2.2 分离模式
12.2.3 数据-计算分离的网络影响
12.2.4 数据-计算分离模式下的共享存储方式
12.2.5 用于应用临时数据的本地磁盘
12.2.6 使用网络附加存储(NAS)的共享存储架构模型
12.2.7 部署模式总结
12.3 Hadoop虚拟化工作节点的最佳实践
12.4 Hadoop虚拟化扩展
12.5 小结
参考文献
资源
第13章 私有云中部署Hadoop即服务
13.1 云概念
13.1.1 Hadoop的受益者
13.1.2 解决方案架构概述
13.2 小结
参考文献
第14章 掌握Hadoop的安装
14.1 为正确的场景使用正确的解决方案
14.2 配置仓库
14.2.1 安装HDP2.2
14.2.2 环境准备
14.3 设置Hadoop配置
14.4 启动HDFS和YARN
14.4.1 启动YARN
14.4.2 验证MapReduce功能
14.5 安装和配置Hive
14.6 安装和配置MySQL数据库
14.7 安装和配置Hive和HCatalog
14.8 小结
第15章 为Hadoop配置Linux
15.1 支持的Linux平台
15.2 不同部署模式
15.3 Linux黄金模板
15.3.1 构建企业级Linux Hadoop平台
15.3.2 Linux版本选择
15.4 最优Linux内核参数和系统设置
15.4.1 epoll
15.4.2 禁用交换空间
15.4.3 安装过程中的安全性禁用
15.4.4 IO调度器调优
15.4.5 检查透明大内存页面配置
15.4.6 Limits.conf
15.4.7 RDM分区对齐
15.4.8 文件系统注意事项
15.4.9 XFS惰性计算参数
15.4.10 Mount
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

温馨提示:请使用浙江工贸职业技术学院的读者帐号和密码进行登录

点击获取验证码
登录