图书简介:
目 录
第1章 云计算概述 1
1.1 理解云计算 1
1.2 云计算的三大交付模型 1
1.2.1 基础设施即服务(IaaS) 1
1.2.2 平台即服务(PaaS) 2
1.2.3 软件即服务(SaaS) 3
1.2.4 云交付模型的比较 3
1.3 云计算的四大部署模式 4
1.4 云计算的关键技术——虚拟化 4
1.4.1 硬件无关性 5
1.4.2 服务器整合 5
1.4.3 资源复制 5
1.4.4 基于操作系统的虚拟化 5
1.4.5 基于硬件的虚拟化 6
1.4.6 虚拟化管理 6
1.5 基本云架构模型 7
1.5.1 相关技术 7
1.5.2 负载分布架构 7
1.5.3 资源池架构 8
1.5.4 动态可扩展架构 8
1.6 云计算解决方案及厂商简介 8
本章小结 9
思考题 10
第2章 开源云平台OpenStack 11
2.1 OpenStack发展史 11
2.2 OpenStack概述 12
2.3 OpenStack架构剖析 13
2.4 OpenStack核心组件 14
2.4.1 Identity组件Keystone 14
2.4.2 Storage组件Swift、Glance及Cinder 16
2.4.3 Compute组件Nova 20
2.4.4 Network组件Neutron 21
本章小结 24
思考题 24
第3章 OpenStack安装部署 25
3.1 DevStack脚本安装 25
3.1.1 环境准备 25
3.1.2 安装 26
3.2 OpenStack自动化部署 28
3.2.1 自动化安装和配置工具 28
3.2.2 IBM OpenStack自动化部署方案 33
3.2.3 Fuel快速安装多节点OpenStack 36
3.3 OpenStack手动安装配置 49
3.3.1 多节点部署的典型架构 50
3.3.2 多节点虚拟机配置 53
3.3.3 基础环境准备和设置 60
3.3.4 认证服务的安装和配置 61
3.3.5 镜像服务的安装和配置 66
3.3.6 计算服务的安装和配置 70
3.3.7 网络服务的安装和配置 75
3.3.8 安装Horizon 84
3.3.9 安装块存储服务 85
本章小结 89
思考题 89
第4章 OpenStack云平台应用与实践 90
4.1 项目和用户管理 90
4.1.1 仪表盘设置 90
4.1.2 项目管理 91
4.1.3 用户管理 95
4.2 虚拟机管理 99
4.2.1 设置云主机类型(Flavor) 99
4.2.2 虚拟机实例操作 101
4.3 存储管理 108
4.3.1 镜像操作 108
4.3.2 卷操作 111
4.4 网络管理 120
4.4.1 创建网络 120
4.4.2 创建子网 121
4.4.3 查看网络列表 123
4.4.4 删除网络 123
4.5 云监控工具:Nagios和Ganglia的使用 124
4.5.1 Nagios对服务与资源的监控 124
4.5.2 Ganglia对云平台性能的监控 128
4.6 OpenStack环境下的桌面云系统 128
4.6.1 基于OpenStack的桌面虚拟化实现方案 129
4.6.2 桌面云系统的应用和实践 132
本章小结 134
思考题 134
第5章 云计算的开源实现Hadoop 135
5.1 Hadoop概述 135
5.2 Hadoop在云计算和大数据中的位置和其相应关系 135
5.3 Hadoop生态系统 136
5.3.1 Hadoop分布式文件系统HDFS 137
5.3.2 Hadoop分布式计算模型MapReduce 138
5.3.3 Hadoop分布式数据库HBase 139
5.3.4 Hadoop数据仓库Hive 141
5.4 Hadoop的行业应用 142
本章小结 144
思考题 144
第6章 Hadoop安装和部署 145
6.1 Hadoop安装环境 145
6.2 Hadoop实验集群的部署结构 145
6.3 Hadoop安装部署实验 146
6.3.1 Hadoop伪分布式安装配置 146
6.3.2 Hadoop集群式安装配置 156
6.3.3 第一个MapReduce测试程序 158
6.4 Hadoop集群异常问题及解决方法 160
本章小结 162
思考题 162
第7章 Hadoop应用与实践 163
7.1 HDFS基本操作 163
7.1.1 HDFS基本概念 163
7.1.2 HDFS Shell命令 166
7.1.3 HDFS的Web接口 178
7.1.4 HDFS的Java访问接口 179
7.2 MapReduce编程 192
7.2.1 MapReduce工作机制 192
7.2.2 在Eclipse中配置开发环境 193
7.2.3 MapReduce程序结构 197
7.2.4 MapReduce应用实例 199
7.3 HBase的基本操作 229
7.3.1 HBase安装部署 229
7.3.2 HBase的SHELL操作 231
7.3.3 HBase的Java API 234
本章小结 238
思考题 238
第8章 OpenStack环境下Hadoop的应用 239
8.1 Savanna简介 239
8.2 Savanna应用与实践 240
本章小结 249
思考题 249
附录A 常用Linux命令 250
附录B 常用OpenStack命令 285
参考文献 294
展开
前 言
云计算技术是目前计算机和互联网领域的研究热点,并在短短几年内极大地改变了人们的生活形态。云计算的虚拟化、动态可伸缩性以及按需服务的特性,颠覆了传统的技术模式和商业模式,让人们的生活和工作变得简单而高效。今天,我们可以随时随地通过访问互联网来管理自己的办公桌面、浏览信息、存储文件或者处理大数据,不必担心在传统IT环境下的成本、运维效率、数据备份等问题。许多企业都通过采用云计算技术来降低成本、提高效率,Google、Amazon、IBM等IT巨头都推出了自己的云计算产品和服务,极大地推动了云计算技术和应用的普及。
随着云计算技术的迅速发展,就业市场对云计算技术人才的需求也越来越大,培养具备一定云计算设计和应用能力的专业人才已经成为计算机教学和科研领域的一个新兴的热点问题。目前,国内各高校根据自己的实际情况,开设了云计算相关的课程,在培养云计算专业人才方面进行了探索和实践。云计算的学习除了要了解基本的理论知识、拓宽知识面外,更要强化实践操作和应用。本书主要面向普通本科院校和广大的云计算初学者,在介绍云计算相关概念、基础架构和关键技术的基础上,重点阐述了开源IaaS云平台OpenStack以及分布式计算平台Hadoop的原理及使用方法,并在这些主流的云计算平台上展开实践,激发读者深入认识计算机领域新兴技术的兴趣。本教材具有以下几个特色:
(1)在内容设计上注重理论知识和实践操作相结合,首先让读者快速建立起云计算的基本概念,然后通过实验操作体验云平台的使用,在此基础上深入理解云计算系统的体系结构和实现模块。在内容的组织上由浅入深,从理论到实践循序渐进,适合初学者从认识到实践再到应用的学习过程。
(2)为便于自学,实验内容给出了云平台安装、使用的详细操作步骤,并配以大量的图表和说明,使读者能够按照实验步骤独立完成实验,经历云平台搭建、基本操作、平台配置管理、应用开发等环节,训练对云平台的设计、实施和应用能力。
(3)书中的内容均来自于云平台的实验和实践,其中OpenStack的实验操作和Hadoop的程序代码在IBM OpenStack Solution for System X云计算实验平台上测试通过。云平台的安装参考了官方文档并进行了验证,在安装时根据实验环境进行了部分调整。对于本书的实验材料,读者均可以在自己搭建的测试平台上操作和验证。
本书的内容包括以下几个章节:
第1章介绍云计算的概念、基础架构、关键技术、云服务类型以及主流的云计算解决方案。第2章介绍开源云平台OpenStack的发展历史、基本框架以及核心组件的功能。第3 章介绍OpenStack的安装部署方式,包括脚本安装、自动化安装和手动安装,读者按照这些步骤能够搭建起一个云平台环境。第4章介绍OpenStack的基本操作,包括项目和用户管理、虚拟机管理、存储管理、网络管理、云监控工具Nagios和Ganglia的使用以及基于OpenStack的桌面云系统。第5章介绍云计算的开源实现Hadoop,包括Hadoop生态系统、Hadoop组件、Hadoop行业应用案例。第6章介绍Hadoop实验集群的部署结构,给出了Hadoop的安装和配置过程,让读者快速搭建和体验Hadoop。第7章介绍Hadoop实践操作,包括HDFS 基本操作、MapReduce编程实例以及使用Hbase、Hive进行查询分析。第8章介绍Savanna项目,以及利用Savanna在OpenStack上运行和管理Hadoop集群的基本过程。
在学习本书之前,读者需要有一定的Linux操作系统的基础知识和使用经验,对计算机网络有一定的了解,有较好的编程基础,能熟练使用Java语言。在内容的编排上,OpenStack和Hadoop的实验内容相对独立,读者可以有选择地学习。由于云计算很多技术仍然处于研究阶段,新的研究成果和技术往往难以迅速以教材形式出版,建议读者在学习过程中充分利用开源软件的网络资源,实时关注开源软件更新信息,获取最新的技术资料。
本书的编写得到了IBM OpenStack设计团队张小斌、姚岩炜、郭晋兵等专家的大力支持,他们为云计算教学实验平台的搭建和实验项目的设计做了大量的工作;刘景老师对本书的编写提出了许多宝贵的意见和建议;本书中部分实验项目的验证工作由吕进、吴俞昊、吴龙影、张智高、韩磊等完成,在此向他们表示诚挚的谢意。
作者在书中使用了部分从网络中收集的资料,如OpenStack官网、Hadoop官网、个人博客文章等,这些网络资源为本书提供了很好的参考素材,在此向这些网络作者表示衷心的感谢。
作者为本书的编写投入了大量的精力和努力,尽管我们希望做到最好,但受知识水平所限,书中难免存在不足,恳请广大读者批评指正。作者联系方式:jinyx@hhu.edu.cn。
展开