华信教育资源网
大数据平台运维基础
作   译   者:龚大丰 出 版 日 期:2022-06-01
出   版   社:电子工业出版社 维   护   人:徐建军 
书   代   号:G0434200 I S B N:9787121434204
定价 46.0
您的专属联系人更多
关注 评论(0) 分享
配套资源 图书内容 样章/电子教材 图书评价
  • 配 套 资 源

    本书资源

    会员上传本书资源

  • 图 书 内 容

    内容简介

    本书是高等职业教育大数据技术与应用系列教材中的一册,讲解了大数据系统运行维护过程中的各个主要任务,包括大数据生态圈、Hadoop环境搭建与运维、Hive环境搭建与基本操作、HBase环境搭建与运维、Hadoop常用组件安装等内容。本书内容详尽充实,针对每个知识点都配有相应的实验用于验证和巩固,在基础理论知识上增加了运维大数据平台实践应用知识,重点介绍了大数据系统的运维实操技能,对于培养应用型大数据平台运维人才有着很强的指导性。

    图书详情

    ISBN:9787121434204
    开 本:16(185*260)
    页 数:216
    字 数:346

    本书目录

    第1章  大数据生态圈	(1)
    1.1  大数据的概念和价值	(1)
    1.2  大数据的特点	(3)
    1.3  大数据技术组成与生态圈	(6)
    1.4  大数据的行业应用和未来发展	(9)
    第2章  Hadoop环境搭建与运维	(15)
    2.1  Hadoop概述	(15)
    2.2  Hadoop单机模式和伪分布模式搭建	(16)
    2.2.1  创建“hadoop”用户	(17)
    2.2.2  准备工作	(18)
    2.2.3  安装SSH、配置SSH无密码登录	(18)
    2.2.4  安装Java环境	(19)
    2.2.5  安装Hadoop 2	(20)
    2.2.6  Hadoop单机配置	(21)
    2.2.7  Hadoop伪分布式配置	(23)
    2.2.8  运行Hadoop伪分布式实例	(26)
    2.3  Hadoop集群模式搭建	(28)
    2.3.1  创建Hadoop运行用户	(28)
    2.3.2  关闭防火墙	(28)
    2.3.3  配置机器名和网络	(29)
    2.3.4  配置非root用户免验证登录SSH	(30)
    2.3.5  安装JDK	(31)
    2.3.6  安装Hadoop	(32)
    2.3.7  格式化HDFS	(34)
    2.3.8  启动Hadoop	(35)
    2.4  Hadoop HA模式介绍	(35)
    2.4.1  Hadoop的HA机制	(35)
    2.4.2  HA集群	(36)
    2.5  Hadoop查看集群运行状态	(37)
    2.6  网页查看集群	(39)
    2.7  Hadoop命令的使用	(40)
    2.7.1  Hadoop常用命令	(40)
    2.7.2  HDFS常用命令	(40)
    2.8  WordCount示例程序的运行和日志查看	(44)
    2.8.1  MapReduce的工作原理	(45)
    2.8.2  MapReduce框架的作业运行流程	(45)
    2.8.3  WordCount示例程序	(46)
    2.9  实验	(46)
    2.9.1 【实验1】CentOS系统安装	(46)
    2.9.2 【实验2】Hadoop单机部署	(54)
    2.9.3 【实验3】Hadoop伪分布式部署	(65)
    2.9.4 【实验4】Hadoop完全分布式部署	(66)
    2.9.5 【实验5】Hadoop查看集群状态	(85)
    2.9.6 【实验6】Hadoop基础命令的使用	(88)
    2.9.7 【实验7】Hadoop示例程序WordCount的执行(Java)	(91)
    2.9.8 【实验8】Hadoop示例程序WordCount的执行(Python)	(100)
    2.9.9 【实验9】Hadoop HA模式解析	(100)
    第3章  Hive环境搭建与基本操作	(102)
    3.1  Hive概述	(102)
    3.2  基于HDFS和MySQL的Hive环境搭建	(105)
    3.3  Hive Shell	(115)
    3.4  Hive SQL语句的使用	(119)
    3.5  Hive函数的使用	(122)
    3.6  Hive分区表和桶表的创建	(129)
    3.7  实验	(133)
    3.7.1 【实验10】Hive环境搭建	(133)
    3.7.2 【实验11】Hive SQL语句操作	(134)
    3.7.3 【实验12】Hive函数的使用	(135)
    3.7.4 【实验13】Hive分区表的创建	(136)
    第4章  HBase环境搭建与运维	(138)
    4.1  HBase概述	(138)
    4.2  HBase单机模式和伪分布模式部署	(139)
    4.3  HBase完全分布模式部署	(143)
    4.4  HBase查看集群运行状态	(146)
    4.5  HBase Shell的使用	(149)
    4.6  实验	(155)
    4.6.1 【实验14】HBase单机模式和伪分布模式部署	(155)
    4.6.2 【实验15】HBase分布式部署	(158)
    4.6.3 【实验16】HBase查看集群运行状态	(159)
    4.6.4 【实验17】HBase Shell命令的使用	(160)
    第5章  Hadoop常用组件安装	(164)
    5.1  Hadoop常用组件概述	(164)
    5.2  ZooKeeper环境部署	(175)
    5.3  Kafka环境部署	(178)
    5.4  Storm环境部署	(183)
    5.4.1  单机环境部署	(183)
    5.4.2  分布式环境部署	(185)
    5.5  Flume环境部署	(187)
    5.6  Spark环境部署	(189)
    5.6.1  单机环境部署	(189)
    5.6.2  分布式环境部署	(190)
    5.7  实验	(194)
    5.7.1 【实验18】ZooKeeper环境部署	(194)
    5.7.2 【实验19】Kafka环境部署	(196)
    5.7.3 【实验20】Storm环境部署	(200)
    5.7.4 【实验21】Flume环境部署	(203)
    5.7.5 【实验22】Spark环境部署	(204)
    
    展开

    前     言

    今天,越来越多的行业对大数据应用表现出强烈的兴趣,大数据或者相关数据分析解决方案的使用不但出现在互联网行业,像电信、金融、能源这些传统行业,越来越多的用户也开始尝试使用大数据解决具体业务问题,来提升自己的业务水平。在“大数据”背景之下,精通“大数据”的专业人才将成为企业重要的业务角色,“大数据”从业人员薪酬持续增长,人才缺口巨大。
    大数据运维工程师作为大数据专业培养的基础岗位,在国民经济的各个领域都有很大的需求,基本上哪里有大数据哪里就需要大数据运维工程师。大数据运维工程师的工作内容包括:大数据集群的运维工作(Hadoop、HBase、Hive等);负责大数据集群性能优化、扩容;负责Hadoop集群的监控、数据备份、数据监控、报警、故障处理;研究大数据运维相关技术,根据系统需求制定运维技术方案,开发自动化运维工具和运维辅助系统;研究大数据业务相关运维技术,优化集群服务架构,探索新的大数据运维技术及发展方向。
    本书作为培养应用型大数据运维工程师的基础教材,基本覆盖了大数据运维工作的各个方面,在基础理论知识上增加了运维大数据平台实践应用知识,重点介绍了大数据系统的运维实操技能,既适合大数据运维工程师学习使用,也可以作为已经从事大数据运维工作的人员的参考书。
    本书由温州职业技术学院信息技术系大数据技术与应用教研团队组织策划,由龚大丰、翁正秋、池万乐担任主编,施莉莉、王小铭担任副主编。其中,第1、3章由池万乐编写,第2章由翁正秋编写,第4、5章由龚大丰编写,实验部分由施莉莉和王小铭参与编写,全书由龚大丰统稿。此外,参与编写工作的还有陈贤、邵剑集、高瑜澧、陈清华、施郁文、杜益虹等。同时,也特别感谢阿里巴巴集团高级技术专家陈华曦、温州市大数据发展管理局陈力琼为本书提供了修订意见。 
    本书的编写得到浙江省高等教育“十三五”第一批教学改革研究项目(项目编号:jg20180585)、温州职业技术学院教改项目(项目编号:WZYzd202003、WZYCJRH201905、WZYZD201810、WZYYFFP2020005)立项支持,在此表示衷心的感谢。
    为了方便教师教学,本书配有电子教学课件及相关资源,请有此需要的教师登录华信教育资源网(www.hxedu.com.cn)注册后免费进行下载,如有问题可在网站留言板留言或与电子工业出版社联系(E-mail:hxedu@phei.com.cn)。
    教材建设是一项系统工程,需要在实践中不断加以完善及改进,同时由于时间仓促、编者水平有限,书中难免存在疏漏和不足之处,敬请同行专家与广大读者批评指正。
    
    编  者
    
    展开

    作者简介

    龚大丰,男,1978年8月生,高级工程师,华中科技大学软件工程专业硕士,现任温州职业技术学院大数据技术与应用专业专任教师,系统分析师、信息系统项目管理师。
  • 样 章 试 读
  • 图 书 评 价 我要评论
华信教育资源网