Hadoop 大数据技术原理与应用(本科教材)

内容简介

[

  《Hadoop大数据技术原理与应用/大数据技术与应用丛书》围绕Hadoop生态圈相关系统介绍大数据处理架构。全书共11章,其中,第1、2章主要带领大家认识Hadoop以及学会搭建Hadoop集群;第3~5章讲解分布式文件系统(HDFS)、分布式计算框架MapReduce以及分布式协调服务;第6章讲解Hadoop2.0新特性,包含YARN和高可用特性;第7~10章主要讲解Hadoop生态圈的相关辅助系统,包括Hive、Flume、Azkaban和Sqoop;第11章是一个综合项目——网站流量日志数据分析系统,目的是教会大家如何利用Hadoop生态圈技术构建大数据系统架构并进行开发,同时加深对Hadoop技术的理解。  《Hadoop大数据技术原理与应用/大数据技术与应用丛书》附有配套视频、源代码、习题、教学设计、教学课件等资源。同时,为了帮助初学者更好地学习《Hadoop大数据技术原理与应用/大数据技术与应用丛书》中的内容,还提供了在线答疑,欢迎读者关注。  《Hadoop大数据技术原理与应用/大数据技术与应用丛书》可作为高等院校本、专科计算机相关专业,信息管理等相关专业的大数据课程教材,也可供相关技术人员参考,是一本适合广大计算机编程爱好者的优秀读物。

]

目录

第1章 初识Had00p1.1 大数据概述1.1.1 什么是大数据1.1.2 大数据的特征1.1.3 研究大数据的意义1.2 大数据的应用场景1.2.1 医疗行业的应用1.2.2 金融行业的应用1.2.3 零售行业的应用1.3 HadOOp概述1.3.1 Hadoop的前世今生1.3.2 Hadoop的优势1.3.3 HadOOp的生态体系1.3.4 Hadoop的版本1.4 本章小结1.5 课后习题第2章 搭建Hadoop集群2.1 安装准备2.1.1 虚拟机安装2.1.2 虚拟机克隆2.1.3 Linux系统网络配置2.1.4 SSH服务配置2.2 HadOOp集群搭建2.2.1 HadoOp集群部署模式2.2.2 JDK安装2.2.3 Hadoop安装2.2.4 Hadoop集群配置2.3 Hadoop集群测试2.3.1 格式化文件系统2.3.2 启动和关闭Hadoop集群2.3.3 通过UI查看Hadoop运行状态2.4 Hadoop集群初体验2.5 本章小结2.6 课后习题第3章 HDFS分布式文件系统3.1 HDFS的简介3.1.1 HDFS的演变3.1.2 HDFS的基本概念3.1.3 HDFS的特点3.2 HDFS的架构和原理3.2.1 HDFS存储架构3.2.2 HDFS文件读写原理3.3 HDFS的Shell操作3.3.1 HDFS Shell介绍3.3.2 案例——Shell定时采集数据到HDFS3.4 HDFS的Java API操作3.4.1 HDFS Java API介绍3.4.2 案例——使用Java API操作HDFS3.5 本章小结3.6 课后习题第4章 MapReduce分布式计算框架4.1 MapReduce概述4.1.1 MapReduce核心思想4.1.2 MapRedLlee编程模型4.1.3 MapRedLice编程实例——词频统计4.2 MapReduce工作原理4.2.1 MapReduce工作过程4.2.2 MapTask工作原理4.2.3 RedLiceTask工作原理4.2.4 shuffle工作原理4.3 MapReduce编程组件4.3.1 InputFormat组件4.3.2 Mapper组件4.3.3 Reducer组件4.3.4 Partitioner组件4.3.5 Combiner组件……第5章 Zookeeper分布式协调服务第6章 Hadoop 2.0新特性第7章 Hive数据仓库第8章 Flume日志采集系统第9章 工作流管理器(Azkaban)第10章 Sqoop数据迁移第11章 综合项目——网站流量日志数据分析系统

封面

Hadoop 大数据技术原理与应用(本科教材)

书名:Hadoop 大数据技术原理与应用(本科教材)

作者:黑马程序员

页数:未知

定价:¥45.0

出版社:清华大学出版社

出版日期:2019-07-04

ISBN:9787302524403

PDF电子书大小:74MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注