HADOOP权威指南
内容简介
[
本书从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hadoop这一高性能处理海量数据集的理想工具。全书共16章,3个附录,涉及的主题包括:haddoop简介;mapreduce简介;hadoop分布式文件系统;hadoop的i/o、mapreduce应用程序开发;mapreduce的工作机制;mapreduce的类型和格式;mapreduce的特性;如何构建hadoop集群,如何管理hadoop;pig简介;hbase简介;hive简介;zookeeper简介;开源工具sqoop,*后还提供了丰富的案例分析。
本书是hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行hadoop集群。
]
目录
第1章 初识hadoop
数据!数据!
数据存储与分析
与其他系统相比
关系型数据库管理系统
网格计算
志愿计算
1.3.4 hadoop 发展简史
apache hadoop和hadoop生态圈
第2章 关于mapreduce
一个气象数据集
数据的格式
使用unix工具进行数据分析
使用hadoop分析数据
map阶段和reduce阶段
封面
书名:HADOOP权威指南
作者:(美)怀特(White, T.) 著,周敏奇,钱卫宁,金澈清,王晓玲 译.
页数:600
定价:¥89.0
出版社:清华大学出版社
出版日期:2011-06-01
ISBN:9787302257585
PDF电子书大小:97MB 高清扫描完整版