Learning Hbase-中文版

相关资料

[

apache hbase是运行在hdfs上的非关系型nosql数据库管理系统。它是一个开源的、分布式、多版本的列存数据库。可为那些需要随机、实时读写大数据的科技行业提供线性扩展性。
  本书将带领你了解hbase中一系列的核心任务。首先简要介绍整个hbase的生态系统。进而会指导读者配置、创建、验证以及测试hbase集群。本书还介绍了一些hadoop以及hbase的相关参数,这些参数是优化集群以及搭建无故障集群必须考虑到的。本书重点介绍hbase的数据模型、存储以及架构。读者会了解到一些加快hbase操作的选项。本书还会指导读者进行基础和高级的hbase java编程。在本书*后介绍了大数据集下如何使用hbase以及与hadoop的集成。

]

本书特色

[

译者从事相关工作多年,具有丰富的理论知识和实践经验,一直工作在技术*前沿,对相关知识有很深刻的理解。

]

内容简介

[

非常便于快速入门,实战与原理并重
  覆盖管理与开发,同时适合运维与程序员
  真实场景,真实案例,与一线实践无缝衔接
  “去哪网”hbase团队leader携资深工程师倾力献译
  你可以从本书学到:
  理解hbase的基本原理
  了解搭建hbase的先决条件
  安装和配置新的hbase集群
  通过hadoop以及hbase参数优化集群
  使用各种故障排除与运维技术,以保障集群高可用性
  掌握hbase数据模型及其操作
  了解使用hadoop工具包的好处

]

作者简介

[

Shashwat Shriparv生于印度比哈尔邦穆扎法尔布尔县。他先后在穆扎法尔布尔和梅加拉亚邦西隆求学。他在德里英迪拉?甘地国立开放大学获得计算机应用学士(BCA)学位,在喀拉拉邦科钦科技大学(特里凡得琅 C-DAC)获得计算机应用硕士(MCA)学位。他在 2010年早些时候开始研究大数据技术,当时他需要做一个用大数据技术存储和处理日志的概念验证(POC)。同时他还有另一个项目,在此项目中需要存储巨大的不同文件头的二进制文件并要处理它们。这时,他开始配置、搭建并测试 Hadoop HBase集群,并为它们写了一些代码。在做了一个成功的POC之后,他用 Java REST和 SOAP Web服务做了些开发,并搭立了一个系统,在此系统中通过 Web服务利用 Hadoop存储和处理日志,然后在HBase中通过自定义表存储这些日志,通过 HBase API和 HBase-Hive映射查询来读取数据。Shashwat成功地实现了这个项目,紧接着开始了 1TB到 3TB的大规模二进制文件头的处理工作,他把文件的元数据存储在 HBase中,文件本身存在 HDFS上。
  Shashwat在特里凡得琅 C-DAC网络取证中心开始他的软件开发生涯,为取证分析开发可移动相关软件。接着,他去了 Genilok Computer Solutions公司,在那里,他的工作包括:集群计算、HPC技术和 Web技术。
  在此之后,他从特里凡得琅到了班加罗尔并加入了 PointCross,在那里他开始了大数据技术工作,用 Java开发软件、Web服务和大数据平台。在 PointCross,他的很多项目都是围绕着大数据技术,例如 Hadoop、HBase、Hive、Pig、 Sqoop、 Flume等。从这里他又到了 HCL Infosystems公司,开始做 UIDAI项目,这是一个在印度非常有声望的项目,它为每一个印度居民提供一个**身份识别号。在这里,他工作中使用的技术有:HBase、Hive、 Hadoop、 Pig、 Linux、脚本语言、管理 HBase Hadoop集群、编写脚本、自动化任务和处理、为集群监控创建仪表盘。
  Shashwat曾经审校过 Pig Design Pattern, Pradeep Pasupuleti, Packt Publishing一书,他还曾担任过他大学杂志 InfinityTech的编辑。
  译者介绍
  去哪儿网数据库总监,知名DBA、架构师

]

目录

目录译者序 ……………………………………………… ii关于作者 ……………………………………………. iii致谢 ……………………………………………….. v关于审校者 ………………………………………….. vii前言 ……………………………………………….. ix第 1章了解 hbase生态系统 ……………………………. 1基于 hadoop的 hbase架构 2 rdbms和 hbase的架构对比 3 hbase的特征 3 hbase在 hadoop生态系统中的位置 4 hbase中的数据表示 5 hadoop 6 hbase与关系型数据库的功能对比 8行存储数据库的逻辑展现 9列存储数据库的逻辑展现 9 hbase的内部存储架构 11 开始使用 hbase 11 hbase是何时出现的 11 hbase的组件和功能 14谁在用 hbase?为什么要用? 19什么时候考虑使用 hbase? 20什么时候不使用 hbase? 21了解一些开源的 hbase工具 21 hadoop和 hbase版本兼容性对照表 22 hbase的应用 23 hbase的优点和缺点 24小结 25第 2章开启 hbase之旅……………………………….. 26深入理解 hbase的组件 27 hfile 27 region 27可扩展性——理解纵向扩展和横向扩展的过程 29读写周期 32 write-ahead logs 33 memstore 33 hbase内部管理 34合并 34 region分裂 35 region分配 36 region合并 37 regionserver故障转移 37 hbase的删除请求 37读写周期 37可用的 hbase发行版本列表 38 hbase的**条件和容量规划 39 dns正向解析 39 dns反向解析 40 ssh 41小结 45第 3章搭建 hbase…………………………………… 46在 ubuntu上下载 java 46主机配置 52主机文件 52命令修改 52文件修改 52基于 dns 54安装配置 ssh 54在 ubuntu/red hat/centos上安装 ssh 55配置 ssh 55安装配置 ntp 56容量规划 57安装配置 hadoop 58 core-site.xml 63 hdfs-site.xml 63 yarn-site.xml 65 mapred-site.xml 66 hadoop-env.sh 66 yarn-env.sh 67 hadoop的启动步骤 67配置 hbase 68在单机模式中配置 hbase 69配置分布式模式 70安装配置zookeeper 73安装 cloudera版本的hadoop和 hbase 75下载 rpm包 76简易安装 cloudera 76安装 hadoop和 mapreduce包 77在 windows上安装 hadoop 78小结 80 第 4章优化 hbase/hadoop集群 ………………………… 82 hadoop/hbase集群类型 82 cdh集群推荐配置 84容量规划 85优化 hadoop 86通用优化技巧 86优化 java gc 86优化 linux操作系统 87优化 hadoop参数 87优化 mapreduce 88优化 hbase 91 hadoop 91内存 93 java 93操作系统 94 hbase 94优化 zookeeper 96 hadoop中的重要配置文件 97 hbase中的重要配置文件 97小结 98第 5章 hbase的存储、框架以及数据类型 ………………….. 99 hbase的数据类型 100 hbase中的数据存储——逻辑视图 vs.真实物理视图 101命名空间 102 hbase服务 103行键(row key) 104列族(column family) 104列(column) 104单元格(cell) 104版本(version) 104时间戳(timestamp) 105数据模型的操作 105读(get) 105写(put) 106扫描(scan) 106删除(delete) 106版本和原因 107决定版本数量 108版本的下界 108版本的上界 108模式设计 110表类型的设计 113短宽和高瘦设计模式的好处 114复合键设计 115在 hbase中计算存储的数据大小 118小结 119第 6章 hbase集群运维与故障处理. . . . …… . . . ……. . . . …… 120 hadoop shell命令 121 hadoop shell命令的类型 121 hbase shell命令 140 hbase管理工具 148 hbck —— hbase检查 148 hbase健康检查脚本 150写 hbase shell脚本 151使用 hadoop工具或者 jar 151用 hive连接 hbase 153 hbase region管理 154压缩 154合并 155 hbase节点管理 155服役(commissioning) 155退役(decommissioning) 155 实现安全性 156安全访问 156 kerberos kdc 157客户端的安全配置 158服务器端的安全配置 159简单的安全 159客户端配置 161标签的安全特性 161 hbase的访问控制 162服务器端的访问控制 167使用标签的单元格访问 167配置 zookeeper安全 168 hbase常见错误故障排查和相关说明 170集群失败的可能情况 171监控 hbase的健康状况 171小结 175第 7章 hbase脚本编程 . . . ……. . . . ……. . . . …… . . . …… 176 hbase中的备份与恢复技术 176离线备份/full-shutdown备份 177在线备份 178 windows上的 hbase 185 hbase脚本编程 185 .irbrc文件 187获取时间戳 188开启调试 189在 hbase中开启 sql 189参与 hbase 190小结 190第 8章 hbase java编程. . . ……. . . . ……. . . ……. . . . …… 191准备开发环境 192构建 java客户端程序 192数据类型 196数据模型的 java操作 196读操作 197写操作 205修改操作 206 hbase过滤器 208过滤器类型 209客户端 api 214小结 215第 9章 hbase java高级编程 …… . . . …… . . . ……. . . . …… 216接口、类和异常 216管理任务编程 218数据操作代码 224 mapreduce和 hbase 226 restful和 thrift服务接口 231 restful服务接口 231 thrift服务接口 232 hdfs编程 233高级主题简介 237协处理器 237布隆过滤器 238 lily项目 238小结 239第 10章 hbase使用案例 . . ……. . . . …… . . . ……. . . . …… 240 hbase在当今行业 240 hbase和关系型数据库的未来对比 241一些现实世界的工程使用案例 241 hbase在 facebook 241 hbase在 pinterest 243 hbase在 groupon 244 hbase在 longtail video 246 hbase在 aadhaar(uidai)  246 有用的链接和引用  247 小结  249

封面

Learning Hbase-中文版

书名:Learning Hbase-中文版

作者:谢帕夫

页数:249

定价:¥65.0

出版社:电子工业出版社

出版日期:2015-10-01

ISBN:9787121270727

PDF电子书大小:38MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注