Pig编程指南
本书特色
[
apache pig 是一个高级过程语言,适合于使用 hadoop 和 mapreduce
平台来查询大型半结构化数据集。通过允许对分布式数据集进行类似 sql 的查询,pig 可以简化 hadoop
的使用。本文不仅为初学者讲授,pig 的基础知识,同时还向有经验的用户更加全面的介绍pig的重点特性。
通过学习本书,你将能够身日了解数据模型,包括基本数据和复杂数据类型。掌握更高效的在hadoop集群中运行脚本的方法和技巧。
]
内容简介
[
《pig编程指南》不仅为初学者讲解apache
pig的基础知识,同时也向有一定使用经验的高级用户介绍更加综合全面的pig重要特性,如piglatin脚本语言、控制台shell交互命令以及用于对pig进行拓展的用户自定义函数(udf)等。当读者有大数据处理需求时,《pig编程指南》提供了如何更高效地使用pig来完成需求的方法。
《pig编程指南》适合各个层次的pig用户及开发人员阅读使用。
]
作者简介
[
alan gates
是将PIG从雅虎的研究项目转化成一个成功的Apache开源项目的工程师团队中最早的成员。他负责监督Pig的实现、编程接口和总体设计。
]
目录
第1章 初识pig
1.1 pig是什么?
1.1.1 pig是基于hadoop的
1.1.2 pig latin,一种并行数据流语言
1.1.3 pig的用途
1.1.4 pig的设计思想
1.2 pig发展简史
第2章 安装和运行pig
2.1 下载和安装pig
2.1.1 从apache下载pig软件包
2.1.2 从cloudera下载pig
2.1.3 使用maven下载pig
2.1.4 下载pig源码
2.2 运行pig
封面
书名:Pig编程指南
作者:[美]盖茨 著,曹坤 译
页数:191
定价:¥49.0
出版社:人民邮电出版社
出版日期:2013-02-01
ISBN:9787115301116
PDF电子书大小:144MB 高清扫描完整版
本文标题:《Pig编程指南》PDF下载
资源仅供学习参考,禁止用于商业用途,请在下载后24小时内删除!