Informatida Powercenter权威指南

相关资料

[

推荐序

犹豫了很久,以我现今的职位给作者写序,是否有些自吹自擂?但读完书稿,我决定了:一本好书,介绍一个好产品,既然与我受用,何不推荐给更多的人呢?

“it”是信息(information)和技术(technology)的缩写,它的发展不过三十多年的时间。在it发展前期的大部分时间里,其所有进步大部分体现在“t”上,例如计算性能、存储容量、网络拓展及打印效果等。直到近些年“大数据时代”的出现,人们才开始了对于信息数据,也就是“i”的关注。我相信,这个变化是it发展的必然,是一个破茧成蝶的过程,并且这个关注也一定会延续很多年。

同样,正是因为“大数据”日益深入人心,企业的it 规划和发展越来越与“大数据”相关联,powercenter才得以从一个it人员得心应手的工具,蜕变为大数据应用的一个重要环节。记得在2014年国务院工业和信息化部颁布的大数据白皮书中,就明确地将“数据准备”定义为大数据发展的第一个环节。由此,作为在数据集成领域里历年排名第一的powercenter,也就承担起了“帮助企业实现大数据应用的第一步”的重要使命。

本书前6章中规中矩,如同一本深入浅出的教科书,将具备一些基本it知识的人士引进数据迁移的奇妙世界,加上作者风趣的调侃,学来丝毫不觉得枯燥单调。第7章开始是实战描述,实际上是一系列的应用经验分享,这些宝贵的经验之谈,可以让初学者在未来的实践中少走弯路,还可以将本书作为可以随时受教的参考书。更值得一提的是,不同于普通的产品手册,本书作者以其十几年的理论研究和教育培训,以及主导或参与诸多中外企业“数据集成项目”实施的经验,将powercenter的很多功能细节描述得淋漓尽致。本书对于有意进行etl教学的教育培训机构,不失为一本经典的教材;而对于有意培养自己成为etl应用高手的it人士,则是一本有益而又有趣的读物。

曾经有不少朋友问我:当成了etl的行家里手以后,下一个职业目标会有哪些发展方向?所以,我想借此序的一角,分享一些我的认知,供大家参考。

第一,云数据集成和管理。根据idc的预测,2017年全球saas和云软件模式将占软件开支的1/6。越来越多的云应用系统承诺并交付更简单、更快捷和更智能的业务营运方法,所以,掌握云数据集成,会让你在不可阻挡的云服务趋势下游刃有余。

第二,下一代数据洞察。不同于第一代商业智能(bi)对展示形态和分析过去的重视,大数据时代的数据洞察,更加关注数据的质量而不是数据的展现形式,更重视预测未来的行为模式而非过去的行为分析。所以,要想成为大数据分析专家,你必须懂得数据质量管理和前瞻性的分析。当然,保障分析结果正确的前提是确保数据的统一性、完整性,并找到数据的关联性。

第三,数据治理。大数据时代,越来越多的企业将数据纳入其固定资产;在金融和医疗行业,数据相关的合规性成为政府监管的重要指标;为了应对客户需求和市场业务模式的变化,许多企业开始考虑应用整合和迁移……这些巨大的变化,不断催生出数据治理的高手,他们必须在行业规范、企业应用系统、数据的关联性和安全性方面具备独特的技能。因此,了解行业特性、行业应用,使之与数据集成相结合,便成为你进行数据治理的更高境界。
近年来,关于大数据的定义一直在调整,而大数据应用的目标却始终没变,那就是:发现数据价值,帮助企业降低成本并实现业务创新。在过去短短的两三年里,中国作为自然的大数据国家,已经在大数据的理论研究和实际应用方面取得了巨大的进展。大数据的应用会推动各行各业诞生越来越多的数据科学家,那是行业知识和数据治理兼备的卓越人才。it的发展已经实现了由“计算机科学”向“数据科学”的转换,近年来,“数据科学”又开始向行业应用进行大规模迁移。所以,数据科学家既是数据价值的挖掘者,更是行业产品和流程的创新者,他们的价值不是向企业的高管提供分析报表,他们本身就是企业的高管,他们在用数据作为依据,实现企业面向客户、市场、产品和流程方面的创新。

千里之行,始于足下。与各位读者共勉。

informatica大中国区总经理王晨杰

]

本书特色

[

在大数据时代,掌控数据首先需要掌握数据的处理能力。俗话说:“工欲善其事,必先利其器。”informatica powercenter作为业界广泛使用的数据处理工具之一,被全球多数大型机构、组织认可并采用。__eol__本书全面地介绍了informatica powercenter的主要功能及高级特性。__eol__本书分为3个部分:**部分为基础篇,包括第1~4章,系统介绍了powercenter的基础组件和常用功能,并在其中穿插了大量实践案例;第二部分为高级篇,包括第5~8章,系统介绍了powercenter并行、集群、性能调优和字符集管理等高级内容;第三部分为扩展篇,包括第9章,简要介绍了cdc的相关知识,powercenter与sap、mpp、hadoop集成,以及非结构化和半结构化数据处理能力。__eol__

]

内容简介

[

informatica大中国区专家力作,内容权威、可靠;
  全面而系统地讲解了informatica powercenter,并辅以大量案例以辅助读者实践;
  提供与作者在线交流的机会(扣扣群:212017946)

 

]

作者简介

[

杜绍森,任Informatica大中国区资深顾问。从PowerMart 5开始使用Informatica产品,自PowerCenter 8.1.1版本发布就一直任职于Informatica公司,服务于Informatica近10年时间,帮助Informatica用户设计和构建系统,或者对系统进行重构和调优。之前曾作为系统架构师、项目经理等服务于惠普及本地公司,从事电信行业计费及数据仓库项目。

]

目录

第1章 powercenter hello world世界 1.1 informatica hello world 1.2 powercenter架构和客户端简介 1.2.1 powercenter架构 1.2.2 powercenter客户端 1.3 powercenter hello world 第2章 powercenter基础组件 2.1 source 2.1.1 数据库源 2.1.2 文本文件源 2.2 target 2.2.1 数据库目标 2.2.2 文本文件目标 2.3 expression表达式 expression中的变量端口(variable port) 2.4 filter 2.5 source qualifier 2.5.1 source qualifier的作用 2.5.2 数据库数据源的source qualifier 2.5.3 source qualifier自定义sql 2.5.4 source qualifier复杂关联 2.6 sorter 2.7 joiner 2.7.1 关联类型 2.7.2 sorted joiner 2.7.3 joiner有什么独特作用 2.7.4 自关联(self-join) 2.8 lookup 2.8.1 lookup caching enabled 2.8.2 非连接的lookup 2.8.3 lookup sql override 2.8.4 共享lookup cache 2.8.5 dynamic lookup 2.8.6 lookup、source qualifier和joiner的对比 2.9 stored procedure 2.9.1 connected stored procedure 2.9.2 unconnected stored procedure 2.9.3 pre- or post-session stored procedure 2.10 union 2.11 transaction control 2.11.1 transaction control有效性问题 2.11.2 transaction control组件 2.12 sequence 2.12.1 sequence的常规用法 2.12.2 共享sequence 2.12.3 可重用的sequence 2.13 aggregator 2.13.1 条件聚合 2.13.2 使用aggregator进行行列转换 2.14 rank 2.15 update strategy 2.15.1 treat source rows as属性的使用 2.15.2 update strategy使用 2.15.3 如何实现update else insert 2.15.4 update stagety案例:缓慢变化维 2.16 sql transformation 2.16.1 script mode 2.16.2 static query mode 2.16.3 dynamic query mode 2.17 java transformation 2.17.1 java transformation简介 2.17.2 passive java transformation 2.17.3 active java transformation 2.17.4 常见错误说明 2.18 normalizer 2.19 router 2.20 custom tranformation 2.21 http transformation 2.22 xml组件组 2.23 transformation中的一些概念 2.23.1 connect与unconnect 2.23.2 active与passive 第3章 workflow执行、监控 3.1 session 3.1.1 reusable session 3.1.2 非reusable session 3.2 *简单、*常用的workflow 3.2.1 并行执行 3.2.2 串行执行 3.2.3 调度 3.3 worklet 3.4 command 3.5 control 3.6 发送e-mail 3.6.1 配置发送e-mail 3.6.2 workflow中使用e-mail 3.7 event tasks 3.7.1 用户自定义事件使用 3.7.2 预定义事件使用 3.8 timer 3.9 decision 3.10 assignment 第4章 常用功能汇集 4.1 debugger 4.2 mapplet/reusable transformation 4.2.1 reusable transformation 4.2.2 mapplet 4.3 使用shortcut 4.3.1 local shortcut 4.3.2 global shortcut 4.4 session相关属性 4.4.1 properties tab相关属性 4.4.2 config object tab相关属性 4.5 参数和变量 4.5.1 mapping参数 4.5.2 mapping变量 4.5.3 系统/session参数与变量 4.5.4 workflow/worklet变量 4.5.5 local 变量(local variables) 第5章 powercenter高级应用 5.1 任务分区(partition) 5.1.1 database partitioning 5.1.2 hash partitioning 5.1.3 key range partitioning 5.1.4 pass through partitioning 5.1.5 round-robin partitioning 5.2 内存管理 5.2.1 dtm内存 5.2.2 transformation cache 5.3 网格计算 5.3.1 grid架构 5.3.2 grid负载均衡 5.3.3 grid与任务分区(partition) 5.4 高可用性(ha) 5.4.1 powercenter自带的ha方案 5.4.2 依托第三方厂商的ha方案 5.4.3 两种ha方案对比 5.5 web service 应用 5.5.1 web service hub 5.5.2 web service调度/监控接口 5.5.3 web service provider 5.5.4 web service consumer 5.6 pushdown optimization 5.6.1 pushdown优化是什么 5.6.2 pushdown优化类型 5.7 版本控制及部署 5.7.1 check in/check out 5.7.2 team-based开发的一些有用功能 5.7.3 label与deployment group 5.7.4 复制对象从开发repository到生产repository 第6章 powercenter实战汇总 6.1 powercenter字符集 6.1.1 oracle数据库 6.1.2 db2字符集 6.1.3 as/400字符集 6.1.4 odbc字符集 6.1.5 文本文件字符集 6.1.6 repository service字符集 6.1.7 integration service字符集 6.1.8 data movement mode 6.2 unix odbc配置 6.2.1 odbc常规配置 6.2.2 my sql社区版odbc配置 6.3 使用mapping动态分发文件 6.4 超越edw,商品自动价格跟踪 6.5 pmcmd命令 6.6 pmrep命令 6.7 infasetup命令 6.8 mapping architect for visio 6.9 mx view语句 6.10 powercenter与其他工具集成 第7章 性能调优 7.1 性能调优过……第8章 powercenter troubleshooting第9章 powercenter扩展能力

封面

Informatida Powercenter权威指南

书名:Informatida Powercenter权威指南

作者:杜绍森

页数:348

定价:¥69.0

出版社:电子工业出版社

出版日期:2015-09-01

ISBN:9787121270451

PDF电子书大小:137MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注