informatica powercenter 9.5是一款非常好用且功能强大的数据集成平台,主要方便用户进行各类数据库的管理操作,可以说是使用相当广泛的一款ETL工具,ETL就是就是用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)之目的端的过程,也就是业内常说的数据仓库,当然对象并不限于数据仓库。需要的朋友不要错过了!
数据整合引擎
Informatica PowerCenter拥有一个功能强大的数据整合引擎,所有的数据抽取转换、整合、装载的功能都是在内存中执行的,不需要开发者手工编写这些过程的代码。Informatica PowerCenter 数据整合引擎是元数据驱动的,通过知识库和引擎的配对管理,可以保证数据整合过程能够最优化执行,并且使数据仓库管理员比较容易对系统进行分析管理,从而适应日益增加的数据装载和用户群。
积极的元数据管理
Informatica PowerCenter充分利用元数据来驱动数据整合过程。它提供了一个单一的元数据驱动的知识库,和数据整合引擎协同运作,并且可使关键的整合过程能被简单定义、修改、重用,从而提高了开发生产力并缩短了部署周期。活动元数据合并严格的文件,提供维护体系,允许冲突性分析,可以广泛跟其他企业应用程序以及系统整合。
支持多数据源
通过辅助产品Informatica PowerConnect, Informatica PowerCenter提供了对特殊数据源和格式的支持,包括SAP、Siebel、PeopleSoft、AS400等。对于e-business格式的数据,可以直接通过分析DTD或XML格式数据文件来实现。
高性能的运行功能
将设计和运行环境的性能特性分离,提供了较好的灵活性,不需要重新编码,吞吐量可以通过服务器、并行引擎管理、最优化CPU资源等方式,尽快处理任务。数据高效并行功能(Data smart parallelism)使用户具有自定义分区功能,提供了最优化的数据并行处理。Informatica PowerCenter提供了一个非编码的图形化设计工具方便用户的调试使用。
分布式体系结构
作为企业级核心数据整合引擎,Informatica PowerCenter 可以单独部署,也可以在分布式体系结构中部署。如果在分布式体系结构中部署,Informatica PowerCenter 要协调和管理多个基于主题的数据集市,而这些数据集市是在局域网或广域网内由Informatica PowerMart 或Informatica PowerCenter引擎执行的。
安全的数据整合
PowerCenter for Remote Data 是Informatica PowerCenter 一个分布式数据整合选项,提供了高性能、安全的、投资回报率高的方法,使用户可以跨广域网与合作伙伴、供应商以及其他远程数据源交换信息。
安装前要确认有可连接的Oracle/DB2/SQLServer/Sybase数据库,且要建立一个专有用户来为powercenter使用,PC用这个用户会在数据库中建立其自身运行所需要的对象(如,在Oracle中,会建立354张表)。在我的实验中,应用Oracle10g,建立用户PCDBA,对该用户赋予了DBA权限(我没找到powercenter所需的最小数据库权限,索性把dba权限全权赋予该用户了)。
在安装过程中,要配置PowerCenter的域信息,其中会建立一个用户(默认用户名admin,可以修改),这个用户是用来做PowerCenter域、节点、服务全局管理的最高权限用户,安装完成之后,在Administration Console中,还会发现可以用到另外一个叫Administrator的用户,这个是默认建立的管理员用户,默认密码Administrator,主要用于客户端中使用,来连接repository元数据
在Administration Console配置repository服务和integration服务时,要注意它们的codepage设置要一致,关于PowerCenter中的codepage,参考本文可知其主要用于:
Repository Service
Integration Service
Integration Service Data Move
Source
Target
1与2必须一致;3在ascii和unicode中选择;5>=1;2>=4