informatica组件

老牧童 • 2023-12-05 15:15 • 未分类

informatica组件informatica组件Informatica常用组件的使用方法https://www.cnblogs.com/wan-ge1212/一、F(X)表达式组件：主要用于行级表达式的计算；如对某个字段进行四则运算；对某些字符串进行计算等。Oracle简单查询差不多。SELECTsal

大家好，欢迎来到IT知识分享网。

informatica组件

Informatica常用组件的使用方法

informatica组件

一、F(X)表达式组件：

主要用于行级表达式的计算；如对某个字段进行四则运算；

对某些字符串进行计算等。 Oracle简单查询差不多。

SELECT sal Expression Transformatiion 表达式组件；

功能描述：它是做这种字段级的计算，加减乘除等等都可以在这里面来做，所以会用的比较多；

在端口中I表示：输入（input）;

O表示：输出（output）;

v表示：变量（variable）(临时保存一些数值);

二、SQ: Source Qualifier

功能描述：Source Qualifier组件在说有的场景中会被用到，它主要用于连接数据源，将数据源的数据类型转换为PowerCenter的数据类型。

对源进行抽取的一个组件；他是和源绑定在一起的；

相当于inforamtica做ETL的第一个动作，E的动作。这个组件基本上是不能缺少的；

Source Qualifier 能做哪些功能呢？

1、一般不会手动就写一些脚本，可以手工的定义一些SQL的select脚本；

informatica对数据库来说他也是数据库的一个客户端，相当于inforamtica扔给他一个SQL脚本然后返回他想要的结果集；

所以inforamtica呢会产生一个SQL脚本，这个时候呢你可以手动去编辑他

4 条件： SQ :同构数据源的。（来自于同一个数据库）

三、Filter组件

四、Normalizer组件：

特点：

将列表转换为行表

将列表转换为行表 GK_SAL_AOMOUNT 是一个序列号，从1，2，3，4，5，6….一直增长；

GCID_SAL_AMOUNT为1、2、、3、4重复进行。

EMPNO SAL_AMOUNT GK_SAL_AOMOUNT GCID_SAL_AMOUNT

1 1000 1 1

1 100 2 2

1 10 3 3

1 1 4 4

2 10000 5 1

2 1000 6 2

2 100 7 3

2 10 8 4

五、Router组件：

路由组件实现数据的分发：

六、Aggregator 汇总组件：

分组聚合按哪几个字段进行分组对哪几个字段进行聚合运算；统计出每个部门的工资之和

作用：执行分组聚合运算 Aggregator Transformation;

Aggregator 这个组件呢跟数据库里面的写SUM，group by 语句类似；

功能就是分组数据做一些汇总函数；排好序在汇总他的性能是最高的；

你可以理解成相当于sum 什么什么，group by 哪些字段，但是他的操作是在 inforamtica 内存中操作的，而不是在数据库中操作，已经把数据读过来了；

七、Lookup组件：

— 连接

1、有连接和未连接之分；

2、Lookup表可以是数据库表，也可以是文本文件；

— 未连接

查找组件；

有两种类型一种是连接的一种非连接的

非连接的 Lookup相当于一个函数。

连接的有一点对源表内容进行丰富。

有一个动作先把一张表放进了Lookup里面去了；

作为咱们的资源池： Baidu 关键字（后台有这种相关的东西）数据流规则：一种是分叉一种是不可以分叉

Lookup是被动组件：进去一条记录他必须出来一条如果查找不到呢？他会给咱们补空。

Lookup是比较消耗ETL服务器资源的组件之一，因此很多时候开发人员都会试图优化这个组件的性能，如减少Lookup的次数。

基于这个考虑，PowerCenter提供了Unconnected Lookup，确保只有必须的数据采执行Lookup操作。

八、Rank 作用：

排序记录，只输出最顶层或最低层的n个记录

用法：创建好Rank(下简称RNK)后，将需要的用的字段从transformation拖拽到RNK,双击RNK,对RNK的属性进行设置。

在Ports tab中有一个名为‘R’的列，选择你要排序的列。你还可以选择你想分组的列。

在Properties tab中Top/Bottom属性，Top表示选择顶层的记录，Bottom表示选择底层的记录；

Number Of Ranks属性值是整数，表示要选择的记录条数。

假设你在‘R’列中选择了名为’ Price’的列，而且Group By选择了‘Name’列，Top/Bottom属性选择的是‘Top’, Number Of Ranks属性值是2,

那么将抽取过程是这样的：以name分组取出每组中 Price最大的2列记录。

命名方式：RNK_Name

九、Joiner组件：

特点：

M的选择：一般会先码表数据量比较小的数据为M M放进内存里。

Joiner type： Joiner:可以实现异构数据源的合并。

Emp CSV Dept 数据库里 Joiner 有局限性：每次合并的时候只能合并两张表。N张表 N-1joiner组件进行合并。

十、文本文件：

特点：

十一、XML组件：

特点：

十二、Expression组件：

十三、Sorter组件：

十四、Union组件：

十五、调用存过组件：

十六、序号组件：

2、设置开始值，每次递增的值；

3、设置循环使用序列号，当序列号当前值到达最大值时，重置序列号为初始值；

十七、Mapplet映射组件：

十八、Update Strategy组件

— — — — — — — — —

1、变量的值在运行过程会发生变化；参数是一个常量值，在运行过程中不能修改的值。

功能：在表达式中引用变量和参数

相关链接：https://blog.csdn.net/yongjian1092/article/details/52588434

其他连接：informatica组件

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://yundeesoft.com/32938.html

赞 (0)

0

发表回复

关注微信