大家好,欢迎来到IT知识分享网。
概述
今天主要介绍下kettle的记录集连接功能和一些注意点。
一、什么是记录集连接
记录集连接可以实现数据集合的关联,也分为内连接,左连接,右连接,外连接。
多表的join,可以直接用sql写入【表输入】组件,也可以借助kettle提供的【记录集连接】组件,使用kettle的记录集连接组件,首先必须要两个输入数据集是有序的,并且是根据需要join的字段排序,可以借助kettle的【排序记录】组件。
步骤:
1:首先根据【排序记录】组件将两个数据集需要join的字段进行排序。 2:使用记录集连接组件对数据集进行排序。
注:
1:第一个步骤为连接的主表 2:连接类型分为,内链接,左外连接,右外连接,全外连接。 3:两个步骤的连接字段必须和排序记录中的名称一致。
其他:
1:步骤名称:在单一转换中名称必须唯一。 2:第一个步骤:指定要合并的第一个输入步骤。 3:第二个步骤:指定要合并的第二个输入步骤。 4:连接类型:选择合并可用的类型。 5:连接字段:指定要做关联的字段。
二、记录集连接实验
需求:将A表(code,部门,指标)、B表(code,部门,核心内容)组合输出结果:S表(code,部门,指标,核心内容)
1、准备A表、B表
A表:
B表:
2、kettle流程
其中以code进行排序,注意AB两张表的code都是不重复的
3、结果:
觉得有用的朋友多帮忙转发哦!后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注下~
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/61865.html