首页 > 编程知识 正文

开源etl工具kettle,kettle工具介绍

时间:2023-05-03 18:43:09 阅读:158025 作者:1328

建立Kettle的数据库连接,并使用Kettle进行简单的总量比较插入更新。 Kettle会自动比较用户设置的比较字段,如果目标表中不存在字段,则会插入新记录。 如果存在,则更新。

Kettle介绍: Kettle是国外开源ETL工具,采用纯java编写,可以在Window、Linux、Unix上运行,数据提取高效稳定。 Kettle的中文名字叫水壶,项目的主程序员MATT想把各种各样的数据放在一个水壶里,以指定的格式流出。 名为Kettle的ETL工具集。 可以管理来自各种数据库的数据。 通过提供图形用户环境来描述你想做什么,而不是你想做什么。 Kettle有两种脚本文件。 是传输和作业。 transformation完成数据的基础转换,作业完成对整个工作流的控制。 (引用百度百科() ) ) ) )。

1、下载和安装Kettle (本文使用的Kettle版本为6.1.0.1-196 ) ) ) ) ) ) ) ) )。

2、打开kettle。

首先对下载的压缩包进行解压缩,例如:pdi-ce-6.1.0.1-196.zip

然后,如图所示打开Spoon.bat。

打开后请稍等。

3、建立转换。

文件-新安装。

在新的转换后,在左侧的主对象树中建立数据库连接。 如图所示:

建立数据库连接的过程类似于其他数据库管理软件连接到数据库。

注:链接数据库时,可能会报告在数据库连接中找不到的异常。 那是因为没有对应的数据库链接驱动程序。 下载相应的驱动程序后,将其放入kettle的lib文件夹中。

4、插入更新简单的数据表

(1)插入新表格

在左面板中选择“核心对象”,在核心对象中选择“输入-表格输入”,然后用鼠标拖动到右面板。 如图所示:

双击拖动的表格,可以编辑表格输入。

选择数据库连接并编辑sql语句。 在这里,你可以点击预览,确认自己是否正确连接。

(2)插入)通过更新输出到表中。

在左侧面板中选择核心对象,然后选择“输出-插入更新”:

插入更新:

首先,表输入连接插入更新。

选择表格输入,然后按住shift键并拖动以插入和更新。

然后双击以插入和编辑更新。

到此为止,这个变换基本上结束了。 点击执行可以看到效果,看有没有错误。 请在保存后再执行此操作。 可以自由保存在任何地方。

5、使用工作控件,更换执行。

使用作业,可以定期或定期执行转换以创建新作业。 从左侧面板拖动到start和变换。

双击start可以进行编辑,可以设定执行时间等

单击“安装”可以配置要执行的转换任务。 例如,可以执行上述转换。 XXX.ktr

最后点击运行就可以了。

到此为止,通过简单作业安排的kettle已经结束了。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。