首页 > 编程知识 正文

linux安装kettle集群,linux下安装kettle

时间:2023-05-03 13:15:15 阅读:55911 作者:1756

软件介绍

平台概述

起点

专门为名为kettle的优秀ETL工具开发的web端管理工具。

kettle被广泛用作非常好的开源ETL工具,通常使用客户端操作管理。 但是,问题是,投入生产环境后,需要数百个作业进行管理,在这种情况下,很难使用客户端进行管理。 我知道的解决方案有命令行调用,但操作麻烦,总之很难使用。 另外,正在开发web端管理工具。 kettle附带了web端管理工具,但界面非常简陋,难以使用,几乎无法投入生产环境。 我没注意到还有很多管理作业的工具。

在以上基础上,我和近两年的kettle定制开发和使用经验。 我设计并开发了这个kettle web端管理工具。

重要信息

功能介绍

主接口

参数设定

作业执行参数的设定。 选项卡页面上设置作业执行参数。 使用每次运行作业时设置的参数复盖默认值。 这个很多人不能使用。

计时器设定

操作界面与kettle的启动控制界面匹配,这可能是最佳功能之一。

运行和停止

不用说核心功能了。

强制结束

强制结束等待中的工作,应对正常停止无效的情况。

实时日志

实时查看作业执行日志时,此功能看不见,但实际上应该有用。

工作目录

获取工作目录。

新建作业

当前有四种类型的作业支持新建页面。 所有这些作业都支持修改页面。 其中的千米工作基于我的插件开发。 这里的工作将接管com.oss.job.AbsJob。 这些工作支持这里的千米工作,也支持使用以下定时日程。

删除作业

支持批量删除作业。 这很危险哦。 使用时请小心不要删除子转换或工作。

重新启动失败

支持配置失败时自动重新启动,并将job_version字段用作作业类别,从而简化分类管理。

日程安排

支持cron定时的调度。 所有类都必须继承。 com.oss.job.AbsJob,作业支持参数部署。 可以重用同一类,传递不同的参数。 这样开发的作业页面与上面的KM作业配置相对应。

con设计

引入cron辅助设计模块

按顺序执行

我已经开发了上面的千米工作。 com.oss.job.KettleJobRunner。 这样的工作既可以作为KM工作,也可以用于定时日程表。

此工作已经包含在项目中,可以直接使用。

请参考KM作业示例和日程示例。

运转状态

作业的运行状态定期反映在管理界面中,您可以在不同的条件下筛选所需的作业,以便批量运行或停止。

作业状态更新完成并记录在日志文件中的类: com.oss.job.JobManager。 使用方法类似于按顺序运行的作业。 请参阅使用方法。

为了简化部署,项目默认情况下不依赖于我开发的插件。 如果你不使用KM作业功能,就不需要我开发的插件。 默认情况下,项目按时间表配置作业,并默认运行。

平台级日志

一般优秀的作业设计记录自己的日志表,详细记录作业的执行状况。 本平台提供平台级日志功能,记录作业开始、停止时间、最终执行结果,与业务无关。

日志文件按天分文件夹存储,可以设置日志文件的大小。 如果需要空间,可以设计一个定期清理以前日志文件的作业,以便以后提供该作业。 也可以配置为不写入日志文件。

此功能也是通过com.oss.job.JobManager作业实现的。 与更新运行状态相同的作业。

业务日志

Km数据库中有用于记录我设计的业务日志的表。 METL_KETTLE_LOG。 本表是根据我们平时的设计工作经验设计的,工作设计人员在设计工作时需要填写本表的数据。 默认情况下,此平台提供此表的查询。

此日志与平台级日志互补,此日志更详细、与业务相关,平台级日志是备份,主要用于故障排除等。

enter">

KM作业示例

JS作业示例

该作业前部分操作基本与KM类似,区别在于具体的js基本配置

SQL作业示例

该作业前部分操作基本与KM类似,区别在于需要选择数据库,然后就是数据库脚本了

Shell作业示例

该作业前部分操作基本与KM类似,额外的需要配置脚本运行路径,默认:/tmp。

作业在linux上运行就写shell脚本,在windows上运行就写bat脚本。

都比较直观,就不多说了。

定时调度示例

 

后续计划

支持简单的表对表作业新增。

考虑新增转换管理,开发通用km作业支持转换运行。

一个job同时在多个km中运行还需要考虑,日志,状态等

任务管理在设置定时时可能需要人为分散定时,考虑生成时间-运行任务数的分析图辅助进行分散定时。

作业管理显示上一次和下一次运行时间。

作业管理支持配置文件资源库运行。

改为支持文件资源库和更多数据库作为资源库。

权限管理,不同用户看到自己的作业,管理员看所有作业。

分布式、集群支持。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。