开源 ETL 工具 Kettle

开源 ETL 工具 Kettle

Apache
Java 查看源码»
跨平台
2009-09-10
hymn

Kettle 是一款国外开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle 中有两种脚本文件,transformation 和 job,transformation 完成针对数据的基础转换,job 则完成整个工作流的控制。

Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。

Kettle家族目前包括4个产品:Spoon、Pan、CHEF、Kitchen。 

SPOON 允许你通过图形界面来设计ETL转换过程(Transformation)。 

PAN 允许你批量运行由Spoon设计的ETL转换 (例如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面。 

CHEF 允许你创建任务(Job)。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。 

KITCHEN 允许你批量使用由Chef设计的任务 (例如使用一个时间调度器)。KITCHEN也是一个后台运行的程序。

的码云指数为
超过 的项目
加载中

评论(11)

李佳豪
李佳豪
你好我有一个大定时任务,关联了大概10个转换,数据交换量大概每分钟1000左右,每分钟执行一次 但是每隔三两天就会停止。但是定时任务是执行状态。(本来打算做集群但是目前只有两台服务起不做虚拟机的情况下如何保持稳定)
老衲大海
TASKCTL是一款作业自动化调度工具和Kettle可形成良好互补,可关注www.taskctl.com
久雨初晴
kettle 是不是不支持spark,我看官网只有hadoop的插件
AdamHH
AdamHH
本地用,怎么下载部署?
爬不动的小胖
爬不动的小胖
能下载吗
mark_wangfb
mark_wangfb
有个命令行下的高效迁移工具ora2mysql http://www.yougemysqldba.com/discuz/forumdisplay.php?fid=3
林韦杰
林韦杰
刚开始接触这个,问各位前辈,为什么我的软件打开之后,核心模块那里没有输入的功能呢?
LiangThinking
LiangThinking
叫我刀刀
叫我刀刀
@皮总 您好,这个软件是用来做什么的呢? #Kettle#
g
gh_95533
聚合函数 #Kettle#

Kettle 8.1 RC 发布,开源 ETL 工具

Kettle 8.1 RC 发布了,下载地址: https://github.com/pentaho/pentaho-kettle/releases/tag/8.1.0.0-RC 改进记录请看: https://github.com/pentaho/pentaho-kettle/compare/8.1.0.0-RC.....

2017/12/14 09:08

没有更多内容

加载失败,请刷新页面

没有更多内容

3
回答
请问kettle的JS组件放到web端运行报错问题
海子海子 的回答 04/18 17:05
最佳答案
https://blog.csdn.net/moumouguo/article/details/82143426
1
回答
kettle 调用web service接口报错,急,求指教。

报错信息如下 2012/06/28 09:30:44 - Web 服务查询.0 - ERROR (version 4.1.0-stable, build ...

2012/06/28 09:33
1
回答
kettle如何实现开机自启,并自动启动之前启动的作业

kettle部署到服务器上并设置作业自动调度任务时,服务器因故关机后,如何实现开机后自动恢复上次调度状态。

04/01 14:48
11
回答
kettle效率怎么样?

请教大家一个问题,我现在用kettle做了一个demo,从oracle抽取数据到mysql,抽取单张表数据,oracle这个单表有2600多万的数据,按时...

01/22 15:08
2
回答
Oracle的SQL在pl/sql能获取数据,但是在kettle里预览不到数据,这是为什么?

大家好,我写了:SELECT * FROM INP_SETTLE_MASTER where SETTLING_DATE > (to_date(substr...

2018/07/20 10:53
3
回答
kettle7.0无法连接ambari的hadoop集群

kettle在我的本机上,本机是可以通过浏览器去访问集群上的hadoop的,使用kettle连接之前,在kettle的安装目录下的plugins\pent...

2017/11/21 11:07
2
回答
kettle定时任务运行job不自动释放内存

我通过java代码写了一个定时任务,在linux环境去调用很多job,但是发现每次运行完之后内存不自动释放,这个问题不知道怎么解决,谁有好的解决办法还望赐教。

2015/06/25 19:49
1
回答
kettle源码修改

请问一下, 公司安排我研究kettle的源码,想做成公司内部产品化的软件, 要求我用mac地址来做为软件的激活码,但是这个mac地址是可以修改,这样的话做...

01/03 17:14
1
回答
kettle工具中嵌入java代码

现在一家电网公司上班,因为主要做数据抽取解析这一块,kettle工具用的地方比较多,这两天遇到一个小问题 :(这里暂时做了几条假数据),抽取一批数据入库,...

2018/11/19 16:36
6
回答
Kettle 8.1转Oracle到MYSQL报错,哪位大神看看怎么解决。空值引起的问题
程序猿4648 的回答 2018/11/23 14:41
最佳答案
表输出目标表和mysql里面的表不一样

没有更多内容

加载失败,请刷新页面

kettle的技巧

kettle的技巧

2015/09/25 23:28
511
0
数据层交换和高性能并发处理(开源ETL大数据治理工具--KETTLE使用及二次开发 )

北风网-在线教育java培训,java教程,java视频下载,中国IT网络教育第一品牌。

2014/01/02 14:01
1K
0
跑通kettle8.2源码,可以连接资源库,有大数据等插件的

要结束2年的相关kettle开发咯,出去看看世界(换个平台继续码农)。记录一下kettle8的源码部署过程。怕以后忘记咯。 如果直接部署源码,很奇怪,没有大数据等插件,也没有连接资源库按钮。 ...

03/06 10:23
51
0
安装jar文件到本地maven仓库

安装jar文件到本地maven仓库

2015/09/26 14:04
77
0
ETL Pentaho代码学习笔记

1、通过设置KETTLE_HOME环境变量可以让.kettle不需要在user.home下 2、默认kettle_home 为User.home,如果要自定义需要设置环境变量KETTLE_HOME 3、在.kettle目录下可放置以下文件或目录: ...

2014/12/17 16:46
425
0
Kettle 6.x 源码开发环境搭建

使用kettle 6.x源码搭建开发环境,可以调试插件,方便检查错误。

2016/11/02 18:06
4.3K
7
kettle 乱码问题 -

看了网上写 设置 数据库链接的 字符 utf8,可是还是不行。 后来找, 在spoon.bat 里启动参数面 加 “-Dfile.encoding=UTF-8” 网上说: (PS:kettle在windows下跑的,然而数据库是utf8,这是...

02/27 10:33
4
0
10分钟搞定kettle源码部署

从kettle4.4就开始用,截止到今天已经发展到8.0了,除了中间几次易主,显而易见的改变就是更改了两次主题,丰富了更多的插件仅此而矣。对于使用过程中一些常见的问题,并没有太多处理。在处理...

2018/05/09 11:54
175
0
kettle整合到web项目并运用quartz实现定时任务

目前正在做的项目需要用将主业务库的部分数据同步出去以作统计用,为了保持数据实时同步需要定时执行同步操作。同步工具运用了比较流行的ETL工具kettle,首先我们在kettle界面工具Spoon中设计...

2018/05/17 11:30
265
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部