Kettle 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
Kettle 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
授权协议 Apache
开发语言 Java 查看源码 »
操作系统 跨平台
软件类型 开源软件
所属分类 企业应用ETL工具框架
开发厂商
地区 不详
提 交 者 hymn
适用人群 未知
收录时间 2009-09-10

软件简介

Kettle 是一款国外开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle 中有两种脚本文件,transformation 和 job,transformation 完成针对数据的基础转换,job 则完成整个工作流的控制。

Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。

Kettle家族目前包括4个产品:Spoon、Pan、CHEF、Kitchen。 

SPOON 允许你通过图形界面来设计ETL转换过程(Transformation)。 

PAN 允许你批量运行由Spoon设计的ETL转换 (例如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面。 

CHEF 允许你创建任务(Job)。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。 

KITCHEN 允许你批量使用由Chef设计的任务 (例如使用一个时间调度器)。KITCHEN也是一个后台运行的程序。

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (12)

加载中
Mark一下,正在使用中。
2019/09/09 09:11
回复
举报
你好我有一个大定时任务,关联了大概10个转换,数据交换量大概每分钟1000左右,每分钟执行一次 但是每隔三两天就会停止。但是定时任务是执行状态。(本来打算做集群但是目前只有两台服务起不做虚拟机的情况下如何保持稳定)
2019/01/16 18:46
回复
举报
打分: 力荐
TASKCTL是一款作业自动化调度工具和Kettle可形成良好互补,可关注www.taskctl.com
2017/08/17 11:20
回复
举报
kettle 是不是不支持spark,我看官网只有hadoop的插件
2017/07/20 09:58
回复
举报
打分: 力荐
本地用,怎么下载部署?
2017/07/10 08:30
回复
举报
打分: 还行
能下载吗
2017/05/31 11:36
回复
举报
有个命令行下的高效迁移工具ora2mysql http://www.yougemysqldba.com/discuz/forumdisplay.php?fid=3
2017/03/17 15:34
回复
举报
刚开始接触这个,问各位前辈,为什么我的软件打开之后,核心模块那里没有输入的功能呢?
2017/03/15 22:34
回复
举报
打分: 力荐
2017/01/01 11:25
回复
举报
free的ETL调度监控(taskctl)+free的任务设计(kettle)=free的ETL方案。信与不信,它始终存在... Kettle
2013/01/28 21:46
回复
举报
更多评论
发表了资讯
2017/12/14 09:08

Kettle 8.1 RC 发布,开源 ETL 工具

Kettle 8.1 RC 发布了,下载地址: https://github.com/pentaho/pentaho-kettle/releases/tag/8.1.0.0-RC 改进记录请看: https://github.com/pentaho/pentaho-kettle/compare/8.1.0.0-RC...8.0 Kettle 是一款国外开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle 中有两种脚本文件...

8
43
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
05/27 16:53

Kettle与Hadoop(一)Kettle简介

目录 一、Kettle设计原则 二、转换 1. 步骤 2. 转换的跳 3. 并行 4. 数据行 5. 数据转换 (1)Date和String的转换 (2)Numeric和String的转换 (3)其它转换 三、作业 1. 作业项 2. 作业跳 3. 多路径和回溯 4. 并行执行 5. 作业项结果 四、转换或作业的元数据 五、数据库连接 1. 一般选项 2. 特殊选项 3. 关系数据库的力...

0
1
发表了博客
2019/02/26 10:23

kettle之linux使用kettle

Kettle可以在Window、Linux、Unix上运行,数据抽取高效稳定,使用之前需要准备环境。 准备java环境,这里就不赘述了,建议jdk7以上版本。 上传kettle压缩包,并解压,我解压的路径是/usr/soft/kettle 以下是重点: 确保kettle脚本可执行权限 使用命令查看文件权限 ls -l /data-integration 如图:  如果没有执行权限,...

0
2
发表于数据库专区
07/19 13:24

kettle 简介

描述 Kettle是一款开源的 ETL 工具,采用 JAVA 语言编写。 特性 高效稳定,支持多种类型的数据格式,如:MySQL,Oracle,PostGreSQL,CSV 等。 可视化设计。 概念 Transformation(转换):数据抽取/迁移主要设计...

0
0
2017/10/26 18:01

kettle 跑马观花

# 一. Kettle能做什么? 数据迁移, 数据增量同步, 数据收集. # 二. kettle运行方式 1. 使用kettle的GUI客户端运行. 2. 命令行运行 3. 通过kettle的server端运行. # 三. kettle实例 ## 环境准备 * 安装 JDK * 安装 MySQL * 下载,解压kettle ## 数据准备 mysql数据库创建脚本 ```sql # 创建数据库 create database kettle_d...

0
0
发表了博客
2018/07/19 14:43

关于kettle

1.点spoon.bat无报错也不运行 可以运行一下spoonDebug.bat 查看一下spoondebug.txt日志 我遇到这个问题时 是给他分配的内存太多了 我的电脑只有2g 给果他给分了2048M很明显运行不起来 这时用记事本打开spoon.bat修改一下内存分配,我这个改成了 512m和256,因为是测试学习用数据不会太大改这么小也是可以用的: if "%PEN...

0
0
发表了博客
2012/12/05 18:13

kettle常见问题

摘要:本文主要介绍使用kettle设计一些ETL任务时一些常见问题,这些问题大部分都不在官方FAQ上,你可以在kettle的论坛上找到一些问题的答案 1. Join 我得到A 数据流(不管是基于文件或数据库),A包含field1 , field2 , field3 字段,然后我还有一个B数据流,B包含field4 , field5 , field6 , 我现在想把它们 ‘加’ 起来...

1
4
发表于AI & 大数据专区
2019/10/04 23:59

Kettle 入门

1 概述 1.1 什么是 Kettle? Kettle 是一款开源的 ETL 工具,纯 Java 编写,可以在 Window、Linux、Unix 上运行,绿色无需安装,数据抽取高效稳定。 1.2 Kettle 工程存储方式 以 XML 形式存储 以资源库方式存储(...

0
1
发表于软件架构专区
2015/09/25 23:28

kettle的技巧

kettle的技巧

0
1
发表于服务端专区
2017/06/18 23:53

kettle-manager

平台简介 出发点 专门为kettle这款优秀的ETL工具开发的web端管理工具。 kettle作为非常优秀的开源ETL工具得到了非常广泛的使用,一般的使用的都是使用客户端操作管理,但问题是当投入生产环境使用时,动辄上百或几...

23
17
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了问答
2013/01/26 22:11

kettle 文件导出命名问题

kettle文本导出,勾选文件名里包含日期,为何导出的文件名年份显示不全,例如:2013年01月26日,只显示130126,可是我需要的是20130126,请教高手,谢谢。。。

3
0
发表了问答
2014/07/16 10:51

Kettle-spoon会秒退

有时候正常,有时候会秒退,时间不定期的,在windows系统 C:\Users\adminitrator\AppData\Local\Temp 下有部分的log,有其他人遇到这样的问题么? 无从下手啊,,感谢大家 2014/07/15 20:52:29 - ERROR (version 4.2.0-RC1, build 15366 from 2011-06-14 12.04.35 by buildguy) : 一个未预期的错误发生在Spoon: probable...

1
0
发表于数据库专区
09/10 17:53

如何解决kettle经常性断开资源库的连接?

T,我采用MySQL5.7.12作为8.2版本kettle的数据库资源库,但是在配置作业时间过长,kettle就断开与资源库的连接了,无法保存配置,只能重新连接,非常不便。报错如图: 而且,在cmd中用kitchen去执行作业,第一个转换跑了16个小时,顺序执行第二个转换时报错断开资源库的连接,如图: 请问怎么解决该问题呢?...

2
0
发表于开发技能专区
06/16 16:32

kettle5.4能在日志表加入一个自己在转换中的一个随机数吗?

kettle5.4能在作业日志表加入一个自己在转换中的一个随机数吗?因为我想通过这个id关联日志

2
0
01/16 17:14

kettle 运行carte 报Incorrect password or login ,大神进来看下

我使用的 kettle4.3 版本,jdk 1.8。 现在想这在liunx 系统下 创建 carte 子服务器,远程执行job,但发现用户为 admin/admin 才能创建成功,用其它的账号和密码都不行,我想问下,怎么配置那,或者说 kettle4.3 版本只能用 admin/admin 用户才能创建carte z子服武器吗?...

1
0
发表了问答
2014/11/18 16:43

Kettle的集群问题

windows7环境下,为了测试Kettle的集群功能,我在本机开了3个端口,以便测试Kettle的集群问题。 我在配置好Kettle环境的集群后,用集群方式启动,报错连接超时,以下是我配置的过程: 1、修改pwd文件夹下的3个carte-config.xml文件 <slaveserver> <name>q1</name> <hostname>boco-PC</hostname> <port>8381</port> <mast...

1
0
发表于开发技能专区
2019/12/02 17:48

kettle时间维度的累计求和怎么做

业务表不同日期录入,比如 日期 收款 2019-10-1 100 2019-10-2 50 2019-11-3 50 2019-12-4 100 统计每月收款和累计收款 月 当月收款 累计收款 2019-10 150 150 2019-11 50 200 2019-12 100 300

2
0
发表了问答
2015/04/13 11:37

kettle传递变量执行sql替换 出现中文乱码

请教各位大神,刚学 运行环境是win8 ,mysql ,kettle版本pdi-ce-5.3.0.0-213 在同一个数据库的同一张表中进行操作,编码方式为utf-8 我希望执行这样功能读取tb_cnki中的记录数iNum作为变量,读取tb_cnki中id号为63-67的记录,并在其id上加上iNum后重新写入tb_cnki 这一过程中,kettle可以正常执行,但是新插入tb_cnki的...

1
0
发表了问答
2012/09/04 10:36

KETTLE连接sybase数据库乱码!!!紧急!!!

使用KETTLE连接sybase数据库后,表输入里面的预览数据乱码,请问这个怎么解决,来高手帮忙啊!紧急!!!

6
0
发表了问答
2017/01/21 18:37

kettle启动报空指针异常

3
0
发表了问答
2016/05/10 19:53

Kettle怎么配置用户登录的Session信息,然后获取Rest接口数据

想用Kettle获取网站上面的数据,我这里有管理员的帐号和密码,需要登录后获取指定Rest接口的数据,然后转存到我的数据库中,我要怎么配置呀?

1
0
2019/06/26 16:45

有关kettle作业抽取数据的问题

现有1000万条数据,使用kettle工具将其抽取到指定的表中,并且要实事更新

1
0
发表于数据库专区
2019/06/12 10:35

linux环境kettle连接oracle Io exception: Connection reset

2019/06/12 10:28:48 - 表输入.0 - ERROR (version 7.1.0.0-12, build 1 from 2017-05-16 17.18.02 by buildguy) : An error occurred, processing will be stopped: 2019/06/12 10:28:48 - 表输入.0 - Error occurred while trying to connect to the database 2019/06/12 10:28:48 - 表输入.0 - 2019/06/12 10:28:48 ...

1
0
发表于开发技能专区
2019/05/28 15:08

kettle 二次开发成web项目有人尝试过吗?

kettle 二次开发成web项目有人尝试过吗?

2
0
发表于DevOps专区
2019/05/10 16:22

kettle能不能往Redis中抽数据

kettle能不能往Redis中抽数据

2
0
发表于大前端专区
2019/04/22 11:27

kettle提交作业到远程centos报错

2019/04/19 17:42:57 - sync-orcale2mysql - exec(1, 0, oracle-TEST-targetstudent.0) 2019/04/19 17:42:57 - oracle-TEST-targetstudent - Starting job entry 2019/04/19 17:42:57 - oracle-TEST-targetstudent - Opening transformation: [zip:file:///tmp/export_82a853ac-6286-11e9-8e4f-d9d75f3a3e1c.zip!//oracl...

1
0
发表于大前端专区
2018/08/27 14:09

请问kettle的JS组件放到web端运行报错问题

ERROR (version 5.4.1.8-209, build 1 from 2016-10-22 07.42.42 by buildguy) : java.lang.NoSuchMethodError: org.mozilla.javascript.ContextFactory.enterContext()Lorg/mozilla/javascript/Context; 我在kettle spoon客户端运行得好好的,但是放到java web端就跑不了,报这个提示少包的错误,请问大家有没有遇到过这...

3
0
发表了问答
2012/06/28 09:33

kettle 调用web service接口报错,急,求指教。

报错信息如下 2012/06/28 09:30:44 - Web 服务查询.0 - ERROR (version 4.1.0-stable, build 14410 from 2010-11-16 16.43.28 by buildguy) : Unexpected error : 2012/06/28 09:30:44 - Web 服务查询.0 - ERROR (version 4.1.0-stable, build 14410 from 2010-11-16 16.43.28 by buildguy) : org.pentaho.di.core.excep...

1
0
2019/04/01 14:48

kettle如何实现开机自启,并自动启动之前启动的作业

kettle部署到服务器上并设置作业自动调度任务时,服务器因故关机后,如何实现开机后自动恢复上次调度状态。

1
0
发表于开发技能专区
2019/01/22 15:08

kettle效率怎么样?

请教大家一个问题,我现在用kettle做了一个demo,从oracle抽取数据到mysql,抽取单张表数据,oracle这个单表有2600多万的数据,按时间戳增量抽取到mysql中,每次抽取1000,提交1000,跑了三十分钟,才抽取了50万,这个效率是不是太慢了啊

11
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
12 评论
897 收藏
分享
返回顶部
顶部