Kettle 中使用转换完成数据 ETL 全部工作。转换由多个步骤(Step)组成,如文本文件输入,过滤输出行,执行SQL脚本等。各个步骤使用跳(Hop)(连接箭头) 来链接。跳定义了一个数据流通道,即数据由一个步骤流(跳)向下一个步骤。在 Kettle中数据的最小单位是数据行(row),数据流中流动其实是缓存的行集(RowSet) ...
场景:kettle调用存储过程,存储过程中通过select * from table 方式返回结果集,kettle接收结果集。 解决方案:1)借助临时表。2)表输入步骤。今天主要讲解表输入。 1、创建一个无参存储过程,脚本中通过select * from t1 返回数据集。脚本如下: usetest;dropprocedureifexistssp_without_param1; delimiter//createprocedu...
1、Kettle的下载与安装(在本文中使用的kettle版本为8.2.0.0-342) kettle的最新下载地址:http://community.pentaho.com/projects/data-integration/ 2、打开kettle。 首先解压下载下来的压缩包如:pdi-ce-8.2.0.0-342.zip 然后打开Spoon.bat,打开后请耐心等待一会儿时间。如图所示: 3、建立转换。 在文件->新建装换...
在使用Kettle连接数据库时,需要下载并配置相应的数据库驱动。例如,连接MySQL数据库需要下载mysql-connector-java.jar,并将其放入Kettle解压后路径的lib文件夹中。 三、Kettle入门教程 创建新转换 打开Kettle,点击“文件”->“新建”->“转换”,创建一个新的转换项目。 配置数据库连接 在左侧的“DB连接”处点击“新建...
kettle可以连接市面上常见的各种数据库,比如Oracle,Mysql, SqlServer等。但是在连接各个数据库之前,我们需要先配置好对应的数据库驱动,本教程以mysql为例,给大家讲解kettle连接mysql数据库的过程。 1)创建数据库连接 MySQL驱动下载(一定要下载对应数据库版本):官网下载地址 首先我们要将对应版本的mysql连接驱动放到...
将数据从oracle迁移到mysql,需要先在kettle中建立oracle和mysql数据库连接,注意 mysql-connector-java-5.1.45.jar 和 ojdbc14-10.2.0.1.0.jar 要在kettle启动之前拷贝进去。 2.1 mysql 将mysql-connector-java-5.1.45.jar 拷贝到 data-integration\lib 目录下 ...
直接上干活,不扯淡 我使用的kettle是6.1版本的,有需要的朋友可以到:https://sourceforge.net/projects/pentaho/files/Data%20Integration/6.1/pdi-ce-6.1.0.1-196.zip/download#, 下载,这是官方下载链接,使用的时候需要事先安装jdk,如果安装了多个jdk,想指定jdk请在环境变量中加PENTAHO_JAVA_HOME,值就是你所指定...
执行快捷方式以启动工具。在完成基本安装与配置后,还需额外配置Oracle驱动以实现数据库连接能力。在Oracle安装目录中,通过关键字搜索ojdbc5.jar文件,并复制到Kettle的lib目录下,至此,基本的Kettle安装教程就到此结束。成功完成步骤之后,Kettle即可用以执行ETL任务,实现数据的提取、转换及加载。
kettle官网 和 官方教程 参考 一、kettle下载 GitHub:https://github.com/pentaho/pentaho-kettle 安装版:http...
在需求下,了解业务逻辑后,做了十几份不同逻辑不同业务范畴的日常报表工作流。以其中一例作为示范。这可以看作Kettle的基本教程噢。。。 1、 导数 新建一个转换,核心对象中有许多功能,导数的话,根据源数据的文件类型选择,最常见的excel,csv,txt……选中你想要的,直接拖到编辑区(图1),so easy,双击就可以选择需...