Kettle,中文名:水壶,是一款国外免费开源的、可视化的、功能强大的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。 Kettle家族目前包括4个产品:Spoon、Pan、CHEF、Kitchen。 组成部分: Spoon:允许使用图形化界面实现ETL数据转换过程 Pan:批量运行Spoon数据转换过程 Chef:job(有状态,可以监控到是...
总之,Kettle可以简化数据仓库的创建,更新和维护,使用Kettle可以构建一套开源的ETL解决方案。 架构 Kettle是一个组件化的集成系统,包括如下几个主要部分: 1.Spoon:图形化界面工具(GUI方式),Spoon允许你通过图形界面来设计Job和Transformation,可以保存为文件或者保存在数据库中。 也可以直接在Spoon图形化界面中运行Job和Tr...
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、 Unix.上运行,绿色无需安装,数据抽取高效稳定。 Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。 Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做...
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。 Kettle家族目前包括4个产品:Spoon、Pan、CHEF、Kitchen。 SPOON 允许你通过图形界面来设计ETL转换过程(Transformation)...
Kettle(也称为 Pentaho Data Integration)是一款功能强大的开源 ETL(Extract, Transform, Load)工具,主要用于数据仓库和商业智能领域。Kettle最早可追溯到本世纪初,当时ETL工具种类繁多。Kettle的作者Matt Casters在2001年有了开发自己的ETL工具的想法,他每天忙于咨询工作,为不同项目不断修改ETL代码和框架,部署各种...
ETL处理工具-kettle使用 一、Kettle介绍 kettle是一个ETL工具,ETL的全称为(Extract-Transform-Load),用来描述将数据从来源端经过 抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL是将业务系统的数据经过抽取、清洗、转换之后加载到数据仓库的过程,目的是将业务系统分散、零乱、标准不统一的数据整合到一...
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、 Linux、Unix上运行,无… 十叶心 彻底学会使用epoll(一)——ET模式实现分析 1. ET模式实现分析1.1 ET和LT的实现区别 首先给出下面一张图,这张图是从我之前的一篇博文——epoll实现分析中摘取并细化的。这张图对理解ET模式已经epoll的工作过程只管重要,...
常见的ETL工具或类ETL的数据集成同步工具很多,以下对开源的datax、Kettle、ETLCloud进行简单梳理比较。1.DataX 1.1介绍 DataX是阿里巴巴集团开源的一款异构数据源离线同步工具,旨在实现各种数据源之间稳定高效的数据同步功能。它支持包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等多种异构数据源...
打开 Kettle 只需要运行 Spoon.bat (win)/ spoon.sh (Linux / macOS),即可打开 Spoon 图形工具。启动 Kettle 如下图,执行 ./spoon.sh 命令 欢迎页面 首页 HelloWorld 把数据从 CSV 文件复制到 Excel 文件 CSV 文件到 Excel 文件 CSV 文件输入 CSV 输入控件 将 「CSV 文件输入」拖拽到右侧的工作区,双击...