- ETL数据整合与处理(Kettle)
- 王雪松 张良均主编
- 756字
- 2025-03-12 17:56:26
1.3.2 新建转换与任务
转换和任务,是Kettle中的最基础的,也是最核心的操作。Kettle采用图形界面,建立转换工程,使用组件,将分布的、异构数据源中的数据,抽取至临时中间层后进行清洗、转换、集成等操作,最后将处理后的数据装载至目标数据库或数据文件中。因为转换不能自动运行,需要人工操作才能运行,所以需要建立任务工程,使用任务组件,设置时间调度,调用转换工程,具体执行转换工程中的数据转换工作。
1.转换
在Kettle欢迎界面中,依次单击【新建】→【转换】菜单项,或使用Ctrl+N组合键,创建【转换1】转换工程,如图1-16所示。

图1-16 新建【转换1】转换工程
在图1-16所示【转换1】转换工程中,与欢迎界面不同,左边的组件区域以树形结构的形式,列出了【核心对象】选项卡中所有的类别对象。例如,单击【输入】对象,系统会列出【输入】对象下所有的组件,选择【CSV文件输入】组件,拖曳至右边的工作区域中,完成【CSV文件输入】组件的创建,如图1-17所示。完成该组件的创建后,即可设置组件的参数,预览转换组件的结果数据。

图1-17 创建【CSV文件输入】组件
在图1-17所示的【转换1】转换工程名称的下方,是转换工程的快捷菜单图标。有关快捷菜单图标说明如表1-10所示。
表1-10 转换工程快捷菜单图标的说明

续表

2.任务
在Kettle欢迎界面中,依次单击【新建】→【作业(J)】菜单项,或使用Ctrl+Alt+N组合键,创建【作业1】任务工程,如图1-18所示。

图1-18 新建【作业1】任务工程
在图1-18所示【作业1】的任务工程中,单击左边的组件区域中的【通用】对象,显示出【通用】对象下所有的组件,选择【Start】组件,拖曳至右边的工作区域中,完成【Start】组件的创建,如图1-19所示。【Start】组件创建后,即可设置该组件的参数,运行任务。

图1-19 创建【Start】组件
在图1-19所示的【作业1】转换工程的下方,是任务工程的快捷菜单图标。有关任务工程快捷菜单图标说明如表1-11所示。
表1-11 任务工程快捷菜单图标说明
