在本节中,我们已准备好在Talend Studio中创建我们的第一份工作.
商业模式的可抵押层是作业设计.当一个或多个组件连接时,它表示图形设计,它允许我们设置并运行数据流管理过程.
作业设计有助于将业务需求转换为代码,例程和程序,基本上它用于实现我们的数据流.
我们设计的作业可以关联我们需要的所有各种源和目标,用于数据集成以及任何其他相关过程.
在设计作业时,我们可以执行许多操作:
我们可以设置组件之间的连接和关系来定义序列和动作的性质.
我们可以更改组件的默认设置以及创建与我们确切需要的新组件.
编辑组件,我们可以随时访问代码.
我们可以设计并将项目添加到存储库中以重用和共享目的.
按照以下进程在Talend Studio中设计作业,用于数据集成平台:
创建一个新作业
添加组件
连接组件
配置组件
执行作业
step1:
打开Talend Open Studio for Data Integration平台.
转到存储库窗格,右键单击作业设计,然后选择 create作业,因为我们可以在下面看到屏幕截图:
step2:
新的作业窗口将打开,在那里我们将填写像名称,目的和描述的细节,然后单击 finish 按钮可以在下面的屏幕截图中看到:
在作业设计下创建了作业部分,我们可以在下面的图像中看到
作业设计的下一阶段正在添加组件,在那里我们将添加组件,连接和配置它们.
step3:
为添加组件作业,我们将直接转到调色板面板,,我们有多个可用的组件.
或,我们还可以使用搜索字段并输入组件的名称并选择它.
例如,我们将在文件组件中选择输入中的 tfileinputexcel .
调色板→文件→输入→tfileinputexcel
step4:
由于我们将Excel文件作为输入,我们将从调色板面板中拖动 TfileInputexcel 组件,然后将其放到设计工作区窗口,因为我们可以在下面的图片中看到:
step5:
现在在下一步中,我们将单击"设计工作区"窗口的任意位置.
一个搜索框将出现,然后键入 tlogrow 并从给定列表中选择它,并且将在设计工作区窗口中显示所选组件,因为我们可以在下面的图片中观察到:
step6:
在下一步中,我们最终将从调色板窗格中拖动 tfileoutputexcel 组件,然后删除进入设计工作区窗口,因为我们可以在下面的屏幕截图中观察到:
as现在,我们完成了添加作业的组件,而我们的设计工作空间将如下所示:
成功添加组件后,我们将要连接组件.
要连接组件,请遵循以下过程:
step7:
右键单击是TfileInputexcel的第一个组件,并使用行连接连接,如下所示,行→main
row1(main)连接,我们可以在下面的屏幕截图中看到:
step8:
到目前为止,我们已成功连接了作业的组件.
添加并连接组件后,我们将转向我们的下一阶段,即配置组件.
step9:
要配置组件,请双击第一个组件 tFileInputExcel,并在 File name/stream 中给出我们输入文件的路径,如果 Excel 文件的第一行有列名,则在 Header 中放一个 列如下图:
步骤10:
在此之后,单击编辑模式,我们可以添加列,并根据我们的输入Excel文件添加列.
添加架构后,单击确定按钮,我们可以在下面的屏幕截图中观察:
step11:
然后,单击是按钮以传播上述更改.
step12:
现在,转到 tlogrow_1 组件,单击 sync列,然后选择 mode ,我们要生成行从我们的投入.
为此,我们将选择 mode 作为基本,并将"|"作为字段分隔符,我们可以在下面的图片中看到:
step13:
之后,转到 tfileoutputexcel 组件,并通过给出路径来存储它.
,在工作表名称字段中,将输出Excel文件表名作为"thee1"提供,然后单击同步列.
在完成添加,连接和配置组件后,我们将准备好执行我们的第一次Talend作业.
step14:
要执行作业,请单击运行按钮,正如我们在下面的屏幕截图中看到:
我们可以看到 firstjob 的执行正如我们在下面的屏幕截图所示:
并且,我们还可以看到输出即将到来的基本模式"|"分开.
我们的输出文件在给定的输出路径中以Excel格式保存,因为我们可以在下面的屏幕截图中看到:
在本节中,我们将学习我们如何处理工作执行.
来控制执行工作的实施,我们将考虑上面的示例.
右键单击存储库窗格中的作业,,然后选择构建作业标签,如下图片所示:
之后会打开构建 Job 窗口,我们可以在 TO archive file 字段中给出 Job 的路径,在 Job Version 部分更改 Job 的版本,我们还可以在 Build type 中选择构建类型
然后,点击完成
在正常模式下运行作业,请按照以下进程:
从运行(作业firshjob)中选择基本运行选项,然后单击运行按钮以开始执行,就像我们一样可以在下面的屏幕截图中看到:
要识别作业执行中可能的错误,我们将以调试模式运行作业.
在调试模式下运行作业,我们在Talend Studio中提供了两种选项:
trace debug
java debug
跟踪功能允许我们在为数据集成平台运行Talend Studio中运行作业时监视数据处理.
它通过组件行为的行视图向我们提供一行,并将动态结果显示为"设计工作区"窗口上的行链路.
要访问跟踪调试模式,请按照以下进程:
单击运行视图以访问它.
单击 debug运行选项卡以访问调试执行模式,然后选择 trace debug 以在跟踪模式下执行作业.
调试作业后,我们的设计工作区窗口将如下所示:
在java调试模式下运行我们的作业之前,主要步骤是添加断点.
将断点添加到我们要调试的组件中,请按照以下过程进行操作.
右键单击设计工作区中的组件,然后在弹出菜单上选择添加断点.
这将允许我们自动获取作业以停止每个断点.
我们可以按步骤运行作业,检查每个断点组件是否有预期的行为及其变量值.
并看看我们已将断点添加到 tfileinputexcel 和 tlogrow
添加断点后,转到运行面板的调试按钮 并选择 java调试
我们可以从下面的屏幕截图中注意到 firstjob 根据断点在调试模式下执行.
运行视图上的提前设置选项卡有各种提前执行设置,可用于执行作业处理程序.
高级设置包含多个特征,如统计信息,执行时间,在执行前保存作业,在运行之前清除,以及JVM设置.每个功能都如下所示,
统计:统计信息用于显示处理速率.
执行时间:这些功能在执行结束时显示控制台中的执行时间.
保存作业在执行前:在执行开始之前会自动保存作业.
在运行之前清除:此功能将在重新执行作业之前清除先前执行的所有结果.
jvm设置: JVM设置帮助我们配置我们的Java参数.
本文地址:https://www.itbaoku.cn/tutorial/cn_talend-talend_data_integration_job_designing.html
18 talend
32 talend
8 talend
12 talend talend-mdm
12 performance etl talend