IBM InfoSphere Information Server

发布时间:2025-09-27 18:28

获得信息安全相关如CISSP(Certified Information Systems Security Professional)认证。 #生活技巧# #工作学习技巧# #工作技能认证#

有一些适合使用 Balanced Optimization 的常见场景。

在以下场景中使用 Balanced Optimization 可提高作业的性能。

将作业转换为使用批量登台表 如果您有大量数据,该优化可提高性能。该优化并不像一直以来那样可用于 Netezza。该优化不适用于 Big Data File 阶段。

方式属性包含批量登台的任何目标连接器都会将批量 INSERT 数据转换为目标数据库中的临时登台表。将添加后处理 SQL 以将数据从登台表转换为实际的目标表。如果希望登台表在与实际目标表不同的目标数据库空间中创建,那么可在属性中指定该空间。

在数据目标中进行处理、连接和查找 该优化会将尽可能多的工作推送到目标数据库或 Hadoop 集群中,包括查找或连接源表已在目标数据源中的情况。您还可以选择对登台表实施批量 INSERT。如果推送到目标数据服务器的工作涉及数据减少(例如,作业包含 Aggregator 阶段或带有约束表达式的 Transformer 阶段),那么也可以选择在数据源中执行数据减少。

缺省情况下,数据减少阶段只会推送到源数据服务器中。如果要将数据减少阶段推送到目标数据服务器中,请选择将数据减少推送到数据目标选项。

在数据源中减少数据 如果作业具有 Aggregator 阶段、包含可能会丢弃许多行的约束的 Transformer 阶段、Remove Duplicates 阶段或 Sort 阶段,那么该优化有助于提高性能。该优化会将尽可能多的处理推送到数据库源连接器或 Hadoop 集群中。 在数据源中执行连接和查找。 该优化将涉及同一数据库服务器(尽管可能是不同的数据库实例)或 Hadoop 分布式文件系统 (HDFS) 中的数据的 Join 和 Lookup 阶段推送到源数据库或 Hadoop 集群中。该优化还可省去通常由 Join 阶段隐式执行的额外排序工作。 均衡源数据服务器、InfoSphere Information Server 引擎和目标数据服务器之间的工作 该优化会将尽可能多的工作推送到一个或多个目标数据服务器中,然后将尽可能多的剩余工作推送到一个或多个源数据服务器中,最后剩下的工作将留在作业中。 将所有工作推送到数据服务器 如果作业使用的所有数据都位于同一个数据服务器或 HDFS 上,并且作业中的所有处理可在目标数据服务器内执行,那么可以省去所有数据服务器 I/O,并使所有处理都在目标数据库内作为 SQL 运行或在 Hadoop 集群内作为 JAQL 运行。

如果想要专门限制优化以便仅包括作业设计的一部分,那么可以设置应停止优化的阶段的名称属性。在此属性中指定的阶段以外,不会将处理推送到源或目标数据服务器。

如果要确保某个特定阶段只能推送到源或目标连接器,可以将该阶段的阶段亲缘关系属性相应设置为 source 或 target。 如果阶段亲缘关系属性具有缺省值 none,那么 Balanced Optimization 将使用缺省优化规则。

网址:IBM InfoSphere Information Server https://www.yuejiaxmz.com/news/view/1340958

相关内容

全球19个最佳 ETL工具列表以及选型建议
500 Internal Server Error
521: Web server is down
10 个最佳数据清理工具(2024 年 XNUMX 月)
IBM Business Automation Workflow
appium===报错adb server version (31) doesn’t match this client (39); killing…的解决办法
富士胶片IBM超大规模数据智能化存储技术沙龙在北京顺利举行
Internal Server Error
form runat=server标记
Python实现数据转移:SQL server ==> SQL server

随便看看