2024-07-08
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
StreamExecutionEnvironment
包含了 ExecutionConfig
,它允许在运行时设置作业特定的配置值。
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
ExecutionConfig executionConfig = env.getConfig();
以下是可用的配置选项:(默认为粗体)
setClosureCleanerLevel()
。closure cleaner 的级别默认设置为 ClosureCleanerLevel.RECURSIVE
。closure cleaner 删除 Flink 程序中对匿名 function 的调用类的不必要引用。禁用 closure cleaner 后,用户的匿名 function 可能正引用一些不可序列化的调用类。这将导致序列化器出现异常。可设置的值是: NONE
:完全禁用 closure cleaner ,TOP_LEVEL
:只清理顶级类而不递归到字段中,RECURSIVE
:递归清理所有字段。getParallelism()
/ setParallelism(int parallelism)
。为作业设置默认的并行度。getMaxParallelism()
/ setMaxParallelism(int parallelism)
。为作业设置默认的最大并行度。此设置决定最大并行度并指定动态缩放的上限。getNumberOfExecutionRetries()
/ setNumberOfExecutionRetries(int numberOfExecutionRetries)
。设置失败任务重新执行的次数。值为零会有效地禁用容错。-1
表示使用系统默认值(在配置中定义)。该配置已弃用,请改用重启策略。getExecutionRetryDelay()
/ setExecutionRetryDelay(long executionRetryDelay)
。设置系统在作业失败后重新执行之前等待的延迟(以毫秒为单位)。在 TaskManagers 上成功停止所有任务后,开始计算延迟,一旦延迟过去,任务会被重新启动。该配置已被弃用,请改用重启策略 。getExecutionMode()
/ setExecutionMode()
。默认的执行模式是 PIPELINED。设置执行模式以执行程序。执行模式定义了数据交换是以批处理方式还是以流方式执行。enableForceKryo()
/ disableForceKryo
。默认情况下不强制使用 Kryo。强制 GenericTypeInformation 对 POJO 使用 Kryo 序列化器,即使可以将它们作为 POJO 进行分析。在某些情况下,应该优先启用该配置。例如,当 Flink 的内部序列化器无法正确处理 POJO 时。enableForceAvro()
/ disableForceAvro()
。默认情况下不强制使用 Avro。强制 Flink AvroTypeInfo 使用 Avro 序列化器而不是 Kryo 来序列化 Avro 的 POJO。enableObjectReuse()
/ disableObjectReuse()
。默认情况下,Flink 中不重用对象。启用对象重用模式会指示运行时重用用户对象以获得更好的性能。注意可能会导致bug。getGlobalJobParameters()
/ setGlobalJobParameters()
。此方法允许用户将自定义对象设置为作业的全局配置。由于 ExecutionConfig
可在所有用户定义的 function 中访问,因此这是一种使配置在作业中全局可用的简单方法。addDefaultKryoSerializer(Class type, Serializer serializer)
。为指定的类型注册 Kryo 序列化器实例。addDefaultKryoSerializer(Class type, Class