table.exec.hive.infer-source-parallelism:默认值是 true,表示 source 的并行度是根据数据分区数和文件数推断的,如果设置为 false 的话表示并行度是以配置的为准 table.exec.hive.infer-source-parallelism.max:默认值是 1000,表示读取 Hive 数据的 source 最大并行度 这两个参数只在 HiveParallelismInference 类中...
org.apache.hadoop.hive.ql.stats包含的类与接口如下图所示: 其中: 接口: ClientStatsPublisher : 包含run方法,在hive中并没有其他类实现该方法,这个主要用于hive stats扩展使用。具体实现需要由 hive.client.stats.publishers这个参数决定,这个参数是用逗号隔开的stats publisher,这些stats publisher被每一个job调用。
table.exec.hive.infer-source-parallelism:默认值是 true,表示 source 的并行度是根据数据分区数和文件数推断的,如果设置为 false 的话表示并行度是以配置的为准 table.exec.hive.infer-source-parallelism.max:默认值是 1000,表示读取 Hive 数据的 source 最大并行度 这两个参数只在 HiveParallelismInference 类中...