| | |--> //SELECT id, array_agg(label_name) FROM test_array_agg GROUP BY id; | | |--> //如果是多阶段聚合:这个时候num_rows=1,需要在上层调用5次 | | |--> //SELECT label_name, array_agg(label_name) FROM test_array_agg GROUP BY label
笔者最近由于工作需要开始调研 Apache Doris,通过阅读聚合函数代码切入 Apache Doris 内核,同时也秉承着开源的精神,开发了 array_agg 函数并贡献给社区。笔者通过这篇文章记录下对源码的一些理解,同时也方便后面的新人更快速地上手源码开发。 聚合函数,顾名思义,即对一组数据执行聚合计算并返回结果的函数,在统计分析过...
笔者最近由于工作需要开始调研 Apache Doris,通过阅读聚合函数代码切入 Apache Doris 内核,同时也秉承着开源的精神,开发了 array_agg 函数并贡献给社区。笔者通过这篇文章记录下对源码的一些理解,同时也方便后面的新人更快速地上手源码开发。 聚合函数,顾名思义,即对一组数据执行聚合计算并返回结果的函数,在统计分析过...
修复array_agg函数结果不对的问题。 https://github.com/apache/doris/pull/32387 使Variant 类型应当一直是 nullable. https://github.com/apache/doris/pull/32248 修复Schema Change 没有正确处理空 Block 的问题。 https://github.com/apache/doris/pull/32396 修复使用 json_length() 函数时部分场景会出错...
数组函数 array_agg 支持在 ARRAY 中嵌套 ARRAY/MAP/STRUCT。#42009 新增近似聚合统计函数 approx_top_k 和approx_top_sum。#44082 改进与优化存储 支持将 bitmap_empty 作为默认值。#40364 引入insert_timeout 会话变量,用以控制 DELETE 语句的超时时间。#41063 改进部分错误提示信息。#41048 #39631 ...
数组函数array_agg支持在 ARRAY 中嵌套 ARRAY/MAP/STRUCT。#42009 新增近似聚合统计函数approx_top_k和approx_top_sum。#44082 改进与优化 存储 支持将bitmap_empty作为默认值。#40364 引入insert_timeout会话变量,用以控制 DELETE 语句的超时时间。#41063 ...
新增array_agg函数 聚合函数 Bug Fix 执行计划 Bug Fix TaskGroupManager 优化 BE Crash 修复 文档修改: https://github.com/apache/doris/pull/26958 https://github.com/apache/doris/pull/26410 https://github.com/apache/doris/pull/25082 https://github.com/apache/doris/pull/25075 ...
实际业务中还遇到过需要把多行数据合并成数组的情况,这时候可以用array_agg函数。比如先按用户分组,把访问过的页面ID聚合成数组: SELECT user_id, array_agg(page_id). FROM user_behavior. GROUP BY user_id; 这样就能把原来多行的页面访问记录压缩成单行数组,方便后续存储或分析。但要注意数组长度不能超过Dor...
笔者最近由于工作需要开始调研 Apache Doris,通过阅读聚合函数代码切入 Apache Doris 内核,同时也秉承着开源的精神,开发了 array_agg 函数并贡献给社区。笔者通过这篇文章记录下对源码的一些理解,同时也方便后面的新人更快速地上手源码开发。 聚合函数,顾名思义,即对一组数据执行聚合计算并返回结果的函数,在统计分析过...
修复ARRAY 类型倒排索引空值处理错误的问题。 修复对刚刚添加的列执行 BUILD INDEX 异常的问题。 修复特殊字符 UTF8 编码索引被截断导致结果错误的问题。 半结构化数据类型 修复array_agg 函数在特殊情况下 crash 的问题。 修复Stream Load 导入 JSON 类型时,chunk 参数设置错误导致 crash 的问题。 查询优化器 修复...