Apache Kyuubi是一个分布式和多租户网关,为数据湖查询引擎(例如Spark、Flink或Trino等)提供SQL等查询服务。 功能特性 多租户:Kyuubi通过统一的身份验证授权层为资源获取,数据和元数据访问提供端到端的多租户支持。 高可用:Kyuubi基于ZooKeeper提供了负载均衡,提供了企业级的高可用性,以及无限的客户端高并发。 多工作负载...
总体而言,Kyuubi 是一个强大的分布式 SQL 引擎,通过整合 Apache Spark 的计算能力,提供了高性能、多租户支持的 SQL 查询服务。在大数据分析领域,Kyuubi 提供了一种灵活、可扩展的解决方案。官方文档:https://kyuubi.apache.org/https://kyuubi.readthedocs.io/en/v1.8.0/https://github.com/apache/kyuubi K...
比如上述场景,用户可以分别在连接时指定 kyuubi.engine.share.level.subdomain=realtime 或 kyuubi.engine.share.level.subdomain=olap ,这样 Kyuubi Server 就会启动两个 Flink Engine。 2.4. Kyuubi Server 状态共享 大部分情况下 Kyuubi Server 是没有状态的,但也会有例外。例如当用户批量提交大量的 SQL 到 Kyuub...
导读:Cisco WebEx 早期数据平台采用了多系统架构(包括 Trino、Pinot、Iceberg 、 Kyuubi 等),面临架构复杂、数据冗余存储、运维困难、资源利用率低、数据时效性差等问题。因此,引入 Apache Doris 替换了 Trino、Pinot 、 Iceberg 及 Kyuubi 技术栈,依赖于 Doris 的实时数据湖能力及高性能 OLAP 分析能力,统一...
Kyuubi的意思是九尾。详细解释如下:一、Kyuubi的基本含义 Kyuubi是一个日语词汇,直接翻译为“九尾”。这个词通常用来指代一种虚构的生物,特别是在日本动漫和文化中。在火影忍者这部著名的动漫作品中,Kyuubi就是指代了强大的九尾狐狸,它具有巨大的力量和特殊的能力。二、在火影忍者中的具体表现...
这一句话就把Kyuubi介绍清楚了。 注意关键字:基于Spark、多租户、Thrift JDBC/ODBC服务器。 大家可以看到,Kyuubi支持的存储、客户端工具是比较丰富的。尤其是对数据湖组件支持比较好。赞赞赞! 其他介绍大家可以去看下官网:https://kyuubi.apache.org/docs/latest/index.html。
近日,Apache Spark 4.0.0-preview1 发布,意味着 Spark 正式进入 4.0 时代;Apache Kyuubi 同步发布了 1.9.1,此版本支持 Spark 3.1~3.5 以及 4.0。 01 发布记录 Apache Kyuubi 于 2024 年 6 月 3 日正式发布 1.9.1 版本。该版本是 1.9 分支第一个维护版本,此版本中引入了两项新特性: ...
近日,Apache Kyuubi于2024年3月19日迎来了1.9.0版本的正式发布。这一里程碑式的进展,离不开Apache Kyuubi开源社区成员的辛勤付出与贡献。发布要点:环境兼容性:Apache Kyuubi 1.9.0版本经过充分验证,支持Java 8、11和17,以及Scala 2.12和2.13。与Apache Spark的兼容性:该版本与Apache Spark 3.1至3.5...
Apache Kyuubi在T3出行场景 AD-HOC场景 Hue 整合 Kyuubi,替代 Hive 为分析师和大数据开发提供服务。 我们在 hue_safety_valve.ini 配置文件中,增加如下配置: 代码语言:javascript 代码运行次数:0 运行 AI代码解释 [notebook][[interpreters]][[[cuntom]]]name=Kyuubiinterface=hiveserver2[spark]sql_server_host=...
第三个是作业级别的资源弹性,通过前面讲的 Kyuubi 对于引擎的生命周期进行管理,来实现高效的回收和复用。 第四个是作业内的资源弹性,Spark 支持动态资源分配来实现 Excutor 的弹性分配,其中最重要一点是向下缩容的能力,可以避免“拖尾任务”导致大量的 Excutor 长期闲置。