CeresDB 是基于 OceanBase 分布式存储引擎设计的时序数据库产品,用来存储和管理时间序列数据,提供高性能读写、高压缩比低成本存储、可视化查询等功能,有效解决由于采集数据点量大、高频造成的存储成本高,写入和查询分析效率低的问题。适用于物联网 loT、运维监控、金融分析等场景。
CeresDB 是⼀个分布式、⾼可⽤、⾼可靠的时间序列数据库,诞⽣于蚂蚁集团内部。 时序数据 时序数据是基于时间的⼀系列数据点的集合,在有时间的坐标中将这些数据点连成线,从时间维度往前看可以做成多维度报表,揭示其趋势性、规律性、异常性;往未来看可以做⼤数据分析、机器学习、实现预测和预警。
CeresDB 是一款高性能、分布式的云原生时序数据库,采用 Rust 编写。其开发团队近日宣布:经过近一年的开源研发工作,时序数据库 CeresDB 1.0 正式发布,达到生产可用标准。CeresDB 1.0 官方中文文档:https://docs.ceresdb.io/cn/ CeresDB 1.0 核心特性介绍 存储引擎 支持列式混合存储高效 XOR 过滤器 云原生分布式...
在上一篇 Shard Lock 机制文章中介绍了 CeresDB 的集群拓扑正确性的理论性保障,它从理论上解决了数据可能损坏的可能性,但是并没有就上层具体的实现做过多的说明,我们将在本文和大家分享 CeresDB 分布式调度的设计和实践。 一、问题 作为一个分布式时序数据库,我们在设计时主要面临的问题有: Shard 的调度,作为 Cer...
CeresDB:一个 CeresDB 实例, 负责时序数据组织与存储; WAL Service(外部):WAL 服务,在集群方案中,用于存储实时写入的数据; Object Storage(外部):对象存储服务,用于存储从 memtable 生成的 SST 文件。 详细的集群方案可以参看官方文档(https://docs.ceresdb.io/cn/design/clustering.html) ...
对于单机模式的 CeresDB,WAL 是基于 RocksDB 实现的,数据被保存到了本地磁盘上。 对于分布式模式的 CeresDB,WAL 需要作为一个分布式模块存在以保证新写入数据的高可靠性,当前我们提供了一套基于 OceanBase 的实现。当然在我们的研发计划里程碑上,还将提供更加轻量的分布式 WAL 实现方案。
而CeresDB 的解决方案是通过特定的机制,在共享存储的情况下达到了类似 Shared-Nothing 架构 的效果,也就是说存储层的数据经过一定规则的划分,可以保证在任何时刻最多只有一个 CeresDB 实例可以对其进行更新,本文中,将这个特性定义成集群拓扑的正确性,如果这个正确性得到保证的话,那么数据就不会因为集群的灵活调度而受到...
CeresDB 诞生于蚂蚁集团内部,是一个分布式、高可用、高可靠的时间序列数据库 Time Series Database。经过多年双11打磨,作为蚂蚁全站监控数据存储的时间序列数据库,承载了每天数万亿数据点的写入,并提供多维度查询。今天 CeresDB 宣布正式开源,通过开源,我们希望帮助用户解决时间序列数据存储的水平扩展与高可用的痛点,乃至针...
CeresDB 是一个面向云原生打造的高性能时序数据库,存储引擎采用的是类 LSM 架构,数据先写在 memtable 中,达到一定阈值后 flush 到底层(例如:S3),为了防止小文件过多,后台还会有专门的线程来做合并。 在生产环境中,笔者发现一个比较诡异的问题,每次当表的合并请求加剧时,表的 flush 耗时就会飙升,flush 与合并之间...
蚂蚁 OceanBase 时序数据库 CeresDB 正式商用 IT之家 6 月 3 日消息 6 月 1 日,在数据库 OceanBase3.0 峰会上,OceanBase CEO 杨冰宣布首个时序数据库产品 CeresDB 正式商用。该数据库将为用户提供安全可靠的数据查询和存储管理服务,解决监控运维、物联网等场景中,时间序列数据的高吞吐、横向扩展等难题。IT之...