全文目录:CMU 15721 课程笔记目录 欢迎在 我的博客 阅读这篇文章 为什么要上这门课? DBMS 开发人员的需求很大,而且在数据管理和处理方面有许多具有挑战性的未解决问题。 如果你能很好地胜任写数据库相关的代码,那么任何其他类型的 coding 工作你都能够胜任。 课程目标 学习用于分析工作负载的数据库内部和系统编程的...
全文目录: CMU 15721 课程笔记目录上一篇文章: OLAP 索引欢迎在 我的博客 阅读这篇文章真实世界的数据特征数据集往往具有 高度偏斜 的属性值分布。例子: 布朗语料库的 Zipfian 分布。数据集倾向于在同一元组的…
感觉和15445里面讲的内容差不多,但15721里多提到了几点重要的内容。首先,CPU的流水线操作对有分支的代码性能不太好,所以建议尽量减少if else语句中的操作,如图2所示。其次,火山模型通常采用pull模型,即从根节点向下获取数据,而像snowflake则采用push模型,从叶节点向上传递数据,这两种模型的优缺点如图3所示。具体来说...
15-721 Spring 2024 - Catalog #1. Contribute to cmu-db/15721-s24-catalog1 development by creating an account on GitHub.
15-721 Spring 2024 - Catalog #1. Contribute to cmu-db/15721-s24-catalog1 development by creating an account on GitHub.
全文目录: CMU 15721 课程笔记目录上一篇文章: 存储模型与数据布局欢迎在 我的博客 阅读这篇文章 上一节我们讨论了通过 PAX 实现的列式存储模型在 OLAP 工作负载中的优势。列式数据库中的所有属性必须是固定长度…
全文目录:CMU 15721 课程笔记目录 上一篇文章:现代 OLAP 数据库 欢迎在我的博客阅读这篇文章 这节课讲数据库中数据的最底层的物理表示。 观察 数据的 "样子 "几乎决定了DBMS的整个系统结构。 处理模型 元组物化策略 Operator 算法 数据输入/更新 并发控制(我们将忽略这一点) ...
15-721 Spring 2024 - Catalog #1. Contribute to cmu-db/15721-s24-catalog1 development by creating an account on GitHub.
15-721 Spring 2024 - Catalog #1. Contribute to cmu-db/15721-s24-catalog1 development by creating an account on GitHub.
仍然需要 Exchange Operator 来结合生成的中间结果。 这个方式也叫 流水线式 并行。 最后一句 对于现代CPU来说,最简单的实现方式并不总是能产生最有效的执行策略。 我们将看到,向量化 / 自下而上 的执行将是执行 OLAP 查询的更好方式。 下一篇文章 黄见青:CMU 15721 笔记:查询调度16 赞同 · 13 评论文章编辑...