面向实际的数据需求,以DWD或者DWS层的数据为基础,组成的各种统计报表。 统计结果最终同步到RDS以供BI或应用系统查询使用。 ADS层的主要任务是将DWS层的数据进行业务化加工和转换,以生成各种针对具体业务需求的洞察和分析结果。此外,ADS层还负责提供各种业务应用和服务,包括数据可视化、报表生成、数据挖掘、预测建模、决策...
2.1、login_count 登录次数这个指标简单,根据dwd层,dwd_page_log表可以直接计算。 2.2、cart_count 加入购物车次数;favor_count 收藏次数;这两个指标也是很简单,直接根据dwd层,dwd_action_log表中获取。 2.3、order_count 下单次数;order_activity_count订单参与活动次数;order_activity_reduce_amount订单减免金额(活动...
但是现实中接触的情况是 ods 层的数据很难保证质量,毕竟数据的来源多种多样,推送方也会有自己的推送逻辑,在这种情况下,我们就需要通过额外的一层 dwd 来屏蔽一些底层的差异。问:我大概明白了,是不是说 dwd 主要是对 ods 层做一些数据清洗和规范化的操作,dws 主要是对 ods 层数据做一些轻度的汇总? 答:对的,...
比如ADS层,基本是完全为应用来设计的,很易懂,DWS层的话,相对来讲就会有一点点理解成本,然后DWD层就比较难理解了,因为它的维度可能会比较多,而且一个需求可能要多张表经过很复杂的计算才能完成。 从能力范围来讲,我们希望80%需求由20%的表来支持。直接点讲,就是大部分(80%以上)的需求,都用DWS的表来支持就...
🔍 数据仓库通常分为三层:数据进出口贴源层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。CDM层进一步分为DWD明细层、DWS轻度汇总层和DIM维度层。📁 ODS层 ODS层将业务数据几乎无处理地同步备份到数据仓库,确保数据的完整性。它分离了业务库和分析...
DW层又细分为维度层(DIM)、明细数据层(DWD)和汇总数据层(DWS),采用维度模型方法作为理论基础, 可以定义维度模型主键与事实模型中外键关系,减少数据冗余,也提高明细数据表的易用性。在汇总数据层同样可以关联复用统计粒度中的维度,采取更多的宽表化手段构建公共指标数据层,提升公共指标的复用性,减少重复加工...
数据仓库层从上到下,又可以分为3个层:数据细节层DWD、数据中间层DWM、数据服务层DWS。 数据细节层DWD 数据细节层:data warehouse details,DWD 该层是业务层和数据仓库的隔离层,保持和ODS层一样的数据颗粒度;主要是对ODS数据层做一些数据的清洗和规范化的操作,比如去除空数据、脏数据、离群值等。
狭义ADS层;广义上指hadoop从DWD DWS ADS 同步到RDS的数据 数据集市(Data Mart),也叫数据市场,数据集市就是满足特定的部门或者用户的需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。 从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的...
DW层又细分为维度层(DIM)、明细数据层(DWD)和汇总数据层(DWS),采用维度模型方法作为理论基础, 可以定义维度模型主键与事实模型中外键关系,减少数据冗余,也提高明细数据表的易用性。在汇总数据层同样可以关联复用统计粒度中的维度,采取更多的宽表化手段构建公共指标数据层,提升公共指标的复用性,减少重复加工。
狭义ADS层;广义上指hadoop从DWD DWS ADS 同步到RDS的数据数据集市(Data Mart),也叫数据市场,数据集市就是满足特定的部门或者用户的需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的数据...