数据仓库层 数据仓库层从上到下,又可以分为3个层:数据细节层DWD、数据中间层DWM、数据服务层DWS。 数据细节层DWD 数据细节层:data warehouse details,DWD 该层是业务层和数据仓库的隔离层,保持和ODS层一样的数据颗粒度;主要是对ODS数据层做一些数据的清洗和规范化的操作,比如去除空数据、脏数据、离群值等。 为...
DW层又细分为维度层(DIM)、明细数据层(DWD)和汇总数据层(DWS),采用维度模型方法作为理论基础, 可以定义维度模型主键与事实模型中外键关系,减少数据冗余,也提高明细数据表的易用性。在汇总数据层同样可以关联复用统计粒度中的维度,采取更多的宽表化手段构建公共指标数据层,提升公共指标的复用性,减少重复加工...
2> DWM:也有的称为DWB(data warehouse base) 数据基础层,对数据进行轻度聚合,存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。 这里最容易搞混,实际生产中甚至跳过这个,只有dwd和dws层,其实严格要求上来讲,dwd层数据来源于生产系统,只对数据负责,别的不考虑。而到了dwm层,已经开始向我们的业务层...
DWS:data warehouse service 数据服务层,基于DWB上的基础数据,整合汇总成分析某一个主题域的服务数据层,一般是宽表。用于提供后续的业务查询,OLAP分析,数据分发等。 用户行为,轻度聚合 主要对ODS/DWD层数据做一些轻度的汇总。 1)公共维度层(DIM,Dimension) DIM:这一层比较单纯,举个例子就明白,比如国家代码和国家名...
DWD 层是以业务过程为驱动。 DWS 层、DWT 层和 ADS 层都是以需求为驱动。 DWD:data warehouse details 数据明细层。主要对ODS数据层做一些数据清洗和规范化的操作。 数据清洗:去除空值、脏数据、枚举值转换,超过极限范围的。 DWB:data warehouse base 数据基础层,存储的是客观数据,一般用作中间层,可以认为是大量...
DWS 层、DWT 层和 ADS 层都是以需求为驱动。 DWD:data warehouse details 数据明细层。主要对ODS数据层做一些数据清洗和规范化的操作。 数据清洗:去除空值、脏数据、枚举值转换,超过极限范围的。 DWB:data warehouse base 数据基础层,存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。
DWS 层、DWT 层和 ADS 层都是以需求为驱动。 DWD:data warehouse details 数据明细层。主要对ODS数据层做一些数据清洗和规范化的操作。 数据清洗:去除空值、脏数据、枚举值转换,超过极限范围的。 DWB:data warehouse base 数据基础层,存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。
DWD 层是以业务过程为驱动。 DWS 层、DWT 层和 ADS 层都是以需求为驱动。 DWD:data warehouse details 数据明细层。主要对ODS数据层做一些数据清洗和规范化的操作。 数据清洗:去除空值、脏数据、枚举值转换,超过极限范围的。 DWB:data warehouse base 数据基础层,存储的是客观数据,一般用作中间层,可以认为是大量...
DWS 层、DWT 层和 ADS 层都是以需求为驱动。 DWD:data warehouse details 数据明细层。主要对ODS数据层做一些数据清洗和规范化的操作。 数据清洗:去除空值、脏数据、枚举值转换,超过极限范围的。 DWB:data warehouse base 数据基础层,存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。
DW层又细分为维度层(DIM)、明细数据层(DWD)和汇总数据层(DWS),采用维度模型方法作为理论基础, 可以定义维度模型主键与事实模型中外键关系,减少数据冗余,也提高明细数据表的易用性。在汇总数据层同样可以关联复用统计粒度中的维度,采取更多的宽表化手段构建公共指标数据层,提升公共指标的复用性,减少重复加工。 维度层...