答:嗯,我是这样理解的,站在一个理想的角度来讲,如果 ods 层的数据就非常规整,基本能满足我们绝大部分的需求,这当然是好的,这时候 dwd 层其实也没太大必要。但是现实中接触的情况是 ods 层的数据很难保证质量,毕竟数据的来源多种多样,推送方也会有自己的推送逻辑,在这种情况下,我们就需要通过额外的一层 dwd 来屏蔽一些底层的差异。
概念:轻度汇总层数据仓库中DWD层和DM层之间的一个过渡层次,是对DWD层的生产数据进行轻度综合和汇总统计(可以把复杂的清洗,处理包含,如根据PV日志生成的会话数据)。轻度综合层与DWD的主要区别在于二者的应用领域不同,DWD的数据来源于生产型系统,并未满意一些不可预见的需求而进行沉淀;轻度综合层则面向分析型应用进行细...
ODS层是数据仓库与业务系统之间的桥梁,它的主要作用是保证业务系统与数据仓库之间的数据一致性和完整性。 DWD层(数据仓库明细层) DWD(Data Warehouse Detail)层是数据仓库中的明细层,是ODS层的后续层次。这一层主要负责将ODS层中的数据进行进一步的清洗、转换和加载,并将数据存储到数据仓库的明细表中。DWD层的主要...
DWD层建表:自己指定每个字段的Schema建表 create external table if not exists one_make_dwd.ciss_base_areas( ID string, AREANAME string, PARENTID string, SHORTNAME string, LNG string, LAT string, RANK bigint, POSITION string, SORT bigint ) partitioned by (dt string) stored as orc location ...
数据仓库架构分层设计包括STG(数据缓冲层)、ODS(数据操作层)、DWD(数据明细层)、DWS(主题汇总层)和ADM(数据应用层)。 1、STG层 主要完成业务系统结构化数据引入到数据中台,保留业务系统原始数据,缓冲层设计主要保持和数据源的一致性,不做任何类型转换和数据加工处理,为ODS层提供基础数据服务。
简介:本文详细介绍了数据仓库和数据挖掘中的关键概念,包括分层概念、ODS(Operational Data Store)、DM(Data Mining)、DWD(Data Warehouse Detail)、DWS(Data Warehouse Summary)和DIM(Date Intelligence Module),并重点突出了这些概念中的重点词汇或短语,同时引入了百度智能云文心快码(Comate)作为数据处理和分析的辅助工具...
数仓分层设计架构ODSDWDDWSADS详解如下:1. ODS层: 定义:ODS层是数据仓库的基石,存放从业务系统同步过来的原始数据。 特点:保持与业务系统的实时同步,确保数据的完整性和持久性。即使业务系统发生故障,ODS层也能提供数据保护。 作用:作为数据仓库的入口,为后续的数据处理和分析提供基础数据。2. DWD...
DWD 层(Data Warehouse Detail):用于存储具体的业务数据,通常包括数据清洗、数据加工和数据计算等过程...
数仓分层设计架构ODSDWDDWSADS详解如下:ODS层:功能:作为数据仓库的基础,存储原始数据并保持与业务系统同步。特点:数据保持原样,不进行任何转换或处理,主要用于数据的临时存储和备份。优势:确保数据的完整性和可靠性,为后续数据处理提供原始素材。DWD层:功能:对ODS层中的原始数据进行精细化处理,提供...
DWS层指数据汇总层,其主要作用是通过聚合和汇总,将DWD层中的数据按照主题进行汇总,形成宽表,进而提升数据分析性能。DWS层通常包含多个宽表,每个宽表都是由多个事实表和维度表经过聚合和分组运算生成的。DWS层中的宽表可以满足特定主题和不同维度的分析需求,减少了对...