第二阶段是数据仓库,主要特点是MPP(大规模并行处理)架构,无奈数据仓库只支持结构化数据。作为另一种数据存储方式的数据湖虽然可以存储半结构化、非结构化的数据,但只具备存储能力,不具备分析能力,从而无法实现数据资产化。 因此,许多企业选择同时搭建数据仓库和数据湖,数据便出现了冗余。此时,新的湖仓一体(Data Lakeho...