主要跟使用者的背景和业务有关,跟技术无关。 第一是原生数据的问题。数据湖缘起互联网,强调从非结构化数据中挖掘价值,比如谷歌使用MR计算引擎来处理非结构化的网页,而现在使用Hadoop的企业大多可是传统行业,本身没有什么非结构化数据,或者利用非结构化数据的业务驱动还不够,大家只是希望利用数据湖的分布式计算框架来...