试述如下Spark的几个主要概念:RDD、DAG、阶段、分区、 窄依赖、宽依赖。 答案 答:①RDD:是弹性分布式数据集(Rusilicnt Distributed Dasset) 的英文缩写,是分布式内存的一个抽象概念,提供了一种高度受 限的共享内存模型。2DAG:是Directed Acyclic Graph (有向无环图)的英文缩写, 反映RDD之间的依赖关系。3阶投:...
【简答题】试述如下Spark的几个主要概念:RDD、DAG、阶段、分区、窄依赖、宽依赖。 答案:①RDD:是弹性分布式数据集(Resilient Distributed Dataset)的英文缩写... 点击查看完整答案手机看题 你可能感兴趣的试题 问答题 【简答题】试述“Spark on YARN”的概念。 答案:Spark可以运行与YARN之上,与Hadoop进行统一...