④分区:一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合,每个RDD可以分成多个分区,每个分区就是一个数据集片段。 ⑤窄依赖:父RDD的一个分区只被一个子RDD的一个分区所使用就是窄依赖。 ⑥宽依赖:父RDD的一个分区被一个子RDD的多个分区所使用就是宽依赖。结果...
【简答题】试述如下Spark的几个主要概念:RDD、DAG、阶段、分区、窄依赖、宽依赖。 答案:①RDD:是弹性分布式数据集(Resilient Distributed Dataset)的英文缩写... 点击查看完整答案手机看题 你可能感兴趣的试题 问答题 【简答题】试述“Spark on YARN”的概念。 答案:Spark可以运行与YARN之上,与Hadoop进行统一...