其他选项的说法是正确的,可以简要描述如下: A. Spark RDD是一个抽象的弹性分布式数据集,是Spark中的核心数据抽象。 C. 窄依赖指的是子RDD的一个分区只依赖于某个父RDD中的一个分区,它的计算过程可以在同一节点上完成,因此不会引起数据的shuffle。 D. 宽依赖指的是子RDD的每一个分区都依赖于某个父RDD中一个...
关于Spark和RDD下列说法错误的是()A.Spark支持三种类型的部署方式:Standalone,Spark on Mesos,Spark on YARNB.在选择S
下列关于spark中的RDD描述不正确的是A.RDD(resilient distributed dataset)z叫做弹性分布式数据集,是spark中最基本的数据抽象B
关于Spark中RDD的描述不正确的是? A.可以从HDFS输入创建,或从与Hadoop兼容的其他存储系统中输入创建B.当前RDD默认是存储于内存,当内存不足时,RDD也不会溢出到磁盘中C.Spark的所有Transform操作都是基于RDD来实现的D.RDD是只读和可区分的。要想对RDD进行操作,只能重新生成一个新的RDD...
关于SparkRDD,下列说法不正确的是() A、SparkRDD是一个抽象的弹性分布式数据集B、窄依赖指的是子RDD的每一个分区只依赖于某个父RDD中的一个分区C、宽依赖指的是子RDD的每一个分区都依赖于某个父RDD中的一个以上的分区D、RDD的行动操作指的是将原始数据集加载为RDD或将一个RDD转换为另一个RDD操作正确答案:...
关于RDD下列说法不正确的是()。 A、SparkRDD是一个抽象的弹性分布式数据集B、RDD的行动操作指的是将原始数据集加载为RDD或将一个RDD转换为另一个RDD的操作C、窄依赖指的是子RDD的一个分区值依赖于某个父RDD中的一个分区D、宽依赖指的是子RDD的每一个分区都依赖于某个父RDD中的一个以上的分区正确答案:RDD...
1、RDD是Spark中最基本的数据抽象和计算模型之一。它是一个不可变的分布式对象集合,可以直接跨越多个节点进行并行计算,是Spark分布式计算的核心模块。SparkRDD能够通过多种方式进行创建,例如从本地文件系统中读取数据、从HDFS中读取数据、从外部数据库中读取数据等等。正确。2.RDD是只读的,一旦创建就不能...
百度试题 结果1 题目关于RDD,下列说法错误的是 A. RDD只是一个只读的,可分区的分布式数据集 B. RDD是Spark对基础数据的抽象 C. RDD具有血统机制(Lineage) D. RDD默认存储在磁盘 相关知识点: 试题来源: 解析 D
【单选题】下列关于spark中的RDD描述不正确的是A. RDD(resilient distributed dataset)z叫做弹性分布式数据集,是spark中最基本的数据抽象 B. distributed:表示弹性的,弹性表示 C. distributed:分布式,可以并行在集群中计算 D. dataset:就是一个数据库,用于存放数据的 ...