![](https://static.youtibao.com/asksite/comm/h5/images/m_q_title.png)
下列关于spark中的RDD描述正确的有()。
A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;
B.Resilient:表示弹性的;
C.Destributed:分布式,可以并行在集群计算;
D.Dataset:就是一个集合,用于存放数据的;
![](https://static.youtibao.com/asksite/comm/h5/images/solist_ts.png)
A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;
B.Resilient:表示弹性的;
C.Destributed:分布式,可以并行在集群计算;
D.Dataset:就是一个集合,用于存放数据的;
A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多
B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的
C.宽依赖中会有shuffle的产生
D.窄依赖中会有shuffle的产生
A.RDD Object->ADGScheduler->TaskScheduler->Worker
B.ADGScheduler->RDD Object->TaskScheduler->Worker
C.RDD Object->TaskScheduler->ADGScheduler->Worker
D.Worker->ADGScheduler->TaskScheduler->RDD Object
A.只提供+=操作的变量
B.累加函数必须服从交换律
C.Action中的累加操作会重复执行
D.Transformation中的累加操作可能被多次执行
A.Spark是一个基于内存迭代的框架
B.Spark是一个数据分析技术栈,包含了大数据的多种计算模式
C.Spark可以采用多种编程语言进行开发,比如Scal
D.Java
E.Spark计算过程中,数据不会落地到磁盘