首页 > 学历类考试
题目内容 (请给出正确答案)
[多选题]

下列关于spark中的RDD描述正确的有()。

A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;

B.Resilient:表示弹性的;

C.Destributed:分布式,可以并行在集群计算;

D.Dataset:就是一个集合,用于存放数据的;

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“下列关于spark中的RDD描述正确的有()。”相关的问题
第1题
关于spark中RDD说法错误的是:()。

A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多

B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的

C.宽依赖中会有shuffle的产生

D.窄依赖中会有shuffle的产生

点击查看答案
第2题
Spark的RDD持久化操作有()方式。

A.cache

B.presist

C.storage

D.long

点击查看答案
第3题
Spark中每一个RDD都可以用不同的存储级别进行保存,从而允许持久化数据集在硬盘或者在内存作为序列化的______对象。

点击查看答案
第4题
Spark大数据分析处理中的内存数据结构是()。

A.RDD弹性分布式数据集

B.Key-Value

C.Record

D.Document

点击查看答案
第5题
Spark的关键技术包括以下哪几个()。

A.RDD;

B.Scheduler;

C.Storage;

D.Shuffle;

点击查看答案
第6题
以下哪项是Spark的架构核心部分()。

A.RDD

B.Standalone

C.Mesoes

D.yarn

点击查看答案
第7题
Spark任务调度过程是什么?()

A.RDD Object->ADGScheduler->TaskScheduler->Worker

B.ADGScheduler->RDD Object->TaskScheduler->Worker

C.RDD Object->TaskScheduler->ADGScheduler->Worker

D.Worker->ADGScheduler->TaskScheduler->RDD Object

点击查看答案
第8题
以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。

A.resetpartition

B.repartiton

C.Partition

D.coalesce

点击查看答案
第9题
关于Spark编程中的累加器描述正确的是()

A.只提供+=操作的变量

B.累加函数必须服从交换律

C.Action中的累加操作会重复执行

D.Transformation中的累加操作可能被多次执行

点击查看答案
第10题
关于Spark的描述,以下哪项是错误的?()

A.Spark是一个基于内存迭代的框架

B.Spark是一个数据分析技术栈,包含了大数据的多种计算模式

C.Spark可以采用多种编程语言进行开发,比如Scal

D.Java

E.Spark计算过程中,数据不会落地到磁盘

点击查看答案
第11题
下列选项中,关于中国制药的现状,描述正确的有()。

A.鲜有创新

B.过渡重复

C.低附加值的原料药规模化生产

点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改