首页 > 学历类考试

题目内容（请给出正确答案）

[多选题]

下列关于spark中的RDD描述正确的有（）。

A.RDD（ResilientDistributedDataset）叫做弹性分布式数据集，是spark中最基本的数据抽象；

B.Resilient：表示弹性的；

C.Destributed：分布式，可以并行在集群计算；

D.Dataset：就是一个集合，用于存放数据的；

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“下列关于spark中的RDD描述正确的有（）。”相关的问题

第1题

关于spark中RDD说法错误的是：（)。

A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区，关系是一对多

B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用，是一对一的

C.宽依赖中会有shuffle的产生

D.窄依赖中会有shuffle的产生

点击查看答案

第2题

Spark的RDD持久化操作有（)方式。

A.cache

B.presist

C.storage

D.long

点击查看答案

第3题

Spark中每一个RDD都可以用不同的存储级别进行保存，从而允许持久化数据集在硬盘或者在内存作为序列化的______对象。

点击查看答案

第4题

Spark大数据分析处理中的内存数据结构是（）。

A.RDD弹性分布式数据集

B.Key-Value

C.Record

D.Document

点击查看答案

第5题

Spark的关键技术包括以下哪几个（）。

A.RDD；

B.Scheduler；

C.Storage；

D.Shuffle；

点击查看答案

第6题

以下哪项是Spark的架构核心部分（)。

A.RDD

B.Standalone

C.Mesoes

D.yarn

点击查看答案

第7题

Spark任务调度过程是什么？（)

A.RDD Object-＞ADGScheduler-＞TaskScheduler-＞Worker

B.ADGScheduler-＞RDD Object-＞TaskScheduler-＞Worker

C.RDD Object-＞TaskScheduler-＞ADGScheduler-＞Worker

D.Worker-＞ADGScheduler-＞TaskScheduler-＞RDD Object

点击查看答案

第8题

以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区（)。

A.resetpartition

B.repartiton

C.Partition

D.coalesce

点击查看答案

第9题

关于Spark编程中的累加器描述正确的是（)

A.只提供+=操作的变量

B.累加函数必须服从交换律

C.Action中的累加操作会重复执行

D.Transformation中的累加操作可能被多次执行

点击查看答案

第10题

关于Spark的描述，以下哪项是错误的？（)

A.Spark是一个基于内存迭代的框架

B.Spark是一个数据分析技术栈，包含了大数据的多种计算模式

C.Spark可以采用多种编程语言进行开发，比如Scal

D.Java

E.Spark计算过程中，数据不会落地到磁盘

点击查看答案

第11题

下列选项中，关于中国制药的现状，描述正确的有（)。

A.鲜有创新

B.过渡重复

C.低附加值的原料药规模化生产

点击查看答案

版权所有 ©2024

营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）