![](https://static.youtibao.com/asksite/comm/h5/images/m_q_title.png)
有关MapReduce的输入输出,说法错误的是()。
A.链接多个MapReduce作业时,序列文件是首选格式
B.FileInputFormat中实现的getSplits()可以把输入数据划分为分片,分片数目和大小任意定义
C.想完全禁止输出,可以使用NullOutputFormat
D.每个reduce需将它的输出写入自己的文件中,输出无需分片
![](https://static.youtibao.com/asksite/comm/h5/images/solist_ts.png)
A.链接多个MapReduce作业时,序列文件是首选格式
B.FileInputFormat中实现的getSplits()可以把输入数据划分为分片,分片数目和大小任意定义
C.想完全禁止输出,可以使用NullOutputFormat
D.每个reduce需将它的输出写入自己的文件中,输出无需分片
A.MapReduce可以计算任务的划分和调度;
B.MapReduce可完成数据的分布存储和划分;
C.MapReduce可以实现处理系统节点出错检测和失效恢复;
D.MapReduce可实现处理数据与计算任务的同步;
A.Partitioner负责控制map输出结果key的分割
B.Reporter用于MapReduce应用程序报告进度
C.OutputCollector收集Mapper或Reducer输出数据
D.Reduce的数目不可以是0
A.分为Map和Reduce两个阶段
B.Map阶段由一系列Map任务组成
C.Reduce阶段由一系列Reduce任务组成
D.Map阶段与Reduce阶段没有任何依赖关系
A.Pig的主要目的是弥补MapReduce编程的复杂性
B.Pig的核心是一种数据分析语言
C.Pig程序的结构适合于串行处理
D.Pig主要包含PigLatin和Pig执行环境两部分
A.SparkSQL依赖Hive的元数据
B.SparkSQL的执行引擎为Sparkcore,Hive默认执行引擎为MapReduce
C.SparkSQL不可以使用Hive的自定义函数
D.SparkSQL兼容绝大部分Hive的语法和函数
A.云计算的主要特点是非常昂贵。
B.大数据是多源、异构、动态的复杂数据,即具有4V特征的数据
C.大数据是数据科学的研究对象之一
D.MapReduce是采用云计算这种新的计算模式研发出的具体工具软件(或算法)
A.概念“Map(映射)”和“Reduce(归约)”,是它们的主要思想
B.提供数据划分和计算任务调度功能
C.使用了多种有效的错误检测和恢复机制
D.顺序处理数据、避免随机访问数据
E.平滑无缝的可扩展性
A.“摩尔定律”,CPU性能大约每隔12个月翻一番
B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D.谷歌公司最先提出了分布式并行编程模型MapReduce