下面关于Hive四种排序方式的区别,描述正确的是()。
A.orderby是要对输出的结果进行全局排序,多个reducer可以实现全局排序
B.sortby不是全局排序,只是在进入到reducer之前完成排序
C.distributeby指的是按照指定的字段划分到不同的输出reduce文件中,常见使用方式是orderbydistributeby
D.clusterby不仅支持正序排序,也支持逆序排序。
A.orderby是要对输出的结果进行全局排序,多个reducer可以实现全局排序
B.sortby不是全局排序,只是在进入到reducer之前完成排序
C.distributeby指的是按照指定的字段划分到不同的输出reduce文件中,常见使用方式是orderbydistributeby
D.clusterby不仅支持正序排序,也支持逆序排序。
A.SparkSQL依赖Hive的元数据
B.SparkSQL的执行引擎为Sparkcore,Hive默认执行引擎为MapReduce
C.SparkSQL不可以使用Hive的自定义函数
D.SparkSQL兼容绝大部分Hive的语法和函数
下面四种排序方法中,平均查找长度最小的是()
A.插入排序
B.选择排序
C.快速排序
D.归并排序
A.可以对表格中的任意字段求和
B.可以用表格数据生成统计图表
C.可以对表格中的任一字段进行排序
D.在工作表中可以放置图形
A.分类汇总前必须按关键字段排序
B.分类汇总的关键字段只能是一个字段
C.分类汇总可以被删除,但删除汇总后排序操作不会撤消
D.汇总方式只能是求和
A.进程是由程序、数据和进程控制块三部分组成的
B.进程是构成程序的组成部分之一
C.进程是静态的,而程序是动态的
D.二者没有区别
A.能基于Atlas的Web页面查询用户的数据查询操作历史
B.能基于Atlas的Web页面浏览数据的血缘关系
C.能基于Atlas的Web页面标注元数据,为元数据分类
D.Atlas支持与Hive数据源的集成,可以实时获取Hive的元数据变化
A.默认创建普通表
B.删除外部表时,只删除外部表数据而不删除元数据
C.外部表实质上是将已存在的HDFS文件路径与表关联起来
D.删除普通表时,元数据和数据同时被删除
A.为减少网络开销,提升效率,查询与写入时应该批量操作,使用mget/bulk接口
B.默认情况下,查询结果按相关性排序
C.FilterDSL语句的作用类似于selectwhere,提升查询速度
D.DSL支持多种复杂查询方式,包含词条搜索,范围搜索,词前缀搜索,正则搜索,模糊搜索等