B.Spark Streaming 准实时流计算框架,数据可以消费MQ,Kafka等
C.Spark Ml lib基于机器学习算法库,封装了主流的机器学习算法
D.Spark Graph X 进行基于图计算的服务支持
A.计算资源标签调度是yarm的特征,存储资源调度是HDFS的特征
B.通过存储资源标签,可以将在线应用数据存储在SAS盘节点的HDFS目录下,而离线应用数据存储在SATA盘节点对应的HDFS目录下
C.通过计算资源标签,可以将spark作业调度到大内存节点上运行,而MR作业调度在标配内存节点上运行
D.计算资源和存储资源的标签通常配合使用,是为了将指定的应用跨节点访问计算和数据资源
A.Spark是一个基于内存迭代的框架
B.Spark是一个数据分析技术栈,包含了大数据的多种计算模式
C.Spark可以采用多种编程语言进行开发,比如Scal
D.Java
E.Spark计算过程中,数据不会落地到磁盘