多项选择题

下列关于SparkSQL描述正确的是()。

A.提供了两个编程抽象:DataFrame和DataSet。
B.底层将SQL转换成RDD ,然后提交到集群执行。
C.DataFrame和DataSet可以进行相互转化。
D.SparkSQL兼容HQL语法。

<上一题 目录 下一题>
热门 试题

多项选择题
下列关于DAG描述正确的是()。

A.RDD通过一系列的转换就就形成了DAG。
B.根据RDD之间的依赖关系的不同将DAG划分成不同的Stage。
C.对于窄依赖,partition的转换处理在Stage中完成计算。
D.对于宽依赖,由于有Shuffle的存在,只能在parent RDD处理完成后,才能开始接下来的计算。

多项选择题
下列属于rdd的创建方式的是()。

A.parallelize函数
B.makeRDD函数
C.textFile 函数
D.从其它rdd转换

相关试题
  • 下列选项中,属于Spark生态圈的组件有()...
  • 下列选项中,属于RDD行动算子的有()。
  • Spark编程支持的语言有()。
  • 下列选项中,用于提交和监控Task任务的是(...
  • 在Spark运行过程中,每个Job可以划分为更小...