多项选择题
A.提供了两个编程抽象:DataFrame和DataSet。B.底层将SQL转换成RDD ,然后提交到集群执行。C.DataFrame和DataSet可以进行相互转化。D.SparkSQL兼容HQL语法。
A.RDD通过一系列的转换就就形成了DAG。B.根据RDD之间的依赖关系的不同将DAG划分成不同的Stage。C.对于窄依赖,partition的转换处理在Stage中完成计算。D.对于宽依赖,由于有Shuffle的存在,只能在parent RDD处理完成后,才能开始接下来的计算。
A.parallelize函数B.makeRDD函数C.textFile 函数D.从其它rdd转换