多项选择题
A.数据采用集中式处理B.在时间分布和数量上无限的一系列动态数据集合体C.数据记录是流数据的最小组成单元D.数据分时段批量到达
A.返回一个新的数据集,这个数据集中的元素是通过func函数筛选后返回为true的元素B.对RDD中的数据按照func进行计算得到新的RDDC.返回排序后的数据集D.对元素为键值对的RDD中Key相同的元素的value进行reduce
A.驱动程序包含Spark应用程序中的主函数B.驱动程序定义了分布式数据集以应用在集群中C.每个Spark应用程序都包含一个驱动程序D.驱动程序负责把并行操作发布到集群上