多项选择题
A.一个作业(Job)是对一组输入流进行处理转化成输出流的程序B.Samza的流数据单位既不是Storm中的元组,也不是Spark Streaming中的DStream,而是一条条消息C.一个作业会被进一步分割成多个任务(Task)来执行D.分区之间没有定义顺序,从而允许每一个任务独立执行
A.Spark Streaming无法实现毫秒级的流计算B.Storm可以实现毫秒级响应件C.Storm的低延迟执行引擎(100ms+)可以用于实时计算D.Spark Streaming采用的小批量处理的方式使得它可以同时兼容批量和实时数据处理的逻辑和算法
A.worker:每个worker进程都属于一个特定的TopologyB.executor:executor是产生于worker进程内部的线程C.task:实际的数据处理由task完成D.在Topology的生命周期中,每个组件的task数目是不会发生变化的,而executor的数目却不一定