单项选择题
A.Storm将流数据Stream描述成一个有限的Tuple序列B.Storm保证每个消息都能完整处理C.Storm认为每个Stream都有一个源头,并把这个源头抽象为SpoutD.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
A.从编程的灵活性来讲,Storm是比较理想的选择,它使用Apache Thrift,可以用任何编程语言来编写拓扑结构(Topology)B.当有大量的状态需要处理时,比如每个分区都有数十亿个元组,则可以选择Storm和Spark StreamingC.Spark Streaming无法实现毫秒级的流计算D.在Spark上可以统一部署Spark SQL,Spark Streaming、MLlib,GraphX等组件,提供便捷的一体化编程模型
A.流数据层(Kafka)B.执行层(YARN)C.处理层(Samza API)D.数据采集层(Scribe)