多项选择题
A.数据快速持续到达,潜在大小也许是无穷无尽的B.数据来源众多,格式复杂C.注重数据的整体价值,不过分关注个别数据D.系统可以控制将要处理的新到达的数据元素的顺序
A.FieldsGrouping:广播发送,每一个Task都会收到所有的TupleB.GlobalGrouping:全局分组,所有的Tuple都发送到同一个Task中C.NonGrouping:不分组,和ShuffleGrouping类似,当前Task的执行会和它的被订阅者在同一个线程中执行D.DirectGrouping:直接分组,直接指定由某个Task来执行Tuple的处理
A.Storm将流数据Stream描述成一个有限的Tuple序列B.Storm保证每个消息都能完整处理C.Storm认为每个Stream都有一个源头,并把这个源头抽象为SpoutD.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作