传统的MapReduce模型要求每一轮MapReduce操作之后,数据必须落地到分布式文件系统上。而一般的MapReduce应用通常由多个MapReduce作业组成,每个作业结束之后需要写入磁盘接下去的Map任务很多情况下只是读一遍数据为后续的Shuffle阶段做准备,这样其实造成了冗余的0操作。为了解决这问题,提供更优的性能,大数据计算服务提供了扩展的MapReduce模型,该模型区别于普通ma
A.支持Map后连接任意多个 Reduce操作,如Map-Reduce-Reduce B.支持Map后不连接 Reduce,而是连接另一个map,如Map-Map- Reduce C.支持 Chain mapper/ Reducer,即支持MapReduce-Map-Reduce D.支持没有Map,直接进入 Reduce