0n-Device执行,即整图卸载执行,充分发挥异腾芯片的算力,可以大大降低交互的开销,从而提升加速器占用率,关于n-Device执行以下描述错误的是?()
A.MindSpore通过梯度数据驱动的自适应图优化,实现去中心化的自主A11Reduce梯度聚合步调一致,计算与通信充分流水 B.超强芯片算力下模型执行的挑战内存墙问题、交互开销大、数据供给难。部分在Host执行,部分在Device执行交互开销甚至远大于执行开销,导致加速器占用率低 C.MindSpore通过面向芯片的深度图优化技术,同步等待少,最大化“数据计算通”的并行度,训练性能相比Host侧图调度方式持平 D.超强芯片算力下分布式梯度聚合的挑战:ReslNet58单选代26ms时间时会产生中心控制的同步开销和频繁同步的通信开销。传统方法需要3次同步完成A11Reduce,数据驱动方法自主A11Reduce,无控制开销