PFC 死锁怎么形成、如何预防与运维
本章节范围:AI 训练 / 推理集群互联网络中的死锁问题——死锁如何形成、业界用哪些手段在各层打破循环依赖,以及不同互联 fabric 的处理路线对比
背压如何成为死锁的必要条件,以及无损与可丢的权衡