描述
<!--在这里详细描述你的改动,包括改动的原因和所采取的方法。-->
本PR旨在扩展集合通信库的Reduce算法能力,新增一个名为InsReduceMesh1DTwoShot的算法实现。该算法专门针对1D Mesh拓扑结构下,当Reduce操作的数据量超过32MB时,原有单次通信算法可能存在的性能瓶颈问题,通过引入“Reduce-Scatter”后接“Gather”的两阶段(Two-Shot)通信模式来优化大规模数据处理的性能。
关联的Issue
<!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123-->
<!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。-->
DTS2026012012560
测试
<!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。-->
checker功能验证
上板测试8p功能和性能
文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
不涉及
类型标签
<!-- [x] 表示选中 -->