910_95支持host侧本地sdma拷贝和本地reduce操作
在 GetPubDispatcher 中添加设备类型检查,对Ascend950 设备跳过 dispatcher 在 HcclLocalCopy 中添加 dispatcherPtr 为 nullptr 时的降级处理,使用 hrtMemAsyncCopy 直接拷贝 在 HcclLocalCopyReduce 中添加 dispatcherPtr 为 nullptr 时的降级处理,使用 hrtReduceAsync 直接执行 reduce 修复 HcclLocalCopyReduce 中的变量声明位置问题(将 stream 声明移到函数开头) 添加 HCCL 到 ACL 数据类型和 reduce 操作的映射表
null
不涉及