910_95支持host侧本地sdma拷贝和本地reduce操作
Co-authored-by: temper7620<w.wangchao@huawei.com>
# message auto-generated for no-merge-commit merge:
!648 merge myfeature1 into master
910_95支持host侧本地sdma拷贝和本地reduce操作
Created-by: temper7620
Commit-by: temper7620
Merged-by: cann-robot
Description: ## 描述
910_95支持host侧本地sdma拷贝和本地reduce操作
在 GetPubDispatcher 中添加设备类型检查,对Ascend950 设备跳过 dispatcher
在 HcclLocalCopy 中添加 dispatcherPtr 为 nullptr 时的降级处理,使用 hrtMemAsyncCopy 直接拷贝
在 HcclLocalCopyReduce 中添加 dispatcherPtr 为 nullptr 时的降级处理,使用 hrtReduceAsync 直接执行 reduce
修复 HcclLocalCopyReduce 中的变量声明位置问题(将 stream 声明移到函数开头)
添加 HCCL 到 ACL 数据类型和 reduce 操作的映射表
## 关联的Issue
null
## 测试
不涉及
## 文档更新
## 类型标签
- [ ] 新特性
See merge request: cann/hcomm!648