fix aclgraph offload + opbase
Co-authored-by: guoziqi2025<guoziqi2@huawei.com>
# message auto-generated for no-merge-commit merge:
!1233 merge master into master
fix aclgraph offload + opbase
Created-by: guoziqi2025
Commit-by: guoziqi2025
Merged-by: cann-robot
Description: ## 描述
aclgraph场景,支持零拷贝的算子会转为offload下发,和单算子混跑出现device展开kernel乱序的情况,当前改为aclgraph图模式下发用freestream下发kernel
<!--在这里详细描述你的改动,包括改动的原因和所采取的方法。-->
## 关联的Issue
NA
<!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。-->
<!-- 如果这个PR不涉及Issue,可填写"NA"。-->
## 测试
aclgraph用例,在capture begin和end之间下发allgather和scatter测试,allgather支持零拷贝,会转为offload下发,scatter保持opbase下发
<!--描述进行了哪些测试来验证你的改动。包括但不限于构造对应xx测试用例、二级冒烟、算子泛化等。-->
## 文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
## 类型标签
<!-- [x] 表示选中 -->
- [x] Bug修复
- [ ] 新特性
- [ ] 性能优化
- [ ] 文档更新
- [ ] 其他,请描述:
See merge request: cann/hcomm!1233