CANN/

hcomm

公开

HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。

496
代码Commits分支Pull Requests213讨论
已合并

algraph destroy callback only record zerocopy#1533

laodazhao1创建于 24 天前从aclgraph_tag合入到master
讨论13提交1检查0文件改动2

合并人

未指定
l
laodazhao124 天前创建

描述

<!--在这里详细描述你的改动,包括改动的原因和所采取的方法。-->
  1. 回退 https://gitcode.com/cann/hcomm/pull/1267 中 hccl_communicator_host.cc 的修改
  2. aclgraph场景下,只记录aclgraph零拷贝的算子tag,在graph销毁时也只清理零拷贝算子的资源,防止ccl buffer重复建链

关联的Issue

<!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR不涉及Issue,可填写"NA"。-->

NA

测试

<!--描述进行了哪些测试来验证你的改动。包括但不限于构造对应xx测试用例、二级冒烟、算子泛化等。-->
  1. aclgraph destory迭代发现问题的精度问题用例回归验证通过
  2. aclgraph 反复创建销毁卡住问题用例回归验证通过

文档更新

<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->

NA

类型标签

<!-- [x] 表示选中 -->
  • Bug修复
  • 新特性
  • 性能优化
  • 文档更新
  • 其他,请描述:
Pull Request已成功合入, 合并人 @cann-robot
(感谢 laodazhao1 的贡献)