CANN/

hcomm

公开

HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。

496
代码Commits分支Pull Requests213讨论
已合并

aiv listen failed#1577

maxinyuan1创建于 19 天前从master合入到master
讨论6提交1检查0文件改动1

合并人

未指定
m
maxinyuan119 天前创建

描述

问题背景:Aiv算子,在ub_mem_endpoint中调用ServerSocketMgr单例起监听,ServerSocketMgr使用A3的MAX_MODULE_DEVICE_NUM(32)管理所有设备 问题现象:在A5环境中,deviceId配置存在从32开始的情况,导致起监听失败; 解决方案:算子公共流程中已经在endpointPair中起监听,故ub_mem_endpoint中的起监听流程实际为重复操作、直接删除,最终结果Aicpu、CCU、Aiv算子起监听的流程进行归一。

关联的Issue

NA

测试

hccl_test

文档更新

NA

类型标签

<!-- [x] 表示选中 -->
  • Bug修复
  • 新特性
  • 性能优化
  • 文档更新
  • 其他,请描述:
Pull Request已成功合入, 合并人 @cann-robot
(感谢 maxinyuan1 的贡献)