linzy_hccl/

hcomm

公开

HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。

forked from cann/hcomm

0
代码Commits分支Pull Requests讨论
提交4f4963b5
Mmaxinyuan1创作于 18 天前·Ccann-robot提交于 18 天前
1 Parent(s):56db5b4f
aiv listen failed
Co-authored-by: maxinyuan1<maxinyuan2@h-partners.com>



# message auto-generated for no-merge-commit merge:
!1577 merge master into master

aiv listen failed

Created-by: maxinyuan1
Commit-by: maxinyuan1
Merged-by: cann-robot
Description: ## 描述
问题背景:Aiv算子,在ub_mem_endpoint中调用ServerSocketMgr单例起监听,ServerSocketMgr使用A3的MAX_MODULE_DEVICE_NUM(32)管理所有设备
问题现象:在A5环境中,deviceId配置存在从32开始的情况,导致起监听失败;
解决方案:算子公共流程中已经在endpointPair中起监听,故ub_mem_endpoint中的起监听流程实际为重复操作、直接删除,最终结果Aicpu、CCU、Aiv算子起监听的流程进行归一。

## 关联的Issue
NA

## 测试
hccl_test

## 文档更新
NA

## 类型标签
<!--  [x] 表示选中 -->
- [x] Bug修复
- [ ] 新特性
- [ ] 性能优化
- [ ] 文档更新
- [ ] 其他,请描述:




See merge request: cann/hcomm!1577
浏览文件
master
共 0 个文件变更+0-0