linzy_hccl/

hcomm

公开

HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。

forked from cann/hcomm

0
代码Commits分支Pull Requests讨论
提交6f19b4d0
Rren-mengguang创作于 23 天前·Ccann-robot提交于 23 天前
1 Parent(s):010a908c
add lock
Co-authored-by: ren-mengguang<renmengguang@h-partners.com>



# message auto-generated for no-merge-commit merge:
!1544 merge rmg_code into master

add lock

Created-by: ren-mengguang
Commit-by: ren-mengguang
Merged-by: cann-robot
Description: ## 描述
共享内存的读写操作没加锁。算子重执行场景,背景线程和算子执行线程同时往内存中写入数据,导致共享内存缓存刷新异常。

## 关联的Issue

## 测试
A3天成4机环境,整网QWEN网络注入HCCS断链故障持续压测没有复现问题。

## 文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->

## 类型标签
<!--  [x] 表示选中 -->
- [X] Bug修复
- [ ] 新特性
- [ ] 性能优化
- [ ] 文档更新
- [ ] 其他,请描述:




See merge request: cann/hcomm!1544
浏览文件
master
共 0 个文件变更+0-0