perf(ccu): ccu fast launch
Co-authored-by: one_random<shibingchen@huawei.com>
# message auto-generated for no-merge-commit merge:
!1436 merge perf into master
perf(ccu): ccu fast launch
Created-by: one_random
Commit-by: one_random
Merged-by: cann-robot
Description: ## 描述
性能调优,支撑ccu快速下发
修改点:
1. 去除性能关键路径的run info日志
2. 重写engine ctx get的核心逻辑,取消重复索引和重复拷贝unordered_map
3. 取消get hccl buffer shared_prt的重复拷贝,取消一些string的重复拷贝
4. 调整 HCCLV2_FUNC_RUN宏,通过局部静态变量减少重复查询soc name,并取消多余string拷贝
5. 调整llt,拆分部分a3与a5用例,a5用例需要对soc name获取打桩
## 关联的Issue
<!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。-->
<!-- 如果这个PR不涉及Issue,可填写"NA"。-->
## 测试
<!--描述进行了哪些测试来验证你的改动。包括但不限于构造对应xx测试用例、二级冒烟、算子泛化等。-->
## 文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
## 类型标签
<!-- [x] 表示选中 -->
- [x] Bug修复
- [x] 新特性
- [x] 性能优化
- [ ] 文档更新
- [ ] 其他,请描述:
See merge request: cann/hcomm!1436