描述
性能调优,支撑ccu快速下发
修改点:
- 去除性能关键路径的run info日志
- 重写engine ctx get的核心逻辑,取消重复索引和重复拷贝unordered_map
- 取消get hccl buffer shared_prt的重复拷贝,取消一些string的重复拷贝
- 调整 HCCLV2_FUNC_RUN宏,通过局部静态变量减少重复查询soc name,并取消多余string拷贝
- 调整llt,拆分部分a3与a5用例,a5用例需要对soc name获取打桩
关联的Issue
<!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。-->
<!-- 如果这个PR不涉及Issue,可填写"NA"。-->
测试
<!--描述进行了哪些测试来验证你的改动。包括但不限于构造对应xx测试用例、二级冒烟、算子泛化等。-->
文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
类型标签
<!-- [x] 表示选中 -->