fix device aicpu profiling
Co-authored-by: acjr0011<chenjiarong6@huawei.com>
# message auto-generated for no-merge-commit merge:
!1440 merge master into master
fix device aicpu profiling
Created-by: acjr0011
Commit-by: acjr0011
Merged-by: cann-robot
Description: ## 描述
<!--在这里详细描述你的改动,包括改动的原因和所采取的方法。-->
1、补充legacy流程上报aicpu侧的任务(即aicpu主流上下的wait与record)
2、调整InsLocalReduce指令中获取taskid的顺序,在更新前获取。
3、提前legacy流程里device侧注册profiling回调函数的时机,让profiling可以马上调用执行开关控制。
4、日志补充
5、调整新流程中,profiling上报接口调用,解决上报数据中,mainstream块与task块taskid对不上的问题。
6、修改profiling上报streamId值,改为sqId,与任务下发保持一致。
## 关联的Issue
<!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。-->
<!-- 如果这个PR不涉及Issue,可填写"NA"。-->
https://gitcode.com/cann/hcomm/issues/152
## 测试
<!--描述进行了哪些测试来验证你的改动。包括但不限于构造对应xx测试用例、二级冒烟、算子泛化等。-->
验证了aicpu加速模式,新老流程开启profiling的用例,结果:1、老流程中可顺利打开profiling开关,首算子任务上报正常;2、新流程中mainstream数据块与task数据块taskid一致;3、展开流id正确。
验证了A3A5RDV。
## 文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
## 类型标签
<!-- [x] 表示选中 -->
- [x] Bug修复
- [ ] 新特性
- [ ] 性能优化
- [ ] 文档更新
- [ ] 其他,请描述:
See merge request: cann/hcomm!1440