aicpu 2+6 优化算法 + aicpu Allreduce算子4template优化算法
<!--在这里详细描述你的改动,包括改动的原因和所采取的方法。-->NA
<!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR不涉及Issue,可填写"NA"。-->已跑过RDV测试,并在0305分支的64p环境上进行了验证
<!--描述进行了哪些测试来验证你的改动。包括但不限于构造对应xx测试用例、二级冒烟、算子泛化等。-->NA
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->