1、相对vllm-ascend 0Day镜像解决MTP采信率低的问题 2、下载权重后将quarot.safetensors权重文件迁移至optional路径下 (当前gitcode upload文件有些bug) 3、新量化attention部分支持MLAPO等