E
Eco-Tech/Qwen3-Next-80B-A3B-Instruct-w8a8-mtp
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

Qwen3-Next-80B-A3B-Instruct-w8a8-mtp

1. 基本信息

项目信息
原始模型名Qwen3-Next-80B-A3B-Instruct
原始模型链接Qwen/Qwen3-Next-80B-A3B-Instruct
msmodelslim commit idd2ada17a46811bcebc151a8b4f5a2ea016ae8245
精度测试机型Atlas 800T A3 1台
精度测试平台docker vllm-ascend
vllm 版本v0.15.0
vllm-ascend 版本e7a13beedb74b39dffd9f9dd1dd47bed32360206

2 量化脚本:

拉取 Qwen3-Next-80B-A3B-Instruct-w8a8-mtp 的 msmodelslim 开发分支并安装:

# 该分支不会做删除或大的调整
git clone https://gitcode.com/weixin_74198818/msmodelslim.git -b qwen3-next/qwen3.5
cd msmodelslim
bash install.sh

一键量化:

# 默认使用的量化配置:msmodelslim/lab_practice/qwen3_next/qwen3-next-80b-a3b-w8a8.yaml
msmodelslim quant \
--model_path ${model_path} \
--save_path ${save_path} \
--model_type Qwen3-Next-80B-A3B-Instruct \
--quant_type w8a8 \
--trust_remote_code True

3 精度测试结果

模型名量化格式数据集测试精度 %NPU 浮点精度 %官方精度 %
Qwen3-Next-80B-A3B-Instruct-w8a8-mtpW8A8GPQA74.7573.7472.9
  • 精度测试未开启 mtp;--max-model-len 32768;精度存在波动,建议多次测试。