E
Eco-Tech/Qwen3-30B-A3B-w8a8-QuaRot-310
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

Qwen3-30B-A3B-w8a8-QuaRot-310

1. 基本信息

项目信息
原始模型名Qwen3-30B-A3B
原始模型链接Qwen/Qwen3-30B-A3B
msmodelslim commit id6a860e4a7b48b4573a8aeeaa12123d2bbc9ec9b8
msmodelslim 操作指引Readme
精度测试机型Atlas 300I DUO
精度测试平台docker MindIE 镜像
版本MindIE 2.3.0

2 量化命令:

模型稀疏量化

python3 quant_qwen_moe_w8a8.py --model_path {浮点权重路径} \
--save_path {W8A8量化权重路径} \
--anti_dataset ../common/qwen3-moe_anti_prompt_50.json \
--calib_dataset ../common/qwen3-moe_calib_prompt_50.json \
--trust_remote_code True \
--rot

3 精度测试结果

模型名量化格式数据集测试精度 %浮点精度 %
Qwen3-30B-A3B-w8a8-QuaRot-310w8a8BoolQ88.0188.01
Qwen3-30B-A3B-w8a8-QuaRot-310w8a8CEval84.3283.88
Qwen3-30B-A3B-w8a8-QuaRot-310w8a8GSM8K94.5494.31
  • 精度数据来自于非深度思考模式的推理结果