E
Eco-Tech/Qwen3.6-27B-w8a8
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

Qwen3.6-27B-w8a8

1. 基本信息

项目信息
原始模型名Qwen3.6-27B
原始模型链接Qwen3.6-27B
msmodelslim commit id640291a51ffe5acb919e68f609b84fef419276d4
精度测试机型Atlas 800T A3 1台
精度测试平台docker vllm-ascend
版本vllm-ascend:v0.18.0rc1
链接quay.io/ascend/vllm-ascend:v0.18.0rc1-a3-openeuler

2 量化脚本:

该模型与Qwen3.5-27B结构一致,msmodelslim已支持一键量化:

msmodelslim quant \
    --model_path weights/Qwen3.6-27B \
    --save_path weights/Qwen3.6-27B-W8A8 \
    --device npu \
    --model_type Qwen3.5-27B \
    --quant_type w8a8 \
    --trust_remote_code True

3 精度测试结果

模型名量化格式数据集测试精度 %本地浮点精度 %
Qwen3.6-27B-w8a8w8a8GPQA85.41585.4175

*--max-model-len 256000,精度存在波动,建议多次测试。