E
Eco-Tech/Qwen3.5-397B-A17B-w4a8-mtp
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

Qwen3.5-397B-A17B-w4a8-mtp

1. 基本信息

项目信息
原始模型名Qwen3.5-397B-A17B
原始模型链接 Qwen/Qwen3.5-397B-A17B
modelslim commit idc52048041e31176dfe1084538a8c74a3f6aad9d4
精度测试机型Atlas 800T A2 1台
精度测试平台docker vllm-ascend
版本vllm-ascend:v0.14.0rc1
链接quay.m.daocloud.io/ascend/vllm-ascend:v0.14.0rc1

2 量化脚本:

已集成一键量化

msmodelslim quant --model_path ${MODEL_PATH} --save_path ${SAVE_PATH} --device npu --model_type Qwen3.5-397B-A17B --quant_type w4a8 --trust_remote_code True

3 精度测试结果

模型名量化格式数据集测试精度 %官方精度 %
Qwen3.5-397B-A17B-w4a8-mtpw4a8ceval93.4693.0
Qwen3.5-397B-A17B-w4a8-mtpw4a8gpqa87.8888.4
Qwen3.5-397B-A17B-w4a8-mtpw4a8mmlupro87.8887.8
  • 服务端--max-model-len 133120,测试端使用ais_bench,其中max_out_len = 65536,精度存在波动,建议多次测试。