E
Eco-Tech/DeepSeek-V3.2-Exp-w4a8-mtp-QuaRot
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

DeepSeek-V3.2-Exp-w4a8-mtp-QuaRot

1. 基本信息

项目信息
原始模型名DeepSeek-V3.2-Exp
原始模型链接 deepseek-ai/DeepSeek-V3.2-Exp
modelslim commit idc52048041e31176dfe1084538a8c74a3f6aad9d4
精度测试机型Atlas 800T A2 1台
精度测试平台docker vllm-ascend
版本vllm-ascend:v0.14.0rc1
链接quay.m.daocloud.io/ascend/vllm-ascend:v0.14.0rc1

2 量化脚本:

已集成一键量化

msmodelslim quant \
 --model_path ${model_path} \
 --save_path ${save_path} \
 --model_type DeepSeek-V3.2-Exp \
 --quant_type w4a8 \
 --trust_remote_code True

3 精度测试结果

模型名量化格式数据集测试精度 %官方精度 %
DeepSeek-V3.2-Exp-w4a8-mtp-QuaRotw4a8gpqa81.3179.9
DeepSeek-V3.2-Exp-w4a8-mtp-QuaRotw4a8mmlupro84.6385.0
  • 服务端--max-model-len 70000,测试端使用ais_bench,其中max_out_len = 65536,精度存在波动,建议多次测试。