E
Eco-Tech/DeepSeek-V3-0324-w4a8c8-mtp-QuaRot
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

DeepSeek-V3-0324-w4a8c8-mtp-QuaRot

1. 基本信息

项目信息
原始模型名DeepSeek-V3-0324
原始模型链接deepseek-ai/DeepSeek-V3-0324
msmodelslim commit id9969c63e5243b7bfc7af6fc3ab19e4968fcd67c5
精度测试机型Atlas 800T A2 1台
精度测试平台docker mindie
版本mindie:2.2.RC1
链接mindie镜像仓库

2 量化脚本:

msmodelslim quant \
 --model_path weights/DeepSeek-V3-0324 \
 --save_path weights/DeepSeek-V3-0324-w4a8c8-mtp-QuaRot \
 --model_type DeepSeek-V3.1 \
 --quant_type w4a8c8 \
 --trust_remote_code True

3 精度测试结果

模型名量化格式数据集测试精度 %官方精度 %
DeepSeek-V3-0324-w4a8c8-mtp-QuaRotw4a8c8MMLU-pro82.9781.2

*"maxSeqLen" : 33892,,精度存在波动,建议多次测试。