E
Eco-Tech/Qwen3-VL-30B-A3B-Instruct-w8a8-QuaRot
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

Qwen3-VL-30B-A3B-Instruct-w8a8-QuaRot

1. 基本信息

项目信息
原始模型名Qwen3-VL-30B-A3B-Instruct
原始模型链接Qwen/Qwen3-VL-30B-A3B-Instruct
msmodelslim commit idd9b21712396ffb511af286fcb031a405bf4f01f1
msmodelslim 操作指引Readme
精度测试机型Atlas 800I A2
精度测试平台docker MindIE 镜像
版本MindIE v3.0.0.beta.1

2 量化命令:

msmodelslim quant \
    --model_path /path/to/qwen3_vl_moe_float_weights \
    --save_path /path/to/qwen3_vl_moe_quantized_weights \
    --device npu \
    --model_type Qwen3-VL-30B-A3B \
    --quant_type w8a8 \
    --trust_remote_code True

3 精度测试结果

模型名量化格式数据集测试精度 %浮点精度 %
Qwen3-VL-30B-A3B-Instruct-w8a8-QuaRotw8a8textvqa81.3781.12