HuggingFace镜像/Qwen3-32B-gs-A8W8
模型介绍模型推理文件和版本分析
下载使用量0

数据集精度

将权重加载到MindSpore Transformers网络仓,并使用vLLM-MindSpore Plugin进行部署,基于AISBench评测工具 gsm8k_gen_0_shot_cot_chat_prompt 任务和 ceval_gen_0_shot_cot_chat_prompt 任务,输入长度4K,输出长度32K,评测结果如下:

模型gsm8kceval-averageceval-weighted
Qwen3-32B bf1696.2189.5788.86
Qwen3-32B a8w895.9889.4188.78