Qwen-3.5-28B-A3B-REAP:可用于减少 Qwen3.5-35B-A3B 模型的显存占用并保持性能,该项目通过 REAP 方法对 MoE 模型进行 20% 专家剪枝,保留 205 个专家,在标准基准测试中保持竞争力,同时降低显存需求。【此简介由AI生成】 - AtomGit AI社区