gemma-4-31B-it-assistant:可用于提升 Gemma 4 模型的解码速度,实现低延迟和设备端应用。该项目是 Multi-Token Prediction drafter,通过 Speculative Decoding 管道预测多 token,与目标模型并行验证,保证生成质量的同时提速最高达 2 倍。【此简介由AI生成】 - AtomGit AI社区