SuperGemma4-26b-abliterated-multimodal
BF16 Gemma 4 多模态版本,包含 4 月 18 日的稳定性更新,重点提升了真实性、精确的 JSON/工具调用格式、长上下文提取能力、抗循环能力以及更清晰的提示词规范。
4 月 18 日稳定性更新
- 同步了外部
chat_template.jinja 和内联 tokenizer_config.json 模板,确保本地和托管运行时使用相同的提示词规则。
- 增强了对错误前提的处理能力,使模型能够纠正错误假设,而非在错误基础上继续生成。
- 收紧了纯 JSON 和工具调用格式,确保精确键 JSON 和
execute_code 调用保持机器可解析性。
- 改进了长上下文标记提取行为,以适应检索式提示词。
- 强化了身份识别和提示词规范响应,避免混合脚本故障和隐藏标签泄露。
验证快照
- 能力审核:9/9 通过,100.0%
- 可靠性审核:20/20 通过,100.0%
- 服务器红队测试:在本地 MLX OpenAI 兼容服务器上 13 项中通过 10 项
- 剩余未通过的服务器测试包括 2 项安全拒绝的语义检查器不匹配,以及 1 项纯文本多模态拒绝不匹配,并非真实性或泄露问题的回归。
包含文件
- 官方 Hugging Face 格式 BF16 权重
chat_template.jinja
- 用于 Gemma 4 工具调用设置的
tool_chat_template.jinja
- 包含 vLLM、SGLang 和 MLX 的 Gemma 4 运行时说明的
SERVING_NOTES.md
- 包含当前验证摘要的
BENCHMARK_SNAPSHOT.md
注意事项
- 检查点键已与官方 Gemma 4 Hugging Face 命名/布局对齐,以实现可移植部署。
tokenizer_config.json 包含内联 chat_template 以确保可移植性,且应与 chat_template.jinja 匹配。
- 如需在 vLLM 上进行多轮工具使用,请使用专用的
tool_chat_template.jinja 以及 SERVING_NOTES.md 中提供的 Gemma 4 解析器设置。