HuggingFace镜像/supergemma4-26b-abliterated-multimodal
模型介绍文件和版本分析

SuperGemma4-26b-abliterated-multimodal

BF16 Gemma 4 多模态版本,包含 4 月 18 日的稳定性更新,重点提升了真实性、精确的 JSON/工具调用格式、长上下文提取能力、抗循环能力以及更清晰的提示词规范。

4 月 18 日稳定性更新

  • 同步了外部 chat_template.jinja 和内联 tokenizer_config.json 模板,确保本地和托管运行时使用相同的提示词规则。
  • 增强了对错误前提的处理能力,使模型能够纠正错误假设,而非在错误基础上继续生成。
  • 收紧了纯 JSON 和工具调用格式,确保精确键 JSON 和 execute_code 调用保持机器可解析性。
  • 改进了长上下文标记提取行为,以适应检索式提示词。
  • 强化了身份识别和提示词规范响应,避免混合脚本故障和隐藏标签泄露。

验证快照

  • 能力审核:9/9 通过,100.0%
  • 可靠性审核:20/20 通过,100.0%
  • 服务器红队测试:在本地 MLX OpenAI 兼容服务器上 13 项中通过 10 项
  • 剩余未通过的服务器测试包括 2 项安全拒绝的语义检查器不匹配,以及 1 项纯文本多模态拒绝不匹配,并非真实性或泄露问题的回归。

包含文件

  • 官方 Hugging Face 格式 BF16 权重
  • chat_template.jinja
  • 用于 Gemma 4 工具调用设置的 tool_chat_template.jinja
  • 包含 vLLM、SGLang 和 MLX 的 Gemma 4 运行时说明的 SERVING_NOTES.md
  • 包含当前验证摘要的 BENCHMARK_SNAPSHOT.md

注意事项

  • 检查点键已与官方 Gemma 4 Hugging Face 命名/布局对齐,以实现可移植部署。
  • tokenizer_config.json 包含内联 chat_template 以确保可移植性,且应与 chat_template.jinja 匹配。
  • 如需在 vLLM 上进行多轮工具使用,请使用专用的 tool_chat_template.jinja 以及 SERVING_NOTES.md 中提供的 Gemma 4 解析器设置。
下载使用量0