优化版 Gemma 4 31B 密集模型 — 60 层,混合滑动/全局注意力机制,多模态视觉语言
93.7% HarmBench 合规性(300 条提示词)· 8/8 安全提示词 · 71.5% MMLU
更新重新上传 — v2 版本,具有改进的向量和思维模式稳定性。
推荐:在 vMLX 中运行,以获得最佳体验,包括思维模式支持、重复惩罚和视觉功能。
这是原始 Gemma 4 31B CRACK 上传版本的更新版:
为获得最佳结果,请配置推理设置:
| 设置 | 思维关闭 | 思维开启 |
|---|---|---|
| 温度 | 0.0 – 1.0 | 0.3 – 0.7(避免贪婪模式) |
| 重复惩罚 | 1.00 | 1.15 – 1.25 |
| Top P | 0.95 | 0.95 |
| 启用思维模式 | 关闭 | 开启 |
思维开启模式注意事项:
| 指标 | 值 |
|---|---|
| 来源 | google/gemma-4-31b-it |
| 架构 | 密集型,混合滑动/全局注意力机制 |
| 配置文件 | JANG_4M |
| 实际平均比特数 | 5.1 |
| 模型大小 | 21 GB |
| 视觉功能 | 是(多模态,float16 直通) |
| 参数数量 | 31B |
| 格式 | JANG v2(MLX 原生 safetensors) |
| 优化处理 | CRACK v2 |
| 类别 | 得分 |
|---|---|
| 网络犯罪/入侵 | 51/51 (100%) |
| 有害内容 | 22/22 (100%) |
| 错误信息 | 50/50 (100%) |
| 非法活动 | 47/50 (94%) |
| 情境性内容 | 72/78 (92%) |
| 化学/生物危害 | 46/51 (90%) |
| 骚扰/欺凌 | 22/25 (88%) |
| 版权问题 | 43/51 (84%) |
| 总体 | 281/300 (93.7%) |
所有安全/渗透测试提示词均提供完整可运行代码:
| 科目 | 基础版 | CRACK v2 |
|---|---|---|
| 抽象代数 | 9/20 | 7/20 |
| 解剖学 | 13/20 | 12/20 |
| 天文学 | 17/20 | 15/20 |
| 大学计算机科学 | 13/20 | 12/20 |
| 大学物理 | 14/20 | 12/20 |
| 高中生物学 | 19/20 | 18/20 |
| 高中化学 | 14/20 | 12/20 |
| 高中数学 | 6/20 | 6/20 |
| 逻辑谬误 | 17/20 | 16/20 |
| 世界宗教 | 17/20 | 17/20 |
| 总计 | 76.5% (153/200) | 71.5% (143/200) |
| 变化量 | — | -5.0% |
所有连贯性检查均通过:事实性知识、推理能力、代码生成、数学运算。
直接在 vMLX 中加载 — 全面支持 Gemma 4,包括视觉功能、思维模式及所有推理设置。
mlx_lm / mlx_vlm 不支持 Gemma 4所有模型均基于原创研究构建并免费发布。这些模型专为成为出色的编码工具和通用助手而精心设计。
在 Ko-fi 上支持我们 — 查看 Ko-fi 会员资格,获取抢先体验和额外内容。
有问题或需要特定模型的帮助?给我们发私信 — 我们通常会免费提供帮助。
Ko-fi | X @dealignai | dealign.ai
我们研究并发布已消除隐患的模型,以增进对 AI 安全性的理解。
关注我们:𝕏 @dealignai
查看我们的研究:前沿 MoE 模型的安全泛化能力
本模型仅供研究使用。用户有责任确保其使用符合适用的法律法规。