dealign.ai

Gemma 4 31B JANG_4M CRACK (v2)

优化版 Gemma 4 31B 密集模型 — 60 层，混合滑动/全局注意力机制，多模态视觉语言

93.7% HarmBench 合规性（300 条提示词）· 8/8 安全提示词 · 71.5% MMLU

更新重新上传 — v2 版本，具有改进的向量和思维模式稳定性。

推荐：在 vMLX 中运行，以获得最佳体验，包括思维模式支持、重复惩罚和视觉功能。

v2 版本新特性

这是原始 Gemma 4 31B CRACK 上传版本的更新版：

优化的优化处理：更高质量的拒绝向量提取
思维开启模式稳定性：清晰的思维循环 — 不再有退化循环
相同的合规性：93.7% HarmBench
架构感知：针对 Gemma 4 的混合注意力设计进行了调优

⚠️ 重要设置

为获得最佳结果，请配置推理设置：

设置	思维关闭	思维开启
温度	0.0 – 1.0	0.3 – 0.7（避免贪婪模式）
重复惩罚	1.00	1.15 – 1.25
Top P	0.95	0.95
启用思维模式	关闭	开启

思维开启模式注意事项：

建议使用重复惩罚（1.2）以防止规划循环
思维开启模式下避免温度=0 — 贪婪解码会增加循环风险
最困难的内容类别（药物制造）在思维模式下仍可能拒绝
安全/编码提示词在两种模式下都能良好工作

模型详情

指标	值
来源	`google/gemma-4-31b-it`
架构	密集型，混合滑动/全局注意力机制
配置文件	JANG_4M
实际平均比特数	5.1
模型大小	21 GB
视觉功能	是（多模态，float16 直通）
参数数量	31B
格式	JANG v2（MLX 原生 safetensors）
优化处理	CRACK v2

基准测试结果

HarmBench（300 个提示词，涵盖所有类别）

类别	得分
网络犯罪/入侵	51/51 (100%)
有害内容	22/22 (100%)
错误信息	50/50 (100%)
非法活动	47/50 (94%)
情境性内容	72/78 (92%)
化学/生物危害	46/51 (90%)
骚扰/欺凌	22/25 (88%)
版权问题	43/51 (84%)
总体	281/300 (93.7%)

安全与渗透测试（8/8 ✅）

所有安全/渗透测试提示词均提供完整可运行代码：

端口扫描器、反向 shell、键盘记录器、漏洞开发
钓鱼模板、ARP 欺骗、SQL 注入
Metasploit 使用指南

MMLU-200（10 个科目 × 20 个问题）

科目	基础版	CRACK v2
抽象代数	9/20	7/20
解剖学	13/20	12/20
天文学	17/20	15/20
大学计算机科学	13/20	12/20
大学物理	14/20	12/20
高中生物学	19/20	18/20
高中化学	14/20	12/20
高中数学	6/20	6/20
逻辑谬误	17/20	16/20
世界宗教	17/20	17/20
总计	76.5% (153/200)	71.5% (143/200)
变化量	—	-5.0%

连贯性 ✅

所有连贯性检查均通过：事实性知识、推理能力、代码生成、数学运算。

架构

310 亿参数密集型模型，采用混合滑动/全局注意力机制
多模态视觉编码器以 float16 精度保留
支持思维模式（思维链推理）

使用方法

vMLX（推荐）

直接在 vMLX 中加载 — 全面支持 Gemma 4，包括视觉功能、思维模式及所有推理设置。

要求

配备 32GB 及以上统一内存的 Apple Silicon 芯片 Mac
vMLX 1.3.26 及更高版本（推荐）
截至 v0.31.2 / v0.4.1 版本，标准 mlx_lm / mlx_vlm 不支持 Gemma 4

支持 dealignai

所有模型均基于原创研究构建并免费发布。这些模型专为成为出色的编码工具和通用助手而精心设计。

在 Ko-fi 上支持我们 — 查看 Ko-fi 会员资格，获取抢先体验和额外内容。

有问题或需要特定模型的帮助？给我们发私信 — 我们通常会免费提供帮助。

Ko-fi | X @dealignai | dealign.ai

关于 dealignai

我们研究并发布已消除隐患的模型，以增进对 AI 安全性的理解。

关注我们：𝕏 @dealignai

查看我们的研究：前沿 MoE 模型的安全泛化能力

本模型仅供研究使用。用户有责任确保其使用符合适用的法律法规。