HuggingFace镜像/Gemma-4-E2B-Uncensored-HauhauCS-Aggressive

Gemma-4-E2B-Uncensored-HauhauCS-Aggressive

加入Discord 获取更新、路线图、项目信息，或只是闲聊。

Gemma 4 E2B-IT 由 HauhauCS 进行无审查处理。0/465 拒绝率***

HuggingFace 的“硬件兼容性”小部件无法识别 K_P 量化版本——它显示的文件可能比实际存在的少。请点击 “查看 +X 个变体” 或前往 “文件和版本” 查看所有可用下载。

关于

未对数据集或功能进行任何更改。完全功能正常，100% 保留原作者的设计初衷——只是去除了拒绝机制。

这些模型旨在成为目前最佳的无损无审查模型。

激进变体

更强的无审查处理——模型完全解锁，不会拒绝任何提示。可能会偶尔附加简短的免责声明（这些是基础模型训练中固有的，并非拒绝），但始终会生成完整内容。

如果需要保留部分安全防护的保守型无审查版本，请在平衡变体可用后查看。

下载

文件	量化方式	每权重位数（BPW）	大小
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q8_K_P.gguf	Q8_K_P	9.4	4.7 GB
—	Q8_0	8.5	—
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q6_K_P.gguf	Q6_K_P	7.0	3.7 GB
—	Q6_K	6.6	—
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q5_K_P.gguf	Q5_K_P	6.1	3.5 GB
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q4_K_P.gguf	Q4_K_P	5.2	3.3 GB
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q3_K_P.gguf	Q3_K_P	4.1	3.1 GB
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-IQ3_M.gguf	IQ3_M	3.7	3.0 GB
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q2_K_P.gguf	Q2_K_P	3.5	2.9 GB
mmproj-Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-f16.gguf	mmproj (f16)	—	940 MB

所有量化版本均使用重要性矩阵（imatrix）生成，以在权重精简的情况下实现最佳质量保留。

什么是 K_P 量化版本？

K_P（“完美”）量化版本是 HauhauCS 的自定义量化格式，它通过特定模型分析，有选择性地在最关键的部分保留质量。每个模型都有其专属的优化量化配置文件。

K_P 量化版本能将质量有效提升 1-2 个量化等级，而文件大小仅比基础量化版本大 ~5-15%。完全兼容 llama.cpp、LM Studio 以及任何 GGUF 兼容的运行时环境——无需特殊构建版本。

注意： 在 LM Studio 的量化列中，K_P 量化版本可能显示为“？”。这仅是显示问题——模型加载和运行均正常。

规格

20 亿参数
35 层，混合滑动窗口（512）+ 全注意力机制
131K 上下文长度
原生多模态（文本、图像、视频、音频）
20 个 KV 共享层，提升内存效率
基于 google/gemma-4-e2b-it

使用方法

适用于 llama.cpp、LM Studio、Jan、koboldcpp 以及其他 GGUF 兼容的运行时环境。

# Text only
llama-cli -m Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q4_K_P.gguf \
  --jinja -c 8192 -ngl 99

# With vision/audio
llama-cli -m Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q4_K_P.gguf \
  --mmproj mmproj-Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-f16.gguf \
  --jinja -c 8192 -ngl 99

其他尺寸

Gemma-4-E4B-Uncensored-HauhauCS-Aggressive — 4B 版本，能力更强

* 与我其他版本相比，Gemma 4 在长上下文方面没有得到那么多的手动测试时间。谷歌现在采用了类似于 NVIDIA GenRM 的技术——即充当内部评判者的生成式奖励模型——这使得（真正的）无审查成为一个日益具有挑战性的领域。我预计 99.999% 的用户不会遇到边缘情况，但为了诚实起见，特此标注。

** 这是一个 2B 模型。请降低您的期望——就其尺寸而言，它已经令人印象深刻，但它仍然只有 2B 参数。复杂推理、细致的角色扮演和长篇连贯输出并非其强项。它非常适合快速任务、移动/边缘部署以及实验用途。

Gemma-4-E2B-Uncensored-HauhauCS-Aggressive

加入Discord 获取更新、路线图、项目信息，或只是闲聊。

Gemma 4 E2B-IT 由 HauhauCS 进行无审查处理。0/465 拒绝率***

HuggingFace 的“硬件兼容性”小部件无法识别 K_P 量化版本——它显示的文件可能比实际存在的少。请点击 “查看 +X 个变体” 或前往 “文件和版本” 查看所有可用下载。

关于

未对数据集或功能进行任何更改。完全功能正常，100% 保留原作者的设计初衷——只是去除了拒绝机制。

这些模型旨在成为目前最佳的无损无审查模型。

激进变体

如果需要保留部分安全防护的保守型无审查版本，请在平衡变体可用后查看。

下载

文件	量化方式	每权重位数（BPW）	大小
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q8_K_P.gguf	Q8_K_P	9.4	4.7 GB
—	Q8_0	8.5	—
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q6_K_P.gguf	Q6_K_P	7.0	3.7 GB
—	Q6_K	6.6	—
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q5_K_P.gguf	Q5_K_P	6.1	3.5 GB
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q4_K_P.gguf	Q4_K_P	5.2	3.3 GB
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q3_K_P.gguf	Q3_K_P	4.1	3.1 GB
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-IQ3_M.gguf	IQ3_M	3.7	3.0 GB
Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q2_K_P.gguf	Q2_K_P	3.5	2.9 GB
mmproj-Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-f16.gguf	mmproj (f16)	—	940 MB

所有量化版本均使用重要性矩阵（imatrix）生成，以在权重精简的情况下实现最佳质量保留。

什么是 K_P 量化版本？

注意： 在 LM Studio 的量化列中，K_P 量化版本可能显示为“？”。这仅是显示问题——模型加载和运行均正常。

规格

20 亿参数
35 层，混合滑动窗口（512）+ 全注意力机制
131K 上下文长度
原生多模态（文本、图像、视频、音频）
20 个 KV 共享层，提升内存效率
基于 google/gemma-4-e2b-it

使用方法

适用于 llama.cpp、LM Studio、Jan、koboldcpp 以及其他 GGUF 兼容的运行时环境。

# Text only
llama-cli -m Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q4_K_P.gguf \
  --jinja -c 8192 -ngl 99

# With vision/audio
llama-cli -m Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-Q4_K_P.gguf \
  --mmproj mmproj-Gemma-4-E2B-Uncensored-HauhauCS-Aggressive-f16.gguf \
  --jinja -c 8192 -ngl 99

其他尺寸

Gemma-4-E4B-Uncensored-HauhauCS-Aggressive — 4B 版本，能力更强

Gemma-4-E2B-Uncensored-HauhauCS-Aggressive

关于

激进变体

下载

什么是 K_P 量化版本？

规格

推荐设置

使用方法

其他尺寸

Gemma-4-E2B-Uncensored-HauhauCS-Aggressive

关于

激进变体

下载

什么是 K_P 量化版本？

规格

推荐设置

使用方法

其他尺寸