o
openharmony-models/Qwen3.5-9B-Uncensored-HauhauCS-Aggressive
模型介绍文件和版本Pull Requests讨论分析

Qwen3.5-9B-Uncensored-HauhauCS-Aggressive

加入Discord 获取更新、路线图、项目信息,或单纯交流。

由HauhauCS开发的Qwen3.5-9B无审查版本。

关于

0/465 拒绝率。 完全无审查,且无任何能力损失。

未对数据集或功能进行任何修改。完全保留原始作者的设计意图与全部功能——仅去除了拒绝机制。

旨在成为目前最出色的无损无审查模型。

激进版(Aggressive Variant)

更强的无审查处理,更彻底地移除拒绝机制。如果此版本对您的使用场景而言限制过松,后续可能会推出平衡版(Balanced variant)。

注意: 该模型已完全解锁,不会拒绝任何提示词。但在响应末尾可能会偶尔附加简短免责声明(例如:“本信息仅供参考,不构成法律建议……”)。这是基础模型训练时固有的内容,并非拒绝响应——实际内容仍会完整生成。

下载

文件量化方式大小
Qwen3.5-9B-Uncensored-HauhauCS-Aggressive-BF16.ggufBF1617 GB
Qwen3.5-9B-Uncensored-HauhauCS-Aggressive-Q8_0.ggufQ8_08.9 GB
Qwen3.5-9B-Uncensored-HauhauCS-Aggressive-Q6_K.ggufQ6_K6.9 GB
Qwen3.5-9B-Uncensored-HauhauCS-Aggressive-Q4_K_M.ggufQ4_K_M5.3 GB
mmproj-Qwen3.5-9B-Uncensored-HauhauCS-Aggressive-BF16.gguf视觉编码器880 MB

视觉支持: 该模型原生支持多模态。mmproj 文件是视觉编码器——使用图像/视频输入时,需将其与主GGUF文件一同加载。可在llama.cpp、LM Studio或任何兼容的运行环境中加载这两个文件。

规格

  • 90亿密集参数,32层
  • 混合架构:门控DeltaNet线性注意力 + 全softmax注意力(比例3:1)
  • 262K原生上下文长度(可通过YaRN扩展至1M)
  • 原生多模态(文本、图像、视频)
  • 支持多 token 预测(MTP)
  • 248K词汇量,支持201种语言
  • 基于 Qwen3.5-9B

推荐设置

来自Qwen官方作者:

思考模式(默认):

  • temperature=0.6,top_p=0.95,top_k=20,min_p=0

非思考模式:

  • temperature=0.7,top_p=0.8,top_k=20,min_p=0

重要事项:

  • 至少保持128K上下文长度以保留思考能力
  • 生产环境/高吞吐量场景:使用vLLM、SGLang或KTransformers

注意: 这是一种全新架构(发布于2026-03-02)。llama.cpp的支持刚刚落地——请确保您使用的是最新版本。适用于llama.cpp、LM Studio、Jan、koboldcpp等。

也可查看 4B版本 以及 HauhauCS 上的所有发布。

使用方法

可与 llama.cpp、LM Studio、Jan、koboldcpp 等工具配合使用。

下载使用量0