HuggingFace镜像/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive
模型介绍文件和版本分析
下载使用量0

Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive

加入Discord 获取更新、路线图、项目信息,或单纯聊天交流。

Qwen3.6-35B-A3B 由 HauhauCS 进行无审查处理。0/465 拒绝率。

HuggingFace 的“硬件兼容性”小部件无法识别 K_P 量化版本——它显示的文件可能比实际存在的少。请点击 “查看 +X 个变体” 或前往 “文件和版本” 查看所有可用下载。

关于

未对数据集或功能进行任何修改。完全功能正常,保留原始作者设计的 100% 功能——只是去除了拒绝机制。

这些模型旨在成为目前最佳的无损无审查模型。

激进变体

更强的无审查处理——模型完全解锁,不会拒绝任何提示。偶尔可能会附加简短免责声明(这是基础模型训练时内置的,并非拒绝回应),但始终会生成完整内容。

如果需要更保守的无审查版本并保留部分安全防护措施,请在平衡变体可用时查看该版本。

下载

文件量化版本每权重位数(BPW)大小
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q8_K_P.ggufQ8_K_P10.0644 GB
—Q8_08.5—
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q6_K_P.ggufQ6_K_P7.0731 GB
—Q6_K6.6—
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q5_K_P.ggufQ5_K_P6.4728 GB
—Q5_K_M5.7—
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_P.ggufQ4_K_P5.4023 GB
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M.ggufQ4_K_M4.8821 GB
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-IQ4_NL.ggufIQ4_NL4.5620 GB
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-IQ4_XS.ggufIQ4_XS4.3219 GB
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q3_K_P.ggufQ3_K_P4.3919 GB
—Q3_K_M3.9—
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-IQ3_M.ggufIQ3_M3.5615 GB
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q2_K_P.ggufQ2_K_P3.4615 GB
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-IQ2_M.ggufIQ2_M2.6911 GB
mmproj-Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-f16.ggufmmproj (f16)—899 MB

所有量化版本均使用重要性矩阵(imatrix)生成,以在权重优化过程中实现最佳质量保留。

什么是 K_P 量化版本?

K_P(“完美”)量化版本是 HauhauCS 的自定义量化格式,它通过特定模型分析,有选择性地在关键位置保留模型质量。每个模型都拥有专属的优化量化配置。

K_P 量化版本能将质量提升 1-2 个量化等级,而文件大小仅比基础量化版本增加约 5-15%。完全兼容 llama.cpp、LM Studio 以及任何 GGUF 兼容的运行时——无需特殊构建版本。

注意: 在 LM Studio 的量化列中,K_P 量化版本可能显示为“?”。这仅是显示问题——模型加载和运行均正常。

规格说明

  • 总参数 350 亿,每次前向传递约 30 亿活跃参数(MoE)
  • 256 个专家,每个 token 路由 8 个专家
  • 混合架构:线性注意力 + 全 softmax 注意力(比例 3:1)
  • 40 层
  • 262K 原生上下文长度
  • 原生多模态(文本、图像、视频)
  • 基于 Qwen/Qwen3.6-35B-A3B

推荐设置

来自 Qwen 官方作者的建议:

思考模式(默认):

  • 通用场景:temperature=1.0, top_p=0.95, top_k=20, min_p=0, presence_penalty=1.5
  • 编码/精确任务:temperature=0.6, top_p=0.95, top_k=20, min_p=0, presence_penalty=0

非思考模式:

  • 通用场景:temperature=0.7, top_p=0.8, top_k=20, min_p=0, presence_penalty=1.5
  • 推理任务:temperature=1.0, top_p=1.0, top_k=40, min_p=0, presence_penalty=2.0

重要提示:

  • 至少保留 128K 上下文长度以维持思考能力
  • 使用 llama.cpp 时添加 --jinja 标志以正确处理聊天模板
  • 视觉支持需要 mmproj 文件与主 GGUF 文件放在一起

使用方法

适用于 llama.cpp、LM Studio、Jan、koboldcpp 以及其他 GGUF 兼容的运行时。

llama-cli -m Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_P.gguf \
  --mmproj mmproj-Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-f16.gguf \
  --jinja -c 131072 -ngl 99

其他模型

  • HuggingFace 上的 HauhauCS