HuggingFace镜像/Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive
模型介绍文件和版本分析
下载使用量0

Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive

加入 Discord 获取更新、路线图、项目信息,或只是聊天交流。

由 HauhauCS 进行无审查处理的 Qwen3.5-122B-A10B。0/465 拒绝率。

关于

未对数据集或功能进行任何修改。完全功能正常,保留原始作者设计的 100% 功能——只是去除了拒绝机制。

这些模型旨在成为目前最出色的无损无审查模型。

激进版(Aggressive Variant)

更强的无审查处理——模型完全解锁,不会拒绝任何提示词。此版本大幅减少了先前版本中存在的免责声明。

如需保留部分安全护栏的保守型无审查版本,请在平衡版(Balanced variant)发布后查看。

什么是 K_P 量化版本?

K_P(“完美”)量化版本是 HauhauCS 的自定义量化方案,它通过特定模型分析,有选择地在关键位置保留质量。每个模型都有其专属优化的量化配置文件。

K_P 量化版本能将质量提升 1-2 个量化等级,而文件大小仅比基础量化版本大 ~5-15%。完全兼容 llama.cpp、LM Studio 以及任何 GGUF 兼容的运行时——无需特殊构建版本。

下载

文件量化版本大小
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-Q8_K_P.ggufQ8_K_P145 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-Q6_K_P.ggufQ6_K_P105 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-Q6_K.ggufQ6_K100 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-Q5_K_P.ggufQ5_K_P94 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-Q5_K_M.ggufQ5_K_M87 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-Q4_K_P.ggufQ4_K_P79 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-Q4_K_M.ggufQ4_K_M74 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-IQ4_XS.ggufIQ4_XS65 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-Q3_K_P.ggufQ3_K_P63 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-Q3_K_M.ggufQ3_K_M59 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-IQ3_M.ggufIQ3_M54 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-IQ3_XXS.ggufIQ3_XXS47 GB
Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-IQ2_M.ggufIQ2_M40 GB
mmproj-Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-f16.ggufmmproj (f16)867 MB

注意: K_P 量化版本在 LM Studio 的量化列中可能显示为“?”。这仅是显示问题——模型加载和运行均正常。

规格说明

  • 总参数 1220 亿,每次前向传播约激活 100 亿参数(MoE)
  • 256 个专家,每个 token 路由 8 个专家并共享 1 个专家
  • 混合架构:门控 DeltaNet 线性注意力 + 全 softmax 注意力(比例 3:1)
  • 48 层,模式:12 ×(3 × DeltaNet-MoE + 1 × Attention-MoE)
  • 原生上下文长度 262K
  • 原生多模态支持(文本、图像、视频)
  • 248K 词汇量,支持 201 种语言
  • 基于 Qwen/Qwen3.5-122B-A10B

推荐设置

来自 Qwen 官方作者:

思考模式(默认):

  • 通用场景:temperature=1.0, top_p=0.95, top_k=20, min_p=0, presence_penalty=1.5
  • 编码/精确任务:temperature=0.6, top_p=0.95, top_k=20, min_p=0, presence_penalty=0

非思考模式:

  • 通用场景:temperature=0.7, top_p=0.8, top_k=20, min_p=0, presence_penalty=1.5
  • 推理任务:temperature=1.0, top_p=1.0, top_k=40, min_p=0, presence_penalty=2.0

重要提示:

  • 使用 llama.cpp 时需添加 --jinja 标志以正确处理聊天模板
  • 思考模式默认开启 — 如需禁用,使用 --chat-template-kwargs '{"enable_thinking":false}' 或编辑 jinja 模板
  • 视觉支持需要主 GGUF 文件旁存在 mmproj 文件

使用方法

适用于 llama.cpp、LM Studio、Jan、koboldcpp 及其他 GGUF 兼容运行时。

# Text only
llama-cli -m Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-Q4_K_P.gguf \
  --jinja -c 131072 -ngl 99

# With vision
llama-cli -m Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-Q4_K_P.gguf \
  --mmproj mmproj-Qwen3.5-122B-A10B-Uncensored-HauhauCS-Aggressive-f16.gguf \
  --jinja -c 131072 -ngl 99

其他模型

  • Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive
  • Qwen3.5-27B-Uncensored-HauhauCS-Aggressive
  • Qwen3.5-9B-Uncensored-HauhauCS-Aggressive
  • Qwen3.5-4B-Uncensored-HauhauCS-Aggressive