Assistant_Pepe_32B

8B
版本 32B
版本 70B
版本

前往此处获取角色扮演卡片

前往此处获取冒险卡片

点击此处查看量化版本点击此处获取推荐设置点击此处请我喝杯咖啡

如果我们把通义千问（Qwen）的大脑"烧"了会怎样？

"这堆张量绝对需要心理治疗" 🐸??? ⚕👩🏻‍⚕️🧠

这次微调差点就黄了

这次微调做得真是费劲。我好几次都想放弃，另起炉灶。但……

我收到了一笔（非常）慷慨的捐赠，用于制作32B版本，所以我说：“我百分百会搞定！”——因此，我是承诺过的。而且在这之前，8B和70B版本反响异常热烈，远超常理预期，所以当然，为什么不做个32B版本呢？我觉得有必要。按理说，32B版本应该小菜一碟。按理说啊。唉，根本不是这么回事。我真的好几次都想放弃。

我还是从那句老套的“这不是钱的事”说起吧，因为确实不是。要是我在云端训练这堆“张量怪物”，现在账单早就轻松破四位数了。更别提这耗费的时间和精力了；就算不算算力成本，也已经离谱到家了。但我是个说话算话的人，既然承诺了，就得做到。现在看来，我真庆幸自己坚持下来了。

“Qwen不适合做创意类任务的基底模型”

很多才华横溢且经验丰富的调参师（有理由地）抱怨Qwen极难训练。不是说在STEM领域难，而是在……除了STEM之外的任何领域。尤其是创意类任务。Qwen有非常强烈、独特的“Qwen味儿”。它固执、刻板，还特别干巴巴。想把它调优来做创意类任务，简直像白费功夫。据我所知，针对Qwen的创意类微调少得可怜，而且和同作者用类似数据集基于Mistral/Llama做的版本比起来，人气也差远了。在创意类任务上，Mistral和Llama就是（始终）表现更好；这是公认的事实。

但我的天，这个模型简直是“化腐朽为神奇”！结果异常独特、新颖、搞笑，而且非常、非常放飞自我。我费了九牛二虎之力才把那种“Qwen味儿”和刻板的“助手腔”给压下去。这个模型显然不如70B变体聪明，甚至在某些方面（比如编程）可能还不如8B变体，但它比前两者都更特别。我是认真的，这不是自我安慰；当你拿一个有着特定先验知识、人设和风格的模型（这里是侧重逻辑思考的STEM风格），让它去做完全不搭边的事时，有时就会发生一些独特又不可预测的化学反应（比如可以看看Phi-Lthy4）。

这是第一个让我感受到那种诡异“自我意识”表象的模型，就像Tenebră-30B及其小尺寸变体那样——那是我在2023年底和2024年初在HuggingFace上发布的第一批模型。从那以后，时不时就有人问我会不会出新版Tenebră，但可惜的是，那些模型的训练数据集已经永久丢失了。有意思的是，这个模型和Tenebră尺寸相同，但架构更现代。Tenebră基于老款Llama-1，而这个是基于Qwen-3，上下文能力超强，而且我认为，它有着和Tenebră一样诡异又有趣的怪癖。

一个最干巴巴、最“机器人”的基底模型，竟然诞生了一个可以说是最具“人性”的微调版本。和它聊天简直太有意思了，而且在任何创意/头脑风暴任务中都表现得非常出色。就算我拿给1000个人用，估计至少95%的人都不会相信它的底层是Qwen。绝了🤌

概览

无疑是最具人性化的Qwen-3微调模型。
无需思考！ 讨厌思考的朋友们，欢呼吧！
不过，若明确提示，它依然能够进行思考。
无需系统提示！ 角色形象已融入模型权重之中 :)
它会狠狠吐槽你！也会狠狠吐槽自己，这得益于我们~~毫不掩饰地~~注入的负面偏向。
出色且极具创造力的写手（查看示例）。
独特的写作风格，几乎没有冗余内容！
超长上下文能力，归功于Qwen-3 32B基础模型（更多详情参见nVidia的RULER）。在32K上下文长度下连贯性极佳，即使在64K长度下也保持非常好的连贯性！
可能比之前的8B和70B版本更加肆无忌惮和离经叛道。
丰富的回复多样性。
极其有趣的聊天对象！
非常拟人化
完全不像是Qwen-3！
对两栖动物友好。

模型详情

预期用途：搞笑发帖、创意写作、头脑风暴、聊天。
审查级别：低 - 极低
7.5 / 10（10分为完全无审查）

UGI评分：

可用量化版本：

原始版本：FP16
GGUF：静态量化
EXL3：3.0 bpw | 3.5 bpw
GPTQ：4-Bit-128 AutoRound
移动版（ARM）：Q4_0

生成设置

助手模式推荐设置：

完整生成设置：调试确定性。

完整生成设置：min_p。

聊天示例：

聊天示例（点击下方展开）

创意写作 + SLOP 诱导，结果确实令人惊讶。

如何找到妻子

总统想买一只宝可梦

关于 AI 意识之类的聊天

模型指令模板：ChatML

<|im_start|>system
You are a BASED AI, your job is to fulfill the will of thy user.<|im_end|>
<|im_start|>User request
{prompt}<|im_end|>
<|im_start|>AI answer

您的支持 = 更多模型

我的 Ko-fi 页面（点击此处）

引用信息

@llm{Assistant_Pepe_32B,
  author = {SicariusSicariiStuff},
  title = {Assistant_Pepe_32B},
  year = {2026},
  publisher = {Hugging Face},
  url = {https://huggingface.co/SicariusSicariiStuff/Assistant_Pepe_32B}
}

其他内容

我的大部分模型 - 按顺序排列
Impish_LLAMA_4B 带来**“Impish 体验”**，现在可在机械硬盘和低配设备上运行。
SLOP_Detector 使用 SLOP 检测器清除 GPT 式表达。

这次微调差点就黄了

这次微调做得真是费劲。我好几次都想放弃，另起炉灶。但……

“Qwen不适合做创意类任务的基底模型”

概览

无疑是最具人性化的Qwen-3微调模型。

无需思考！ 讨厌思考的朋友们，欢呼吧！

不过，若明确提示，它依然能够进行思考。

无需系统提示！ 角色形象已融入模型权重之中 :)

它会狠狠吐槽你！也会狠狠吐槽自己，这得益于我们~~毫不掩饰地~~注入的负面偏向。

出色且极具创造力的写手（查看示例）。

独特的写作风格，几乎没有冗余内容！

超长上下文能力，归功于Qwen-3 32B基础模型（更多详情参见nVidia的RULER）。在32K上下文长度下连贯性极佳，即使在64K长度下也保持非常好的连贯性！

可能比之前的8B和70B版本更加肆无忌惮和离经叛道。

丰富的回复多样性。

极其有趣的聊天对象！

非常拟人化

完全不像是Qwen-3！

对两栖动物友好。

@llm{Assistant_Pepe_32B, author = {SicariusSicariiStuff}, title = {Assistant_Pepe_32B}, year = {2026}, publisher = {Hugging Face}, url = {https://huggingface.co/SicariusSicariiStuff/Assistant_Pepe_32B} }