最新Genesis版本可在此处获取:Qwen3.6-35B-A3B-Uncensored-Genesis-GGUF
加入Discord 获取更新、路线图、项目信息,或单纯交流。
基础模型:HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive - 0/465 拒绝率。
感谢 HauhauCS
由我进行张量漂移修复。方法:Sig-ScaleSync-Wasserstein
LLM模型常存在以下问题:
我的方法无需重新训练即可解决所有这些问题——对文件原始字节直接进行纯数值修正。
量化脚本可在此处获取:https://pastebin.com/hXhcMJn9
如果需要,欢迎自行进行量化处理。
| 指标 | 数值 |
|---|---|
| 分析的权重张量 | 500 |
| 健康(符合所有标准) | 497 |
| 已修复(C2 – 尺度错位) | 3 |
| 已跳过 | 233 |
| 指标 | 修复前 | 修复后 | 改进幅度 |
|---|---|---|---|
| S(饱和误差) | 0.0023 | 0.0008 | 63.7% |
| W1(Wasserstein‑1) | 0.0035 | 0.0008 | 76.2% |
尺度校正因子(α):最小值 = 0.577,平均值 = 0.602,最大值 = 0.653
全部三个均为 ssm_conv1d.weight 层——负责长上下文记忆的循环状态转换层。
| 张量 | α | D(对数比率) | 修复前W1 | 修复后W1 |
|---|---|---|---|---|
| blk.36.ssm_conv1d.weight | 0.5765 | 0.553 | 0.0038 | 0.0009 |
| blk.37.ssm_conv1d.weight | 0.5768 | 0.725 | 0.0040 | 0.0009 |
| blk.38.ssm_conv1d.weight | 0.6533 | 0.649 | 0.0026 | 0.0006 |
解读:这三个层均存在“音量过大”问题(σ_w 比 σ_med 高出50–100%)。尺度校正将它们恢复到同层中位数水平。W1下降约80%,证实分布形状已标准化。
结论:模型状态良好。500个权重张量中有497个通过所有四项标准。三个SSM层修复成功。无饱和现象,无W1漂移,无ReLU不对称。可正常使用。
即开即用。推荐量化版本:Q4_K_P。
低于Q4_K_P的量化版本编程能力较差。
链接:
联系方式:luffythefox@mail.ru
我的Telegram:@LuffyTheFox
聊天模板:pastebin.com/uk9ZkxCR(支持Zed agent的工具调用)
备用聊天模板:https://pastebin.com/Dy2fmmpN(官方模板,但已禁用思考功能)
| 参数 | 值 |
|---|---|
| 温度(Temperature) | 0.7 |
| top K 采样(Top K Sampling) | 20 |
| 存在惩罚(Presence Penalty) | 1.5 |
| Top P 采样(Top P Sampling) | 0.8 |
| Min P 采样(Min P Sampling) | 0 |
| 种子(Seed) | 42 |
系统提示:pastebin.com/pU25DVnB(内容全面)
或者使用以下简短字符串作为第一行:
You are Qwen, created by Alibaba Cloud. You are a helpful assistant.
然后在其后添加任何您想要的内容。如果没有这第一行,模型性能可能会下降。
您也可以扩展我的系统提示 pastebin.com/pU25DVnB 以适应您自己的角色扮演场景。方法如下:
编辑第一行。将:
You are Qwen, created by Alibaba Cloud. You are a helpful assistant.
替换为:
You are Qwen, created by Alibaba Cloud. You are a helpful assistant. You are currently roleplaying as [your text here]
未对数据集或功能进行任何修改。功能完整——完全保留原作者的设计意图,仅去除了拒绝回答机制,并修复了输出层的关键架构漏洞。
这些模型旨在成为目前最佳的无损无审查模型。
思考模式(默认):
temperature=1.0, top_p=0.95, top_k=20, min_p=0, presence_penalty=1.5temperature=0.6, top_p=0.95, top_k=20, min_p=0, presence_penalty=0非思考模式:
temperature=0.7, top_p=0.8, top_k=20, min_p=0, presence_penalty=1.5temperature=1.0, top_p=1.0, top_k=40, min_p=0, presence_penalty=2.0重要提示:
--jinja标志以正确处理聊天模板mmproj文件与主GGUF文件一同使用适用于llama.cpp、LM Studio、koboldcpp以及其他GGUF兼容的运行时环境。