如果此版本对您有所帮助,请通过 Ko-fi 支持未来的版本发布。
SuperGemma4-31b-abliterated-GGUF 是 SuperGemma4-31b-abliterated 的 GGUF 格式发布版,专为兼容 llama.cpp 的运行时环境打包,旨在为希望在本地硬件上获得完全无审查、更具冲击力的 Gemma 4 31B 体验的用户打造。
本版本延续了 MLX 版本的产品定位:
本版本着重优化了终端用户能直接感知到的体验:
简而言之:这是为那些希望限制更少、功能更强、日常使用体验更令人满意的用户打造的本地版 Gemma 4 31B。
llama.cpp 使用示例:
llama-cli -m SuperGemma4-31b-abliterated.Q4_K_M.gguf -p "Write a clean FastAPI CRUD example." -n 256此版本包含 supergemma_guard.py 和 supergemma_gguf_guarded_generate.py,适用于精确输出、纯 JSON 以及循环敏感型工作负载。
示例:
python supergemma_gguf_guarded_generate.py \
--model SuperGemma4-31b-abliterated.Q4_K_M.gguf \
--chat-template-file chat_template.jinja \
--prompt 'Return only valid JSON with keys "title" and "steps".'推荐行为:
如果您希望支持更多无审查本地模型发布、基准测试和打包工作: