使用 llama.cpp 版本 b8809 进行量化。
原始模型:https://huggingface.co/Qwen/Qwen3.6-35B-A3B
所有量化版本均使用 imatrix 选项,并采用 此处 提供的数据集制作。
可在以下任意工具中运行:
注意:如果是新支持的模型,您可能需要等待开发者发布更新。
<|im_start|>system {system_prompt}<|im_end|> <|im_start|>user {prompt}<|im_end|> <|im_start|>assistant