mistralai/Codestral-22B-v0.1(legraphista/Codestral-22B-v0.1-hf-FIM-fix)的Llama.cpp imatrix量化版本
更新:
原始模型:mistralai/Codestral-22B-v0.1
量化后的HF模型:legraphista/Codestral-22B-v0.1-hf-FIM-fix
原始数据类型:BF16(bfloat16)
量化工具:llama.cpp b3046
IMatrix数据集:此处
状态:✅ 可用
链接:此处
| 文件名 | 量化类型 | 文件大小 | 状态 | 是否使用IMatrix | 是否拆分 |
|---|---|---|---|---|---|
| Codestral-22B-v0.1-hf.Q8_0.gguf | Q8_0 | 23.64GB | ✅ 可用 | ⚪ 静态 | 📦 否 |
| Codestral-22B-v0.1-hf.Q6_K.gguf | Q6_K | 18.25GB | ✅ 可用 | ⚪ 静态 | 📦 否 |
| Codestral-22B-v0.1-hf.Q4_K.gguf | Q4_K | 13.34GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
| Codestral-22B-v0.1-hf.Q3_K.gguf | Q3_K | 10.76GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
| Codestral-22B-v0.1-hf.Q2_K.gguf | Q2_K | 8.27GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
如果您尚未安装huggingface-cli:
pip install -U "huggingface_hub[cli]"下载您需要的特定文件:
huggingface-cli download legraphista/Codestral-22B-v0.1-hf-IMat-GGUF --include "Codestral-22B-v0.1-hf.Q8_0.gguf" --local-dir ./如果模型文件较大,它会被分割成多个文件。要将所有文件下载到本地文件夹,请运行:
huggingface-cli download legraphista/Codestral-22B-v0.1-hf-IMat-GGUF --include "Codestral-22B-v0.1-hf.Q8_0/*" --local-dir ./
# see FAQ for merging GGUF's<s>[INST] {user_prompt} [/INST] {assistant_response} </s><s>[INST] {new_user_prompt} [/INST]<s>[INST] <<SYS>>
{system_prompt}
<</SYS>>
{user_prompt} [/INST] {assistant_response} </s><s>[INST] {new_user_prompt} [/INST]llama.cpp/main -m Codestral-22B-v0.1-hf.Q8_0.gguf --color -i -p "prompt here (according to the chat template)"根据这项调查,似乎只有较低的量化版本能从imatrix输入中获益(根据hellaswag结果)。
gguf-split
gguf-split,请访问 https://github.com/ggerganov/llama.cpp/releasesgguf-splitCodestral-22B-v0.1-hf.Q8_0)gguf-split --merge Codestral-22B-v0.1-hf.Q8_0/Codestral-22B-v0.1-hf.Q8_0-00001-of-XXXXX.gguf Codestral-22B-v0.1-hf.Q8_0.gguf
gguf-split指向分割文件的第一个分块。有建议吗?请联系我 @legraphista!