Vero-Qwen25-7B-i1-GGUF:可用于视觉推理等多模态任务，提供i1-GGUF格式的量化版本，包含多种IQ和Q系列量化类型，支持不同性能需求，基于Vero-Qwen25-7B模型优化。【此简介由AI生成】

关于

如需便捷概览和下载列表，请访问我们的该模型页面。

这是一个视觉模型 - mmproj 文件（如有）将位于静态仓库中。

如果您不确定如何使用 GGUF 文件，请参考 TheBloke 的某个 README 以获取更多详细信息，包括如何拼接多部分文件。

（按大小排序，不一定代表质量。IQ 量化版本通常比同等大小的非 IQ 量化版本更优）

链接	类型	大小/GB	说明
GGUF	imatrix	0.1	矩阵文件（用于创建您自己的量化版本）
GGUF	i1-IQ1_S	2.0	适用于存储空间极度紧张的情况
GGUF	i1-IQ1_M	2.1	主要适用于存储空间紧张的情况
GGUF	i1-IQ2_XXS	2.4
GGUF	i1-IQ2_XS	2.6
GGUF	i1-IQ2_S	2.7
GGUF	i1-IQ2_M	2.9
GGUF	i1-Q2_K_S	2.9	质量非常低
GGUF	i1-Q2_K	3.1	IQ3_XXS 可能更优
GGUF	i1-IQ3_XXS	3.2	较低质量
GGUF	i1-IQ3_XS	3.4
GGUF	i1-Q3_K_S	3.6	IQ3_XS 可能更优
GGUF	i1-IQ3_S	3.6	优于 Q3_K*
GGUF	i1-IQ3_M	3.7
GGUF	i1-Q3_K_M	3.9	IQ3_S 可能更优
GGUF	i1-Q3_K_L	4.2	IQ3_M 可能更优
GGUF	i1-IQ4_XS	4.3
GGUF	i1-IQ4_NL	4.5	推荐优先选择 IQ4_XS
GGUF	i1-Q4_0	4.5	速度快，质量低
GGUF	i1-Q4_K_S	4.6	尺寸/速度/质量的最佳平衡
GGUF	i1-Q4_K_M	4.8	速度快，推荐使用
GGUF	i1-Q4_1	5.0
GGUF	i1-Q5_K_S	5.4
GGUF	i1-Q5_K_M	5.5
GGUF	i1-Q6_K	6.4	实际效果接近静态 Q6_K

以下是 ikawrakow 制作的一张方便图表，比较了一些低质量量化类型（数值越低越好）：

有关您可能存在的疑问，以及如果您希望对其他模型进行量化处理，请参阅 https://huggingface.co/mradermacher/model_requests。

感谢我的公司 nethype GmbH 允许我使用其服务器，并为我的工作站提供升级，使我能够在业余时间开展这项工作。特别感谢 @nicoboss 提供其私人超级计算机的访问权限，这使我能够提供比原本更多、质量更高的 imatrix 量化版本。

提供的量化版本

（按大小排序，不一定代表质量。IQ 量化版本通常比同等大小的非 IQ 量化版本更优）

链接	类型	大小/GB	说明
GGUF	imatrix	0.1	矩阵文件（用于创建您自己的量化版本）
GGUF	i1-IQ1_S	2.0	适用于存储空间极度紧张的情况
GGUF	i1-IQ1_M	2.1	主要适用于存储空间紧张的情况
GGUF	i1-IQ2_XXS	2.4
GGUF	i1-IQ2_XS	2.6
GGUF	i1-IQ2_S	2.7
GGUF	i1-IQ2_M	2.9
GGUF	i1-Q2_K_S	2.9	质量非常低
GGUF	i1-Q2_K	3.1	IQ3_XXS 可能更优
GGUF	i1-IQ3_XXS	3.2	较低质量
GGUF	i1-IQ3_XS	3.4
GGUF	i1-Q3_K_S	3.6	IQ3_XS 可能更优
GGUF	i1-IQ3_S	3.6	优于 Q3_K*
GGUF	i1-IQ3_M	3.7
GGUF	i1-Q3_K_M	3.9	IQ3_S 可能更优
GGUF	i1-Q3_K_L	4.2	IQ3_M 可能更优
GGUF	i1-IQ4_XS	4.3
GGUF	i1-IQ4_NL	4.5	推荐优先选择 IQ4_XS
GGUF	i1-Q4_0	4.5	速度快，质量低
GGUF	i1-Q4_K_S	4.6	尺寸/速度/质量的最佳平衡
GGUF	i1-Q4_K_M	4.8	速度快，推荐使用
GGUF	i1-Q4_1	5.0
GGUF	i1-Q5_K_S	5.4
GGUF	i1-Q5_K_M	5.5
GGUF	i1-Q6_K	6.4	实际效果接近静态 Q6_K

以下是 ikawrakow 制作的一张方便图表，比较了一些低质量量化类型（数值越低越好）：