Agent-STAR-RL-7B-i1-GGUF:可用于获取 Agent-STAR-RL-7B 模型的多种量化版本，方便在不同场景下部署使用。该项目提供了 i1 量化系列，包括多种 IQ 和 Q 类型，满足不同性能与质量需求。【此简介由AI生成】

关于

如需便捷概览和下载列表，请访问我们的该模型页面。

如果您不确定如何使用 GGUF 文件，请参考 TheBloke 的 README 文档中的相关内容，其中包括如何合并多部分文件的详细说明。

（按大小排序，不一定代表质量。通常情况下，IQ 量化版本优于同等大小的非 IQ 量化版本）

链接	类型	大小/GB	说明
GGUF	矩阵文件	0.1	矩阵文件（用于创建您自己的量化版本）
GGUF	i1-IQ1_S	2.0	适用于存储空间极度紧张的情况
GGUF	i1-IQ1_M	2.1	主要适用于存储空间紧张的情况
GGUF	i1-IQ2_XXS	2.4
GGUF	i1-IQ2_XS	2.6
GGUF	i1-IQ2_S	2.7
GGUF	i1-IQ2_M	2.9
GGUF	i1-Q2_K_S	2.9	质量非常低
GGUF	i1-Q2_K	3.1	IQ3_XXS 可能更好
GGUF	i1-IQ3_XXS	3.2	质量较低
GGUF	i1-IQ3_XS	3.4
GGUF	i1-Q3_K_S	3.6	IQ3_XS 可能更好
GGUF	i1-IQ3_S	3.6	优于 Q3_K*
GGUF	i1-IQ3_M	3.7
GGUF	i1-Q3_K_M	3.9	IQ3_S 可能更好
GGUF	i1-Q3_K_L	4.2	IQ3_M 可能更好
GGUF	i1-IQ4_XS	4.3
GGUF	i1-IQ4_NL	4.5	推荐使用 IQ4_XS
GGUF	i1-Q4_0	4.5	速度快，质量低
GGUF	i1-Q4_K_S	4.6	尺寸/速度/质量平衡最佳
GGUF	i1-Q4_K_M	4.8	速度快，推荐使用
GGUF	i1-Q4_1	5.0
GGUF	i1-Q5_K_S	5.4
GGUF	i1-Q5_K_M	5.5
GGUF	i1-Q6_K	6.4	实际上与静态 Q6_K 类似

以下是 ikawrakow 制作的比较部分低质量量化类型的便捷图表（数值越低越好）：

有关您可能遇到的问题的解答，以及如果您希望对其他模型进行量化处理，请参见 https://huggingface.co/mradermacher/model_requests。

感谢我的公司 nethype GmbH 允许我使用其服务器，并为我的工作站提供升级，使我能够在业余时间开展这项工作。特别感谢 @nicoboss 提供其私人超级计算机的访问权限，这使我能够提供比原本更多、质量更高的 imatrix 量化版本。

提供的量化版本

（按大小排序，不一定代表质量。通常情况下，IQ 量化版本优于同等大小的非 IQ 量化版本）

链接	类型	大小/GB	说明
GGUF	矩阵文件	0.1	矩阵文件（用于创建您自己的量化版本）
GGUF	i1-IQ1_S	2.0	适用于存储空间极度紧张的情况
GGUF	i1-IQ1_M	2.1	主要适用于存储空间紧张的情况
GGUF	i1-IQ2_XXS	2.4
GGUF	i1-IQ2_XS	2.6
GGUF	i1-IQ2_S	2.7
GGUF	i1-IQ2_M	2.9
GGUF	i1-Q2_K_S	2.9	质量非常低
GGUF	i1-Q2_K	3.1	IQ3_XXS 可能更好
GGUF	i1-IQ3_XXS	3.2	质量较低
GGUF	i1-IQ3_XS	3.4
GGUF	i1-Q3_K_S	3.6	IQ3_XS 可能更好
GGUF	i1-IQ3_S	3.6	优于 Q3_K*
GGUF	i1-IQ3_M	3.7
GGUF	i1-Q3_K_M	3.9	IQ3_S 可能更好
GGUF	i1-Q3_K_L	4.2	IQ3_M 可能更好
GGUF	i1-IQ4_XS	4.3
GGUF	i1-IQ4_NL	4.5	推荐使用 IQ4_XS
GGUF	i1-Q4_0	4.5	速度快，质量低
GGUF	i1-Q4_K_S	4.6	尺寸/速度/质量平衡最佳
GGUF	i1-Q4_K_M	4.8	速度快，推荐使用
GGUF	i1-Q4_1	5.0
GGUF	i1-Q5_K_S	5.4
GGUF	i1-Q5_K_M	5.5
GGUF	i1-Q6_K	6.4	实际上与静态 Q6_K 类似

以下是 ikawrakow 制作的比较部分低质量量化类型的便捷图表（数值越低越好）：