h2o-danube3-500m-chat-GGUF

模型说明

本仓库包含采用 llama.cpp 框架量化的 h2o-danube3-500m-chat 模型的 GGUF 格式文件。

下表汇总了 h2o-danube3-500m-chat 的不同量化版本，展示了模型在大小、速度和质量之间的权衡。

模型名称	量化方法	模型大小	MT-Bench 平均分	困惑度	每秒生成词元数
h2o-danube3-500m-chat-F16.gguf	F16	1.03 GB	3.34	9.46	1870
h2o-danube3-500m-chat-Q8_0.gguf	Q8_0	0.55 GB	3.76	9.46	2144
h2o-danube3-500m-chat-Q6_K.gguf	Q6_K	0.42 GB	3.77	9.46	2418
h2o-danube3-500m-chat-Q5_K_M.gguf	Q5_K_M	0.37 GB	3.20	9.55	2430
h2o-danube3-500m-chat-Q4_K_M.gguf	Q4_K_M	0.32 GB	3.16	9.96	2427

表格中各列含义：

<|prompt|>Why is drinking water so healthy?</s><|answer|>