OpenBuddy - 开放式多语言聊天机器人

本模型评估结果：Evaluation.txt

Demo

版权声明

许可证：deepseek

所有OpenBuddy模型均存在固有的局限性，可能会产生错误、有害、冒犯性或其他不良输出。用户不应在可能导致人身伤害、财产损失或重大损失的关键或高风险场景中使用这些模型。此类场景包括但不限于医疗领域、可能造成伤害的软硬件系统控制，以及重要的财务或法律决策。

OpenBuddy按“原样”提供，不提供任何形式的明示或暗示担保，包括但不限于对适销性、特定用途适用性和非侵权性的暗示担保。在任何情况下，作者、贡献者或版权持有人均不对因本软件或软件的使用或其他交易而产生的任何索赔、损害或其他责任（无论是合同诉讼、侵权行为还是其他形式）承担责任。

使用OpenBuddy即表示您同意这些条款和条件，并承认您了解其使用相关的潜在风险。您还同意赔偿作者、贡献者和版权持有人，并使其免受因您使用OpenBuddy而引起的任何索赔、损害或责任。

所有OpenBuddy模型均存在固有的局限性，可能产生错误的、有害的、冒犯性的或其他不良的输出。用户在关键或高风险场景中应谨慎行事，不要使用这些模型，以免导致人身伤害、财产损失或重大损失。此类场景的例子包括但不限于医疗领域、可能导致伤害的软硬件系统的控制以及进行重要的财务或法律决策。

详细结果可查看此处

免责声明

指标

数值

平均值

71.80

AI2 推理挑战（25次射击）

67.75

HellaSwag（10次射击）

84.65

MMLU（5次射击）

70.58

TruthfulQA（0次射击）

55.66

Winogrande（5次射击）

82.95

GSM8k（5次射击）

69.22