GitHub及使用指南:https://github.com/OpenBuddy/OpenBuddy
网站及演示:https://openbuddy.ai
本模型评估结果:Evaluation.txt

基础模型:https://huggingface.co/deepseek-ai/deepseek-llm-67b-base
许可证:deepseek
所有OpenBuddy模型均存在固有的局限性,可能会产生错误、有害、冒犯性或其他不良输出。用户不应在可能导致人身伤害、财产损失或重大损失的关键或高风险场景中使用这些模型。此类场景包括但不限于医疗领域、可能造成伤害的软硬件系统控制,以及重要的财务或法律决策。
OpenBuddy按“原样”提供,不提供任何形式的明示或暗示担保,包括但不限于对适销性、特定用途适用性和非侵权性的暗示担保。在任何情况下,作者、贡献者或版权持有人均不对因本软件或软件的使用或其他交易而产生的任何索赔、损害或其他责任(无论是合同诉讼、侵权行为还是其他形式)承担责任。
使用OpenBuddy即表示您同意这些条款和条件,并承认您了解其使用相关的潜在风险。您还同意赔偿作者、贡献者和版权持有人,并使其免受因您使用OpenBuddy而引起的任何索赔、损害或责任。
所有OpenBuddy模型均存在固有的局限性,可能产生错误的、有害的、冒犯性的或其他不良的输出。用户在关键或高风险场景中应谨慎行事,不要使用这些模型,以免导致人身伤害、财产损失或重大损失。此类场景的例子包括但不限于医疗领域、可能导致伤害的软硬件系统的控制以及进行重要的财务或法律决策。
OpenBuddy按“原样”提供,不附带任何种类的明示或暗示的保证,包括但不限于适销性、特定目的的适用性和非侵权的暗示保证。在任何情况下,作者、贡献者或版权所有者均不对因软件或使用或其他软件交易而产生的任何索赔、损害赔偿或其他责任(无论是合同、侵权还是其他原因)承担责任。
使用OpenBuddy即表示您同意这些条款和条件,并承认您了解其使用可能带来的潜在风险。您还同意赔偿并使作者、贡献者和版权所有者免受因您使用OpenBuddy而产生的任何索赔、损害赔偿或责任的影响。
详细结果可查看此处
| 指标 | 数值 |
|---|---|
| 平均值 | 71.80 |
| AI2 推理挑战(25次射击) | 67.75 |
| HellaSwag(10次射击) | 84.65 |
| MMLU(5次射击) | 70.58 |
| TruthfulQA(0次射击) | 55.66 |
| Winogrande(5次射击) | 82.95 |
| GSM8k(5次射击) | 69.22 |