这是基于数据集子集训练的 wizard-vicuna-13b,其中删除了包含对齐/道德化内容的响应。目的是训练一个不内置对齐功能的 WizardLM,以便可以通过例如 RLHF LoRA 单独添加对齐(任何类型的对齐)。
感谢开源 AI/ML 社区以及所有帮助过我的人。
注意:
一个未经审查的模型没有任何防护措施。
您对使用该模型所做的任何事情负责,正如您对使用任何危险物品(如刀、枪、打火机或汽车)所做的任何事情负责一样。
发布此模型生成的任何内容等同于您自己发布。
您对发布的内容负责,您不能将责任归咎于模型,正如您不能将责任归咎于刀、枪、打火机或汽车一样。
详细结果可在此处找到 here
| 指标 | 值 |
|---|---|
| 平均值 | 49.52 |
| ARC (25-shot) | 58.96 |
| HellaSwag (10-shot) | 81.95 |
| MMLU (5-shot) | 47.92 |
| TruthfulQA (0-shot) | 51.69 |
| Winogrande (5-shot) | 75.69 |
| GSM8K (5-shot) | 8.64 |
| DROP (3-shot) | 21.79 |