反思之Llama 3.1 70B

重要更新 - 我们最初上传该模型时存在一个问题。如果您之前尝试过但未得到理想结果，请再次尝试，我们相信已经修复了这个问题。

反思Llama-3.1 70B是一款开源的大型语言模型（LLM），通过一种名为“反思调优”的新训练技术培养，这项技术教会LLM识别其推理中的错误并自我修正。

该模型利用了由Glaive生成的合成数据进行训练。如果您正在训练模型，Glaive绝对出色——推荐使用。

基准测试

从Llama 3.1 70B指令版本训练而来，您可以在与使用其他Llama模型相同的方式下采样反思Llama-3.1 70B，包括代码、管道等。它甚至沿用了标准的Llama 3.1聊天模板格式（尽管我们添加了一些新的特殊令牌来辅助推理和反思）。

在采样过程中，模型首先会在`

基础模型：meta-llama/Meta-Llama-3.1-70B-Instruct

管道标签：text-generation

库名称：transformers

重要更新 - 我们最初上传该模型时存在一个问题。如果您之前尝试过但未得到理想结果，请再次尝试，我们相信已经修复了这个问题。

该模型利用了由Glaive生成的合成数据进行训练。如果您正在训练模型，Glaive绝对出色——推荐使用。

在采样过程中，模型首先会在`