基础模型:meta-llama/Meta-Llama-3.1-70B-Instruct
管道标签:text-generation
库名称:transformers
重要更新 - 我们最初上传该模型时存在一个问题。如果您之前尝试过但未得到理想结果,请再次尝试,我们相信已经修复了这个问题。
反思Llama-3.1 70B是一款开源的大型语言模型(LLM),通过一种名为“反思调优”的新训练技术培养,这项技术教会LLM识别其推理中的错误并自我修正。
该模型利用了由Glaive生成的合成数据进行训练。如果您正在训练模型,Glaive绝对出色——推荐使用。
您可以在此处试用该模型。
从Llama 3.1 70B指令版本训练而来,您可以在与使用其他Llama模型相同的方式下采样反思Llama-3.1 70B,包括代码、管道等。它甚至沿用了标准的Llama 3.1聊天模板格式(尽管我们添加了一些新的特殊令牌来辅助推理和反思)。
在采样过程中,模型首先会在`