我们推出了luxia-21.4b-alignment-v1.0,这是一个基于luxia-21.4b的指令微调与对齐模型。 详情请参见评估结果表。
我们采用了最先进的指令微调方法,包括监督微调(SFT)和直接偏好优化(DPO)。
结果即将更新。
结果即将更新。
# pip install transformers==4.35.2
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("saltlux/luxia-21.4b-alignment-v0.1")
model = AutoModelForCausalLM.from_pretrained(
"saltlux/luxia-21.4b-alignment-v0.1",
device_map="auto",
torch_dtype=torch.float16,
)欢迎在讨论区提出任何问题和建议。