HuggingFace镜像/luxia-21.4b-alignment-v1.0
模型介绍文件和版本分析
下载使用量0

简介

我们推出了luxia-21.4b-alignment-v1.0,这是一个基于luxia-21.4b的指令微调与对齐模型。 详情请参见评估结果表。

指令微调策略

我们采用了最先进的指令微调方法,包括监督微调(SFT)和直接偏好优化(DPO)。

数据污染测试结果

结果即将更新。

评估结果

结果即将更新。

使用说明

使用方法

# pip install transformers==4.35.2
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("saltlux/luxia-21.4b-alignment-v0.1")
model = AutoModelForCausalLM.from_pretrained(
    "saltlux/luxia-21.4b-alignment-v0.1",
    device_map="auto",
    torch_dtype=torch.float16,
)

许可证

  • saltlux/luxia-21.4b-alignment-v1.0:apache-2.0

联系我们

欢迎在讨论区提出任何问题和建议。