简介

我们推出了luxia-21.4b-alignment-v1.0，这是一个基于luxia-21.4b的指令微调与对齐模型。详情请参见评估结果表。

指令微调策略

我们采用了最先进的指令微调方法，包括监督微调（SFT）和直接偏好优化（DPO）。

数据污染测试结果

结果即将更新。

评估结果

结果即将更新。

使用说明

使用方法

# pip install transformers==4.35.2
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("saltlux/luxia-21.4b-alignment-v0.1")
model = AutoModelForCausalLM.from_pretrained(
    "saltlux/luxia-21.4b-alignment-v0.1",
    device_map="auto",
    torch_dtype=torch.float16,
)

许可证

saltlux/luxia-21.4b-alignment-v1.0：apache-2.0

联系我们

欢迎在讨论区提出任何问题和建议。

简介

我们推出了luxia-21.4b-alignment-v1.0，这是一个基于luxia-21.4b的指令微调与对齐模型。详情请参见评估结果表。

指令微调策略

我们采用了最先进的指令微调方法，包括监督微调（SFT）和直接偏好优化（DPO）。

数据污染测试结果

结果即将更新。

评估结果

结果即将更新。

使用说明

使用方法

# pip install transformers==4.35.2
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("saltlux/luxia-21.4b-alignment-v0.1")
model = AutoModelForCausalLM.from_pretrained(
    "saltlux/luxia-21.4b-alignment-v0.1",
    device_map="auto",
    torch_dtype=torch.float16,
)

许可证

saltlux/luxia-21.4b-alignment-v1.0：apache-2.0

联系我们

欢迎在讨论区提出任何问题和建议。