HuggingFace镜像/Qwen2-0.5B-ITA-Instruct
模型介绍文件和版本分析
下载使用量0

为提升意大利语性能,本模型已使用Unsloth的持续预训练模式在gsarti/clean_mc4_it数据集(仅100k行)上进行了微调。第二次微调是在指令数据集FreedomIntelligence/alpaca-gpt4-italian上完成的。

已上传模型

  • 开发者: e-palmisano
  • 许可证: apache-2.0
  • 微调基础模型: unsloth/Qwen2-0.5B-Instruct-bnb-4bit

使用方法

from openmind import AutoTokenizer, AutoModelForCausalLM, is_torch_npu_available
from openmind_hub import snapshot_download
import torch.nn.functional as F
from torch import Tensor
import openmind
import torch
import argparse
import sys
import time

def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument(
        "--model_name_or_path",
        type=str,
        help="Path to model",
        default="zhouhui/Qwen2-0.5B-ITA-Instruct",
    )
    args = parser.parse_args()
    return args

def main():
    args = parse_args()
    model_path = args.model_name_or_path

    if is_torch_npu_available():
        device = "npu:0"
    else:
        device = "cpu"
    start_time = time.time()      
    model = AutoModelForCausalLM.from_pretrained(model_path).to(device)
    tokenizer = AutoTokenizer.from_pretrained(model_path)
    model.eval()

    prompt = "Ciao, chi sono? Aiutami a tradurre in italiano"
    input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to(device)
    outputs = model.generate(input_ids=input_ids, max_length=100)
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    print(response)
    end_time = time.time()
    print(f"硬件环境:{device},推理执行时间:{end_time - start_time}秒")
    
if __name__ == "__main__":
    main()

评估

有关模型性能的详细对比,请查看 意大利语言模型排行榜。

以下是性能指标的细分情况:

指标hellaswag_it acc_normarc_it acc_normm_mmlu_it 5-shot acc平均值
归一化准确率36.2827.6335.433.1

该 qwen2 模型借助 Unsloth 和 Huggingface 的 TRL 库,训练速度提升了 2 倍。