模型 ID 的模型卡片

模型详情

模型描述

这是已推送至 Hub 的一个 🤗 transformers 模型的模型卡片。此模型卡片为自动生成。

开发方： [需补充更多信息]
资助方（可选）： [需补充更多信息]
分享方（可选）： [需补充更多信息]
模型类型： [需补充更多信息]
语言（自然语言处理）： [需补充更多信息]
许可证： [需补充更多信息]
微调自模型（可选）： [需补充更多信息]

模型来源 [可选]

代码仓库： [需补充更多信息]
论文 [可选]： [需补充更多信息]
演示 [可选]： [需补充更多信息]

在 Openmind 中的使用

import torch
from openmind import AutoTokenizer, AutoModelForCausalLM, is_torch_npu_available
from openmind_hub import snapshot_download
import argparse
import time

def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument(
        "--model_name_or_path",
        type=str,
        help="Path to model",
        default="jeffding/T3Q-ko-solar-sft-dpo-v1.0-openmind",
    )
    args = parser.parse_args()
    return args

def main():
    args = parse_args()
    model_path = args.model_name_or_path

    if is_torch_npu_available():
        device = "npu:0"
    else:
        device = "cpu"
        
    tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
    # Set `torch_dtype=torch.float16` to load model in float16, otherwise it will be loaded as float32 and might cause OOM Error.
    model = AutoModelForCausalLM.from_pretrained(model_path, torch_dtype=torch.float16, trust_remote_code=True).to(device)
    
    start_time = time.time()
    
    model = model.eval()
    inputs = tokenizer(["상해라는 도시를 간단히 소개하겠습니다."], return_tensors="pt")
    for k,v in inputs.items():
        inputs[k] = v.to(device)
    gen_kwargs = {"max_length": 500, "top_p": 0.8, "temperature": 0.8, "do_sample": True, "repetition_penalty": 1.0}
    output = model.generate(**inputs, **gen_kwargs)
    output = tokenizer.decode(output[0].tolist(), skip_special_tokens=True)
    print(output)
    
    end_time = time.time()
    print(f"硬件环境：{device},推理执行时间：{end_time - start_time}秒")

if __name__ == "__main__":
    main()

使用方式

直接使用

[需要更多信息]

下游使用 [可选]

[需要更多信息]

超出范围的使用

[需要更多信息]

偏差、风险与局限性

[需要更多信息]

建议

应让用户（包括直接用户和下游用户）了解模型的风险、偏差和局限性。需要更多信息以提供进一步建议。

如何开始使用模型

使用以下代码开始使用模型。

[需要更多信息]

训练详情

训练数据

[需要更多信息]

训练过程

预处理 [可选]

[需要更多信息]

训练超参数

训练模式： [需要更多信息]

速度、大小、时间 [可选]

[需要更多信息]

评估

测试数据、因素与指标

测试数据

[需要更多信息]

因素

[需要更多信息]

指标

[需要更多信息]

结果

[需要更多信息]

总结

模型检查 [可选]

[需要更多信息]

环境影响

可以使用 Lacoste et al. (2019) 中提出的机器学习影响计算器来估算碳排放。

硬件类型： [需要更多信息]
使用时长： [需要更多信息]
云服务提供商： [需要更多信息]
计算区域： [需要更多信息]
碳排放量： [需要更多信息]

技术规格 [可选]

模型架构与目标

[需要更多信息]

计算基础设施

[需要更多信息]

硬件

[需要更多信息]

软件

[需要更多信息]

引用 [可选]

BibTeX：

[需要更多信息]

APA：

[需要更多信息]

术语表 [可选]

[需要更多信息]

模型卡片作者 [可选]

[需要更多信息]

模型卡片联系方式

[需要更多信息]

模型详情

模型描述

这是已推送至 Hub 的一个 🤗 transformers 模型的模型卡片。此模型卡片为自动生成。

开发方： [需补充更多信息]

资助方（可选）： [需补充更多信息]

分享方（可选）： [需补充更多信息]

模型类型： [需补充更多信息]

语言（自然语言处理）： [需补充更多信息]

许可证： [需补充更多信息]

微调自模型（可选）： [需补充更多信息]

模型来源 [可选]

代码仓库： [需补充更多信息]

论文 [可选]： [需补充更多信息]

演示 [可选]： [需补充更多信息]

在 Openmind 中的使用

import torch
from openmind import AutoTokenizer, AutoModelForCausalLM, is_torch_npu_available
from openmind_hub import snapshot_download
import argparse
import time

def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument(
        "--model_name_or_path",
        type=str,
        help="Path to model",
        default="jeffding/T3Q-ko-solar-sft-dpo-v1.0-openmind",
    )
    args = parser.parse_args()
    return args

def main():
    args = parse_args()
    model_path = args.model_name_or_path

    if is_torch_npu_available():
        device = "npu:0"
    else:
        device = "cpu"
        
    tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
    # Set `torch_dtype=torch.float16` to load model in float16, otherwise it will be loaded as float32 and might cause OOM Error.
    model = AutoModelForCausalLM.from_pretrained(model_path, torch_dtype=torch.float16, trust_remote_code=True).to(device)
    
    start_time = time.time()
    
    model = model.eval()
    inputs = tokenizer(["상해라는 도시를 간단히 소개하겠습니다."], return_tensors="pt")
    for k,v in inputs.items():
        inputs[k] = v.to(device)
    gen_kwargs = {"max_length": 500, "top_p": 0.8, "temperature": 0.8, "do_sample": True, "repetition_penalty": 1.0}
    output = model.generate(**inputs, **gen_kwargs)
    output = tokenizer.decode(output[0].tolist(), skip_special_tokens=True)
    print(output)
    
    end_time = time.time()
    print(f"硬件环境：{device},推理执行时间：{end_time - start_time}秒")

if __name__ == "__main__":
    main()

模型 ID 的模型卡片

模型详情

模型描述

模型来源 [可选]

在 Openmind 中的使用

使用方式

直接使用

下游使用 [可选]

超出范围的使用

偏差、风险与局限性

建议

如何开始使用模型

训练详情

训练数据

训练过程

预处理 [可选]

训练超参数

速度、大小、时间 [可选]

评估

测试数据、因素与指标

测试数据

因素

指标

结果

总结

模型检查 [可选]

环境影响

技术规格 [可选]

模型架构与目标

计算基础设施

硬件

软件

引用 [可选]

术语表 [可选]

更多信息 [可选]

模型卡片作者 [可选]

模型卡片联系方式

模型 ID 的模型卡片

模型详情

模型描述

模型来源 [可选]

在 Openmind 中的使用

使用方式

直接使用

下游使用 [可选]

超出范围的使用

偏差、风险与局限性

建议

如何开始使用模型

训练详情

训练数据

训练过程

预处理 [可选]

训练超参数

速度、大小、时间 [可选]

评估

测试数据、因素与指标

测试数据

因素

指标

结果

总结

模型检查 [可选]

环境影响

技术规格 [可选]

模型架构与目标

计算基础设施

硬件

软件

引用 [可选]

术语表 [可选]

更多信息 [可选]

模型卡片作者 [可选]

模型卡片联系方式