这是已推送至 Hub 的一个 🤗 transformers 模型的模型卡片。此模型卡片为自动生成。
import torch
from openmind import AutoTokenizer, AutoModelForCausalLM, is_torch_npu_available
from openmind_hub import snapshot_download
import argparse
import time
def parse_args():
parser = argparse.ArgumentParser()
parser.add_argument(
"--model_name_or_path",
type=str,
help="Path to model",
default="jeffding/T3Q-ko-solar-sft-dpo-v1.0-openmind",
)
args = parser.parse_args()
return args
def main():
args = parse_args()
model_path = args.model_name_or_path
if is_torch_npu_available():
device = "npu:0"
else:
device = "cpu"
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
# Set `torch_dtype=torch.float16` to load model in float16, otherwise it will be loaded as float32 and might cause OOM Error.
model = AutoModelForCausalLM.from_pretrained(model_path, torch_dtype=torch.float16, trust_remote_code=True).to(device)
start_time = time.time()
model = model.eval()
inputs = tokenizer(["상해라는 도시를 간단히 소개하겠습니다."], return_tensors="pt")
for k,v in inputs.items():
inputs[k] = v.to(device)
gen_kwargs = {"max_length": 500, "top_p": 0.8, "temperature": 0.8, "do_sample": True, "repetition_penalty": 1.0}
output = model.generate(**inputs, **gen_kwargs)
output = tokenizer.decode(output[0].tolist(), skip_special_tokens=True)
print(output)
end_time = time.time()
print(f"硬件环境:{device},推理执行时间:{end_time - start_time}秒")
if __name__ == "__main__":
main()
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
应让用户(包括直接用户和下游用户)了解模型的风险、偏差和局限性。需要更多信息以提供进一步建议。
使用以下代码开始使用模型。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
可以使用 Lacoste et al. (2019) 中提出的 机器学习影响计算器 来估算碳排放。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
BibTeX:
[需要更多信息]
APA:
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]