gpt-neox-japanese-2.7b

本仓库提供了一个基于 GPT-NeoX 的日语模型，参数规模为 27 亿。该模型由 ABEJA, Inc 训练。

修改内容

修改示例并添加 NPU 支持
添加依赖项

依赖项

transformers==4.44.2
psutil==6.0.0
better_profanity==0.7.0
einops==0.6.1
protobuf==5.28.2

使用方法

使用 pipeline 进行文本生成时。

from openmind import pipeline, is_torch_npu_available
from openmind_hub import snapshot_download

if is_torch_npu_available():
	device = "npu:0"
else:
	device = "cpu"
generator = pipeline("text-generation", model="SY_AICC/gpt-neox-japanese-2.7b",device=device)
generated = generator(
    "人とAIが協調するためには、",
    max_length=300,
    do_sample=True,
    num_return_sequences=3,
    top_p=0.95,
    top_k=50
)
print(*generated, sep="\n")

"""
[out]
{"generated_text": "人とAIが協調するためには、「人が持っている優れた能力とAIの得意とする分野を掛け合わせる」ことが不可欠になります。"}
{"generated_text": "人とAIが協調するためには、双方の長所を活かしていくことが不可欠だと考えています。"}
{"generated_text": "人とAIが協調するためには、人間がAIを理解する、ということが重要です。人間には「AIに対してAIが何をするべきか」ということを明確に教えないと、AIはある程度の知識はあっても何をすべきかがわかりません。だから、コンピューターが考えたり、決めたりすることはAIではなく、人間が解釈して理解できるようにしなくて"}
"""

数据集

该模型基于Japanese Wikipedia进行训练。

分词

模型使用了special sub-word tokenizer。

许可证

The MIT license。

gpt-neox-japanese-2.7b

本仓库提供了一个基于 GPT-NeoX 的日语模型，参数规模为 27 亿。该模型由 ABEJA, Inc 训练。

修改内容

修改示例并添加 NPU 支持
添加依赖项

依赖项

transformers==4.44.2
psutil==6.0.0
better_profanity==0.7.0
einops==0.6.1
protobuf==5.28.2

使用方法

使用 pipeline 进行文本生成时。

from openmind import pipeline, is_torch_npu_available
from openmind_hub import snapshot_download

if is_torch_npu_available():
	device = "npu:0"
else:
	device = "cpu"
generator = pipeline("text-generation", model="SY_AICC/gpt-neox-japanese-2.7b",device=device)
generated = generator(
    "人とAIが協調するためには、",
    max_length=300,
    do_sample=True,
    num_return_sequences=3,
    top_p=0.95,
    top_k=50
)
print(*generated, sep="\n")

"""
[out]
{"generated_text": "人とAIが協調するためには、「人が持っている優れた能力とAIの得意とする分野を掛け合わせる」ことが不可欠になります。"}
{"generated_text": "人とAIが協調するためには、双方の長所を活かしていくことが不可欠だと考えています。"}
{"generated_text": "人とAIが協調するためには、人間がAIを理解する、ということが重要です。人間には「AIに対してAIが何をするべきか」ということを明確に教えないと、AIはある程度の知識はあっても何をすべきかがわかりません。だから、コンピューターが考えたり、決めたりすることはAIではなく、人間が解釈して理解できるようにしなくて"}
"""

数据集

该模型基于Japanese Wikipedia进行训练。

分词

模型使用了special sub-word tokenizer。

许可证

The MIT license。