HuggingFace镜像/granite-8b-code-instruct-4k
模型介绍文件和版本分析
下载使用量0

Granite-8B-Code-Instruct-4K

模型概述

Granite-8B-Code-Instruct-4K 是一个拥有80亿参数的模型,基于 Granite-8B-Code-Base-4K 进行微调。微调过程中使用了多种宽松许可的指令数据,旨在增强模型的指令遵循能力,包括逻辑推理和问题解决技能。

  • 开发者:IBM Research
  • GitHub 仓库:ibm-granite/granite-code-models
  • 论文:Granite Code Models: A Family of Open Foundation Models for Code Intelligence
  • 发布日期:2024年5月6日
  • 许可证:Apache 2.0。

使用方法

预期用途

该模型旨在响应与编码相关的指令,可用于构建编码助手。

生成

以下是使用 Granite-8B-Code-Instruct-4K 模型的简单示例。

import torch
from openmind import AutoModelForCausalLM, AutoTokenizer, is_torch_npu_available
device = "npu" # or "cpu"
model_path = "SY_AICC/granite-8b-code-instruct-4k"
tokenizer = AutoTokenizer.from_pretrained(model_path)
# drop device_map if running on CPU
model = AutoModelForCausalLM.from_pretrained(model_path, device_map=device)
model.eval()
# change input text as desired
chat = [
    { "role": "user", "content": "Write a code to find the maximum value in a list of numbers." },
]
chat = tokenizer.apply_chat_template(chat, tokenize=False, add_generation_prompt=True)
# tokenize the text
input_tokens = tokenizer(chat, return_tensors="pt")
# transfer tokenized inputs to the device
for i in input_tokens:
    input_tokens[i] = input_tokens[i].to(device)
# generate output tokens
output = model.generate(**input_tokens, max_new_tokens=100)
# decode output tokens into text
output = tokenizer.batch_decode(output)
# loop over the batch to print, in this example the batch size is 1
for i in output:
    print(i)

训练数据

Granite Code Instruct 模型的训练数据包含以下类型:

  • 代码提交数据集:我们的代码提交数据来源于 [CommitPackFT] 数据集,这是完整 CommitPack 数据集的一个筛选版本。在 CommitPackFT 数据集中,我们仅考虑 92 种编程语言的数据。我们的纳入标准是选择那些在 CommitPackFT 和我们用于预训练代码基础模型(Granite-8B-Code-Base)所考虑的 116 种语言中均常见的编程语言。
  • 数学数据集:我们采用了两个高质量的数学数据集,[MathInstruct] 和 [MetaMathQA]。由于许可问题,我们从 MathInstruct 数据集中过滤掉了 GSM8K-RFT 和 Camel-Math。
  • 代码指令数据集:我们使用了 [Glaive-Code-Assistant-v3]、[Glaive-Function-Calling-v2]、[NL2SQL11] 以及一小部分合成的 API 调用数据集。
  • 语言指令数据集:我们包含了高质量的数据集,例如 [HelpSteer] 和经过开源许可筛选的 [Platypus] 版本。我们还加入了一些硬编码的提示,以确保当模型被问及自身名称或开发者信息时,能够生成正确的输出。

伦理考量与局限性

Granite 代码指令模型主要是在特定的一组编程语言上,通过指令-响应对进行微调的。因此,对于域外编程语言,其性能可能会受到限制。在这种情况下,提供少量示例以引导模型输出会有所帮助。此外,开发人员在将这些模型部署到关键应用之前,应进行安全测试和特定目标的调优。该模型还继承了其基础模型的伦理考量和局限性。欲了解更多信息,请参阅 [Granite-8B-Code-Base-4K] 模型卡片。