Nandi-Mini-150M-Instruct

简介

Nandi-Mini-150M-Instruct 是一款紧凑高效的多语言模型，旨在资源受限环境中实现卓越性能。它基于 5250 亿 tokens 从头开始预训练，并通过指令微调与直接偏好优化（DPO）进一步增强。该模型支持英语及 10 种印度语言。

Nandi-Mini-150M-Instruct 侧重于通过架构效率而非规模来最大化每参数性能。它针对边缘设备、本地部署和低延迟应用进行了优化，非常适合资源受限的环境。 Nandi-Mini-150M-Instruct 具备以下主要特性：

强大的多语言能力，覆盖英语和印度语言
高效设计，实现小规模下的高性能（1.5 亿参数）
采用因式分解嵌入，减少内存占用
通过层共享提升参数效率

📝 即将发布与路线图

Nandi 系列才刚刚起步 🚀

Nandi-Mini-150M-Tool-Calling（专用模型） — 本周即将发布
Nandi-Mini-500M（基础版 + 指令版） — 预训练进行中
Nandi-Mini-1B（基础版 + 指令版） — 预训练进行中

📢 技术博客与深度解析即将推出，届时我们将分享：

架构决策与设计权衡
训练见解与数据集构成
基准测试与实际应用案例

敬请期待！

🌍 支持语言

该模型在英语和多种印度语言上进行了训练，包括：

印地语、孟加拉语、泰米尔语、泰卢固语、马拉地语、古吉拉特语、卡纳达语、马拉雅拉姆语、旁遮普语、奥里雅语

🚀 使用方法

!pip install transformers=='5.4.0'

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model_name = "Rta-AILabs/Nandi-Mini-150M-Instruct"

device = "cuda" if torch.cuda.is_available() else "cpu"

tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    trust_remote_code=True,
    dtype=torch.bfloat16
).to(device).eval()

prompt = "Explain newton's second law of motion"

messages = [
    {"role": "user", "content": prompt}
]

prompt = tokenizer.apply_chat_template(messages, tokenize=False)
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **inputs,
    max_new_tokens=500,
    do_sample=True,
    temperature=0.3,
    top_p=0.90,
    top_k=20,
    repetition_penalty=1.1,
)

generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

print(response)

📬 反馈与建议

我们非常期待听到您的想法、反馈和建议！

Discord：https://discord.gg/ZGdjCdRt
邮箱：support@rtaailabs.com
官方网站：https://rtaailabs.com/
LinkedIn：https://www.linkedin.com/company/rta-ai-lab
X（Twitter）：https://x.com/Rta_AILabs

简介

强大的多语言能力，覆盖英语和印度语言

高效设计，实现小规模下的高性能（1.5 亿参数）

采用因式分解嵌入，减少内存占用

通过层共享提升参数效率

📝 即将发布与路线图

Nandi 系列才刚刚起步 🚀

Nandi-Mini-150M-Tool-Calling（专用模型） — 本周即将发布

Nandi-Mini-500M（基础版 + 指令版） — 预训练进行中

Nandi-Mini-1B（基础版 + 指令版） — 预训练进行中

📢 技术博客与深度解析即将推出，届时我们将分享：

架构决策与设计权衡

训练见解与数据集构成

基准测试与实际应用案例

敬请期待！

🚀 使用方法

!pip install transformers=='5.4.0'

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model_name = "Rta-AILabs/Nandi-Mini-150M-Instruct"

device = "cuda" if torch.cuda.is_available() else "cpu"

tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    trust_remote_code=True,
    dtype=torch.bfloat16
).to(device).eval()

prompt = "Explain newton's second law of motion"

messages = [
    {"role": "user", "content": prompt}
]

prompt = tokenizer.apply_chat_template(messages, tokenize=False)
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **inputs,
    max_new_tokens=500,
    do_sample=True,
    temperature=0.3,
    top_p=0.90,
    top_k=20,
    repetition_penalty=1.1,
)

generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

print(response)