HuggingFace镜像/RakutenAI-3.0
模型介绍文件和版本分析

RakutenAI-3.0

模型说明

Rakuten AI 3.0 是一款针对日语优化的混合专家(Mixture of Experts, MoE)模型,参数规模约为7000亿。该模型充分借鉴开源社区的先进成果,并依托乐天集团高质量的双语原创数据、工程技术与研究积累开发而成,具备卓越的日语语言理解能力和文化洞察。

更多详情,请查阅以下公告:

  • 英文版
  • 日文版

模型详情

  • 开发机构:乐天集团(Rakuten Group, Inc.)
  • 支持语言:日语、英语
  • 许可证:Apache License, Version 2.0
  • 模型架构:混合专家(Mixture of Experts, MoE)
  • 总参数:6710亿
  • 每token激活参数:370亿
  • 上下文长度:128K

本地运行方法

使用 SGLang 进行推理

  • 推荐 Docker 镜像:dockerhub-us/lmsysorg/sglang:v0.5.6.post2
python -m sglang.launch_server \ 
    --model-path Rakuten/RakutenAI-3.0 \ 
    --tp 8 \ 
    --mem-fraction-static 0.85 \ 
    --trust-remote-code \ 
    --show-time-cost 

局限性与偏差

RakutenAI-3.0 能够针对广泛的主题生成类人文本。然而,与所有大型语言模型一样,它存在局限性,可能会产生有偏差、不准确或不安全的输出。与本模型交互时,请务必谨慎判断,并确保在生产环境部署时采取适当的安全措施。

引用

@misc{rakutengroup2026rakutenai3.0, 
  author = {Rakuten Group, Inc.}, 
  title = {RakutenAI-3.0}, 
  year = {2026}, 
  publisher = {Hugging Face}, 
  url = {https://huggingface.co/Rakuten}, 
} 

联系方式

如有任何问题或反馈,请在本代码库提交 issue,或访问 ai.rakuten.com。

下载使用量0