| 关于昇腾 | 文档 | #SIG-Ascend | 用户论坛 | 每周会议 |
最新动态 🔥
vLLM Ascend(vllm-ascend)是一款由社区维护的硬件插件,旨在支持vLLM在昇腾NPU上无缝运行。
它是vLLM社区中支持昇腾后端的推荐方案。该插件遵循[RFC]: Hardware pluggable中阐述的原则,提供了硬件可插拔接口,从而将昇腾NPU与vLLM的集成解耦。
通过使用vLLM Ascend插件,各类主流开源模型,包括Transformer类模型、混合专家(MoE)模型、Embedding模型以及多模态大语言模型(LLM),均能在昇腾NPU上无缝运行。
请使用以下推荐版本以快速开始:
详细信息请参见贡献指南,该指南提供了分步说明,帮助您搭建开发环境、构建和测试项目。
我们欢迎并重视任何形式的贡献与合作:
vllm-ascend 包含 main 分支和开发分支。
releases/v0.13.0 是 vLLM v0.13.0 版本的开发分支。以下是当前维护的分支:
| 分支 | 状态 | 说明 |
|---|---|---|
| main | 维护中 | 针对 vLLM 主分支和 vLLM v0.17.0 标签的 CI 承诺 |
| v0.7.1-dev | 不再维护 | 仅允许文档修复 |
| v0.7.3-dev | 维护中 | 针对 vLLM 0.7.3 版本的 CI 承诺,仅允许 bug 修复,不再创建新的发布标签。 |
| v0.9.1-dev | 维护中 | 针对 vLLM 0.9.1 版本的 CI 承诺 |
| v0.11.0-dev | 维护中 | 针对 vLLM 0.11.0 版本的 CI 承诺 |
| releases/v0.13.0 | 维护中 | 针对 vLLM 0.13.0 版本的 CI 承诺 |
| rfc/feature-name | 维护中 | 用于协作的功能分支 |
更多详情请参考版本控制策略。
Apache License 2.0,详见 LICENSE 文件。