讨论列表 - vllm-ascend:用户可借助该项目在 Ascend NPU 上无缝运行 vLLM,支持Transformer、MoE、Embedding等多种模型。它遵循硬件可插拔原则,提供接口实现Ascend NPU与vLLM集成,是vLLM社区推荐的Ascend后端支持方案。【此简介由AI生成】 - AtomGit AI社区