vLLM Ascend
/
GLM-5-w4a8
like
0
添加到合集
问答
汉语
MIT
NPU
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
返回讨论列表
仅管理员可管理讨论分类。
讨论分类列表 - GLM-5-w4a8:可用于在 Atlas 800I A3 等昇腾 NPU 上部署 GLM-5-w4a8 模型,支持复杂系统工程和长周期智能体任务。提供单节点与多节点部署方案,包含环境准备、精度及性能评估等核心功能,支持混合专家架构与量化技术。【此简介由AI生成】 - AtomGit AI社区