vLLM Ascend
/
GLM-5-w4a8
like
0
添加到合集
问答
汉语
MIT
NPU
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
已开启
0
已关闭
0
已合并
0
全部
0
创建者
合并人
排序
暂无数据
合并请求 - GLM-5-w4a8:可用于在 Atlas 800I A3 等昇腾 NPU 上部署 GLM-5-w4a8 模型,支持复杂系统工程和长周期智能体任务。提供单节点与多节点部署方案,包含环境准备、精度及性能评估等核心功能,支持混合专家架构与量化技术。【此简介由AI生成】 - AtomGit AI社区