合并请求 - GLM-5-W4A8_A3-A2_Sglang:用户可在昇腾 Atlas 800 A3/A2 机器上快速跑通 GLM-5-W4A8 单节点推理服务。项目提供容器化部署流程,含镜像选择、模型下载、服务启动及验证步骤,减少本地环境配置折腾。【此简介由AI生成】 - AtomGit AI社区