合并请求 - glm-ocr:基于昇腾NPU和vLLM-Ascend框架,实现GLM-OCR模型部署,支持图像文本识别与纯文本对话,具备高吞吐量与低延迟特性,MTP推测解码加速效果显著。【此简介由AI生成】 - AtomGit AI社区