合并请求 - BitCPM4-CANN-0.5B:用户可用于在昇腾NPU上实现高效文本生成推理,支持中英文问答、数学推理、代码生成等场景。项目基于vLLM-Ascend适配BitCPM4-0.5B模型,零代码修改实现100%精度对齐,单卡吞吐达98 tokens/s,显存占用仅0.82GB。【此简介由AI生成】 - AtomGit AI社区