合并请求 - BitCPM4-0.5B:可用于在端侧设备或华为昇腾 NPU 上实现高效文本生成。项目通过量化感知训练将模型参数压缩为三元值,保持与同规模全精度模型相当性能,支持 vLLM-Ascend 推理,适配昇腾 910B2 NPU 并实现高精度低误差运行。【此简介由AI生成】 - AtomGit AI社区