合并请求 - kurisu725_Qwen2.5-0.5b-gpu-pro:可在昇腾NPU环境快速部署Qwen2.5 0.5B文本生成模型,支持一键加载推理。基于HuggingFace transformers框架,验证NPU与CPU logits数值一致性,提供性能参考与部署指南。【此简介由AI生成】 - AtomGit AI社区