讨论列表 - kurisu725_Qwen2.5-0.5b-gpu-725:可用于文本生成任务,支持一键加载推理。基于 Qwen2.5 0.5B 模型,适配 NPU 硬件,具备良好的精度与性能,Top-1 一致性 4/4,NPU 生成 64 tokens 耗时 1722.85 ms。【此简介由AI生成】 - AtomGit AI社区