模型来源: (待补充) 适配目标: 基于昇腾(Ascend)NPU 跑通模型推理,精度误差 < 1% 硬件环境: Ascend 910B / CANN 8.x / torch-npu 软件环境: vLLM-Ascend + transformers
| 项目 | 说明 |
|---|---|
| 模型名称 | rho-math-1b-v0.1 |
| 架构类型 | Decoder-only LLM |
| 参数量 | ~1B |
(待补充)
(待补充:请提供模型在昇腾 NPU 上的推理示例输出,包括输入 prompt 和生成结果)
(待补充:请提供 GPU 与昇腾 NPU 之间的精度对比数据,如 loss 差异、输出 token 差异等)
(待补充)
(待补充)