t
ttl_1/rho-math-1b-v0.1
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

rho-math-1b-v0.1 昇腾 NPU 适配报告

模型来源: (待补充) 适配目标: 基于昇腾(Ascend)NPU 跑通模型推理,精度误差 < 1% 硬件环境: Ascend 910B / CANN 8.x / torch-npu 软件环境: vLLM-Ascend + transformers


1. 模型概述

项目说明
模型名称rho-math-1b-v0.1
架构类型Decoder-only LLM
参数量~1B

2. 环境配置

(待补充)


3. 推理正常输出证据

(待补充:请提供模型在昇腾 NPU 上的推理示例输出,包括输入 prompt 和生成结果)


4. 精度校验结果

(待补充:请提供 GPU 与昇腾 NPU 之间的精度对比数据,如 loss 差异、输出 token 差异等)


5. 性能数据

(待补充)


6. 常见问题

(待补充)