s
ssclove/moss-tts-nano
模型介绍文件和版本Pull Requests讨论分析

MOSS-TTS-Nano-100M — 昇腾 NPU 适配报告

1. 模型概述

本仓库提供 OpenMOSS/MOSS-TTS-Nano-100M 在昇腾 Ascend 910B4 NPU 上的推理适配方案。

  • 原始仓库: OpenMOSS/MOSS-TTS-Nano-100M
  • 适配结果: SUCCESS
  • 验证日期: 2026-05-20

2. 运行环境

依赖版本
PyTorch2.9.0
torch-npu2.9.0.post1
transformers4.57.6
CANN8.5.1
操作系统Ubuntu 22.04.5 LTS (aarch64)
加速卡Ascend 910B4

3. 使用方法

python3 inference.py --dev npu:0

4. 推理验证

项目结果
输出张量形状[1, 50, 768]
运行状态SUCCESS

5. 推理性能

指标结果
单次推理耗时21.464943885803223 ms

6. 精度评测

NPU 与 CPU 输出的余弦相似度对比:

指标数值
Cosine Similarity1.0000003576278687
最大绝对误差2.6285648345947266e-05
精度偏差0.0000%
是否达标(< 1%)通过

7. 提交材料

文件用途
inference.pyNPU 推理验证脚本
report.json结构化评测报告

8. 技术说明

  • 推理在 npu:0 设备上执行,精度为 torch.float32
  • 通过 torch.no_grad() 禁用梯度计算以节省显存
  • 使用 torch.npu.synchronize() 确保 NPU 计算完成后再计时

9. 备注

  • 首次运行需下载模型权重,请确保网络通畅
  • 建议在配备昇腾 NPU 的环境中运行以获得最佳体验

参赛赛道: 模型适配赛道 提交日期: 2026-05-20

下载使用量0