m0_74196153/neutts-nano-spanish
模型介绍文件和版本Pull Requests讨论分析

neutts-nano-spanish 在昇腾 NPU 上的部署

1. 简介

西班牙语 NeuTTS-Nano 是由 Neuphonic 开发的高效端侧 TTS(文本转语音)语音语言模型的西班牙语版本,目前已适配华为昇腾 Ascend 910B4 NPU。

属性值
模型neuphonic/neutts-nano-spanish
架构LLaMA 主干网络 + NeuCodec
总参数量~229M
活跃参数量~117M
音频编解码器NeuCodec(50Hz,单码本)
输出采样率24,000 Hz 单声道
上下文窗口2048 个 tokens(约 30 秒音频)
语言西班牙语(es)

2. 验证环境

组件版本
NPU1 张 Ascend 910B4(32GB HBM)
CANN25.5.1
torch2.9.0
torch_npu2.9.0.post1+gitee7ba04
neutts1.1.0
neucodec(随 neutts 一同安装)

3. 快速开始

3.1 环境准备

pip install neutts soundfile

3.2 模型下载

export HF_ENDPOINT=https://hf-mirror.com

python3 -c "
import os; os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
from huggingface_hub import snapshot_download
snapshot_download('neuphonic/neutts-nano-spanish', local_dir='./neutts-nano-spanish')
"

3.3 NPU 推理

export HF_ENDPOINT=https://hf-mirror.com
python3 inference.py --text "Hola mundo, esta es una prueba." --output output.wav

4. 功能验证

指标数值
加载时间26.7秒
推理时间32.9秒
生成音频时长3.0秒
RTF11.11
NPU 内存占用3.93 GiB

5. 精度验证

指标数值
最大绝对误差2.38e-05
平均绝对误差3.09e-06
相对误差0.00007%
Top-1 一致率100.0%
NPU 加速比21.45倍
精度阈值< 1.0%
结果✅ 通过

6. 参考资源

  • NeuTTS-Nano-Spanish 官方 HuggingFace
  • GitCode 适配仓库
  • Neuphonic 官网
下载使用量0