Ascend-SACT/UVR-MDX-NET-Inst_HQ_3
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

引言

本案例给出语音分离模型uvr-mdx-infer系列的UVR-MDX-NET-Inst_HQ_3在NPU环境部署,并基于torch_npu执行推理任务的迁移实践。

使用约束

依赖软件版本
昇腾NPU驱动>=25.0.RC1.1商发版本
昇腾NPU固件>=25.0.RC1.1商发版本
CANN Toolkit>=8.2.RC1商发版本
CANN Kernel>=8.2.RC1商发版本
CANN NNAL>=8.2.RC1商发版本

硬件设备

设备型号NPU配置
Atlas 800I A2 910B1卡

一、环境准备

安装依赖包: pip install -r requirements.txt

二、下载官方代码和权重

2.1 下载开源代码

git clone https://github.com/seanghay/uvr-mdx-infer

2.2 下载开源ONNX权重

https://huggingface.co/seanghay/uvr_models/blob/main/UVR-MDX-NET-Inst_HQ_3.onnx

三、运行指导

3.1 修改基于昇腾推理ONNX部分的代码

在官方代码的seperate.py中,使用GPU或CPU对ONNX模型进行推理。使用昇腾推理,需要修改为CANNExecutionProvider,在第83行,具体改进如下:

#if torch.cuda.is_available():
 #   self.model = ort.InferenceSession(args['model_path'], providers=['CUDAExecutionProvider'])
#else:
 #   self.model = ort.InferenceSession(args['model_path'], providers=['CPUExecutionProvider'])
self.model = ort.InferenceSession(args['model_path'], providers=['CANNExecutionProvider'])

或直接使用代码仓中的seperate.py

3.2 指定推理音频的路径

在推理启动脚本run.sh中,修改speech1.mp3为用户自己要分离的音频路径。

3.3 执行推理

python run.sh