ERes2Net 说话人验证模型（speech_eres2net_base_sv_zh-cn_cnceleb_16k）

ERes2Net 是一种增强型 Res2Net 架构，通过局部和全局特征融合实现说话人验证。

验证环境

使用真实音频样本的 CPU 与 NPU 余弦相似度对比：

指标	数值
余弦相似度	1.000000

Output shape: [1, 512]
Output sample: [0.0856, -0.3106, 0.2295, 0.0755, -0.2715]
SUCCESS

python3 inference.py
python3 evaluate.py

ERes2Net 是一种增强型 Res2Net 架构，通过局部和全局特征融合实现说话人验证。

使用真实音频样本的 CPU 与 NPU 余弦相似度对比：

指标	数值
余弦相似度	1.000000

Output shape: [1, 512]
Output sample: [0.0856, -0.3106, 0.2295, 0.0755, -0.2715]
SUCCESS

python3 inference.py
python3 evaluate.py