讨论列表 - speech_eres2net_large_sv_zh-cn_3dspeaker_16k:可用于中文场景下的说话人身份验证,项目采用 ERes2Net 架构,参数量2901万,适配 Ascend NPU,平均延迟11.57ms,输出512维特征,精度满足要求。【此简介由AI生成】 - AtomGit AI社区