speech_resnet34_sv_zh-cn_3dspeaker_16k:可用于中文场景下的说话人身份验证,采用 ResNet34 模型,基于 3D-Speaker 数据集训练,支持 16kHz 采样率,输出 192 维嵌入向量,CPU 与 NPU 余弦相似度达 1.0。【此简介由AI生成】 - AtomGit AI社区