讨论列表 - Trelis_all-MiniLM-L12-v2-ft-Llama-3-70B:可在昇腾NPU环境快速部署文本嵌入模型,支持高效特征提取。基于HuggingFace transformers框架,通过精度评测确保NPU与CPU数值一致性,性能达6.95ms(batch=8,max_length=128)。【此简介由AI生成】 - AtomGit AI社区