ERNIE-4.5-21B-A3B-Base-PT:可用于在昇腾NPU上实现ERNIE-4.5-21B-A3B-Base-PT模型的高效推理,支持精度验证、性能基准测试及单次/批量推理,通过vLLM-Ascend适配,误差<1%,具备高吞吐量。【此简介由AI生成】 - AtomGit AI社区