DeepSeek-V2:DeepSeek-V2:强大的混合专家语言模型,以经济训练和高效推理著称,参数总量达2360亿,每token仅需激活210亿。相比DeepSeek 67B,性能更强,同时节省42.5%的训练成本,降低93.3%的KV缓存,最大生成吞吐量提升5.76倍。开源、高效、易用。【此简介由AI生成】 - AtomGit AI社区