Ling-2.6-1T

模型描述

Ling-2.6-1T 是一款基于 bailing_hybrid 架构的大规模语言模型，其特点在于融合了多头潜在注意力（MLA）与线性注意力的混合注意力机制，并采用了混合专家（MoE）设计。

该模型可在 ModelScope 获取。

引用信息请参考 HuggingFace 或 ModelScope 上的模型卡片。