我们推出了LongCat-Flash-Thinking的更新版本,命名为LongCat-Flash-Thinking-2601。这是一款功能强大且高效的大型推理模型(LRM),总参数达5600亿,基于创新的混合专家(Mixture-of-Experts, MoE)架构构建。
为了突破当前推理能力的边界,我们在LongCat-Flash-Thinking-2601的基础上建立了深度思考模式(Heavy Thinking Mode)。具体而言,我们将具有挑战性的问题解决过程分解为两个互补阶段:并行思考和总结,从而共同提升推理的深度和广度。在推理广度扩展方面,深度思考模式下会并行独立生成多条推理轨迹,实现对推理路径的广泛探索。在此阶段,我们采用适当较高的推理温度以确保可能的多样性。在推理深度扩展方面,总结阶段中经过提炼的轨迹可以递归反馈到总结模型中,形成迭代推理循环,支持逐步深入的推理过程。我们还特别设计了额外的强化学习阶段来专门训练总结能力,进一步释放该模式的潜力。
我们现已在链接发布LongCat-HeavyModel-Summary模型,该模型是在LongCat-Flash-Thinking-2601的基础上进一步训练得到的。
Longcat AI平台已上线深度思考模式,欢迎体验:https://longcat.chat/。