合并请求 - Kimi-Linear-48B-A3B-Base:基于Kimi Delta Attention的混合架构,优化长上下文任务性能,减少75%KV缓存需求,解码吞吐量提升6倍,支持100万token上下文,开源模型与核心内核。【此简介由AI生成】 - AtomGit AI社区