Moonshot AI发布 Kimi Linear:线性注意力架构快6倍,开源 KDA 内核同步上线
2025年10月31日 10:16·AIBase
Moonshot AI
Linear Attention
KDA Kernel
国产Moonshot AI发布Kimi Linear:开启智能体注意力新时代
国内顶尖AI团队Moonshot AI今日发布重磅技术报告《Kimi Linear Tech Report》。
该报告正式推出革命性架构Kimi Linear,标志着注意力机制迈入全新阶段。
三大核心突破
Kimi Linear在关键性能指标上实现显著提升:
- 速度飞跃:解码吞吐量提升高达6倍
- 内存优化:KV缓存使用量锐减75%
- 长文本处理:完美支持100万上下文长度
技术创新亮点
该架构融合三大核心技术:
Delta Attention:智能节能新机制
采用门控Delta规则,在保持高性能的同时大幅降低能耗。
Linear Architecture:全面超越传统
首个在多项指标上超越完全注意力机制的混合架构。
开放生态建设
提供完整工具链支持:
- 开源KDA内核
- vLLM集成方案
- 模型检查点
应用前景展望
Kimi Linear专为智能体时代设计,将在以下领域发挥重要作用:
- 长文本智能推理
- 多轮对话系统
- 多模态内容生成
随着线性注意力技术成熟,该架构有望成为下一代AI应用标准。
项目地址:https://huggingface.co/moonshotai/Kimi-Linear-48B-A3B-Instruct



