端侧大模型迎突破！Liquid AI 开源混合专家模型 LFM2.5

2026年5月29日 15:29·AIBase

人工智能初创公司 Liquid AI 今日正式发布并开源了全新的端侧大模型LFM2.5-8B-A1B。该模型专为消费级硬件的工具调用和复杂指令遵循而设计，在保持极低计算成本的同时，显著提升了端侧设备的推理与推理性能。

在架构上，该模型采用了稀疏混合专家（MoE）设计，总参数量为 8.3B。得益于这种稀疏性，模型在每个 Token 生成时仅激活 1.5B 参数，这使得它能够流畅地在手机及笔记本电脑等本地设备上运行。

长文本扩展与推理能力升级

相比前代产品，LFM2.5 将上下文窗口从 32K 大幅扩展至 128K 词元，预训练数据量也从 12T 提升至 38T。作为一款纯推理模型，它会在输出最终答案前生成显式的思维链，且其高压缩率的词表能更高效地处理中文、阿拉伯文等九种语言。

为了解决长推理中的逻辑死循环与幻觉问题，开发团队在训练中引入了两阶段强化学习（RL）。其中，偏好优化有效减少了长链路推理中的“死循环”，而专门的防幻觉奖励机制则让模型在面对超出知识库的问题时能够主动拒绝回答。

端侧性能强劲与生态全面兼容

在性能表现上，LFM2.5 实现了爆发式增长，其在逻辑推理与反幻觉基准测试中的得分大幅超越前代，甚至在指令遵循上媲美更大参数量的模型。在工具调用方面，模型默认输出高效的 Python 函数调用，并支持在系统提示词中无缝切换为 JSON 格式。

该模型在发布首日便获得了主流推理生态的全面支持，包括 llama.cpp、MLX、vLLM 和 SGLang。在硬件实测中，它在 M5 Max 芯片上的解码速度高达每秒 253 字节，而在手机端也能达到每秒约 30 字节，完美兼顾了端侧运行的私密性与高效率。