千问豆包元宝，下一个赛段该拼什么

2026年3月4日 18:46·36kr

春节期间，千问、豆包、元宝几乎同时进入高强度竞争阶段。春晚、红包、补贴、热搜、联动活动密集出现，AI应用被推成了一场节日流量事件。

这些日活数字很亮眼，但数字本身并不能说明问题。节日期间用户更愿意尝鲜、分享和传播，很多增长来自情绪和激励，而不是长期需求。

真正的考验发生在节后 —— 当用户回到日常生活与工作流时，AI是否还会被持续使用。

根据QuestMobile统计，豆包、千问、元宝在春节营销的猛烈进击之下，纷纷达到了自身的日活峰值，其中千问在某一日几乎接近于豆包，而豆包的春晚效应则一骑绝尘，但是，“撒币”效应结束之后，三家回落趋势明显。

图源：QuestMobile

与此同时，随着春节大战结束， AI 应用制造的更大关注，居然在于向用户道歉，亦或者核心管理团队离职，这无疑让市场感到疑惑：不顾一切撒币冲刺日活之后，它们真的想好了接下来该怎么走吗？

下一个赛段的问题，其实不是留存率本身，而是留存背后的结构。

其中最先显露出来的是成本问题。

如果每一次对话都需要高成本算力支撑，规模越大亏损越大。谁能把单位推理成本持续压低，谁才有资格谈长期增长。

接下来会拉开差距的是场景构建。

对国内市场而言，或许独立的AI chatbot竞争很难成为终局。真正稳定的使用频率，可能反而会来自真实工作流——办公、搜索、社交、电商、客服等系统入口。

国内部分AI chatbot

而新的变量正在出现在终端形态上。

春节刚过，千问就开始推动独立的AI硬件，也带出了一个明显信号：AI竞争正在从应用层走向终端层。语音、视觉、多模态设备，可能成为新的默认入口。

换句话说：春节解决其实还是认知度问题。

下一阶段各家既要比拼Token成本，也要尽快找到一个无可替代的使用场景，而布局次世代的AI硬件已经不能再停留在纸面上。

Token成本曲线，谁先把“量大管饱”做成护城河

春节的短期活跃增长可以用补贴换来，但补贴买不到长期优势。

AI应用的规模化，本质上受制于单位推理成本：每一次生成、每一次多轮对话、每一次多模态理解，背后都是算力、带宽、电力与调度成本。

最近一波围绕OpenClaw等框架掀起的“自建AI代理”潮，也把这个问题迅速放大。

越来越多公司和开发者开始搭建自己的Agent、自动化流程和多步推理系统，AI不再只是一次对话，而是连续调用、长链路执行。

图源：unsplash

这种变化直接体现在Token使用量上。

一些开发者平台统计显示，2026年初全球AI推理Token使用量在短短一个月内从约6.4万亿/周增长到13万亿/周，几乎翻倍，其中很大一部分增长来自Agent 系统的自动调用。

与此同时，Token消耗不再是线性增长，而是随着任务复杂度呈指数放大。

这意味着，成本问题正在从“单次对话成本”变成“系统级调用成本”。如果每一步都依赖高成本模型，AI代理越复杂，费用增长越快。

过去一年行业最容易犯的错，是把“模型更强”当作唯一方向，把“参数更大”当作唯一指标，却忽略了一个更现实的问题： 当调用规模扩大十倍，成本也会按比例扩大吗？如果答案是“会”，那增长就变成了财务压力测试。

图源：IDC咨询

下一个赛段，谁能把Token成本曲线做得更陡、更快下降，谁就拥有更大的战略空间。

所谓Token成本曲线，至少包含三层——

其一是推理侧优化，能否通过量化、蒸馏、编译加速、KV缓存、并行策略等手段，把同样质量的输出做得更省；

其二是模型路由能力，能否在不同任务中自动选择“足够好”的轻量模型，而不是每次都用最高配；

其三是算力与供应链的组织能力，能否在自有算力、云算力、国产芯片适配、跨地域调度之间找到最优解。

当然单纯是这条曲线对千问、豆包、元宝三家的意义也各不相同。

图源：网络

千问背靠阿里云与电商体系，理论上更容易把算力与业务结合起来做“规模采购+分级调用”，把成本控制转化为平台优势；

豆包依托字节的内容与分发体系，优势在于训练数据与场景丰富，但也意味着调用频率会更高、更碎片化，对成本优化的要求更苛刻；

元宝处在腾讯生态里，天然靠近社交与内容，但社交场景对延迟、稳定性和安全合规更敏感，成本优化必须和体验、风控同步推进。

Token成本曲线之所以会很快成为竞争瓶颈，是因为它决定了竞争方式：当成本足够低，你可以用更激进的定价策略去扩张；当成本不够低，你只能依赖补贴或“限制功能”去控制消耗，最终把用户体验做窄。

像是元宝即便如今还需要频繁切换deepseek去代替自己的浑元大模型，背后显然也是算力瓶颈的问题。

元宝APP截图

或是像一时火爆的seedance 2.0，如今即便是付费用户动辄也要排队几个小时才能完成一次生成，这其实也都是过高的算力成本之下，平台试图平衡成本的无奈之举。

更好的Token成本曲线会决定“AI是否能从C端走向B端与交易链条”。 企业客户不会为一次好玩的对话付费，但会为可预期的效率提升付费。前提是价格透明、质量稳定。

在这个意义上， 下一赛段的核心其实与DAU、MAU这些传统的互联网产品指标无关，核心还是更小的单位成本以及TPD（每日Token消耗量）。

从场景到入口，软硬一体或成默认能力

春节之后，各家的AI应用竞争会越来越像“阶段性战役”：榜单可以冲，DAU可以拉，但它很难成为终局。

真正的战场其实更多在于场景——AI能否嵌进用户已经每天在用的路径里，成为默认的底层能力。

这就是为什么“场景嵌入度”甚至比“留存率”更关键，即便用户没有打开这个应用，但其日常使用中依然能够调用到其模型能力。

图源：unsplash

场景嵌入通常有三种层级。

第一层是工具层，把AI当作写作、翻译、总结、检索的初级工具；

第二层是流程层，把AI放进办公套件、客服系统、内容生产链条，让它参与决策与协作；

第三层是交易与执行层，让AI不止回答，还能直接调用服务、完成下单、预约、支付、售后。

而硬件在这里的作用，是把入口从众多应用的选项变成终端“默认”。

千问近期发力AI硬件，背后的逻辑并不复杂：手机屏幕里的AI入口太拥挤，分发权被操作系统、超级应用与内容平台层层分割；而可穿戴设备、耳机、眼镜等终端，可能提供一种更自然的交互方式——语音唤起、随手拍摄、实时翻译、导航与信息提示。

千问AI眼镜G1

这些场景一旦成立，用户就不需要“打开某一AI产品”，AI会在场景里自动出现。

但硬件不是只要做出来就能赢。

它会把竞争推向物理层面——

一是本地化能力，设备要“随时可用”，就必须依赖一定程度的端侧推理与低延迟架构；

第二是服务编排能力；

第三是长期运营能力，硬件一旦出货，就进入了供应链、售后、系统更新、隐私安全与合规的长周期战场，远比软件更重。

对豆包和元宝来说，做硬件宜早不宜迟 ，毕竟去年豆包手机已经遭遇过一波激烈抵抗。对字节而言，大量传说中的硬件如今也有更好的理由端出来了。

豆包手机助手

除了成本、场景与硬件入口之外，AI产业还有一个更直接的变量：人才竞争。

就在3月4日凌晨，千问团队核心技术负责人林俊旸宣布离职，而同时期团队中多位关键研究人员也相继离开。

当然，“一号位”的变动在AI行业并不罕见，但在大模型竞争进入关键阶段时，它的象征意义被明显放大。

大模型毕竟不是传统意义上的工程流水线。真正决定模型能力的，除了几万张GPU，还有便是几十到几百名核心研究员——他们负责模型架构、训练策略、推理优化和数据体系。

图源：X

一个核心研究员的离开，往往意味着整条技术路径的调整甚至迁移。

因此，AI公司之间的竞争表面上看是产品战、算力战和入口战，但底层其实是一场持续的人才密度竞争。

这也是为什么最近几年国内AI公司之间的挖角频繁发生。从阿里到字节、从腾讯到创业公司，顶级研究员的流动几乎都伴随着团队迁移与技术路线变化。

当模型能力逐渐趋同、开源生态不断扩大之后，真正能够拉开差距的，往往不是参数规模，而是研究团队的稳定性与创新能力。

图源：网络

最终，这一赛段拼的，不再只是春节式的峰值增长，而是三种能力能否同时成立：

Token成本曲线持续下降、AI能力深入真实场景、终端入口形成软硬协同，同时还能维持足够高的人才密度。

只有同时满足这几条条件，AI产品才可能从“节日里的热点应用”变成长期存在的基础设施。

2026年的春节只是开场，长期的泥沼战还会持续下去。

本文来自微信公众号 “壹番YIFAN”（ID：finance_yifan），作者：HAL ，36氪经授权发布。