文章
千问豆包元宝,下一个赛段该拼什么

千问豆包元宝,下一个赛段该拼什么

2026年3月4日 18:46·36kr

春节期间,千问、豆包、元宝几乎同时进入高强度竞争阶段。春晚、红包、补贴、热搜、联动活动密集出现,AI应用被推成了一场节日流量事件。 

这些日活数字很亮眼,但数字本身并不能说明问题。节日期间用户更愿意尝鲜、分享和传播,很多 增长来自情绪和激励,而不是长期需求。 

真正的考验发生在节后 —— 当用户回到日常 生活与 工作流时,AI是否还会被持续使用。 

根据QuestMobile统计,豆包、千问、元宝在春节营销的猛烈进击之下,纷纷达到了自身的日活峰值,其中千问在某一日几乎接近于豆包,而豆包的春晚效应则一骑绝尘,但是,“撒币”效应结束之后,三家回落趋势明显。

图源:QuestMobile

与此同时,随着春节大战结束, AI 应用制造的更大关注,居然在于向用户道歉,亦或者核心管理团队离职,这无疑让市场感到疑惑:不顾一切撒币冲刺日活之后,它们真的想好了接下来该怎么走吗? 

下一个赛段的问题,其实不是留存率本身,而是留存背后的结构。

其中最先显露出来的是成本问题。

如果每一次对话都需要高成本算力支撑,规模越大亏损越大。谁能把单位推理成本持续压低,谁才有资格谈长期增长。 

接下来会拉开差距的是场景构建。

对国内市场而言,或许独立的AI chatbot竞争很难成为终局。真正稳定的使用频率,可能反而会来自真实工作流——办公、搜索、社交、电商、客服等系统入口。 

国内部分AI chatbot

而新的变量正在出现在终端形态上。

春节刚过,千问就开始推动独立的AI硬件,也带出了一个明显信号:AI竞争正在从应用层走向终端层。语音、视觉、多模态设备,可能成为新的默认入口。 

换句话说:春节解决其实还是认知度问题。 

下一阶段各家既要比拼Token成本,也要尽快找到一个无可替代的使用场景,而布局次世代的AI硬件已经不能再停留在纸面上。

Token成本曲线,谁先把“量大管饱”做成护城河

春节的短期活跃增长可以用补贴换来,但补贴买不到长期优势。 

AI应用的规模化,本质上受制于单位推理成本:每一次生成、每一次多轮对话、每一次多模态理解,背后都是算力、带宽、电力与调度成本。 

最近一波围绕OpenClaw等框架掀起的“自建AI代理”潮,也把这个问题迅速放大。 

越来越多公司和开发者开始搭建自己的Agent、自动化流程和多步推理系统,AI不再只是一次对话,而是连续调用、长链路执行。 

图源:unsplash

这种变化直接体现在Token使用量上。 

一些开发者平台统计显示,2026年初全球AI推理Token使用量在短短一个月内从约6.4万亿/周增长到13万亿/周,几乎翻倍 , 其中很大一部分增长来自Agent 系统的自动调用。 

与此同时,Token消耗不再是线性增长,而是随着任务复杂度呈指数放大。 

这意味着,成本问题正在从“单次对话成本”变成“系统级调用成本”。如果每一步都依赖高成本模型,AI代理越复杂,费用增长越快。

过去一年行业最容易犯的错,是把“模型更强”当作唯一方向,把“参数更大”当作唯一指标,却忽略了一个更现实的问题: 当调用规模扩大十倍,成本也会按比例扩大吗?如果答案是“会”,那增长就变成了财务压力测试。

图源:IDC咨询

下一个赛段,谁能把Token成本曲线做得更陡、更快下降,谁就拥有更大的战略空间。

所谓Token成本曲线,至少包含三层——

其一是推理侧优化, 能否通过量化、蒸馏、编译加速、KV缓存、并行策略等手段,把同样质量的输出做得更省; 

其二是模型路由能力, 能否在不同任务中自动选择“足够好”的轻量模型,而不是每次都用最高配; 

其三是算力与供应链的组织能力, 能否在自有算力、云算力、国产芯片适配、跨地域调度之间找到最优解。 

当然单纯是这条曲线对千问、豆包、元宝三家的意义也各不相同。

图源:网络

千问背靠阿里云与电商体系,理论上更容易把算力与业务结合起来做“规模采购+分级调用”,把成本控制转化为平台优势; 

豆包依托字节的内容与分发体系,优势在于训练数据与场景丰富,但也意味着调用频率会更高、更碎片化,对成本优化的要求更苛刻; 

元宝处在腾讯生态里,天然靠近社交与内容,但社交场景对延迟、稳定性和安全合规更敏感,成本优化必须和体验、风控同步推进。 

Token成本曲线之所以会很快成为竞争瓶颈,是因为它决定了竞争方式:当成本足够低,你可以用更激进的定价策略去扩张;当成本不够低,你只能依赖补贴或“限制功能”去控制消耗,最终把用户体验做窄。

像是元宝即便如今还需要频繁切换deepseek去代替自己的浑元大模型,背后显然也是算力瓶颈的问题。 

元宝APP截图

或是像一时火爆的seedance 2.0,如今即便是付费用户动辄也要排队几个小时才能完成一次生成,这其实也都是过高的算力成本之下,平台试图平衡 成本的无奈之举。 

更好的Token成本曲线会决定“AI是否能从C端走向B端与交易链条”。 企业客户不会为一次好玩的对话付费,但会为可预期的效率提升付费。前提是价格透明、质量稳定。 

在这个意义上, 下一赛段的核心其实与DAU、MAU这些传统的互联网产品指标无关,核心还是更小的单位成本以及TPD(每日Token消耗量)。

从场景到入口,软硬一体或成默认能力

春节之后,各家的AI应用竞争会越来越像“阶段性战役”:榜单可以冲,DAU可以拉,但它很难成为终局。 

真正的战场其实更多在于场景——AI能否嵌进用户已经每天在用的路径里,成为默认的底层能力。

这就是为什么“场景嵌入度”甚至比“留存率”更关键,即便用户没有打开这个应用,但其日常使用中依然能够调用到其模型能力。 

图源:unsplash

场景嵌入通常有三种层级。

第一层是工具层,把AI当作写作、翻译、总结、检索的初级工具; 

第二层是流程层,把AI放进办公套件、客服系统、内容生产链条,让它参与决策与协作; 

第三层是交易与执行层,让AI不止回答,还能直接调用服务、完成下单、预约、支付、售后。 

而硬件在这里的作用,是把入口从众多应用的选项变成终端“默认”。

千问近期发力AI硬件,背后的逻辑并不复杂:手机屏幕里的AI入口太拥挤,分发权被操作系统、超级应用与内容平台层层分割;而可穿戴设备、耳机、眼镜等终端,可能提供一种更自然的交互方式——语音唤起、随手拍摄、实时翻译、导航与信息提示。 

千问AI眼镜G1

这些场景一旦成立,用户就不需要“打开某一AI产品”,AI会在场景里自动出现。 

但硬件不是只要做出来就能赢。

它会把竞争推向物理层面——

一是本地化能力,设备要“随时可用”,就必须依赖一定程度的端侧推理与低延迟架构; 

第二是服务编排能力; 

第三是长期运营能力,硬件一旦出货,就进入了供应链、售后、系统更新、隐私安全与合规的长周期战场,远比软件更重。 

对豆包和元宝来说,做硬件宜早不宜迟 ,毕竟去年豆包手机已经遭遇过一波激烈抵抗。对字节而言,大量传说中的硬件如今也有更好的理由端出来了。 

豆包手机助手

除了成本、场景与硬件入口之外,AI产业还有一个更直接的变量:人才竞争。

就在3月4日凌晨,千问团队核心技术负责人林俊旸宣布离职,而同时期团队中多位关键研究人员也相继离开。 

当然,“一号位”的变动在AI行业并不罕见,但在大模型竞争进入关键阶段时,它的象征意义被明显放大。 

大模型毕竟不是传统意义上的工程流水线。真正决定模型能力的,除了几万张GPU,还有便是几十到几百名核心研究员——他们负责模型架构、训练策略、推理优化和数据体系。 

图源:X

一个核心研究员的离开,往往意味着整条技术路径的调整甚至迁移。

因此,AI公司之间的竞争表面上看是产品战、算力战和入口战,但底层其实是一场持续的人才密度竞争。 

这也是为什么最近几年国内AI公司之间的挖角频繁发生。从阿里到字节、从腾讯到创业公司,顶级研究员的流动几乎都伴随着团队迁移与技术路线变化。 

当模型能力逐渐趋同、开源生态不断扩大之后,真正能够拉开差距的,往往不是参数规模,而是研究团队的稳定性与创新能力。

图源:网络

最终,这一赛段拼的,不再只是春节式的峰值增长,而是三种能力能否同时成立: 

Token成本曲线持续下降、AI能力深入真实场景、终端入口形成软硬协同,同时还能维持足够高的人才密度。

只有同时满足这几条条件,AI产品才可能从“节日里的热点应用”变成长期存在的基础设施。 

2026年的春节只是开场,长期的泥沼战还会持续下去。 

本文来自微信公众号 “壹番YIFAN”(ID:finance_yifan),作者:HAL ,36氪经授权发布。