研究显示词元消耗 10 倍仅换 2 倍成果，CFO 开始严控 AI 开支

2026年5月7日 18:00·9466AI精选

IT之家 5 月 7 日消息，科技行业正进入人工智能支出趋于理性的新阶段，企业管理平台 Jellyfish 发布的最新数据显示，并非消耗 AI 词元（token）最多的企业就能成为最终赢家。

IT之家注意到，Jellyfish 在近期一项研究中表示，Claude Code 使用率前 10% 的用户，消耗的 AI 词元数量约为普通开发者中位数水平的 10 倍，但产出成果仅为后者的两倍左右。

AI 词元是人工智能模型将文字和输入内容拆分而成的小型文本单元，用于模型运算处理。同时它也是 AI 服务的计费依据，收费标准通常按每百万词元计价。

Jellyfish 人工智能与研究主管尼古拉斯・阿尔科拉诺表示，这一差距清晰表明，员工无节制消耗 AI 词元的极致词元滥用行为，并非可持续的使用策略。

他在采访中坦言：“首席财务官们已经开始严格管控这类开支。如今大多数企业里，员工开展工作都必须提供费用凭据。客户固然希望业务推进提速，也愿意在人工智能领域投入资金，但前提是必须证明开支合理、能产生实际价值。”

Jellyfish 掌握数百家企业、数十万软件工程师的编程行为数据。研究发现，海量消耗 AI 词元未必能创造实际效益，反而会推高企业成本。这也推动科技行业迈入全新阶段：AI 使用效率的重要性日益凸显。

阿尔科拉诺称：“即便你能自圆其说，认为 AI 完成工作的综合价值高于人工，但一旦词元成本飙升，首席财务官依然会担心财务报表失控。”

事实上，Jellyfish 的报告凸显了高端用户词元消耗量的惊人增幅。Claude Code 高频使用者人均每周词元消耗量高达 2.25 亿，而平台监测的普通软件工程师周消耗量仅为 3200 万。

与此同时，以代码提交合并请求（代码产出的通用衡量指标）为标准来看，AI 使用率与工作效率呈正相关。最新数据显示，AI 高使用率团队的代码合并请求处理量，较低使用率团队高出 77%。

阿尔科拉诺指出，单纯的词元总量杂乱无章，无法单独作为工作效率评判标准。即便工程师编程习惯没有变化，AI 模型版本更新也可能导致词元消耗量大幅波动，这意味着开发者的词元花费并不能真实代表实际工作产出。他建议企业管理者应关注单次代码合并请求成本等以成果为导向的指标，而非单纯统计词元总消耗量。

换言之，大量使用 AI 确实能提升效率，但效果存在边际上限。公司数据表明，频繁借助 AI 智能体辅助编程的高活跃用户，整体效率确实更高，但其效率提升幅度与词元投入成本并不成正比。

阿尔科拉诺解释道：“有些人不愿提前规划最优方案，反而让五个 AI 智能体用五种不同方式开发，再从中挑选最优版本。这过程中会浪费大量无效工作量。这种方式或许有效，总成本也仍低于纯人工开发，但远不如提前定好一套方案来得省钱。”

在阿尔科拉诺看来，最优发展路径是大范围推广 AI 编程应用，让更多工程师进入中等合理使用区间，既避免 AI 使用不足，也杜绝过度消耗资源。

维持这种适中水平，才能让人工智能成为企业持久的运营优势：既能借助 AI 切实提升产品交付效率，又不会为了追求微弱的产出增量而无谓浪费成本。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。