文章
Transformer作者重磅预言:AI无寒冬,推理革命引爆万亿市场

Transformer作者重磅预言:AI无寒冬,推理革命引爆万亿市场

2025年11月14日 19:50·36kr

AI
Transformer
推理革命

AI未来之争:推理模型突破极限,算力能源成胜负关键

大语言模型已达上限?两位图灵奖得主与Transformer发明者激烈交锋!

AI领域正经历资本与算力的双重考验。

Transformer架构问世七年后,推理模型正掀起第二波革命浪潮。

专家观点激烈碰撞

Transformer共同作者Łukasz Kaiser预测:

未来一两年,AI将实现飞跃式进步。真正的瓶颈不在算法,而在GPU与能源供应。

推理模型正在改写游戏规则,资金与电力成为决定性因素。

2017年Transformer八位创始人合影,AI历史性时刻

2017年,八位研究者共同创造了改变AI历史的Transformer架构

Łukasz Kaiser在ChatGPT发布前加入OpenAI,专注于推理模型研究。

他认为这是继Transformer之后最具突破性的进展。

推理模型仅仅是开始,远未达到AI发展的终点。

我们终于拥有了能够思考的机器,现在需要让它更专注于实际任务。

万亿美元的技术路线之争

这场辩论关乎万亿美元的市场前景。

通用人工智能成为行业追逐的圣杯。

OpenAI通过持续投入算力与数据,推动硅谷陷入AGI狂热。

AGI技术发展路线图对比

然而,反对声音同样强烈。

图灵奖得主Richard Sutton直言:大语言模型已走入死胡同。

他强调模型存在根本性局限,改进空间极为有限。

硅谷AI投资预期与现实差距

硅谷的万亿投资与技术进步预期

另一位图灵奖得主Yann LeCun持相似观点。

开源框架Keras创始人François Chollet也认为需要重新规划AGI路径。

对此,Łukasz Kaiser提出有力反驳:

推理模型所需训练数据大幅减少,具备真正的突破潜力。

核心制约因素是算力不足,所有实验室都面临相同挑战。

推理能力:AI的质变时刻

推理模型正在引发AI领域的范式转移。

普通用户可能尚未接触真正的推理型AI。

这些模型具备独特能力:

  • 自我反思并修正推理错误
  • 动态分配计算资源解决复杂问题
  • 直接调用外部工具执行操作
  • 生成多条推理路径并选择最优解

这完全不同于传统的自回归模型。

推理模型与传统模型性能对比

推理模型问世不足一年,潜力远未充分发掘。

在多数推理任务中,OpenAI的o1模型显著优于GPT-4o。

推理模型在数学和编程任务中的表现

这些模型不急于回答,而是先进行深度思考。

它们能够完成实际任务:编写报告、调试代码、分析数据。

Łukasz Kaiser形容这是从对话生成器到真正思考者的转变。

更令人振奋的是,推理模型数据需求更少,却能解决更复杂的问题。

技术演进:从理论到实践

Łukasz Kaiser的AI之路始于16岁。

当时他为AGI概念提出者Ben Goertzel工作。

Łukasz Kaiser与早期AI研究

如今AI在某些领域超越人类,但在物理世界仍显笨拙。

这种差异化发展符合技术演进规律。

推理模型带来的实际变革更值得关注。

AI已能胜任职场任务,持续工作数小时产出价值。

编程领域进步尤为显著:

  • 理解大型代码库
  • 进行代码审查
  • 发现安全漏洞
  • 生成完整程序

一年前还难以想象的能力,如今已成为现实。

AI编程能力年度进步对比

新范式:推理革命刚刚开始

传统Transformer范式依赖海量数据训练。

但互联网数据即将耗尽,需要新的突破。

AI训练数据增长趋势

推理范式处于起步阶段,上升空间巨大。

我们仅仅触及了表面,尚未充分发挥其潜力。

推理模型发展路径预测

结合新旧范式,AI将在未来一两年实现猛烈改进。

世界将发生翻天覆地的变化。

当前推理模型类似于早期RNN,思考过程仍是线性的。

未来需要实现多线并行思考,如同GPT-5 Pro的初步尝试。

关键突破:从任意数据学习

Łukasz Kaiser重点关注模型从任意数据学习的能力。

现实世界数据大多没有明确对错标签。

人类学习不依赖标准答案,AI也需要类似能力。

多模态训练取得显著进展:

  • 音频编码为离散token
  • 图像分割为多个块
  • 通过预测下一个token进行训练
AI多模态训练技术示意图

从早期六指图像到如今流畅生成,进步惊人。

视频训练数据量巨大,但需要智能提取关键信息。

文字理解抽象世界,视频理解物理世界。

填补物理世界理解的空白至关重要。

机器人结合推理与视觉系统

谷歌Gemini 1.5 Robotics结合推理与视觉。

快反应系统与慢思考系统协同工作。

真正拥有大脑的机器人即将成为现实。

开创者:Łukasz Kaiser的专业背景

作为OpenAI唯一在任的Transformer发明者。

Łukasz Kaiser个人简介照片

专攻深度学习与自然语言处理基础研究。

共同发明Transformer架构与推理模型。

Transformer架构技术原理图

曾任法国国家科学研究中心终身研究员。

致力于逻辑学与自动机理论研究。

2008年获德国亚琛工业大学博士学位。

核心观点总结:

  • 推理模型代表AI新范式
  • 算力与能源是主要瓶颈
  • 技术突破将加速到来
  • 实际应用价值日益显著

参考资料:

https://www.youtube.com/watch?v=gdPMNZo4Vb8

https://www.youtube.com/watch?v=ILRrrntPwj0

https://www.freethink.com/robots-ai/arc-prize-agi

本文来源微信公众号“新智元”,经36氪授权发布