黄仁勋的物理AI野望:将5G网络转变为分布式AI计算机
2026年3月20日 21:33·36kr
这几天,关于英伟达 GTC 大会的讨论几乎被老黄的“token 经济学”刷屏了。
“未来的数据中心,不是存储仓库,而是生产智能 Token 的工厂;而每瓦性能,就是这场竞赛里唯一的硬指标。”用这句话,黄仁勋为企业描绘了一种全新的未来竞争范式。
从算力成本到推理效率,从 Token 价格到 AI 商业模式,市场的注意力集中在一个熟悉的问题上:如何更高效地生产与消耗“智能”?但如果把视线从云端稍微下移,会发现另一条同样来自英伟达的消息相对容易被忽略——3 月 16 日,英伟达宣布联合 T-Mobile 与诺基亚,将物理 AI 应用部署于分布式边缘 AI 网络上,试图将无线通信网络升级为高性能边缘 AI 计算平台。
相比“token 经济学”对效率与成本的再优化,这条消息指向一个更底层的问题:当 AI 不再只是生成内容,而是要进入现实世界、参与每一次实时决策时,我们赖以运行 AI 的网络和计算架构,是否需要被重写?
黄仁勋对于这一问题的答案很直接:“网络正在演变为人工智能基础设施,使数十亿台设备——从视觉人工智能代理到机器人和自动驾驶汽车——能够实时地看、听和行动。通过与 T-Mobile 和诺基亚合作,将 5G 网络转变为分布式人工智能计算机,我们正在为全球边缘人工智能基础设施打造一个可扩展的蓝图。”
对于一名长期关注物联网与边缘计算的从业者而言,这或许才是这届 GTC 更值得关注的信号~
打破物理 AI 规模化发展的关键瓶颈
此前,黄仁勋在多个场合的演讲中都曾介绍过对 AI 发展阶段的预测,即 AI 经历了感知 AI、生成式 AI 阶段后,现在进入了代理 AI 阶段,未来将是物理 AI 时代。如果说生成式 AI 解决的是“理解与生成信息”的问题,那么物理 AI 所要面对的,则是一个更复杂的命题:理解世界,并在其中行动。
按照英伟达给出的定义,“物理 AI 是使用运动技能理解现实世界并与之进行交互的模型,它通常以机器人、自动驾驶汽车等自主机器为载体”——我们知道,诸如 GPT 和 Llama 等大语言模型在生成人类语言和抽象概念方面能力惊人,但它们对物理世界了解有限,并受其规则约束,但物理 AI 能够理解我们居住的三维世界的空间关系和物理行为,因而扩展了当前的生成式 AI。
利用物理 AI,自主机器能够感知、理解并在现实 (物理) 世界中执行复杂的操作,例如:自动驾驶汽车可使用传感器感知并理解周围环境,以便在各种环境 (从开放式高速公路到城市景观) 中做出明智决策,包括但不限于更准确地检测行人,对交通或天气条件做出响应并自动变换车道;在工业与物流场景中,仓库中的自主移动机器人 (AMR) 利用来自机载传感器的直接反馈,可以在复杂环境中导航并避开包括人类在内的障碍物,机械手可以根据传送带上物体的位姿调整他们的抓力和位置实现精细操作;而在城市空间中,大量摄像头与传感器构成的系统,正在尝试对环境变化进行实时理解与响应。
也正是在这一转变中,AI 对底层基础设施的要求被彻底改变——因为一旦进入物理世界,延迟、可靠性与实时性,都可能从“体验问题”变成“生死问题”。
许多系统无法容忍高延迟,也无法依赖“先上传云端再处理”的经典路径。正如当前行业实践所显示的,自动驾驶、机器人和智能城市等场景,都需要毫秒级响应与高度可靠的连接能力 。问题由此变得清晰:物理 AI 规模化发展的一个关键瓶颈在于“缺乏低延迟、安全且无处不在的连接能力。”
传统架构下,这一问题有两种解法,但都不理想——
“全部上云”:即终端设备采集数据后上传云端进行处理,再返回结果,这种模式的问题在于链路过长,延迟与稳定性不可控,在关键场景中几乎不可用。
“全部在端侧完成”:把算力尽可能堆叠在设备本身,但这同样面临瓶颈,终端设备在功耗、成本、体积上的限制,使其无法承载复杂模型的持续运行;同时,设备的算力孤岛化,也难以支撑模型的持续迭代与统一调度。
也正是在这两种路径之间,一个新的架构开始浮现,即把计算能力从云端“下沉”,但又不完全压在终端,而是放在“网络之中”。这正是此次英伟达、T-Mobile 与诺基亚推动的 AI-RAN 架构的核心逻辑: 将 AI 推理能力部署在靠近终端的网络边缘节点,使物理 AI 系统可以将大量计算任务从设备侧卸载到最近的基站或边缘数据中心完成。
这一变化带来的直接结果是——开发者不再需要在每一个摄像头、机器人或终端设备上堆叠昂贵算力,而是可以依赖网络侧的分布式计算资源,以更低成本部署更复杂的 AI 能力。在这一架构下,通信网络不再只是“传输数据”,而成为承载智能的计算平台,从而支撑数十亿设备规模的 AI 应用落地 。
领先开发者将推理与视觉 AI 部署至边缘
要将网络转变为分布式 AI 计算平台,就需要在网络边缘为数十亿终端提供超低延迟和时空一致性,而这正是此次英伟达的合作者 T-Mobile 的核心能力所在。不同于覆盖范围和安全性受限的 Wi-Fi,T-Mobile 的 5G 独立组网提供了广域覆盖和服务质量保障,使复杂 AI 智能体能够在繁忙的城市路口、工业设施及偏远地区运行。
根据官方发布的新闻稿,T-Mobile 正与英伟达认证的物理 AI 开发商(包括 Fogsphere、LinkerVision、Levatas、Vaidio 和西门子能源)合作,演示“基站和移动交换中心如何支持分布式边缘 AI 工作负载”,并充分利用公共 5G 网络连接。他们将在该平台上集成英伟达的 Metropolis Blueprint,用于视频搜索和摘要(VSS)功能。
英伟达最新版 VSS (3) Blueprint 引入了多模态视觉理解和智能搜索功能,并以模块化架构的形式提供,可根据不同环境(“从零售店到仓库”)进行重构。英伟达表示,全球有 15 亿个摄像头,但只有不到 1% 的视频内容经过人工审核。VSS (3) Blueprint 能够“分解复杂的自然语言查询,并在五秒内搜索视频片段以找到特定事件”,并且“以比人工审核快 100 倍的速度概括长视频”。
当前,许多领先开发者正与英伟达和 T-Mobile 合作,基于用于视频搜索与总结 (VSS) 的 NVIDIA Metropolis Blueprint,将可驱动实时行动的物理 AI 智能体集成到 T-Mobile 的分布式边缘网络中,试点应用场景包括:
智慧城市运营:LinkerVision、Inchor 和 Voxelmaps 正在测试基于计算机视觉的集成“城市运营智能体”及数字孪生,该系统能够感知、模拟并优化交通信号灯配时,目标是将圣何塞的事故响应速度提升 5 倍。
公用 (电力) 设施自动化巡检:Levatas 正利用英伟达计算能力,对数十万英里的输电线路进行 5G 网络自动化巡检,以检测并快速处理电线杆倾斜、腐蚀及异常发热等问题,且速度可提升至 5 倍。双方目前正在评估 AI-RAN 基础设施,以进一步降低成本、缩短故障恢复时间,并加速从被动维护转向预测性维护。
基于视觉的设施管理:Vaidio 等开发者正基于 VSS Blueprint 构建设施管理智能体,进行威胁检测和故障预测,并触发自动化工作流,从而提升设施管理效率。
实时工业安全:Fogsphere 为 SAIPEM 提供安全 AI 智能体,用于在高风险陆地上、海上及钻探施工环境中,对危险事件实时检测与响应,例如工人处于悬吊物下或发生碳氢化合物泄漏等情况。
AI 如何重塑通信网络的角色?
站在更宏观的视角来看,上文所述的变化同样意味着电信行业自身的角色正在发生根本性转变。
长期以来,通信网络一直被视为“连接基础设施”——其核心任务是高效地在设备之间传输数据。但事实上,这一基础设施的规模之庞大,足以比拟整个 IT 产业:全球电信产业规模接近 2 万亿美元,基站遍布城市与乡村,是人类社会最广泛分布的技术系统之一。在过去,它们承载的是信息流;而在 AI-RAN 架构下,这些原本主要负责“传输”的节点,将被重新定义为分布式计算节点,成为人工智能在边缘运行时的基础设施平台。
而 AI 对整个通信网络角色的重塑其实早已悄然发生。此前,笔者在《LoRa正在争夺物联网新一轮发展周期的”话语权”?》中就提及:以 LoRa 联盟为代表的 LPWAN 阵营,开始强调“物理 AI”和“行动闭环”等概念并非偶然。在过去的 LPWAN 竞争格局中,无论是 NB-IoT、LTE-M,还是卫星 IoT,技术叙事长期围绕覆盖能力、功耗表现和成本优势展开。LoRaWAN 也曾以“低功耗、低成本、私网灵活、部署弹性强”被广泛认知。然而在 AI 时代,它正在尝试重新定义自身角色:不仅仅是数据连接协议,而是 AI 的数据入口、行动出口,以及物理AI的通信神经系统。
这一趋势在未来网络架构中将更加明显。6G 的设计理念正在指向“为 AI 而生”,而不仅仅是提升速率。2026 年 2 月,3GPP SA2 #173 会议在印度果阿落下帷幕,其 R20 架构全景报告释放出一个重要信号:行业共识已经跨越了单纯的“连接管道”,向“原生智慧平台”跃迁。在这一架构下,核心网元 AIMF(AI 管理功能)改变了终端与网络的交互方式:以往核心网只负责比特传输,而 R20 架构开始提供 MaaS(模型即服务)。通过梯度拆分机制,终端仅需计算底层梯度以保护隐私,而核心网承担高层梯度计算。这意味着,网络算力将直接参与用户侧大模型的训练与优化,而不再只是被动传输信息的管道。
放眼全局,显而易见的是:AI 正在吞噬通信网络,而通信网络也正在重塑自己。无论是边缘计算、物理 AI 还是未来 6G 原生智慧网络,都预示着一个新范式的形成:从“传输比特”到“提供智能”,从“被动管道”到“主动计算平台”。在这个新范式下,AI 不仅是软件,也将成为电信网络的内生属性;网络也不仅是基础设施,而是承载智能的实时生态系统。
如今,我们可能真的站在了一个“随处可触、无处不智”的智能世界起点。
本文来自微信公众号 “物联网智库”(ID:iot101),作者:Sophia,36氪经授权发布。





