大模型 Scaling 怎么玩?杨植麟 GTC 首秀:押注 Token 效率与 Agent 集群
2026年3月18日 15:47·AIBase
大模型下半场的入场券,不再仅仅是算力的堆砌,而是对底层逻辑的重构。
在3月18日举办的英伟达 GTC2026大会上,
Token 效率: 拒绝资源空转,追求更极致的计算能效比。
长上下文: 持续深化
智能体(Agent)集群: 智能形态正从单兵作战向动态生成的“数字集群”进化。
在
参考此前的发布信息,今年1月底推出的
随着

2026年3月18日 15:47·AIBase
大模型下半场的入场券,不再仅仅是算力的堆砌,而是对底层逻辑的重构。
在3月18日举办的英伟达 GTC2026大会上,
Token 效率: 拒绝资源空转,追求更极致的计算能效比。
长上下文: 持续深化
智能体(Agent)集群: 智能形态正从单兵作战向动态生成的“数字集群”进化。
在
参考此前的发布信息,今年1月底推出的
随着
查看更多
人工智能领域两位顶尖专家Yann LeCun与Demis Hassabis就大模型的发展路径展开激烈争论。LeCun认为当前大模型路线存在根本缺陷,而Hassabis则坚信持续扩大模型规模是通往AGI的关键。这场辩论反映了AI未来技术方向的核心分歧。
月之暗面 Kimi 创始人杨植麟表示,中国 AI 技术不仅要追求好用,更要参与全球技术规则的制定。他透露公司未来计划将大模型能力扩展到 K100,展现了在人工智能领域持续突破和引领的雄心。
DeepSeek 推出名为 Engram 的新模块,旨在为稀疏大模型植入“条件记忆轴”,从而显著提升模型的效率和性能。