文章
商汤开源 SenseNova-SI 模型:能理解空间结构,号称多项评测领先 GPT-5

商汤开源 SenseNova-SI 模型:能理解空间结构,号称多项评测领先 GPT-5

2025年11月11日 23:40·ithome

AI
Open Source
Spatial Understanding
商汤开源SenseNova-SI模型:空间智能突破,超越GPT-5和Gemini 2.5 Pro

商汤开源SenseNova-SI模型:空间智能领域重大突破

来源:IT之家 | 发布日期:11月10日

模型概览

商汤科技今日正式开源SenseNova-SI系列模型。

该模型在空间理解和推理任务中表现卓越。

它不仅大幅领先同量级开源多模态大模型,还超越了GPT-5和Gemini 2.5 Pro等国际顶尖闭源模型。

这标志着空间智能领域实现了重要技术突破。

行业背景与挑战

当前主流大模型在知识、写作、推理和编程方面表现出色。

然而,它们在空间结构的理解和推理方面存在明显短板。

这种能力恰恰是智能体与世界交互的关键基础。

商汤科技此次发布正是为了弥补这一技术空白。

模型规格与性能

开源系列包括2B和8B两种规格。

在多项基准测试中表现突出:

  • VSI基准测试
  • MMSI基准测试
  • MindCube基准测试
  • ViewSpatial基准测试

SenseNova-SI-8B模型平均得分60.99,显著领先竞争对手。

这不仅是性能提升,更是空间智能质的飞跃。

SenseNova-SI模型性能对比图表

实际测试对比

以下是GPT-5与SenseNova-SI-8B在空间智能问题上的表现对比:

立方体俯视图识别

立方体组合图形俯视图测试

GPT-5选择答案D,SenseNova-SI-8B选择答案B。

正确答案为B,SenseNova-SI-8B回答正确。

空间位置判断

摩托车位置判断测试

判断摩托车位于左侧还是右侧。

GPT-5选择左侧,SenseNova-SI-8B选择右侧。

正确答案为右侧,SenseNova-SI-8B再次正确。

交通场景分析

多车道道路场景分析

判断黄色汽车后续动作。

GPT-5认为静止,SenseNova-SI-8B判断右转。

正确答案为右转,SenseNova-SI-8B正确。

视角变化分析

户外场景移动方向判断

通过视角变化判断移动方向。

GPT-5选择答案C,SenseNova-SI-8B选择答案D。

正确答案为向左前方移动,SenseNova-SI-8B正确。

室内空间分析

室内物体位置变化分析

分析室内物体位置变化。

GPT-5选择答案D,SenseNova-SI-8B选择答案A。

正确答案为向左前方移动,SenseNova-SI-8B正确。

物体识别测试

桌子右侧物体识别测试

从正面视角判断桌子右侧物体。

GPT-5选择答案B,SenseNova-SI-8B选择答案C。

正确答案为门,SenseNova-SI-8B正确。

开源信息

SenseNova-SI开源地址:https://github.com/EvolvingLMMs-Lab/EASI

核心要点总结

  • SenseNova-SI在空间智能领域实现重大突破
  • 多项评测超越GPT-5和Gemini 2.5 Pro
  • 提供2B和8B两种开源规格
  • 在空间理解和推理任务中表现卓越
  • 为具身智能发展提供关键技术支撑

广告声明:文内含有的对外跳转链接用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。