商汤开源 SenseNova-SI 模型:能理解空间结构,号称多项评测领先 GPT-5
2025年11月11日 23:40·ithome
商汤开源SenseNova-SI模型:空间智能领域重大突破
来源:IT之家 | 发布日期:11月10日
模型概览
商汤科技今日正式开源SenseNova-SI系列模型。
该模型在空间理解和推理任务中表现卓越。
它不仅大幅领先同量级开源多模态大模型,还超越了GPT-5和Gemini 2.5 Pro等国际顶尖闭源模型。
这标志着空间智能领域实现了重要技术突破。
行业背景与挑战
当前主流大模型在知识、写作、推理和编程方面表现出色。
然而,它们在空间结构的理解和推理方面存在明显短板。
这种能力恰恰是智能体与世界交互的关键基础。
商汤科技此次发布正是为了弥补这一技术空白。
模型规格与性能
开源系列包括2B和8B两种规格。
在多项基准测试中表现突出:
- VSI基准测试
- MMSI基准测试
- MindCube基准测试
- ViewSpatial基准测试
SenseNova-SI-8B模型平均得分60.99,显著领先竞争对手。
这不仅是性能提升,更是空间智能质的飞跃。
实际测试对比
以下是GPT-5与SenseNova-SI-8B在空间智能问题上的表现对比:
立方体俯视图识别
GPT-5选择答案D,SenseNova-SI-8B选择答案B。
正确答案为B,SenseNova-SI-8B回答正确。
空间位置判断
判断摩托车位于左侧还是右侧。
GPT-5选择左侧,SenseNova-SI-8B选择右侧。
正确答案为右侧,SenseNova-SI-8B再次正确。
交通场景分析
判断黄色汽车后续动作。
GPT-5认为静止,SenseNova-SI-8B判断右转。
正确答案为右转,SenseNova-SI-8B正确。
视角变化分析
通过视角变化判断移动方向。
GPT-5选择答案C,SenseNova-SI-8B选择答案D。
正确答案为向左前方移动,SenseNova-SI-8B正确。
室内空间分析
分析室内物体位置变化。
GPT-5选择答案D,SenseNova-SI-8B选择答案A。
正确答案为向左前方移动,SenseNova-SI-8B正确。
物体识别测试
从正面视角判断桌子右侧物体。
GPT-5选择答案B,SenseNova-SI-8B选择答案C。
正确答案为门,SenseNova-SI-8B正确。
开源信息
SenseNova-SI开源地址:https://github.com/EvolvingLMMs-Lab/EASI
核心要点总结
- SenseNova-SI在空间智能领域实现重大突破
- 多项评测超越GPT-5和Gemini 2.5 Pro
- 提供2B和8B两种开源规格
- 在空间理解和推理任务中表现卓越
- 为具身智能发展提供关键技术支撑
广告声明:文内含有的对外跳转链接用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


