杭州六小龍開源新模型SpatialLM，助力機器人瞬間理解3D 世界！ - AI文章

作者：Eve Cole 更新時間：2025-05-21 15:00:02

2025Binance币安直达

官网www.binance.com/zh-CN：进入官网☜☜
APP：☞☞官方app下载☜☜

近日，杭州群核科技凭借其开源的空间理解模型 SpatialLM 再次成为科技界的焦点。这一创新模型被谷歌在一篇研究论文中特别提及，标志着其在机器人训练领域的重大突破。SpatialLM 的核心功能在于，它能够通过普通视频让机器人理解物理世界的几何关系，从而为机器人训练提供了全新的可能性。

SpatialLM 的独特之处在于，它可以将手机拍摄的视频转化为精确的三维空间布局信息。用户只需用手机录制家中的场景，SpatialLM 便能生成一个详细的3D 模型，包括房间的结构、家具的位置以及通道的宽度。这一技术不仅大幅降低了机器人训练的成本，还显著提升了训练效率，为机器人技术的普及和应用铺平了道路。

在 GTC2025 大会上，群核科技还展示了其虚拟训练平台 SpatialVerse。这一平台结合了 SpatialLM 生成的数据，允许机器人在模拟环境中进行避障、抓取等复杂任务的训练，从而实现了从认知到行动的完整闭环。通过这一系统，机器人不仅能够“看”到空间布局，还能理解如何在复杂环境中进行操作，这为机器人在真实世界中的应用提供了强大的技术支持。

SpatialLM 的工作原理基于 MASt3R-SLAM 技术，它将视频拆解为无数帧，提取出沙发、桌子等物体的细节，并构建成点云模型。随后，模型将这些数据转化为结构化的3D 布局，记录下每个物体的关键信息，如尺寸和位置。与传统的训练方法相比，SpatialLM 不仅节省了时间和资源，还显著提升了机器人的空间认知能力，使其能够更好地适应复杂环境。

这项技术的独特之处在于，它使机器人能够像人类一样理解和处理复杂的环境变化。无论是家庭生活中的日常物品，还是工作场所的工具，SpatialLM 都能帮助机器人快速适应并执行任务。这种能力对于提升机器人在真实环境中的表现至关重要，尤其是在当前的具身智能领域，许多技术依然面临落地难题。

通过开源 SpatialLM 和 SpatialVerse，群核科技正在重塑机器人训练的未来，使其能够在真实世界中灵活应对各种挑战。这一技术的广泛应用，不仅将推动机器人技术的进一步发展，还将为人类生活带来更多便利。

项目地址：https://top.aibase.com/tool/spatiallm