北京商报讯(记者 廖蒙)1月27日,蚂蚁集团旗下具身智能公司灵波科技宣布开源高精度空间感知模型LingBot-Depth。
据了解,该模型基于奥比中光Gemini330系列双目3D相机提供的芯片级原始数据,专注于提升环境深度感知与三维空间理解能力,旨在为机器人、自动驾驶汽车等智能终端赋予更精准、更可靠的三维视觉,在“看清楚”三维世界这一行业关键难题上取得重要突破。这也是蚂蚁灵波科技在2025外滩大会后首次亮相后,时隔半年在具身智能技术基座方向公布重要成果。
从具体场景来看,在家庭和工业环境中,玻璃器皿、镜面、不锈钢设备等透明和反光物体物体十分常见,但却是机器空间感知的难点。传统深度相机受制于光学物理特性,在面对透明或高反光材质时,往往无法接收有效回波,导致深度图出现数据丢失或产生噪声。
针对这一行业共性难题,蚂蚁灵波科技研发了“掩码深度建模”(Masked Depth Modeling,MDM)技术,并依托奥比中光 Gemini330系列双目3D相机进行RGB-Depth数据采集与效果验证。当深度数据出现缺失或异常时,LingBot-Depth模型能够融合彩色图像(RGB)中的纹理、轮廓及环境上下文信息,对缺失区域进行推断与补全,输出完整、致密、边缘更清晰的三维深度图,显著提升消费级深度相机对高难物体的处理效果。
2025年以来,蚂蚁集团加速人工智能布局,已发布AI医疗管家阿福、通用AI助手灵光,布局具身智能灵波科技,蚂蚁百灵大模型也跻身了万亿参数模型阵营。蚂蚁集团方面透露,本周蚂蚁灵波还将陆续开源多款具身智能方向模型。
上一篇:Kimi发布并开源K2.5模型
下一篇:中国惠普AI智创中心正式落成