公司情报专家《财经涂鸦》获悉,近日,京东探索研究院宣布正式开源自研JoyAI-Image-Edit图像模型,从此前的平面修图升级为三维空间重塑,开发者可直接拿来生成应用。
JoyAI-Image-Edit深度贴合真实世界空间规律,从空间位置关系、多视角一致性、相机感知到场景推理等维度全面建模,实现了相机坐标视角变换、物体空间位移旋转、几何结构精准控制等多项空间编辑技术突破,将空间认知能力深度融入文本与图像生成流程,搭建了完整的空间理解数据与任务体系。
该模型打破了AI“理解图像”和“生成图像” 的壁垒,让AI不仅能生成逼真的图像外观,更能精准理解图像背后的空间结构,在编辑过程中稳定保持主体形象与场景结构完整,多视角空间布局高度一致,彻底解决传统模型空间逻辑混乱的行业难题。
具体而言,JoyAI-Image-Edit具备三大辨识度极高的空间编辑能力。
一是视角变换。用户可通过自然语言指定相机的偏航角、俯仰角及缩放程度,模型在保持场景几何一致性的前提下生成新视角图像;
二是空间漫游。支持连续的视角移动,生成在空间中逻辑连贯的多视角图像序列,类似于在三维场景中“走动”;
三是物体空间关系操控。在保持场景整体结构稳定的前提下,对特定物体进行位移、缩放等空间变换,同时确保遮挡与光影关系自然合理。
在实现空间级突破的同时,JoyAI-Image-Edit全面兼容15类通用编辑能力,深度覆盖内容创作的高频需求。无论是物体的替换、删除、添加,还是整体风格迁移、细节精修等操作,模型均实现了高性能覆盖。
凭借领先的空间理解与编辑能力,JoyAI-Image-Edit模型突破场景限制,可广泛应用于电商内容生产、创意设计制作、智能图像处理、3D模型重建、具身智能视觉感知等多元领域,大幅提升AI图像技术在复杂空间场景中的适配性与实用性。尤其是在具身智能领域,空间理解能力是机器人“理解世界”的核心基础,而该模型的推出,也为相关技术研发提供了关键的底层能力。
此次JoyAI-Image-Edit的开源,是京东在AI多模态模型领域的重要布局,更是让AI图像编辑实现了从平面到空间的大跨越。未来该模型还将持续落地更多场景,不断探索空间智能落地价值。
过去一个月内,京东不仅宣布首次开源基础大模型JoyAI-LLM Flash,打破大模型参数内卷的困局,京东云“龙虾”系列产品亦集体上线,token调用量周环比增长高达455%。
此外,京东还宣布将建成全球最大的具身数据采集中心,并将依托超级供应链优势,持续推动AI与产业深度融合。