通义全尺寸GUI智能体基座模型MAI-UI开源：原生具备用户交互能力_学习资源_易库知识网

通义全尺寸GUI智能体基座模型MAI-UI开源：原生具备用户交互能力

创始人

2025-12-29 15:17:42

12月29日，通义实验室多模态交互团队近日宣布开源其通用GUI智能体基座模型MAI-UI。该模型旨在通过理解屏幕界面并执行操作，完成跨应用、多步骤的复杂任务，例如查询车票、在通讯群组同步信息、调整会议安排等。

据介绍，MAI-UI具备在指令不明确时主动向用户提问澄清的能力，并支持通过调用结构化工具（如地图搜索、路线规划API）来替代繁琐的界面点击操作，以提高任务执行的成功率与效率。该模型家族包含2B、8B等不同参数规模的版本，其中2B与8B模型已开源。

根据团队公布的评测数据，MAI-UI在ScreenSpot-Pro、AndroidWorld等多个GUI理解与任务执行基准测试中取得了当前领先的成绩。该模型适用于手机、电脑等不同操作系统的界面交互场景。

【来源：凤凰网科技】

上一篇：辅助使用教程“(WePoKer)辅助挂APP(透明挂)”辅助挂下载”(最新开挂教程)

下一篇：辅助使用教程“WePoKe辅助挂APP(透明挂)”辅助挂下载”(最新开挂教程)

相关内容

热门资讯

中国AI产业的三大优势（下）文 | 盘古智库 3. AI应用市场：人口红利与场景创新的双重驱动 AI产业的价值最终要在应用端兑现...

罗湖开源鸿蒙生态创新中心揭牌，... 与华为终端云服务签署全域鸿蒙场景共建战略协议、区域鸿蒙生态品牌“罗开鸿”同步发布……近日，深圳市罗湖...

华泰证券：业绩期关注AI、涨价... 每经AI快讯，华泰证券7月15日研报认为，业绩期关注AI、涨价、制造三大线索。随着业绩预告密集披露期...

硅谷巨头对簿公堂为中国AI产业... 随着大模型、AI硬件、算力火热发展，产业链陷入白热化竞争，挖角、算法数据泄露、知识产权边界模糊等问题...

苹果洽谈AI模型压缩初创公司P... 观点网讯：7月15日，市场消息显示，苹果正在与硅谷初创公司PrismML进行早期洽谈，评估将其人工智...