通义全尺寸GUI智能体基座模型MAI-UI开源:原生具备用户交互能力
创始人
2025-12-29 15:17:42

12月29日,通义实验室多模态交互团队近日宣布开源其通用GUI智能体基座模型MAI-UI。该模型旨在通过理解屏幕界面并执行操作,完成跨应用、多步骤的复杂任务,例如查询车票、在通讯群组同步信息、调整会议安排等。

据介绍,MAI-UI具备在指令不明确时主动向用户提问澄清的能力,并支持通过调用结构化工具(如地图搜索、路线规划API)来替代繁琐的界面点击操作,以提高任务执行的成功率与效率。该模型家族包含2B、8B等不同参数规模的版本,其中2B与8B模型已开源。

根据团队公布的评测数据,MAI-UI在ScreenSpot-Pro、AndroidWorld等多个GUI理解与任务执行基准测试中取得了当前领先的成绩。该模型适用于手机、电脑等不同操作系统的界面交互场景。

【来源:凤凰网科技】

相关内容

热门资讯

[揭秘]“美猴王牛牛开挂器”[... 您好:美猴王牛牛这款游戏可以开挂,确实是有挂的,需要了解加客服微信【4282891】很多玩家在这款游...
玩家攻略科普“冲关游戏怎么装挂... 网上科普关于“冲关游戏有没有挂”话题很是火热,小编也是针对冲关游戏作*弊开挂的方法以及开挂对应的知识...
今日消息“六瓣数字消辅助开挂神... 有 亲,根据资深记者爆料六瓣数字消是可以开挂的,确实有挂(咨询软件无需打...
[今日要闻]“小乐红中麻将有挂... 小乐红中麻将怎么下挂是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加...
[最新攻略]“新战皇牛牛开挂神... 您好:新战皇牛牛这款游戏可以开挂,确实是有挂的,需要了解加客服微信【9752949】很多玩家在这款游...