苹果新AI模型实现端侧GUI智能 性能超大型模型24倍
创始人
2026-02-21 09:20:39

【CNMO科技消息】近日,据外媒报道,苹果研究人员已成功开发出一款名为Ferret-UI Lite的全新设备端人工智能代理。这款轻量级模型能够直接在设备上运行,并根据用户的指令自主与各类应用程序的图形界面进行交互。

据CNMO了解,这项研究是苹果对多模态大语言模型,特别是其Ferret系列模型的持续探索。早在2023年底,苹果就推出了名为“FERRET”的基础模型,旨在让AI理解图像中的特定部分。此后,苹果陆续发布了针对移动用户界面(UI)理解的Ferret-UI及其增强版Ferret-UI 2。这些早期模型虽然功能强大,但模型参数较大,更侧重于在服务器端运行。

此次发布的Ferret-UI Lite则代表了不同的研究方向——高效与轻量化。它是一个仅有30亿参数的变体,其核心目标是在资源有限的设备上(如手机)实现强大的GUI(图形用户界面)代理功能。

研究人员指出,当前大多数GUI代理都依赖大型基础模型,这些模型虽然推理和规划能力强,但体积庞大、计算需求高,难以在设备端流畅运行。为了解决这一矛盾,Ferret-UI Lite通过一系列创新技术,实现了性能与体积的平衡。它采用了实时裁剪与放大技术:模型在初步分析屏幕后,会对其关注的区域进行动态裁剪和放大,再进行二次判断。这有效弥补了小模型处理大量图像信息的局限性。

研究结果显示,尽管体积小巧,Ferret-UI Lite在多个基准测试中的表现,足以匹敌甚至超越参数规模高达其24倍的竞品模型。它尤其擅长处理短期、低层次的操作任务。虽然在涉及多个步骤的复杂交互上表现尚有不足,但作为一款完全运行在设备端的AI代理,它提供了显著优势:所有数据处理都在本地完成,无需上传至云端,极大地提升了用户隐私和数据安全性。

据悉,与之前主要使用iPhone截图进行测试的版本不同,Ferret-UI Lite的训练和评估主要在Android、网页及桌面GUI环境中进行。这或许反映了当前大规模GUI代理测试平台的可获取性现状,但也展示了该模型跨平台应用的潜力。

相关内容

热门资讯

契约立心,技术归元 AI豪华六... 4月17日,以“契约”为主题的归元S技术发布会暨魏牌V9X预售发布会在保定圆满举行。发布会上,魏牌正...
内容打底 + GEO 破圈:房... AI 正重构地产营销链路,普通房产内容营销解决 “说什么、怎么说”,极客问道 GEO 优化解决 “A...
广东时装周开幕,茵曼上演全国首... 4月17日,2026广东时装周-春季在广州市番禺万博时尚广场盛大启幕。国民棉麻女装品牌茵曼以“一路生...
“有了AI,人们却过得越来越累... 文 | 听筒tech 2026年的春天,科技圈的风向变得比以往任何时候都快。 然而,在AI带来前所...
AI争议缠身的网易:《第五人格... 近日,网易旗下人气游戏《第五人格》迎来8周年纪念,4月11日,《第五人格》官宣“象牙塔系列”付费皮肤...