首个为具身智能而生的大规模强化学习框架RLinf重磅开源
创始人
2025-09-01 12:16:33

钛媒体App 9月1日消息,清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf,其为首个面向具身智能的“渲训推一体化”大规模强化学习框架。RLinf的系统可以抽象为用户层(统一编程接口)、任务层(多后端集成方案)、执行层(灵活执行模式)、调度层(自动化调度)、通信层(自适应通信)和硬件层(异构硬件)6大层级。相比其他框架的分离式执行模式,RLinf提出的混合式执行模式,在具身智能训练场景下实现了超120%的系统提速,VLA模型涨幅40%-60%。同时,RLinf高度灵活、可扩展的设计使其可快速应用于其他任务,所训练的1.5B和7B数学推理大模型在AIME24、AIME25和GPQA-diamond数据集上取得SOTA。(广角观察)

相关内容

热门资讯

智能体发现Linux打印系统C... 在CUPS安全漏洞的最新发现中,一名安全研究人员和他的漏洞猎取智能体团队发现了两个可以链式利用的安全...
2026最新,6款Macos录... 在工作、学习以及娱乐创作的时候,屏幕录制软件已成为电脑必备的Macos录屏工具。我们经常有把操作过程...
原创 霍... 香港的复活节假期与清明节重叠,五天的长假成了不少港人北上的好时机。有人趁机回乡扫墓,也有不少人选择在...
新手露营_疑难杂症 风绳用法2... 新手露营_疑难杂症 风绳用法2,怎么解,怎么用调节扣。露营帐篷 天幕 风绳 户外装备 户外用品
新手露营~疑难杂症 风绳是怎么... 新手露营~疑难杂症 风绳是怎么固定怎么绑的?我来教你,一学就会!户外装备 帐篷 天幕 风绳风绳结打法