首个为具身智能而生的大规模强化学习框架RLinf重磅开源
创始人
2025-09-01 12:16:33

钛媒体App 9月1日消息,清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf,其为首个面向具身智能的“渲训推一体化”大规模强化学习框架。RLinf的系统可以抽象为用户层(统一编程接口)、任务层(多后端集成方案)、执行层(灵活执行模式)、调度层(自动化调度)、通信层(自适应通信)和硬件层(异构硬件)6大层级。相比其他框架的分离式执行模式,RLinf提出的混合式执行模式,在具身智能训练场景下实现了超120%的系统提速,VLA模型涨幅40%-60%。同时,RLinf高度灵活、可扩展的设计使其可快速应用于其他任务,所训练的1.5B和7B数学推理大模型在AIME24、AIME25和GPQA-diamond数据集上取得SOTA。(广角观察)

相关内容

热门资讯

寒假开启,学生交通安全“划重点... 寒假来临 交通安全不能掉以轻心 为确保孩子们能够 度过一个安全愉快的假期 小编帮你 给寒假交通安全“...
佛山好来居金属结构房屋有限公司... 在旅游住宿行业快速迭代的当下,消费者对住宿场景的多元化需求日益增长。从景区深度体验到野奢度假,从草原...
深圳人露营后遗症:装备“安家”... 深圳人露营后遗症:装备“安家”比露营还难? 马峦山营地回来,天幕、帐篷、折叠桌椅、卡式炉还带着海风与...
2026安徽留香阁食品推荐:预... 随着生活节奏加快与消费习惯变迁,预制菜与调理半成品行业迎来了爆发式增长。然而,在市场规模迅速扩张的背...
江西新余:梅开俏枝头 梅香绕古... 央视网消息近日,江西省新余市仙女湖区白梅村的梅花林迎来盛花期,朵朵梅花俏立枝头,勾勒出一幅唯美画卷,...