首个为具身智能而生的大规模强化学习框架RLinf重磅开源
创始人
2025-09-01 12:16:33

钛媒体App 9月1日消息,清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf,其为首个面向具身智能的“渲训推一体化”大规模强化学习框架。RLinf的系统可以抽象为用户层(统一编程接口)、任务层(多后端集成方案)、执行层(灵活执行模式)、调度层(自动化调度)、通信层(自适应通信)和硬件层(异构硬件)6大层级。相比其他框架的分离式执行模式,RLinf提出的混合式执行模式,在具身智能训练场景下实现了超120%的系统提速,VLA模型涨幅40%-60%。同时,RLinf高度灵活、可扩展的设计使其可快速应用于其他任务,所训练的1.5B和7B数学推理大模型在AIME24、AIME25和GPQA-diamond数据集上取得SOTA。(广角观察)

相关内容

热门资讯

玩家攻略科普:“新道游到底是不... 玩家攻略科普:“新道游到底是不是挂”[必胜开挂神器]您好:新道游这款游戏可以开挂,确实是有挂的,需要...
玩家攻略科普:“胡一把麻将有挂... 您好:胡一把麻将这款游戏可以开挂,确实是有挂的,需要了解加客服微信【9752949】很多玩家在这款游...
今日重大通报:“六六棋牌怎么开... 今日重大通报:“六六棋牌怎么开挂”[太坑了果然有挂]亲,六六棋牌这个游戏其实有挂的,确实是有挂的,需...
玩家分享攻略:“新奇玩乐开挂器... 玩家分享攻略:“新奇玩乐开挂器”[透视曝光猫腻]亲.新奇玩乐这款游戏是可以开挂的,确实是有挂的,通过...
今日重大发现:“飞鹰互娱牛牛真... 您好:飞鹰互娱牛牛这款游戏可以开挂,确实是有挂的,需要了解加客服微信【4282891】很多玩家在这款...