源Yuan 3.0 Flash基础大模型开源
创始人
2025-12-31 12:17:32

钛媒体App 12月31日消息,YuanLab.ai 团队正式开源发布 源Yuan3.0 Flash 多模态基础大模型。Yuan3.0 Flash 是一款 40B 参数规模的多模态基础大模型,采用稀疏混合专家(MoE)架构,单次推理仅激活约 3.7B 参数。Yuan3.0 Flash创新性地提出和采用了强化学习训练方法(RAPO),通过反思抑制奖励机制(RIRM),从训练层面引导模型减少无效反思,在提升推理准确性的同时,大幅压缩了推理过程的 token 消耗,显著降低算力成本。(广角观察)

相关内容

热门资讯

Cloudflare推出智能体... Cloudflare这家知名的安全和内容分发网络公司推出了一项名为"智能体专用Markdown"的新...
AI热潮推动RISC-V挑战A... RISC-V标准已经发展成熟,与经过长期验证但价格昂贵的Arm和x86处理器相比,性能差距已基本消失...
Atlassian裁员1600... Atlassian将裁减约10%的全球员工,约1600个岗位,这家协作软件制造商正将资本重新投向人工...
阿里成立ATH,以Token重... 3月16 日,阿里巴巴集团CEO吴泳铭宣布了一项组织调整:成立Alibaba Token Hub(简...
软硬一体大整合,大厂决战AI硬... 请输入图说 在AI大厂的全面博弈中,AI硬件承载“入口+数据+应用”三位一体的价值。 采写 /马十四...