12月12日,蚂蚁集团正式开源了LLaDA2.0系列。LLaDA2.0 包含 MoE 架构的 16B (mini) 和 100B (flash) 两个版本,我们将 Diffusion 模型的参数规模首次扩展到了 100B 量级。此次发布,我们的模型不仅打破了扩散模型难以扩展的固有印象,更在代码、数学和智能体任务上展现出了超越同级自回归(AR)模型的优异性能。
上一篇:[玩家实测教程]德州悟空透明挂辅助下载(透视)查看详细教程(有挂科普)-哔哩哔哩
下一篇:12月12日西部黄金涨6.26%,前海开源金银珠宝混合A基金重仓该股