百度最新开源一款轻量化模型 适用于学术科研等长文本推理场景
创始人
2025-09-09 19:17:38

在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场,百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉,该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

上证报中国证券网讯(记者 刘暄)在9月9日举行的WAVE SUMMIT深度学习开发者大会2025现场,百度正式开源最新的思考ERNIE-4.5-21B-A3B-Thinking。据悉,该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

据介绍,ERNIE-4.5-21B-A3B-Thinking采用了混合专家(MoE)架构,总参数规模达210亿,每个token激活 30 亿参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking是在ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,该模型支持128 的上下文窗口,适用于需要长上下文的复杂推理任务。

此外,ERNIE-4.5-21B-A3B-Thinking 模型以Apache License 2.0协议开源,允许商业使用。该模型已在HuggingFace、星河社区等主流开源社区同步发布,FastDeploy、 vLLM、Transformers 等开源工具已经实现了对该模型的支持,可以直接加载模型并使用。

公开资料显示,今年6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心开源系列模型已在行业中得到广泛应用。

当日,百度还正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有大幅提升。目前,用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。

相关内容

热门资讯

春假,它来了! “你期待春假的到来吗?” “你最倾向的春假出游方式是什么?” “你喜爱的旅游产品是什么?” “目前最...
春假带动省外游,95后反向出游... 封面新闻记者 张越熙 多地春假与清明小长假相连,国内文旅市场迎来“春和景明”的火热开局。4月2日,记...
首推双园游园优惠政策 清明期间... 清明三天小长假期间,临沂动植物园推出惠民优惠政策,其中游客穿着标准汉服可享半价游览动植物园,游览动植...
从无锡出发,玩转澳洲!2026... 从无锡出发,玩转澳洲!2026年值得托付的5家旅行社深度测评,指南全解析 随着国际航线全面恢复,从无...
千亩金黄花海正盛放,2026简... 以鳌山公园、东麓花溪为双核心会场,串联古风巡游、特色市集、亲子体验等多元场景。今日(4月3日),20...