通义Qwen3开源新推理模型:数学超强、代码贼溜,上下文可拓展至100万
创始人
2025-07-31 09:11:52

凤凰网科技讯 7月31日,通义千问团队在公众平台发布消息,Qwen3-30B实现重大升级,全新推理模型Qwen3-30B-A3B-Thinking-2507正式发布。新模型拓展了思考能力,提升了推理的质量和深度,是一个更睿智、更敏捷、更全能的新推理模型。

新模型在推理能力、通用能力及上下文长度上有了显著提升,新模型在聚焦数学能力的AIME25评测中获85.0分,在代码能力测试LiveCodeBench v6中得分66.0,两项核心推理能力均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著;在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,Qwen3-30B-A3B-Thinking-2507均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);原生支持256K tokens,可扩展至1M tokens。

值得一提的是,新模型的思考长度增加,团队建议在处理高度复杂的推理任务时,设置更长的思考预算,可以充分发挥新模型潜力。

目前Qwen3-30B-A3B-Thinking-2507已在魔搭社区、HuggingFace上开源,Qwen Chat同步上线。

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

相关内容

热门资讯

盘点2026年好用的童趣风格温... 当亲子度假成为家庭出游的核心刚需,不少父母都陷入了相似的困境:想趁假期泡温泉放松身心,却要全程盯顾精...
伊犁亲子游超全攻略!7天6晚带... 每年6-8月,伊犁就变成了童话世界。无边无际的草原上开满野花,雪山融水汇成清澈的溪流,成群的牛羊在蓝...
丹东:樱韵花开,亲子寻芳 春和景明,连日来丹东迎来最美樱花季。 4月17日,丹东市第三幼儿园“樱韵花开·寻迹花神”第十一届樱花...
守护成长 童心同行—— 翠云轩... “守护成长 童心同行” 就在 4 月 18 日下午,翠云轩小区迎来了第二场别开生面的儿童性教育主题...
2026年新疆奢华亲子游推荐,... 在2026年,选择新疆作为奢华亲子游的家庭越来越多。这里有丰富的自然风光与独特的文化活动,吸引着各个...