消费级显卡可跑!刚刚,阿里Qwen3.5又开源3款新模型
创始人
2026-02-25 18:20:36

机器之心编辑部

刚过完年,阿里又卷起来了。

2 月 25 日,继除夕开源 Qwen3.5-397B-A17B 之后,阿里继续开源千问 3.5 系列模型,而且是一口气开源三款中等规模的新模型,分别是 Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B

此次开源的三款千问 3.5 模型,凭借架构创新和训练突破,均创下中等尺寸模型的性能新高,不仅超越了更大尺寸的上代旗舰模型 Qwen3-235B-A22B 和 Qwen3-VL,更在多榜单表现上均明显优于 GPT-5 mini。

千问 3.5 新模型甚至可直接部署于消费级显卡,对开发者极为友好。目前,基于 Qwen3.5-35B-A3B 的托管模型 Qwen3.5-Flash 已上线阿里云百炼,每百万 Token 输入低至 0.2 元

更小的参数,更强的性能

千问 3.5 模型采用混合注意力机制,结合高稀疏的 MoE 架构创新,并基于更大规模的文本和视觉混合 Token 上训练,新模型以更小的总参数和激活参数量,实现了更大的性能提升。

Qwen3.5-122B-A10B 与 Qwen3.5-35B-A3B,就是这一新范式在中等规模下的最新模型成果,在指令遵循(IFBench)、博士级别推理(GPQA)、数学推理(HMMT 25)、多语言知识(MMMLU)、Agent 工具调用(BFCL v4)、Agentic Coding(SWE-bench Verified)等多个权威榜单上,新模型均超越了远大于其规模的 Qwen3-235B-A22B 模型及 Qwen3-VL,以及 GPT-5 mini、gpt-oss-120b 等模型。

更紧凑的模型,更好的性能,千问 3.5 家族中的首个密集(Dense)模型 Qwen3.5-27B 此次惊艳亮相。

Qwen3.5-27B 同时拥有更强的 Agent 能力和原生多模态能力,在工具调用、搜索、编程等多个 Agent 评测中均超过了 GPT-5 mini,在视觉推理、文本识别和理解、视频推理等多项视觉理解能力榜单中超过了 Qwen3-VL 旗舰模型和 Claude Sonnet 4.5。

Qwen3.5-27B 可运行于单个 GPU,对于本地部署极为友好。

阿里开源再次引爆AI社区

此前,基于 Qwen3.5-397B-A17B 的 Qwen3.5-Plus 模型已上线阿里云百炼,性能媲美 Gemini 3 但 API 价格仅为其 5%,适用于高性能的 AI 编程、Agent 等场景。

此次,百炼上线基于 Qwen3.5-35B-A3B 的 Qwen3.5-Flash,支持 1M 的上下文长度,提供官方的内置工具调用,企业和开发者每百万 Token 输入成本低至 0.2 元。Qwen3.5-Flash 响应速度快、性价比高、门槛低,适合处理工作、生产、生活的日常 AI 任务。

此外,Qwen3.5-35B-A3B 的基座(Base)模型也一并开源。

千问 3.5 的系列开源引发全球 AI 开源社区热议,有开发者指出,这将加速机器人产业的 VLA 模型发展,或将衍生出一批基于 Qwen3.5 的多模态模型。

据了解,除夕开源的 Qwen3.5-397B-A17B 模型已登顶 Hugging Face 全球榜首,截至目前,阿里已开源千问模型超 400 个,全球下载量突破 10 亿次,衍生模型数超 20 万,千问稳居全球第一开源模型

相关内容

热门资讯

原创 谭... 近年来,越来越多的香港明星选择来到内地旅行,探索这片辽阔的土地。尤其是一些知名景点,成了他们常常光顾...
景洪市强化春节假日旅游接待服务... 马年新春佳节,景洪市全力抓好旅游接待服务和安全保障工作,保驾护航“最长春节假期”。 为做足各项准备,...
辽宁春节假期盘点:从年味里看活... 在刚刚过去的马年春节假期里,辽宁迎来了出行热、旅游热、消费热,到处是热气腾腾的新春场景。 春节九天假...
原创 章... 前段时间,汪峰带着女儿醒醒在三亚度假,没想到,章子怡和她的家人也恰巧在三亚度假。其实,来三亚度假的明...
拉萨几月份去最好?避开旺季、风... 拉萨几月份去最好?避开旺季、风景绝佳、人少的秘密月份 很多想来拉萨的朋友都抱着同样的期待:既想看到最...