阶跃星辰Step3-VL-10B开源:小参数量实现大突破,多模态推理下沉至多终端
创始人
2026-01-29 19:21:32

阶跃星辰近日正式宣布,其研发的多模态模型Step3-VL-10B已实现开源。这款模型以仅10B的参数量,在视觉感知、逻辑推理、数学竞赛及通用对话等多个基准测试中,均展现出与同规模模型相比的领先性能,达到SOTA(State-of-the-Art)水平。尤为引人注目的是,Step3-VL-10B成功突破了参数量与智能水平难以兼顾的技术瓶颈,为行业带来了新的突破。

在多项权威评测中,Step3-VL-10B的表现令人瞩目。它不仅与参数量大10至20倍的开源模型(如GLM-4.6V 106B-A12B、Qwen3-VL-Thinking 235B-A22B)不相上下,甚至在某些方面超越了这些模型。同时,它还展现出了与顶级闭源旗舰模型(如Gemini 2.5 Pro、Seed-1.5-VL)相媲美的实力,进一步证明了其技术的先进性和实用性。

Step3-VL-10B的开源,为多模态推理技术的普及和应用开辟了新的道路。基于这一小而强的模型底座,原本只能在云端运行的复杂多模态推理任务,如GUI操作、复杂文档解析以及高精度计数等,现在可以轻松下沉到手机、电脑甚至工业嵌入式设备中。这不仅大大降低了技术应用的门槛,也为更多行业和场景带来了智能化升级的可能。

值得一提的是,阶跃星辰此次不仅开源了Base模型,还同时开源了Thinking模型。这一举措无疑将进一步推动多模态模型技术的发展和应用,为行业内的研究者、开发者提供更多选择和可能性。

来源:https://www.cnu.com.cn/industry/202601/150376.html

相关内容

热门资讯

万象山水:在湄公河的呼吸里,慢... 如果你第一次来到万象,可能会有一点不适应。 这里没有高楼林立的压迫感,也没有车水马龙的喧哗。时间仿佛...
小众旅游美景怎么找?川西秘境这... 真正称得上旅游美景之处,绝不仅仅限于由视觉那一层面所带来的那种震撼感受,它所蕴含的价值那是极为深刻且...
原创 李... 谁能想到,韩国总统李在明的新年第一枪,不是打向惯例中的华盛顿或东京,而是瞄准了北京?更让人没想到的是...
江苏去年旅游业发展怎么样?今年... 交汇点讯 1月29日,江苏省旅游委员会全体会议在南京召开,会议回顾了2025年全省旅游业发展情况,并...
中国AI,最新趋势来了! 新华深读|2026年中国AI发展趋势前瞻 人工智能(AI)企业数量超过6000家,AI核心产业规模预...