Ai2发布开源AI开发智能体系列 可适应任意代码库
创始人
2026-01-28 23:20:30

人工智能正在快速发展,改变着开发者编写代码的方式。随着代码越来越快地流入GitHub等代码仓库,机器智能现在与人类开发者并肩工作。

根据艾伦人工智能研究所的观点,编码智能体面临一个根本性问题:大多数都是封闭的,训练成本昂贵,难以研究或适应私有代码库。为了解决这个问题,该公司今日发布了Ai2开放编码智能体系列,让构建和训练定制编码智能体变得简单易用。

SERA智能体的核心能力

该系列的首个发布版本名为SERA(软验证高效仓库智能体),能够解决超过55%的SWE-Bench Verified基准测试问题,这一表现超越了同等规模的先前开源模型。

SERA的每个组件都是开源的,包括模型、代码以及与Anthropic公司Claude Code的集成。它只需一行代码即可启动,用户无需任何大语言模型训练经验。

SERA提供两个版本:SERA-32B和SERA-8B。前者是320亿参数的模型,在SWE-bench Verified基准测试中表现强劲,在标准设置下能解决约55%的问题,超越了大多数开源模型如Qwen3-Coder,以及在相同推理设置下的封闭模型,包括Mistral3的Devstral Small 2。后者是80亿参数的模型,能解决29.4%的SWE-Bench Verified问题,而强化学习基线模型仅为9.4%。

技术突破与成本优势

Ai2使用专门的模型,在每个代码库的8000个合成轨迹上进行训练,始终能够匹配甚至超越作为教师模型的GLM-4.5-Air的性能,后者拥有超过1000亿个参数。

Ai2表示,一个特别有希望的结果是,较小的完全开源模型能够复制甚至超越更强大"教师"编码智能体的性能。通过在320亿参数级别针对特定代码库的有利专业化和微调,SERA能够以三分之一的规模超越一些1000亿参数的通用模型。在部署时,这意味着更小的内存占用和更低的计算需求,从而大大降低成本,而不会牺牲质量。

在商品云硬件上重现Ai2主要实验结果的总成本约为400美元,比目前市场上许多现有方法便宜约100倍。

易用性与未来发展

该公司解释说,此次发布包含开发者和研究人员快速上手所需的一切,以便重现、测试和基于SERA进行构建:基于两行代码的轻量级部署,用于启动、部署和推理。还有设置脚本和推理优化,使SERA能够与Claude Code协同工作。

Ai2表示,打算使用相同的方法来不断改进并扩展到更大的骨干网络,但强调当前的流程已经足够便宜和可行,任何人都可以运行、定制和迭代。

Q&A

Q1:SERA智能体是什么?它有什么特殊能力?

A:SERA(软验证高效仓库智能体)是Ai2发布的开源AI编码智能体,能够解决超过55%的SWE-Bench Verified基准测试问题,超越了同等规模的先前开源模型。它的特殊之处在于完全开源,只需一行代码即可启动,用户无需大语言模型训练经验。

Q2:SERA有哪些版本?性能如何?

A:SERA提供两个版本:SERA-32B(320亿参数)和SERA-8B(80亿参数)。SERA-32B在标准设置下能解决约55%的问题,超越了大多数开源和封闭模型。SERA-8B能解决29.4%的问题,远超强化学习基线模型的9.4%表现。

Q3:使用SERA的成本如何?

A:SERA的成本非常低廉。在商品云硬件上重现主要实验结果的总成本约为400美元,比目前市场上许多现有方法便宜约100倍。由于模型规模优化,部署时内存占用更小,计算需求更低,大大降低了使用成本。

相关内容

热门资讯

原创 黄... 黄磊和孙莉带着他们的二女儿以及刚出生的三胎儿子,一家四口悠闲地游玩广东。自从嫁入黄磊的家庭后,孙莉几...
【安庆新闻联播】春茶采摘正当时... 安庆各地立足生态资源禀赋和茶产业基础,以茶旅融合为主线,推动生态优势向产业优势、发展优势转化,走出一...
南京位列五一酒店预订热门目的地... 近日,同程旅行发布的《2026年五一旅行趋势报告》显示,南京位列五一假期酒店预订热门目的地TOP2,...
旅行是疲惫生活的解药:2026... 旅行,是我们给自己的温柔奖励 会不会你也常常有感觉到些许疲惫的时候呢,日子被工作以及那些琐碎的事情给...
暑假带孩子来伊犁研学?这份哈萨... 暑假带孩子来伊犁研学?这份哈萨克非遗与草原生态深度游攻略请收好! 每年暑假,都有许多像您一样的家长,...