OpenAI推出GPT-5.3-Codex:基准测试创新高,成开发者协作新利器
创始人
2026-02-07 11:18:59

OpenAI 正式推出新一代编程模型 GPT-5.3-Codex,宣称其在编程能力与开发者协作体验上实现重大突破。该模型在多项基准测试中刷新纪录,同时支持任务执行过程中的实时交互,标志着人工智能从单一编程工具向通用计算机协作者转型。

在性能测试中,GPT-5.3-Codex展现出显著提升。SWE-bench Pro(公开版)测试显示其得分达56.8%,较前代56.4%微幅增长;Terminal-Bench 2.0测试中,成绩从64.0%跃升至77.3%;最引人注目的是OSWorld-Verified智能体计算机操作测试,得分从38.2%飙升至64.7%,证明其在复杂系统环境中的操作能力实现质的飞跃。官方特别强调,新模型运行速度较GPT-5.2-Codex提升25%,在保持精度的同时显著优化效率。

开发者协作模式迎来革命性升级。新模型支持用户在任务执行过程中随时介入引导,通过高频进度更新实现双向对话。开发者可实时提问、调整方案或修正方向,系统能够完整保留上下文信息,避免传统交互中常见的断层问题。这种设计使Codex从被动执行工具转变为具备主动协作能力的智能伙伴,大幅降低应用开发的技术门槛。

技术实现层面,OpenAI重构了模型的任务处理架构。通过动态上下文管理机制,系统在保持长序列记忆能力的同时,实现多轮交互的精准响应。在代码生成测试中,新模型展现更强的环境适应能力,能够根据开发者反馈动态优化输出策略,在复杂项目开发中表现出更强的稳定性。

产品落地方面,GPT-5.3-Codex已全面开放给ChatGPT付费用户,覆盖Plus、Team及Enterprise等订阅层级。用户可通过Codex专用应用、命令行工具、IDE扩展插件及网页端四种方式访问,API接口计划于近期上线。这种多端协同的部署策略,使不同技术背景的开发者都能找到适合的接入方式。

行业观察人士指出,该模型的突破在于重新定义了AI与开发者的协作边界。通过将编程任务分解为可交互的模块化流程,GPT-5.3-Codex使非专业开发者也能参与复杂系统开发,这可能引发软件开发领域的范式转变。随着API接口的开放,预计将催生大量基于该模型的垂直领域应用。

相关内容

热门资讯

深耕细作·惠州行五洲·露营装备... 当露营从“诗和远方”变成周末常态,消费者的眼光也越来越“刁”。他们不再满足于“能住”,而是追求“好住...
帐篷选的好,露营受罪少,运良两... 帐篷选的好,露营受罪少,运良两款帐篷应该怎么选 运良越野 露营 帐篷 户外露营 户外装备
用这个帐篷过夜露营,可得小心了... 用这个帐篷过夜露营,可得小心了 帐篷露营 bivvybag
特价68丨6.07周日【三角山... 【三角山丨从化十登】千米山之恋 从化第七峰三角山 广州附近十座千米山峰你都去过吗? 这次跟随我们的...
原创 六... 一想起儿童节出游,脑子里是不是马上浮现出:景区门口望不到头的长队、餐厅里高到离谱的儿童套餐、游乐场里...