
Altman称,模型对收集安然将产生净收益,我们正处于“真实影响阶段”,正开端摸索用于防御性网安工作的可托拜访筹划。OpenAI在进行邀请专业人员的可托拜访筹划试点。
在宣布GPT-5.2系列模型一周后,OpenAI再次出手,美东时光18日周四推出基于GPT-5.2的新一代Codex模型GPT-5.2-Codex,号称最先辈的智能体编码模型,聚焦专业软件工程和防御性收集安然,进一步巩固其在AI编程范畴对GoogleGemini的竞争优势。
OpenAI特别强调GPT-5.2-Codex在收集安然方面的明显晋升。CEO Sam Altman提到,本月早些时刻,一名安然研究人员应用上一代模型GPT-5.1-Codex-Max就发明并负义务地披露了React中可能导致源代码裸露的马脚。OpenAI方面认为,新模型尚未达到“高”级别收集安然才能,但公司正在为将来模型跨越这一门槛做预备。
OpenAI表示,GPT-5.2-Codex周四当天在所有Codex界面向付费ChatGPT用户宣布,正在尽力在将来几周内安然地为API用户启用拜访。该司筹划经由过程慢慢推出、安排与保护办法相结合以及与安然社区密切合作的方法,在最大年夜化防御影响的同时降低滥用风险。
一个真实案例凸显了新模型的防御性收集安然潜力。12月11日,React团队颁布了三个影响应用React办事器组件构建的应用法度榜样的安然马脚。Stripe旗下Privy公司首席安然工程师Andrew MacPherson在应用GPT-5.1-Codex-Max与Codex CLI研究另一个名为React2Shell的严重马脚时,经由过程引导Codex履行标准防御性安然工作流程,不测发清楚明了这些此前未知的马脚并负义务地向React团队披露。
本周四的宣布延续了OpenAI在AI编程范畴的进攻态势。
上周宣布GPT-5.2时,OpenAI就援引编码始创公司的用户体验称,该模型拥有“最先辈的智能体编码机能”,还披露GPT-5.2的Thinking版本在SWE编码才能测试中创下汗青最高分,成为OpenAI首个机能达到或跨越人类专家程度的模型。此举被视为对GoogleGemini 3在编码和推理才能上获得好评的直接回应。
编码机能再进级,针对大年夜范围实疆场景优化
GPT-5.2-Codex是GPT-5.2的优化版本,专门针对Codex中的智能体编码进行了强化。OpenAI表示,新模型在三个关键范畴实现改进:经由过程高低文紧缩晋升长周期工作才能,在重构和迁徙等项目级义务上表示更强,以及在Windows情况中机能改良。
在基准测试中,GPT-5.2-Codex在SWE-Bench Pro测试中精确率达到56.4%,高于GPT-5.2的55.6%和GPT-5.1的50.8%。在Terminal-Bench 2.0测试中,GPT-5.2-Codex精确率为64.0%,GPT-5.2为62.2%,GPT-5.1为58.1%。SWE-Bench Pro请求模型在给定代码库中生成补丁以解决实际软件工程义务,Terminal-Bench 2.0则测试AI智能体在真实终端情况中完成编译代码、练习模型和设置办事器等义务的才能。
OpenAI介绍,GPT-5.2-Codex在编码机能、收集安然才能和长周期义务处理上均实现冲破。GPT-5.2-Codex在SWE-Bench Pro测试中精确率达到56.4%,在Terminal-Bench 2.0测试中达到64.0%,刷新两项基准测试记载。该模型已于宣布当天在所有Codex界面向付费ChatGPT用户开放,API用户接入正在推动中。
GPT-5.2-Codex在长高低文懂得、靠得住的对象调用、改进的真实性和原生紧缩方面均有晋升,使其成为长时光编码义务中更靠得住的合作伙伴,同时在推理过程中保持token效力。更强的视觉机能使GPT-5.2-Codex可以或许更精确地解读屏幕截图、技巧图表和用户界面,可以将设计稿快速转化为功能原型。

OpenAI表示,凭借这些改进,Codex可以或许在大年夜型代码库中进行长时光工作,保持完全高低文,更靠得住地完成大年夜范围重构、代码迁徙和功能构建等复杂义务,即使筹划改变或测验测验掉败也不会掉去追踪。
收集安然才能大年夜幅跃升,为跨越“高”级别门槛做预备
收集安然成为GPT-5.2-Codex的另一个重点冲破范畴。OpenAI在核心收集安然评估中不雅察到,从GPT-5-Codex开端才能出现急剧跳跃,GPT-5.1-Codex-Max又实现一次大年夜幅晋升,如今GPT-5.2-Codex完成第三次跳跃。
该筹划最初仅向经由审查的安然专业人员和具有明白专业收集安然用例的组织开放。相符前提的介入者将获得应用OpenAI最强大年夜模型进行防御性工作的权限,使其可以或许开展合法的双重用处工作,如马脚研究或授权的红队测试,同时清除安然团队在模仿威逼行动者、分析恶意软件或压力测试关键基本举措措施时可能碰到的限制。
在专业夺旗赛评估中,GPT-5.2-Codex展示出解决须要专业级收集安然技能的高等多步调真实挑衅的才能。据OpenAI的预备框架评估,GPT-5.2-Codex固然尚未达到“高”级别收集安然才能,但该公司估计将来AI模型将持续沿着这一轨迹成长,正在按照每个新模型都可能达到“高”级其余标准进行筹划和评估。
Altman在社交平台上披露:“上周,一名应用我们上一代(Codex)模型的安然研究人员发明并披露了React中可能导致源代码裸露的马脚。我信赖这些模型对收集安然将产生净收益,但跟着它们的改进,我们正处于‘真实影响阶段’。”

推出可托拜访筹划,为专业安然人员供给特别权限
为均衡才能晋升与安然风险,OpenAI针对收集安然才能的加强在模型层面和产品层面都增长了额外保护办法,包含针对有害义务和提示注入的专门安然练习、智能体沙箱以及可设备的收集拜访。同时,公司正在进行仅限邀请的可托拜访筹划试点。
Altman在X上表示:“我们正在开端摸索用于防御性收集安然工作的可托拜访筹划。”他还在另一条帖子中为Codex雇用打告白:“Codex变得极其出色,并将快速改进。假如你想赞助它在来岁变得好100倍,团队正在招人。包管有猖狂的冒险,成功的可能性很大年夜。”



发表评论 取消回复