新智慧报告主编:桃子很困 【新智慧介绍】介绍最强大的AI代理编程模型,GPT-5.2-Codex!上下文感知压缩、更强大的远程任务处理以及对网络安全的理解。 GPT-5.2-法典,午夜突袭!它是 OpenAI 迄今为止最强大的 AI 代理编程模型,专为复杂的现实世界软件工程而设计。顾名思义,GPT-5.2-Codex 基于 GPT-5.2 的更优化版本。它对许多功能进行了重大改进: · 上下文压缩以提高长期任务吞吐量 · 重构和迁移等大型代码更改期间的性能改进 · 原生 Windows 环境中编程能力的显着改进 · 更强的网络安全功能 Ultraman 声称“OpenAI”已经在使用它并取得了非常好的效果。在基准测试中,GPT-5.2-Codex 在软件性能方面优于 5.1-Codex-Max、GPT-5.2 和 GPT-5.1。工程和终点测试。 OpenAI博客多次强调GPT-5.2-Codex在网络安全方面达到了有史以来的最高水平。上周,一名安全研究人员使用 GPT-5.1-Codex-Max+Codex CLI 直接发现了 React 中的一个漏洞,导致源代码泄露。从今天开始,GPT-5.2-Codex 可供所有付费用户使用,API 将在未来几周内推出。 GPT-5.2-Codex 编程正在激增,并且可能会继续运行很长一段时间。新的GPT-5.2-Codex AI智能代理编程可以用一个词来概括:“强强联合”。除了继承了GPT-5.2原本擅长的“专业业务处理能力”之外,还拥有AG编程AI实体和终端操作。我还了解了 5.1-Codex-Max 的功能。因此,进步是非常真实的,在长上下文理解、工具调用、事实准确性、本机上下文压缩方面有了显着改进。n 等等。因此,GPT-5.2-Codex 可以稳定支持长时间运行的调度任务并在推理过程中节省令牌。为了进行专业的行业基准测试,5.2-Codex 更新了 SWE-Bench Pro 和 Terminal-Bench 2.0 中的 SOTA。与 5.1-Codex 相比,性能提高约 6%。这两个测试专门用于评估模型在真实设备环境中处理各种任务的能力。同时,原生Windows环境下的代理调度性能也得到了显着提升,进一步扩展了GPT-5.1-Codex-Max引入的功能。这些改进使 Codex 能够长时间处理大型代码库,并始终保持完整的上下文。换句话说,如果您有大规模重构、代码迁移或功能开发等复杂任务,您一定可以使用 GPT-5.2-Codex 来完成。 ——即使你的计划中途调整或失败,你也可以继续迭代而不会迷失方向。不仅是帽子,GPT-5.2-Codex的“愿景”更加强大。编程时,只需向我们发送屏幕截图、技术图表、图表和各种用户界面,以帮助我们更准确地理解您的编程。更强大的是能够直接读取设计稿并快速将其转化为可执行的功能原型。同时,开发者可以与Codex合作,逐步完善这些原型,直到可以正式使用。人工智能凭借三大进步,“彻底改变”了现实世界。 OpenAI 的核心网络安全评估清楚地表明“随着时间的推移,能力呈指数级提高”。假设每一代模型都有潜力实现“就绪框架”中定义的“高”级别网络安全功能。然而,GPT-5.2-Codex 尚未达到这个水平。那么 OpenAI 的代理编程模型在现实世界中是如何运作的呢?一周内发现React高危漏洞 12月11日,React团队发现了服务器组件中的三个安全漏洞。反应。因此,Stripe 旗下 Privy 公司的首席安全工程师 AAndrew MacPherson 决定利用这个漏洞来“测试”当前 AI 模型的有效性。使用GPT-5.1-Codex-Max+Codex CLI等编程代理。没想到,在复制和调查漏洞的过程中,他发现了React的一个重大漏洞。具体实践过程如下。我首先尝试了几种零样本学习分析,让模型直接查找补丁并确定要修复哪些类型的漏洞,但无济于事。此后,他开始更频繁地重复指示。当这些方法仍然不起作用时,他指导 Codex 遵循标准的防御安全程序:设置本地测试环境,分析潜在的攻击面,并使用模糊测试将异常输入注入系统。在尝试重现的过程中在 React2Shell 的原始问题中,Codex 发现了值得进一步调查的异常行为。最终,这一过程导致一个以前未知的漏洞被发现,并在短短一周内负责任地向 React 团队披露。这个案例清楚地展示了先进的人工智能系统如何能够显着加速现实世界中广泛使用的软件的防御安全研究。网友对开发者进行了测试,尝试用GP T-5.2-Codex创建一个模拟道路上车辆和交通灯行为的程序,但失败了。 不过,也有人认为它具有与 Gemini 3 Flash 和 Pro 一样精美的动画效果。 GPT-5.2-Codex 在《反恐精英》一代游戏中表现出了出色的性能。综上所述,OpenAI认为GPT-5.2-Codex的发布是AI在现实世界软件开发和安全网络领域的又一大进步。这使得开发人员能够轻松处理复杂且耗时的任务ile 改进对网络安全研究的工具支持。参考资料:https://openai.com/index/introtaining-gpt-5-2-codex/ https://openai.com/index/gpt-5-2-codex-system-card/ 秒级追踪ASI ⭐点赞、转发、观看一键观看⭐点亮星星拦截新智元快推!
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。