知名 AI 编程辅助工具 Cursor 近日分享了一项内部测试发现:在处理超长程、自主性的编程任务时,OpenAI 最新的 GPT-5.2 模型表现出比 Anthropic 的 Claude Opus4.5 更高的可靠性。为了验证模型能力,Cursor 团队尝试从零开始构建一个功能完备的 Web 浏览器 ,涵盖了 HTML 解析、CSS 布局及自定义 JavaScript 虚拟机等复杂底层架构。
Cursor says it has found OpenAI’s GPT-5.2 models to be significantly more reliable than Anthropic’s Claude Opus 4.5 for ...
后来出现了所谓的Agentic编程——Claude Code、Cursor Agent、Windsurf等工具让AI可以自主执行多步任务,读取文件、运行命令、修复错误。 直到GPT-5.2。 Cursor团队让GPT-5.2持续运行了 整整一周 ...