OpenAI发布GPT-5.4:整合推理、编码与计算机操作的最强模型

OpenAI发布GPT-5.4,声称这是其"面向专业工作最强大且高效的前沿模型"。首次将推理、编码和代理工作流整合到统一模型中,支持原生计算机操作和100万token上下文窗口。

OpenAI发布GPT-5.4:整合推理、编码与计算机操作的最强模型

旧金山消息——当地时间3月5日,OpenAI正式发布GPT-5.4,这是其迄今为止"面向专业工作最强大且高效的前沿模型"。这款新产品首次将推理、编码和代理工作流整合到统一的AI系统中,标志着AI能力融合的又一里程碑。

三版本齐发:标准版、Thinking版、Pro版

GPT-5.4的发布一改此前的单一模型策略,首次同时推出三个版本以满足不同用户需求:

GPT-5.4标准版面向通用用户,提供平衡的性能和效率;GPT-5.4 Thinking专注于深度推理任务,适合需要复杂逻辑分析的场景;GPT-5.4 Pro则针对高负载专业工作优化,提供最强算力表现。

OpenAI首席执行官山姆·阿尔特曼(Sam Altman)在社交媒体上表示:"我认为人们会喜欢它的。"这款模型的发布被视为OpenAI在激烈AI竞争中的一次重要出击。

原生计算机操作:AI从"说"到"做"的跨越

GPT-5.4最引人注目的新特性是原生计算机操作能力(Native Computer-Use)。这意味着AI不再仅仅"回答"问题,而是能够真正"执行"任务——直接操作软件、填写表格、点击按钮、执行代码。

此外,GPT-5.4还支持100万token上下文窗口,是当前市场上最长的上下文支持之一。这使得处理超长文档、跨文件分析、多轮复杂对话成为可能。

基准测试显著提升

OpenAI声称,GPT-5.4在多个独立基准测试中"显著提升"了AI推理和专业技能表现。这些基准测试涵盖代码生成、数学推理、专业写作等多个维度。

行业观察人士指出,GPT-5.4的发布意味着OpenAI正在将AI助手从"对话工具"向"生产力工具"转型。原生计算机操作能力让AI可以无缝融入日常工作流程,这对企业用户尤其具有吸引力。

竞争加剧:Google和Anthropic面临压力

GPT-5.4的推出让OpenAI在AI竞赛中继续保持领先优势,同时也给竞争对手带来更大压力。Google的Gemini和Anthropic的Claude都在快速迭代,但目前尚未推出能在单一模型中整合这么多能力的竞品。

TechCrunch评论称,这次更新"保持了对Google和Anthropic的压力",尤其在工作场所AI功能领域。

GPT-5.4即日起向ChatGPT用户、Codex和OpenAI API用户推送。

*参考来源:TechCrunchGizmodoInteresting Engineering