OpenAI发布GPT-5.4：整合推理、编码与计算机操作的最强模型

OpenAI发布GPT-5.4，声称这是其"面向专业工作最强大且高效的前沿模型"。首次将推理、编码和代理工作流整合到统一模型中，支持原生计算机操作和100万token上下文窗口。

旧金山消息——当地时间3月5日，OpenAI正式发布GPT-5.4，这是其迄今为止"面向专业工作最强大且高效的前沿模型"。这款新产品首次将推理、编码和代理工作流整合到统一的AI系统中，标志着AI能力融合的又一里程碑。

三版本齐发：标准版、Thinking版、Pro版

GPT-5.4的发布一改此前的单一模型策略，首次同时推出三个版本以满足不同用户需求：

GPT-5.4标准版面向通用用户，提供平衡的性能和效率；GPT-5.4 Thinking专注于深度推理任务，适合需要复杂逻辑分析的场景；GPT-5.4 Pro则针对高负载专业工作优化，提供最强算力表现。

OpenAI首席执行官山姆·阿尔特曼（Sam Altman）在社交媒体上表示："我认为人们会喜欢它的。"这款模型的发布被视为OpenAI在激烈AI竞争中的一次重要出击。

GPT-5.4最引人注目的新特性是原生计算机操作能力（Native Computer-Use）。这意味着AI不再仅仅"回答"问题，而是能够真正"执行"任务——直接操作软件、填写表格、点击按钮、执行代码。

此外，GPT-5.4还支持100万token上下文窗口，是当前市场上最长的上下文支持之一。这使得处理超长文档、跨文件分析、多轮复杂对话成为可能。

OpenAI声称，GPT-5.4在多个独立基准测试中"显著提升"了AI推理和专业技能表现。这些基准测试涵盖代码生成、数学推理、专业写作等多个维度。

行业观察人士指出，GPT-5.4的发布意味着OpenAI正在将AI助手从"对话工具"向"生产力工具"转型。原生计算机操作能力让AI可以无缝融入日常工作流程，这对企业用户尤其具有吸引力。

GPT-5.4的推出让OpenAI在AI竞赛中继续保持领先优势，同时也给竞争对手带来更大压力。Google的Gemini和Anthropic的Claude都在快速迭代，但目前尚未推出能在单一模型中整合这么多能力的竞品。

TechCrunch评论称，这次更新"保持了对Google和Anthropic的压力"，尤其在工作场所AI功能领域。

GPT-5.4即日起向ChatGPT用户、Codex和OpenAI API用户推送。