类型:社交聊天 版本:v 1.2026.062
大小:54.78M 更新:2026-05-13
ChatGPT5.4是一款全新升级的社交型AI聊天软件。精心准备了丰富多样的互动方式,文字输入、语音对话、上下文自然延展每一次交流都可能成为灵感悄然萌发的起点。支持语音输入与语音播报功能,让沟通更轻松更贴心更富人情味。先进的自然语言处理与机器学习技术拥有广博而扎实的知识积淀始终以专业与诚意陪伴您左右。 当您的提问稍显模糊时会温和地帮您厘清思路、补全逻辑,并主动拆解步骤。更会贴心呈现多种可行方案,供你参考与选择。
这款模型被 OpenAI 定位为“面向专业工作的最强前沿模型”。它以 GPT-5.4 Thinking 的形式进入 ChatGPT,同时上线 API 和代码开发平台 Codex。此外还有一个 GPT-5.4 Pro 版本,面向需要极致复杂任务性能的用户,仅对 ChatGPT Pro(月费 200 美元)和 Enterprise 订阅者开放。Plus 用户可以使用 GPT-5.4 Thinking,免费用户则只能在系统自动路由时偶尔被分配到该模型。
GPT-5.4 在 API 和 Codex 中支持最高 100 万 token(标记)的上下文窗口(Context Window,即模型单次处理文本的长度上限),这是目前 OpenAI 提供的最大上下文窗口。不过超过 272,000 token 的请求,输入价格翻倍、输出加收 50%。标准输入单价从 GPT-5.2 时代的每百万 token 1.75 美元涨到了 2.50 美元,涨幅 43%。
OpenAI 给出的解释是,模型能力更强,研究投入更大,同时推理效率更高——用更少的 token 解决同样的问题,所以总成本未必上升。作为参考,Anthropic 的 Claude Opus 4.6 输入价格是每百万 token 5 美元,输出 25 美元,GPT-5.4 Pro 的定价实际上还要更贵。
跑分方面,在 OSWorld-Verified 基准测试中,GPT-5.4 的成功率达到 75.0%,远超 GPT-5.2 的 47.3%,也超过了该测试报告的人类表现 72.4%。在 OpenAI 的官方演示中,通过 Playwright Interactive(一种浏览器自动化工具)与图像生成结合,仅凭单条提示词就构建出了一个主题乐园模拟游戏,涵盖瓦片路径布置、游乐设施建造、游客路径寻路和实时公园指标。
在 BrowseComp(衡量 AI 代理在网页上持续检索难以定位信息的能力)上,GPT-5.4 比 GPT-5.2 提升了 17 个百分点,Pro 版本达到 89.3%。OpenAI 自己的 GDPval 测试(覆盖美国 GDP 贡献最大的 9 个行业、44 种职业的知识工作任务)给出了 83% 的得分,意味着在这些任务上模型的表现达到或超过了行业从业者水平。
在电子表格建模任务中,得分从 GPT-5.2 的 68.4% 跳到了 87.3%;人类评审者在 68% 的情况下更偏好 GPT-5.4 生成的演示文稿。
这些数字背后有一个关键能力:原生计算机使用(Native Computer Use)。GPT-5.4 是 OpenAI 发布的第一个内置原生计算机操控能力的通用模型,可以通过编写代码(比如使用 Playwright 库)来操控计算机,也可以直接根据屏幕截图发出鼠标和键盘指令。这让它能够在软件环境中执行“构建 - 运行 - 验证 - 修复”的循环,完成需要跨多个应用的多步骤工作流。
另一个对开发者影响较大的新特性是 Tool Search(工具搜索)。过去,在 API 中使用工具时,所有工具的定义需要一次性塞进提示词里,随着工具越来越多,这造成了巨大的 token 开销和上下文污染。GPT-5.4 引入了一个结构性的优化:模型只接收一个轻量级工具列表,需要用到某个工具时再动态检索其完整定义。
在 Scale 公司的 MCP Atlas 基准测试中,使用 36 个 MCP 服务器执行 250 项任务,工具搜索将 token 消耗降低了 47%,同时保持了准确率。对于构建大型智能体(Agent)系统的开发者来说,这直接意味着更低的成本和更快的响应。
幻觉(Hallucination,即模型编造事实)的改善也被重点提及。OpenAI 表示,GPT-5.4 在单条声明中出错的概率比 GPT-5.2 降低了 33%,整体回复包含错误的概率降低了 18%。
不过需要注意的是,在 HealthBench 医疗健康评测中,GPT-5.4 的得分是 62.6%,反而略低于 GPT-5.2 的 63.3%。模型回复的平均长度也更长了,从 GPT-5.2 的 2,676 字符增加到 3,311 字符。更长的回复有时候意味着更全面,也有时候意味着更啰嗦,用户体验如何还有待观察。
在抽象推理方面,进步幅度较为显著。ARC-AGI-2 从 52.9% 跃升至 73.3%,Pro 版本达到 83.3%。FrontierMath Tier 4(最高难度的数学推理测试)从 18.8% 提升至 27.1%,Pro 版本为 38.0%。
一些拿到早期测试权限的用户已经在 X 上密集发布体验报告。AI 创业者 Matt Shumer 称自己测试 GPT-5.4 长达一周,认为其标准版配合深度思考模式的表现已经超过了此前其他模型的 Pro 版本,以至于他几乎不再需要切换到 Pro 模式。
其编码能力尤其突出,Shumer 称在 Codex 中使用 GPT-5.4 的可靠性极高,编码问题“基本上已经被解决了”。Pro 版本则能攻克其他模型完全无法处理的难题,但对日常任务来说属于“过剩火力”。而且的确和 OpenAI 官方宣称的一样,其标准思考版本使用的推理 token 比以前更少,响应速度明显加快。
不过 Shumer 也指出了几个短板:前端设计品味远不如 Claude Opus 4.6 和 Gemini 3.1 Pro;模型有时候会忽略显而易见的现实世界语境,比如为他规划旅行行程时选了一堆春假期间会被游客挤爆的地点。在 OpenClaw 中测试 GPT-5.4 时,模型经常在任务完成之前就停下来。
OpenAI 同时宣布了一套面向金融行业的企业产品,核心是 ChatGPT for Excel 和 Google Sheets(测试版)。OpenAI 将其描述为 ChatGPT 直接嵌入电子表格,用于构建、分析和更新复杂的财务模型。
配套的还有与 FactSet、MSCI、Moody's 等金融数据提供商的集成,以及可复用的“Skills”(技能模板),用于盈利预览、可比公司分析、DCF(折现现金流)分析等标准化金融工作。
在 OpenAI 内部的投资银行基准测试中,GPT-5.4 Thinking 的表现从 GPT-5 时代的 43.7% 提升到了 88.0%。这组产品的对手毫无疑问是 Anthropic 刚推出的 Cowork 桌面工具和 Claude 的文件管理能力,以及 Google 在 Workspace 中持续深入的 AI 集成。
综合来看,GPT-5.4 称得上是一种在多个维度上的整合性进步。原生计算机操控、工具搜索、更大的上下文窗口、更强的推理能力,这些合在一起构成了一个更完整的“AI 工作助手”,也为 OpenClaw 这类智能体框架提供了更强的底层引擎。
日常聊天和写邮件的改进可能体现在细节上,真正能感受到跨代差异的,是那些用 AI 做 PPT、建财务模型、在 Codex 里跑自动化流程的重度用户,以及正在把 OpenClaw 当成个人数字助手的那批早期采纳者。
1、持续扩充多元话题库,认真倾听您的每一句关切,用心回应提出的各类常见疑问。
2、只需在输入框中简要描述问题或需求,便会主动帮您梳理脉络理清重点并尽力提供切实可行的建议与支持。
3、所有对话内容采用端到端加密技术,全程多重安全防护,严格守护您的隐私与数据安全,安心无忧。
1、快速构建清晰完整有条理的思考路径,致力于打造焕然一新自然流畅的交互体验。
2、无需付费、无需订阅,即可免费享受专业、稳定、值得信赖的AI聊天助手服务。
3、涵盖日常常识更能提供实用建议、个性化推荐,以及清晰、具体、可落地的问题解决路径。
1、文字输入、语音交流皆可,轻松发现更自然、更高效、也更有温度的沟通可能。
2、结合上下文主动理解深度推理,让每一次对话都更有深度。
3、持续学习与自我优化的能力,通过一次次用心打磨与迭代升级,努力让每一次对话都更真实。
1、以更开放轻松的方式达成每一次沟通目标,无论您使用何种语言都细致还原所思所想。
2、流畅无压力的对话体验,所有聊天记录与生成内容均通过云端安全存储,并支持跨设备实时同步。
3、无论您身处何地使用手机平板或电脑都能安心随时查阅与延续对话。
ChatGPT5.4持续探索不断更新共同发现更多有趣有用的新功能与新体验。凭借出色的智能问答能力,始终以耐心倾听、以细致回应,认真对待您的每一个问题,并竭力给出准确贴心的答案。
《剑与远征启程》戴蒙阵容搭配推荐
剑与远征启程戴蒙怎么配队?戴蒙是游戏在渊火龙诗赛季中新增的角色,作为女妖的儿子其阵营也必定是亡灵。目前从公布的技能来看基本是和女妖捆绑的。那么想知道这个角色具体技能效果和配队建议的小伙伴不要错过这篇文章了。
985 2026-05-28 14:15:06
《曙光重临》2025端午节活动攻略
曙光重临2025端午节活动怎么玩?游戏今年的端午活动已经开启,活动期间我们需要参与多个活动板块来获得奖励:消耗粽子给龙舟充能、拼图解锁、活动手册和活动商店。那么接下来就由乐玩小编给大家带来具体的活动玩法攻略吧。
660 2026-05-28 14:14:53
《龙息神寂》S2赛季开荒流派推荐
龙息神寂S2开荒用什么流派?游戏全新的S2赛季现已正式开启,在S2赛季中每个阵营都增加了新英雄,其中有一些流派在新赛季中强度非常不错。小编在这里首先推荐大家玩光系鼓舞和毒系流派。那么接下来就和乐玩小编看看新赛季哪些流派是不错的吧。
977 2026-05-28 14:14:51
《指尖无双》群雄割据赛季新将领技能效果一览
指尖无双S7新将领技能是什么?游戏群雄割据赛季即将开启,本赛季增加了大量的进阶版武将,S1和S2赛季的老武将都将迎来升级。许多小伙伴对这些新将领的技能十分感兴趣,乐玩小编在这里整理了这些将领的技能,有需要的小伙伴一定不要错过了。
773 2026-05-28 14:14:37
《指尖无双》群雄割据赛季战役升级方法
指尖无双S7战役等级怎么提升?在游戏S7赛季中我们想要提升战役等级的话不再和之前一样,目前只有2种方法才能获得:给盟主赠送礼物或是通过约翰楼点赞才能获得。那么我们如何才能快速提升等级呢?接下来就由乐玩小编给大家带来具体的升级方法吧。
925 2026-05-28 14:14:31
9.3分
2970人评价