OpenAI发布最强模型GPT-5:“可与任何领域的专家交谈”
北京时间8月8日凌晨1点,OpenAI正式推出最新大型人工智能模型GPT-5。
GPT-5是OpenAI推出的最新旗舰人工智能模型,被认为是迄今为止最强大的模型之一。它结合了GPT系列的快速响应能力和o系列模型的推理能力,形成一个“统一”的AI系统。GPT-5在多个基准测试中表现出色,包括编程、数学、健康领域和创意写作等方面。此外,GPT-5在减少“幻觉”(即AI生成不真实信息)方面也有所改进。
GPT-5的发布标志着OpenAI在实现通用人工智能(AGI)道路上的重要一步。OpenAI CEO Sam Altman在发布会上强调,GPT-5的发布标志着“与任何领域的专家交谈”的体验,甚至被描述为“世界上最好的模型”。
据悉,GPT-5在多项基准测试中创下新高,包括数学(AIME 2025无工具得分94.6%)、编码(SWE-bench Verified 74.9%,Aider Polyglot 88%)、多模态理解(MMMU 84.2%)和医疗(HealthBench Hard 46.2%)。这些成绩表明GPT-5在多个领域的表现显著提升。
在减少“幻觉”方面,GPT-5在匿名ChatGPT流量测试中,回答包含事实错误的概率比GPT-4o低45%,推理模式下比OpenAI o3低80%。
在LongFact(长文本事实核查)和FActScore(细粒度事实评分)等基准测试中,GPT-5(带推理模块)的幻觉率仅为o3模型的六分之一。长文本生成中,传统模型易因上下文丢失或注意力分散导致“事实漂移”,而GPT-5通过优化注意力机制和分块处理策略,确保长篇回答的连贯性和准确性。
OpenAI还引入了“安全完成”训练,模型在处理模糊或双重用途问题时提供高层次、安全的回答,并透明解释拒绝原因,欺骗率从4.8%降至2.1%。
OpenAI还在GPT-5开发过程中进行了广泛的安全评估,包括5000小时的持续测试。OpenAI称,GPT-5不会直接拒绝回答可能存在风险的问题,而是采用“安全完成”策略,提供符合安全限制的高层次回答,以避免潜在危害。
值得一提的是,GPT-5现通过ChatGPT向所有用户开放,包括免费、Plus、Pro和Team用户,而企业用户和教育用户将在未来一周内获得访问权限。
其中,免费用户首次体验推理模型,达到限额后切换至GPT-5 mini。Plus用户享有更高使用限额,Pro用户可无限制访问GPT-5及更强大的GPT-5 Pro。
此外,OpenAI还为开发者提供GPT-5、GPT-5 mini和GPT-5 nano三种API版本,满足不同需求。
GPT-5的发布也引发了微软等科技巨头的积极反应,微软已宣布将其整合到其产品线中,包括Microsoft 365 Copilot、面向消费者的Copilot以及供开发者将AI模型融入第三方应用的Azure AI Foundry。
微软首席执行官萨蒂亚·纳德拉(Satya Nadella)表示:“难以相信当前距奥特曼在雷德蒙德向世界首次展示GPT-4仅过去两年半时间,技术进步之快令人惊叹。”
企业文件管理公司Box首席执行官亚伦·列维(Aaron Levie)也表示,以往AI模型在处理复杂数学或长文档逻辑时常失败,但GPT-5是“彻底的突破”。他认为:“该模型能保留更多信息,并运用更高水平的推理和逻辑能力进行决策。”
尽管GPT-5在多个方面表现出色,但也有报道指出其在某些基准测试中并未完全达到顶尖水平,例如在某些复杂任务中表现不如其他前沿AI模型。
GPT-5的发布标志着AI领域的一个重要里程碑,它不仅在技术上取得了显著进步,也在用户体验和应用层面带来了新的可能性。
