OpenAI发布最强模型GPT-5：“可与任何领域的专家交谈”

2025-08-08 来源：电子工程专辑原创文章

330

北京时间8月8日凌晨1点，OpenAI正式推出最新大型人工智能模型GPT-5。

GPT-5是OpenAI推出的最新旗舰人工智能模型，被认为是迄今为止最强大的模型之一。它结合了GPT系列的快速响应能力和o系列模型的推理能力，形成一个“统一”的AI系统。GPT-5在多个基准测试中表现出色，包括编程、数学、健康领域和创意写作等方面。此外，GPT-5在减少“幻觉”（即AI生成不真实信息）方面也有所改进。

GPT-5的发布标志着OpenAI在实现通用人工智能（AGI）道路上的重要一步。OpenAI CEO Sam Altman在发布会上强调，GPT-5的发布标志着“与任何领域的专家交谈”的体验，甚至被描述为“世界上最好的模型”。

据悉，GPT-5在多项基准测试中创下新高，包括数学（AIME 2025无工具得分94.6%）、编码（SWE-bench Verified 74.9%，Aider Polyglot 88%）、多模态理解（MMMU 84.2%）和医疗（HealthBench Hard 46.2%）。这些成绩表明GPT-5在多个领域的表现显著提升。

在减少“幻觉”方面，GPT-5在匿名ChatGPT流量测试中，回答包含事实错误的概率比GPT-4o低45%，推理模式下比OpenAI o3低80%。

在LongFact（长文本事实核查）和FActScore（细粒度事实评分）等基准测试中，GPT-5（带推理模块）的幻觉率仅为o3模型的六分之一。长文本生成中，传统模型易因上下文丢失或注意力分散导致“事实漂移”，而GPT-5通过优化注意力机制和分块处理策略，确保长篇回答的连贯性和准确性。

OpenAI还引入了“安全完成”训练，模型在处理模糊或双重用途问题时提供高层次、安全的回答，并透明解释拒绝原因，欺骗率从4.8%降至2.1%。

OpenAI还在GPT-5开发过程中进行了广泛的安全评估，包括5000小时的持续测试。OpenAI称，GPT-5不会直接拒绝回答可能存在风险的问题，而是采用“安全完成”策略，提供符合安全限制的高层次回答，以避免潜在危害。

值得一提的是，GPT-5现通过ChatGPT向所有用户开放，包括免费、Plus、Pro和Team用户，而企业用户和教育用户将在未来一周内获得访问权限。

其中，免费用户首次体验推理模型，达到限额后切换至GPT-5 mini。Plus用户享有更高使用限额，Pro用户可无限制访问GPT-5及更强大的GPT-5 Pro。

此外，OpenAI还为开发者提供GPT-5、GPT-5 mini和GPT-5 nano三种API版本，满足不同需求。

GPT-5的发布也引发了微软等科技巨头的积极反应，微软已宣布将其整合到其产品线中，包括Microsoft 365 Copilot、面向消费者的Copilot以及供开发者将AI模型融入第三方应用的Azure AI Foundry。

微软首席执行官萨蒂亚·纳德拉（Satya Nadella）表示：“难以相信当前距奥特曼在雷德蒙德向世界首次展示GPT-4仅过去两年半时间，技术进步之快令人惊叹。”

企业文件管理公司Box首席执行官亚伦·列维(Aaron Levie)也表示，以往AI模型在处理复杂数学或长文档逻辑时常失败，但GPT-5是“彻底的突破”。他认为：“该模型能保留更多信息，并运用更高水平的推理和逻辑能力进行决策。”

尽管GPT-5在多个方面表现出色，但也有报道指出其在某些基准测试中并未完全达到顶尖水平，例如在某些复杂任务中表现不如其他前沿AI模型。

GPT-5的发布标志着AI领域的一个重要里程碑，它不仅在技术上取得了显著进步，也在用户体验和应用层面带来了新的可能性。

行业动态

莫迪宣布印度首款国产芯片年底问世

四年后王者归来，华为重夺中国智能手机市场榜首

宇树科技发布新款人形机器人预告：31个关节，身高1.8米跳芭蕾舞

热读文章

苗圩出席统筹推进疫情防控和产业转型升级促进制造业通信业稳定发展发布会

一图读懂2020年《政府工作报告》

工业富联：拟7763万美元收购鸿海精密美国子公司相关资产