OpenAI发布新一代旗舰模型GPT-5

站长 2025年08月27日

OpenAI于8月7日正式发布了GPT-5，这是其新一代旗舰AI模型，将为ChatGPT的用户提供更强大的功能和更简洁的用户体验。GPT-5是OpenAI首个“统一”的AI模型，结合了其o系列模型的推理能力与GPT系列的快速响应能力，标志着ChatGPT及其创造者OpenAI进入了一个新的时代，展现了OpenAI将AI系统从聊天机器人向智能代理转变的更广泛雄心。

与GPT-4相比，GPT-5不仅能够提供更智能的回答，还能代表用户完成多种任务，例如生成软件应用、管理日程或创建研究报告。GPT-5还简化了ChatGPT的使用方式，无需用户手动选择设置，其内置的实时路由器会自动决定如何提供最佳答案，无论是快速响应还是需要更多时间进行“思考”的回答。

在与记者的简报中，OpenAI首席执行官Sam Altman声称GPT-5是“世界上最好的模型”，并表示这是公司在开发能够超越人类在大多数经济价值工作中的AI（即通用人工智能AGI）道路上的一个“重要步骤”。从周四开始，GPT-5将作为默认模型向所有免费用户开放，这是OpenAI首次向免费用户提供AI推理模型（来源：。

GPT-5的发布备受期待，自2022年ChatGPT使OpenAI声名鹊起以来，ChatGPT已成长为全球最受欢迎的消费产品之一，每周用户超过7亿，接近全球人口的10%。许多行业观察者将GPT-5视为AI进步的风向标，其在硅谷的接受程度可能会对大型科技公司、华尔街和监管技术的政策制定者产生深远影响。

在性能方面，OpenAI声称GPT-5在多个领域达到了行业领先水平，在关键基准测试中略微领先于Anthropic、Google DeepMind和xAI的领先AI模型。然而，在某些领域，GPT-5的表现略低于其他前沿AI模型。例如，在SWE-bench Verified（一项从GitHub提取的真实世界编码任务测试）中，GPT-5首次尝试的得分率为74.9%，略高于Anthropic的Claude Opus 4.1模型（74.5%）和Google DeepMind的Gemini 2.5 Pro（59.6%）。

GPT-5在回答健康相关问题方面也有所改进，其“幻觉”（即AI模型编造信息的倾向）频率远低于OpenAI之前的模型。在ChatGPT提示的响应中，GPT-5（带思考）产生幻觉和错误信息的比例为4.8%，显著低于之前的o3和GPT-4o模型（分别为22%和20.6%）。

GPT-5的发布还为消费者和开发者带来了一些新功能。ChatGPT用户现在可以在设置中选择四种新的人格（愤世嫉俗者、机器人、倾听者和书呆子），这些人格将自动调整ChatGPT的响应方式，而无需用户特别要求模型以某种方式回答。对于开发者，GPT-5将以三种不同大小（gpt-5、gpt-5-mini和gpt-5-nano）的形式出现在OpenAI的API中，开发者还可以控制AI模型响应的冗长程度。

标签:

OpenAI