OpenAI发布新一代旗舰模型GPT-5

OpenAI于8月7日正式发布了GPT-5,这是其新一代旗舰AI模型,将为ChatGPT的用户提供更强大的功能和更简洁的用户体验。GPT-5是OpenAI首个“统一”的AI模型,结合了其o系列模型的推理能力与GPT系列的快速响应能力,标志着ChatGPT及其创造者OpenAI进入了一个新的时代,展现了OpenAI将AI系统从聊天机器人向智能代理转变的更广泛雄心。
与GPT-4相比,GPT-5不仅能够提供更智能的回答,还能代表用户完成多种任务,例如生成软件应用、管理日程或创建研究报告。GPT-5还简化了ChatGPT的使用方式,无需用户手动选择设置,其内置的实时路由器会自动决定如何提供最佳答案,无论是快速响应还是需要更多时间进行“思考”的回答。
在与记者的简报中,OpenAI首席执行官Sam Altman声称GPT-5是“世界上最好的模型”,并表示这是公司在开发能够超越人类在大多数经济价值工作中的AI(即通用人工智能AGI)道路上的一个“重要步骤”。从周四开始,GPT-5将作为默认模型向所有免费用户开放,这是OpenAI首次向免费用户提供AI推理模型(来源:。
GPT-5的发布备受期待,自2022年ChatGPT使OpenAI声名鹊起以来,ChatGPT已成长为全球最受欢迎的消费产品之一,每周用户超过7亿,接近全球人口的10%。许多行业观察者将GPT-5视为AI进步的风向标,其在硅谷的接受程度可能会对大型科技公司、华尔街和监管技术的政策制定者产生深远影响。
在性能方面,OpenAI声称GPT-5在多个领域达到了行业领先水平,在关键基准测试中略微领先于Anthropic、Google DeepMind和xAI的领先AI模型。然而,在某些领域,GPT-5的表现略低于其他前沿AI模型。例如,在SWE-bench Verified(一项从GitHub提取的真实世界编码任务测试)中,GPT-5首次尝试的得分率为74.9%,略高于Anthropic的Claude Opus 4.1模型(74.5%)和Google DeepMind的Gemini 2.5 Pro(59.6%)。
GPT-5在回答健康相关问题方面也有所改进,其“幻觉”(即AI模型编造信息的倾向)频率远低于OpenAI之前的模型。在ChatGPT提示的响应中,GPT-5(带思考)产生幻觉和错误信息的比例为4.8%,显著低于之前的o3和GPT-4o模型(分别为22%和20.6%)。
GPT-5的发布还为消费者和开发者带来了一些新功能。ChatGPT用户现在可以在设置中选择四种新的人格(愤世嫉俗者、机器人、倾听者和书呆子),这些人格将自动调整ChatGPT的响应方式,而无需用户特别要求模型以某种方式回答。对于开发者,GPT-5将以三种不同大小(gpt-5、gpt-5-mini和gpt-5-nano)的形式出现在OpenAI的API中,开发者还可以控制AI模型响应的冗长程度。
← 上一篇 Anthropic推出基于Chrome的Claude AI代理 下一篇 → 网站维护与 SEO 优化的成本分析(长期投入与回报评估)