2025年8月8日,最新GPT-5模型由OpenAI正式发布,在多领域如编程、数学、写作等展现出卓越的能力。
Sam Altman, OpenAI首席执行官,指出GPT-5是公司人工智能产品的“重大提升”,强调“与它交流仿佛是在和各领域专家对话”。
GPT-5已向所有用户逐步开放,付费用户可享受更高的使用配额。
Pro订阅用户可无限制使用GPT-5,而Plus用户能够将其作为默认模型处理日常问题,使用量明显高于免费用户。
GPT-5整合了智能高效模型、深度推理模型(GPT-5 thinking)及实时路由器。
智能高效模型负责大部分问题的解答,深度推理模型解决复杂疑难。
实时路由器依据对话类型及复杂度迅速选择最恰当的模型,并通过真实信号不断改进。
在达到使用限额后,精简版模型会处理剩余查询,未来OpenAI计划将多种功能整合成单一模型。
GPT-5在基准测试中显著超越前代,回答更快速,实用性增强,减少误导信息并改善指令遵循。
特别是在写作、编程及健康咨询方面表现优异。
编程:这个模型在复杂前端生成和大型代码库调试上有突出进步,可根据单个提示开发美观和响应迅速的网站、应用与游戏。
创意表达与写作:能将粗略构思转化为富有文学深度和韵律的作品,对含有结构模糊的写作进行有效处理。
健康:在健康相关的咨询中最为出色,HealthBench评分远超以往,能积极标记潜在问题并提供可靠建议,但不能替代专业医疗人员的诊断。
在数学(AIME 2025无工具时94.6%)、编程(SWE-bench Verified 74.9%)、多模态理解(MMMU 84.2%)与健康(HealthBench Hard 46.2%)中达到新的先进水平。
GPT-5 Pro在GPQA上创造了新的标准,无工具得分达88.4%。
GPT-5 Pro适合最具挑战性的任务,取代OpenAI o3-Pro,推理时间加长并通过规模化并行测试提供高质量答案。
在智力基准测试中表现杰出,评估1000多个经济推理提示后,外部专家67.8%情况下更偏好GPT-5 Pro,主要错误减少22%,在健康、科学、数学及编程方面突出。
标题:GPT-5模型发布:全面解读其在编程、写作、健康领域的创新突破