ChatGPT 5的编程能力宣传言过其实

发布于:2025-08-10 ⋅ 阅读:(19) ⋅ 点赞:(0)

2025年的8月7日,OpenAI 正式向全球揭开了GPT-5的神秘面纱,瞬间在 AI 领域乃至整个科技圈引发了轩然大波。OpenAI对GPT-5的宣传可谓不遗余力,将其描绘成一款具有颠覆性变革的 AI 产品,尤其在编程能力方面,给出了诸多令人瞩目的描述 。

图片

OpenAI声称,GPT-5堪称他们有史以来最为强大的编码模型。在复杂的前端生成任务中,它能够仅凭用户给出的一个简单提示,便迅速创建出美观且响应式极佳的网站、应用程序以及游戏。

我也在今天第一时间测试了一下GPT-5的具体编程能力。从结果来看,GPT-5的实际编程能力仍然不如Claude,甚至不如DeepSeek R1的最新版本。

我们首先用以下提示词要求GPT-5, Claude和DeepSeek的网页版生成一个html: 

“使用HTML设计一个类似Outlook的界面,可以通过cdn使用开源的css和字体,Javacript等。保持界面美观”

以下为这三个大模型生成的网页。

GPT-5:

图片

Claude:

图片

DeepSeek R1:

图片

从功能上来讲,基本上这三个大模型生成的网页功能覆盖都比较类似。也都是响应式布局。但是在具体呈现上来说,GPT-5就显得简陋得多。

实际上在我对网页Javascript功能也试了一下就发现,GPT-5生成的网页上,除了邮件标题可以点击以外,其他地方几乎都不能点击。而Claude和DeepSeek生成的网页,文件夹,切换邮件时候都是有内容变化的效果的。这也从侧面反映了GPT-5在思考编程问题时思考不够全面。

之后我用Cursor和Roo Code(因为Cursor中的DeepSeek不是官网版本,所以用Roo Code + DeepSeek API key的方式)测试了一下它们对复杂Agentic AI编程的支持。提示词为:

“设计一个Agentic AI程序,可以根据用户的自然语言输入,针对一个或者多个文件夹下的文件,进行敏感数据处理,以便可以和隐私法规(如GDPR)相符合。要求:1,用户可以随时中断Agent的工作,也可以在中断后通过自然语言譬如“继续以前的工作”以继续进行;2,考虑到需要处理的文件数目和大模型Token限制,Agent应该把工作规划为不同阶段以完成所有工作;3,文件可能有不同语言,判断文件中使用的主要语言,考虑可能需要适用哪些国家的隐私法规要求,进而根据不同的规则进行修改;4,如果用户有使用自然语言输入的特殊要求,应该加以满足;5,使用Python。规划并生成相关的REST服务,用户通过网页执行各种操作。”

当然这个程序代码量比较大,具体我也就不把生成的内容贴出来了。但是结果仍然是Claude和DeepSeek优于GPT-5。大家也可以自己试一下。

GPT, Gemini和Grok都是很善于宣传的,每次新模型出来都宣称自己是最强的。但是实际上大家在编程时还是继续用Claude(国内就是各种基于DeepSeek的AI)。甚至你在编码时会发现,Claude Sonnet就已经足够打败它们了,都不需要使用Claude Opus。这就是现在大模型引擎的魔幻现实。


网站公告

今日签到

点亮在社区的每一天
去签到