等等,这些图是GPT-Image-2出的?!
发布时间:2026-04-21来源:APPSO
在互联网上吃瓜、维权、实锤一件事,过去我们靠的是五个字:有图有真相。哪怕 AI 生图已经铺天盖地,但只要图里出现复杂的中文排版,或者某款软件的真实界面,AI 就会立刻露馅,变成一个彻底的「文盲」。那个靠找错别字、找 UI 漏洞来鉴别 AI 图片的年代,随着 ChatGPT 旗下图像模型 GPT Image 2 的全量推送,已经轰然收场。APPSO 第一时间用最刁钻的中文场景和商业需求对它展开了压力测试,不用抽卡,每张都出乎意料的好。打开 ChatGPT,点击 + 号,选择「创建图片」,或在右侧边栏更多中找到「图片」,就可以使用 GPT Image 2。目前,任何订阅计划,包括免费用户,都可以直接使用。当初 Nano Banana 就是靠着文字渲染,一举成为 AI 生图界的「神」。但尽管 Nano Banana 在文字处理上比其他模型强上不少,面对一些超量文本时,Nano Banana 的表现,还是会出现个别文字的错位,以及对文字的排版布局比较生硬。现在,GPT Image 2 的出现,把这个局面彻底翻过去了。它不仅懂中文字形,还懂极其复杂的中文排版。使用 GPT Image 2 甚至不太需要过于复杂的提示词,我们的测试都是一两句简单的画面描述,或者再加上图片尺寸要求,如 21:9、16:9、9:16 等。结果相当震撼。卷头标题、填空题下划线、几何图形标注,以及试卷特有的宋体 / 楷体排版风格,全被精准还原。第一眼看,这完全就是一张拿手机对着真实考卷拍出来的照片。如果这种统一字体的文字,算不上有难度的话,我们尝试继续用中国传统书法去难倒它。GPT Image 2 表示,这仍然难不倒我。生成的书法真迹图片,里面的文字不仅准确,还做到了书法作品应有的行云流水、笔锋苍劲。甚至连纸张的做旧纹理,一些印鉴都到位了。对于一些图文并茂的排版测试, GPT Image 2 的表现同样严丝合缝,没有任何乱码或字体重叠。 提示词:一张泛黄的今日人工智能晚报,时间是 2049 年 4 月 21 日当一个 AI 模型能以假乱真地生成带题目的试卷、完美渲染中文日历,这句过去的成语「眼见为实」,真的彻底被击破了。相信把那张四年级的试卷给小学生看,真的会找不到破绽。中文渲染只是基本功的补全,GPT Image 2 更惊艳的,是它展现出的世界知识的厚度。包括前段时间 GPT Image 2 爆料中疯传的那些图片,马斯克在抖音直播买老干妈、奥特曼同平台竞争,都是基于 GPT Image 2 强大的文本渲染能力和世界知识。世界知识这个概念,在 Nano Banana 爆火的时候,就开始流行,意思是就是生图模型也会有通用模型的知识,可以联网搜索,会思考,它真的知道我们每天盯着的屏幕、玩的游戏、看的直播,到底长什么样。出来的图里不只有人物,更恐怖的是它完整复刻了抖音的 UI 界面。左下角的评论区、右侧的点赞和分享按钮、顶部的观众人数和跑马灯,所有交互元素的层级逻辑全部正确。游戏玩家可能感受更深。当我们让它还原英雄联盟的团战画面,它不仅画出了峡谷地形,英雄头顶的血条、技能特效的光影、小地图的 UI 框,也一并安排到位了。提示词:英雄联盟游戏画面,召唤师峡谷地图,经典的等距俯视视角,几个英雄正在进行激烈的团战。甚至科技圈的名场面,它也了如指掌。一句话,就能精准还原 Sam Altman 的面部特征、OpenAI 极简的舞台打光,以及套着视频播放器外壳的直播界面。提示词:GPT-Image-2 发布会直播画面,包含 Sam AltmanGPT Image 2 对这个数字世界视觉规律的掌握程度,比我们想象的都要更深。XX is Dead,再一次颠覆设计、营销、广告……AI 跨过了文字和 UI 的门槛,生图这件事就彻底脱离了「艺术创作」的范畴,成了一种硬核的商业生产力工具。这次实测里,GPT Image 2 的商业落地能力,足以让许多设计师坐不住。工业与产品设计领域,复杂的机械结构和建模往往耗费大量时间,而现在只需几秒。提示词:给「张雪机车」的摩托车设计一张酷炫的产品分解图悬浮的零件排布、极具科技感的光影,这种过去需要 3D 建模师肝上几天的图,它能瞬间给出高品质的原型参考。电商和广告视觉方面,苹果那种冷峻高级的质感,或者电商平台要求的高饱和度、带中文促销文案的网感图,它都游刃有余。提示词:iPhone 16 Pro Max 高端商业广告提示词:产品广告照片,一个游泳圈,有吸引力,能获得大量点击率,16:9,使用中文宣发和 IP 创作上,GPT Image 2 的排版逻辑和特征抓取同样表现出现。中文字体排版直接可用,分镜逻辑清晰,连各家大模型的 Logo 特征,都能被它做成颇具网感的 IP 延展。提示词:给电影拯救计划设计一张横屏海报(虽然他不知道高司令的拯救计划,但是选的几个演员确实是大片演员)提示词:经典漫画书内页,包含分镜格子、人物动态动作、对话气泡提示词:生成一系列不同的 AI 大语言模型(Gemini、deepseek、ChatGPT、Claude、Grok 等)的表情包设计过去设计师对齐需求时,找各种参考、搭复杂的设计框架、排版修字。现在,一段清晰简单的提示词进去,一张可以直接用于商业提案、电商投放甚至直接出街的成品就出来了。在我们测试过程中,无论是 Plus 账号还是免费账号,都已经上线了 GPT Image 2,大家可以在自己的 ChatGPT 对话框里试试。不过,目前仍然会有速率限制的提示,当我们频繁发送提示词,要求 ChatGPT 生成时,他会直接回复一段错误代码,显示「你的图片生成速度太快了,为了保证所有人最好的体验,我们有速率限制,请在 13 分钟后生成。」不得不说,每当我们觉得 OpenAI 陷入停滞,它总能在你毫无防备的时候甩出一张新牌。过去几个月,外界吐槽它发新模型是挤牙膏、Sora 关闭、ChatGPT Atlas 浏览器爆冷,仿佛那个曾经不可一世的 AI 霸主真的变菜了。今天 GPT Image 2 的出现,也算是给了这些唱衰一次有力的回应。当一个模型能以假乱真地生成数学试卷、完整复刻抖音直播界面,「这是 AI 做的」我想很难是一眼能看穿的事了。✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)
转载说明:本文系转载内容,版权归原作者及原出处所有。转载目的在于传递更多行业信息,文章观点仅代表原作者本人,与本平台立场无关。若涉及作品版权问题,请原作者或相关权利人及时与本平台联系,我们将在第一时间核实后移除相关内容。