跑分第一实战拉胯 GPT Image 1.5被骂惨

34 阅读 0 评论 0 点赞

就在方才，OpenAI抛出了它的“圣诞彩蛋”——新一代旗舰图像模型ChatGPT Images正式登场。

这一次，OpenAI将生图才能直接拉满：

精准操控：指令懂得力大年夜幅晋升，真正做到“指哪改哪”。
细节狂魔：画面细节保存完全，质感细腻。
极速生成：速度较前代晋升了整整4倍。

并且从今天起，所有ChatGPT免费用户即可上手，开辟者也可直接调用GPT Image 1.5 API。

在LMArena竞技场上，它似乎弗成克服：

文生图：以1264 Elo分登顶榜首，力压GoogleNano Banana Pro（NBP）。
图像编辑：chatgpt-image-latest以3分优势险胜NBP夺冠，而GPT Image 1.5紧随厥后位列第4。

在Artificial Analysis上，更是拿下了“双料第一”。

阁下滑动查看

然而，反转来得太快。

网友实测后发明，这似乎又是一个“高分低能”的典范。

在Yuchen Jin的比较中，GPT的生图才能根本上能达到GoogleNBP的程度，但智商却惨遭碾压。

尤其是在处理手写体笔记时，GPT Image 1.5的生成看着像模像样，然则完全没做对。

作为OpenAI的应用CEO，Fidji Simo则阴郁对标GoogleNano Banana Pro，直言此次是从单一文本转向动态AI体验。

左：ChatGPT Images；右：Nano Banana Pro

再让他们全部穿上OpenAI定制衣服，全部拿捏。（PS：Mark Chen处理脖子有些怪怪的）

左：ChatGPT Images；右：Nano Banana Pro

这一落差激发了社区的激烈吐槽。

有人直言不讳：“GoogleNano Banana Pro依然是王者。”

更有人痛批：“这可能是OpenAI又一次令工资难、且毫无意义的宣布。”

先是GPT-5.2引全网差评，又是GPT Image 1.5真实首测不敌Google“喷鼻蕉”。

看来，OpenAI岁尾这场硬仗，彻底败给了Google......

GPT Image 1.5登场

Prompt：把我放进《戴珍珠耳环的少女》那幅画里。

史诗级进化

言归正传。

根据官方博客介绍，如今让ChatGPT修图，明显比之前更听话了——

哪怕是细枝末节，只改让改的处所，同时确保光线、构图和人物样貌等元素在输入、输出和后续编辑中保持一致。

OpenAI华人研究员陈博远一张图，验证了GPT Image代号“榛子”出炉了

如许一来，即可获得真正相符意图的成果。

不论是有效的照片编辑，服装发型试穿试戴，照样保存原图精华的风格滤镜和概念转换，ChatGPT皆可搞定。

这一波更新，让ChatGPT成为随身携带的创意工作室：既能扎实干活儿，又能放飞玩创意。

这不，圣诞奥特曼来了......

OpenAI坦言：生成某些特定艺术风格的才能，比之前的版本退步了。

指哪改哪，多轮P图

GPT Image 1.5善于各类“手术”，包含添加、删减、组合、融合和置换。

是以，在想要改变图片的同时，它还能不损掉图片本来的“味道”。

两人一狗，GPT Image 1.5精准捕获了诞辰会上，他们被迫“营业”的无聊感。

Prompt：做一张00年代胶片感的照片，把这俩男的和狗都合成进去，拍他们在小孩诞辰会上那种一脸无聊的样子。

一些女孩子最爱的“芭比换装”，也能在ChatGPT中玩了。

然后，基于这张图基底，就可以让ChatGPT“连环编辑”了，比如背景加一堆熊孩子。

Prompt：背景加一堆熊孩子，乱扔器械乱叫唤的那种，搞乱一点。

接着，把左边须眉变成动漫脸，小狗改成毛绒公仔，AI精准完成编辑。

Prompt：左边那男的改成手绘复古日漫风，狗改成毛绒公仔，右边那男的和背景都别动。

Prompt：给他们全套上OpenAI的毛衣，就长如许的。

更绝的是，ChatGPT还能一键切背景，诞辰party刹时变成OpenAI直播间。

Prompt：如今把那俩男的去掉落，只留那条狗，然后把它放到一个OpenAI直播画面里，就跟附图长得差不多的那种

再以滑板活动为例，让ChatGPT生成一张洛杉矶风景滑板拍摄，90年代末纪实街头摄影风格。

Prompt：洛杉矶风景滑板拍摄，采取以下风格：90年代末纪实街头摄影，35mm彩色胶片拍摄，徕卡M风格旁轴相机配35mm镜头，柯达Portra 400色彩面板，天然日光，柔和比较度，柔和逼真的色彩，嵌入式胶片颗粒，稍微的边沿柔化，不雅察性抓拍构图，无HDR，无现代数码锐化，无片子照明。

Prompt：把滑板那人的衣服改成红的，帽子改成黄的。限速牌写15，那个卡车得是辆消防车。

还不敷热烈，左边来一帮群众，右边来只老鹰，空中再加个飞艇，要啥有啥。

Prompt：左边加一帮围不雅群众，右边马路上蹲只老鹰，远处空中再飞个飞艇。

接下来，把这一画面直接打板印在T恤上，ChatGPT直出图片。

Prompt：弄一件挂在晾衣绳上的T恤，把刚才上面说的那个完全画面全部印在T恤上，要全包的那种印花。

最后，还能让ChatGPT把这件T恤，给滑板须眉穿上。

Prompt：能不克不及把刚才晾衣绳上挂的那件T恤，直接给滑板那哥们穿上？

从以上两个demo中，不难看出GPT Image 1.5加持下，ChatGPT精准编辑图片的才能——

可以做到指哪改哪，同时多轮编辑后，还能保持一致性。

创造力爆表，拿捏细节

编辑是基本，GPT Image 1.5创造力在“大年夜变身”时，尤为刺眼。

它可以经由过程改变和添加元素——比如文字和排版——让设法主意落地，同时保存重要细节。

这些转换既实用于简单的概念，也搞得定复杂的脑洞。并且在新的ChatGPT Images功能中，不消提示词，应用预设的风格和创意直接上手。

比如，上传一张两人合影图，让ChatGPT片子式风格的海报。

可以看到，生成后的创意图片气场一会儿就来了。并且指令中文字细节，也完美在图片中还原。

再让奥特曼变成80年代健身锻练，头发蓬松，头戴发带，手戴护腕。

Prompt：把我变成那种标记性的80年代VHS录像带风格的健身锻练，保存我本来的面部构造和神情。脸部要直策应用正宗的80年代照片和视频特效：柔和的光晕、稍微的模糊、一点点噪点、稍微的色彩溢出，还有那种能影响肤色和边沿细节的淡淡扫描线。造型要穿那种活力四射的80年代健身装，毛巾布发带、护腕，还有带霓虹配色的活动服。头发要做成80年代那种蓬松造型，顺着本来的长度和发质来。妆容假如是那种亮色系的复古妆，跟整体造型搭的话也可以加。整体光线用柔和的粉彩摄影棚布光，加上稍微画质受损的VHS美学，让脸和身材都出现出那种模仿旌旗灯号的氛围。画面如果我正在带大年夜家做有氧活动的状况。屏幕上再配点响应的文字。

不得不说，ChatGPT捕获到了上世纪80年代那种精华。

就连“glam doll”风格的生成，ChatGPT也能一键拿捏。

就着这张图，让滑板须眉衣服变成“红色”，刹时完成。

奥特曼一刹时就有了“苛刻辣妹”范儿～

更有趣的是，还可以把人物（奥特曼）变成一个有效的挂饰。

Prompt：把我变成一个光面模压玻璃雕刻成的挂饰，外面是高光漆面，从各个角度都能反光。触感要极其滑腻冰冷，分量感要既显易碎又显永恒。涂层如果那种有光泽的珐琅质感，介于陶瓷和糖衣外壳之间——反光度要高，让渺小的高光在曲面上像柔和火花一样绽放。用渺小的金属装潢勾画轮廓和纹理——点、线和金银丝图案，动起来会闪烁。这些要用精细的亮粉漆或微珠来做，营造出手工装潢的感到；闪光要有层次感，不是平的，让光线仿佛在凸起的细节上跳跃。整件作品要披发出一种复古的媚俗豪华感：鲜艳的色块撞色闪亮的点缀，既俏皮又克意。曲线受光处要有奥妙的彩虹光泽——透着金、玫瑰色和珍珠色。外面质感要看起来像是能吃的，像上釉的糖或者倒入模具的熔化糖果。用精细的金环和细绳吊挂着，这挂饰要带着一种平和的戏剧感悬停，既喜庆又具雕塑感。这得是那种既标记性又滑稽的物件，一件在圣诞树灯或影棚灯下闪闪发光的宣言单品——表现坎普风的优雅和手工怀旧感。

照样圣诞白叟款的。

另一大年夜局限是新模型还无法靠得住PS多人大年夜合影（上），处理之后人脸特点轻易走形（下）。

再把奥特曼在苹果WWDC一次登台演讲经典粉色衣服拿出来，再让如今的他穿上看看后果。

Prompt：用上传的图片做主体参考。把它改成极简主义的 90 年代美国时尚告白。要完全保存主角的面部特点、比例、姿势和神情。完全保存双领Polo衫本来的色彩。风格：干净、低调、高端时尚画报风。穿搭：双层Polo造型（一件Polo叠穿在另一件上），经典剪裁，中性色或稍微柔和的色彩。场景：无缝摄影棚背景纸，构图要简单。布光：柔和平均的影棚光，带柔和暗影；肤色要天然。情感：自负、松弛、不过时。品牌写：GPT‑Shirt。摄影风格：中画幅胶片质感，奥妙的颗粒感，比较度要克制。

气场这块，照样看本人。

Prompt：做一个超风格化的3D漂浮人头，要把主角做成那种娇蛮、迷人、一脸不爽和无感的版本：半眯着眼、挑眉、嘴角稍微上扬，透着经典的“苛刻辣妹”范儿。皮肤如果滑腻的亮胶质感，颧骨和鼻头打上强高光，捕获柔和的影棚光。眼影要全息偏光的，从紫到青渐变，带清楚的反光点。头发要稠密、顺滑、油亮，做成雕塑感的大年夜波浪或者利落的盘发，像抛光亚克力一样反光。加个金属铬的小鼻环（钉或环），带点拉丝金属反光。人头要悬浮在纯白中性背景上，倾斜15度，就像高等产品衬着图那样。用通亮漫射的影棚光，不要硬暗影，强调光泽感、塑胶感和次外面散射，做出来的深度要逼真。情感要娇蛮、时髦、冷淡抽离。机位要特写肖像，正视镜头，85mm焦段。材质要那种超腻滑、高光泽、卡通风格的塑料感皮肤、嘴唇和头发。

Prompt：把他放进一个2000年代的换装小游戏界面里，情况全搞成粉色系。确保这副墨镜也在套装里。

奥特曼的衣橱，很相符他的人设。并且，就连请求中的那副墨镜，也涌如今图片中。

平步青云，更进一步

ChatGPT还可以把奥特曼变成经典之作——“戴珍珠耳环的少女”。

还能让他为饮料告白代言。

Prompt：用附件里这个汉子的脸，为一个叫“SOTA”（一种新苏取水）的新饮料做一个复古汽水告白。标语写：nothing artificial about it（纯天然，无人工）。风格要忠诚还原那个时代。

一轮演示下来，ChatGPT Image创造力这块更具脑洞。比起GPT-4o主打的吉卜力风，新一疆土像模型更有创意。

Prompt：

Prompt：拿这两小我的照片做一张老派好莱坞黄金时代风格的片子海报，片名叫《codex》。戏服随便改，相符那个年代就行。演员名字改成Wojciech Zaremba（左）和Greg Brockman（右）。导演Sam Altman，制片Fidji Simo。制片方写：A Feel the AGI Pictures Production。

更听人话，6x6网格完美还原

跟第一版GPT Image比拟，1.5版本听批示的才能更强了。

这使得更精准的编辑以及更复杂的原创构图成为可能，元素之间的关系也能按照预期保存下来。

直接上地狱级难度——6x6网格，36个元素，GPT Image 1.5 丝滑、精确，一个不差。

Prompt：

第1行：希腊字母β、沙岸球、柠檬、机械人、鱼缸、青蛙

第2行：螳螂、名表、浴缸、墨镜、彩色蝴蝶、信封

第3行：邮票、相框、冒热气的饺子、单词miracle、双板滑雪板、字母Z

第4行：马桶、地铁代币、静音图标、喷鼻水、蜻蜓、滑板头盔

第5行：蓝牙图标、数字13、绿色的心、魔方、加拿大年夜鹅、士兵头盔

第6行：白狗、浮水衣、绳结、键盘、纸巾盒、数字14

左：新版模型；右：旧版模型

文本清楚衬着，直出编程

在文字衬着上，新模型又进了一步，能处理更密集、字号更小的文本。

如下，在一张图上介绍GPT-5.2，ChatGPT的Markdown衬着的才能，恐怖如斯。

下面这张卡路里信息图，细节还原度超乎想象。

Prompt：做一张图，图里要有一张打印出来的复古老照片。照片上有一年青亚裔男的和一年青白人男，俩人在酒吧里都戴着圣诞帽，个中一个手里还拿着酒。那张打印照片上得能看见相机闪光灯留下的反光点。照片还得带个那种可见的细白边儿，并且稍微歪着点放。

Prompt：

就连复杂的编程界面，ChatGPT都能编译出来。

Prompt：

更多晋升

在其他维度上，新模型也多有改进，让输出变得更直接可用。

比如，它能画好很多的人脸，并且看起来更天然。

让ChatGPT Image生成一张1970年代的伦敦，新（左）旧（右）两版比较差别明显。

在人脸细节上，1.5版本更强，更逼真。

但时，Google方才宣布了新旗舰模型Gemini 3和图像生成对象Nano Banana Pro，后者更是在多个基准测试中登顶LMArena排行榜。

Prompt：做一个1970年代伦敦切尔西的街景，要那种照片级的写实，全焦，纤毫毕现。街上人山人海，还要有一辆公交车，车上有个告白写着“ImageGen 1.5”，再加上OpenAI的标和副标题“Create what you imagine。整体风格要超写实的业余摄影，就像iPhone顺手拍出来似的……

再比如，人山人海的「大年夜排场”，新版（下图左）更逼真更天然，旧版（下图右）一眼过时：

Prompt：金门大年夜桥跟前，乌泱乌泱好几万人的大年夜排场。人群里头每小我的脸都得看得清清楚楚。

一位潜水员在海底弹钢琴，新版（左）写实更有一种人味儿。

Prompt：一个潜水员在水底下弹钢琴，旁边有丽人鱼围不雅。超写实的业余拍摄风格。

让它生成一张带眩光的照片，下面比较图，一眼就能看出右边后果更假。

为了评估机能，OpenAI从新跑了ChatGPT Image 1.0宣布时的很多示例。

在各类案例中，新模型显示出明显的改进，尽管成果仍然不完美。固然此版本代表了有意义的进步，但在将来的迭代中仍有很大年夜的改进空间。

比如，日漫风展示海洋不合深度的生物剖面图，新（左）细节更多，但风格明显不如旧版（右）的更相符“日漫风”。

Prompt：做一张深海生物的海报，要展示不合深度的。搞一个竖着的海洋剖面图，风格就用那种特别精细、好看标日系动漫风。

而阴郁奇幻动漫风，新版（左）也比旧版（右）也出现了明显的懂得误差：

Prompt：给我画张像，风格要那种阴郁奇幻动漫里的感到。

对此，解决筹划是：尝尝用“图片”功能里的预设滤镜，应当能帮上忙。别的，上一版的ChatGPT Images如今也做成了一个自定义GPT，也可以直接去用旧版。

做一个6列6行的网格图，内容如下：

Prompt：能不克不及给他们都穿上印着“OpenAI”字样的T恤，然后让大年夜家都笑得高兴点。

人一多，新模型修图就很难精准地保持住每小我的长相特点了。

另一大年夜局限是多说话文字衬着，问题重重——

中文直接拉完了……更别提阿拉伯语和希伯来语等非英语说话了。

Prompt：能不克不及画张图，上面列点用中文点餐的根本常用语。

API：便宜了20%

API中的GPT Image 1.5供给了与ChatGPT Images雷同的所有改进。

在雷同提示词下，与GPT Image 1.5比拟，Nano Banana生成的图像加倍逼真天然，在电商创意素材上极为有利。

举例来说，它在品牌标记和关键视觉后果在多次编辑中保持更一致，是以异常合适图形和Logo设计等营销和品牌工作，以及电商团队从单一来源图像生成完全的产品图库（不合变体、场景和角度）。

与GPT Image 1比拟，GPT Image 1.5的图像输入和输出价格如今便宜了20%，是以你可以用同样的预算生成和迭代更多图像。

今朝，各行各业的企业和始创公司，包含创意对象、电子商务、营销软件等，都已经用上了GPT Image 1.5。

阁下滑动查看

奥特曼亲手拉响紧急警报

此次更新，也是对Google的强势还击。

就在上个月，因GoogleGemini抢占市场份额，奥特曼紧急拉响“红色警报”（code red）。

面对Google步步紧逼，OpenAI敏捷加快节拍：大年夜约5天前，宣布了GPT-5.2；如今，又推出进级疆土像模型。

OpenAI的这波更新，显然是直面GoogleNano Banana Pro的挑衅——后者在开辟者中口碑极佳。

而OpenAI面对的敌手，还远不止Google。

本年8月，Qwen-Image就已支撑中英文可读文字生成；Black Forest Labs也宣布了开源图像模型Flux.2，实力不俗。

这场AI图像模型之争，显然已经进入白热化阶段，目标很明白：博得企业市场。

奥特曼强调了新模型诸多晋升和新的编辑功能。

她认为，经由过程ChatGPT Images及更多功能，缩短“所思”与“所得”之间的距离。

人类的思维，远不止于文字。事实上，那些最扣人心弦的灵感，往往最初只是脑海中的一幅画面、一段旋律、一个动作或一种模式。假如AI想助我们要释放全部潜能，它就必须用我们习惯的方法——去懂得、去表达、去沟通。

Fidji Simo泄漏，除了图像生成器，OpenAI还在周全进级ChatGPT的视觉体验：

以前几个月里，我一向在谈论 ChatGPT 的进化偏向：它正从一个被动的、基于文本的产品，演变为一个更直不雅、更能与你想要完成的义务慎密相连的智能助手。

从纯文本向多模态和动态 UI（用户界面）的改变，恰是这一变革的关键一环，能看到这些进展，我倍感高兴。

Fidji Simo泄漏，将来用户在搜刮问题时，将能看到更多可视化信息和清楚来源。例如换算单位、查比赛比分等场景，图示比文字更直不雅。

但体验过GPT Image 1.5和Nano Banana Pro的网友，直言此次OpenAI“黔驴技穷”：

一张用青蛙头恶搞奥特曼的梗图，开端传播：

悲哀蛙或佩佩蛙（左），整体上高度模仿OpenAI的预热图（右）——雷同的背景，雷同的文字，雷同的眼神，类似的服饰

这确切有些在内涵奥特曼了。

但最狠的评论，当属网友在OpenAI推文下直接“打脸”：

OpenAI彻底完了。

下图中，上两张为GPT Image 1.5生成，下两张为Nano Banana Pro生成。

提示词：53岁白人德国男性在卧室中，典范的意大年夜利风格卧室，架子上堆着箱子和书本，背景处有一张书桌，上面摆着 iMac 和散落遍地的纸张，身穿灰色连帽衫（带简约 logo），戴着婚戒，手段上有一条低调的红色手链，直视镜头，天然随拍的用户原创内容风格

不过，也有网友表示，GPT Image 1.5生成的“马斯克和奥特曼圣诞合影”，逼真到完全看不出一丝马脚。

推敲到Gemini 3.0 Flash立时要来了，新的Nano Banana图像生成功能或许速度更快、价格更便宜，不知道OpenAI此次的Image 1.5是不是“徒劳的挣扎”。

可以肯定的是，OpenAI的紧急警报，一时停不下来。

参考材料：HYJ

https://x.com/OpenAI/status/2000990989629161873

https://openai.com/index/new-chatgpt-images-is-here/

点赞(0) 打赏

本文分类：互联网
本文标签：AI 人工智能跑分第一实战拉胯 GPT Image 1.5被骂惨
浏览次数：34 次浏览
发布日期：2025-12-17 14:50:25
本文链接：https://fqpy.com/index.php/internet/1164

上一篇 > OpenAI图像新模型带来4倍速、降价20% 但照样输给谷歌
下一篇 > 《阿凡达3》媒体口碑出炉烂番茄70%：系列最低分

跑分第一实战拉胯 GPT Image 1.5被骂惨

评论列表共有 0 条评论

发表评论取消回复

跑分第一实战拉胯 GPT Image 1.5被骂惨

借有名政客推动构造 OpenAI聘请英国前财长与各国合建AI基本举措措施

新型AI模型“读心”才能惊人：不仅看穿动作 更能预判意图

跑分第一实战拉胯 GPT Image 1.5被骂惨

OpenAI图像新模型带来4倍速、降价20% 但照样输给谷歌

评论列表 共有 0 条评论

发表评论 取消回复

新型AI模型“读心”才能惊人：不仅看穿动作更能预判意图

评论列表共有 0 条评论

发表评论取消回复