就在方才,OpenAI抛出了它的“圣诞彩蛋”——新一代旗舰图像模型ChatGPT Images正式登场。

这一次,OpenAI将生图才能直接拉满:

  • 精准操控: 指令懂得力大年夜幅晋升,真正做到“指哪改哪”。

  • 细节狂魔: 画面细节保存完全,质感细腻。

  • 极速生成: 速度较前代晋升了整整4倍。

并且从今天起,所有ChatGPT免费用户即可上手,开辟者也可直接调用GPT Image 1.5 API。

在LMArena竞技场上,它似乎弗成克服:

  • 文生图:以1264 Elo分登顶榜首,力压GoogleNano Banana Pro(NBP)。

  • 图像编辑:chatgpt-image-latest以3分优势险胜NBP夺冠,而GPT Image 1.5紧随厥后位列第4。

在Artificial Analysis上,更是拿下了“双料第一”。



阁下滑动查看

然而,反转来得太快。

网友实测后发明,这似乎又是一个“高分低能”的典范。

在Yuchen Jin的比较中,GPT的生图才能根本上能达到GoogleNBP的程度,但智商却惨遭碾压。

尤其是在处理手写体笔记时,GPT Image 1.5的生成看着像模像样,然则完全没做对。

作为OpenAI的应用CEO,Fidji Simo则阴郁对标GoogleNano Banana Pro,直言此次是从单一文本转向动态AI体验。



左:ChatGPT Images;右:Nano Banana Pro

再让他们全部穿上OpenAI定制衣服,全部拿捏。(PS:Mark Chen处理脖子有些怪怪的)


左:ChatGPT Images;右:Nano Banana Pro

这一落差激发了社区的激烈吐槽。

有人直言不讳:“GoogleNano Banana Pro依然是王者。”

更有人痛批:“这可能是OpenAI又一次令工资难、且毫无意义的宣布。”



先是GPT-5.2引全网差评,又是GPT Image 1.5真实首测不敌Google“喷鼻蕉”。

看来,OpenAI岁尾这场硬仗,彻底败给了Google......

GPT Image 1.5登场

Prompt:把我放进《戴珍珠耳环的少女》那幅画里。


史诗级进化


言归正传。

根据官方博客介绍,如今让ChatGPT修图,明显比之前更听话了——

哪怕是细枝末节,只改让改的处所,同时确保光线、构图和人物样貌等元素在输入、输出和后续编辑中保持一致。


OpenAI华人研究员陈博远一张图,验证了GPT Image代号“榛子”出炉了

如许一来,即可获得真正相符意图的成果。

不论是有效的照片编辑,服装发型试穿试戴,照样保存原图精华的风格滤镜和概念转换,ChatGPT皆可搞定。

这一波更新,让ChatGPT成为随身携带的创意工作室:既能扎实干活儿,又能放飞玩创意。

这不,圣诞奥特曼来了......

OpenAI坦言:生成某些特定艺术风格的才能,比之前的版本退步了。


指哪改哪,多轮P图

GPT Image 1.5善于各类“手术”,包含添加、删减、组合、融合和置换。

是以,在想要改变图片的同时,它还能不损掉图片本来的“味道”。

两人一狗,GPT Image 1.5精准捕获了诞辰会上,他们被迫“营业”的无聊感。



Prompt:做一张00年代胶片感的照片,把这俩男的和狗都合成进去,拍他们在小孩诞辰会上那种一脸无聊的样子。

一些女孩子最爱的“芭比换装”,也能在ChatGPT中玩了。

然后,基于这张图基底,就可以让ChatGPT“连环编辑”了,比如背景加一堆熊孩子。


Prompt:背景加一堆熊孩子,乱扔器械乱叫唤的那种,搞乱一点。

接着,把左边须眉变成动漫脸,小狗改成毛绒公仔,AI精准完成编辑。


Prompt:左边那男的改成手绘复古日漫风,狗改成毛绒公仔,右边那男的和背景都别动。


Prompt:给他们全套上OpenAI的毛衣,就长如许的。

更绝的是,ChatGPT还能一键切背景,诞辰party刹时变成OpenAI直播间。


Prompt:如今把那俩男的去掉落,只留那条狗,然后把它放到一个OpenAI直播画面里,就跟附图长得差不多的那种


再以滑板活动为例,让ChatGPT生成一张洛杉矶风景滑板拍摄,90年代末纪实街头摄影风格。



Prompt:洛杉矶风景滑板拍摄,采取以下风格:90年代末纪实街头摄影,35mm彩色胶片拍摄,徕卡M风格旁轴相机配35mm镜头,柯达Portra 400色彩面板,天然日光,柔和比较度,柔和逼真的色彩,嵌入式胶片颗粒,稍微的边沿柔化,不雅察性抓拍构图,无HDR,无现代数码锐化,无片子照明。

Prompt:把滑板那人的衣服改成红的,帽子改成黄的。限速牌写15,那个卡车得是辆消防车。

还不敷热烈,左边来一帮群众,右边来只老鹰,空中再加个飞艇,要啥有啥。


Prompt:左边加一帮围不雅群众,右边马路上蹲只老鹰,远处空中再飞个飞艇。

接下来,把这一画面直接打板印在T恤上,ChatGPT直出图片。


Prompt:弄一件挂在晾衣绳上的T恤,把刚才上面说的那个完全画面全部印在T恤上,要全包的那种印花。

最后,还能让ChatGPT把这件T恤,给滑板须眉穿上。


Prompt:能不克不及把刚才晾衣绳上挂的那件T恤,直接给滑板那哥们穿上?

从以上两个demo中,不难看出GPT Image 1.5加持下,ChatGPT精准编辑图片的才能——

可以做到指哪改哪,同时多轮编辑后,还能保持一致性。

创造力爆表,拿捏细节

编辑是基本,GPT Image 1.5创造力在“大年夜变身”时,尤为刺眼。

它可以经由过程改变和添加元素——比如文字和排版——让设法主意落地,同时保存重要细节。

这些转换既实用于简单的概念,也搞得定复杂的脑洞。并且在新的ChatGPT Images功能中,不消提示词,应用预设的风格和创意直接上手。


比如,上传一张两人合影图,让ChatGPT片子式风格的海报。


可以看到,生成后的创意图片气场一会儿就来了。并且指令中文字细节,也完美在图片中还原。

再让奥特曼变成80年代健身锻练,头发蓬松,头戴发带,手戴护腕。

Prompt:把我变成那种标记性的80年代VHS录像带风格的健身锻练,保存我本来的面部构造和神情。脸部要直策应用正宗的80年代照片和视频特效:柔和的光晕、稍微的模糊、一点点噪点、稍微的色彩溢出,还有那种能影响肤色和边沿细节的淡淡扫描线。造型要穿那种活力四射的80年代健身装,毛巾布发带、护腕,还有带霓虹配色的活动服。头发要做成80年代那种蓬松造型,顺着本来的长度和发质来。妆容假如是那种亮色系的复古妆,跟整体造型搭的话也可以加。整体光线用柔和的粉彩摄影棚布光,加上稍微画质受损的VHS美学,让脸和身材都出现出那种模仿旌旗灯号的氛围。画面如果我正在带大年夜家做有氧活动的状况。屏幕上再配点响应的文字。

不得不说,ChatGPT捕获到了上世纪80年代那种精华。


就连“glam doll”风格的生成,ChatGPT也能一键拿捏。


就着这张图,让滑板须眉衣服变成“红色”,刹时完成。

奥特曼一刹时就有了“苛刻辣妹”范儿~


更有趣的是,还可以把人物(奥特曼)变成一个有效的挂饰。


Prompt:把我变成一个光面模压玻璃雕刻成的挂饰,外面是高光漆面,从各个角度都能反光。触感要极其滑腻冰冷,分量感要既显易碎又显永恒。涂层如果那种有光泽的珐琅质感,介于陶瓷和糖衣外壳之间——反光度要高,让渺小的高光在曲面上像柔和火花一样绽放。 用渺小的金属装潢勾画轮廓和纹理——点、线和金银丝图案,动起来会闪烁。这些要用精细的亮粉漆或微珠来做,营造出手工装潢的感到;闪光要有层次感,不是平的,让光线仿佛在凸起的细节上跳跃。 整件作品要披发出一种复古的媚俗豪华感:鲜艳的色块撞色闪亮的点缀,既俏皮又克意。曲线受光处要有奥妙的彩虹光泽——透着金、玫瑰色和珍珠色。外面质感要看起来像是能吃的,像上釉的糖或者倒入模具的熔化糖果。 用精细的金环和细绳吊挂着,这挂饰要带着一种平和的戏剧感悬停,既喜庆又具雕塑感。这得是那种既标记性又滑稽的物件,一件在圣诞树灯或影棚灯下闪闪发光的宣言单品——表现坎普风的优雅和手工怀旧感。

照样圣诞白叟款的。


另一大年夜局限是新模型还无法靠得住PS多人大年夜合影(上),处理之后人脸特点轻易走形(下)。

再把奥特曼在苹果WWDC一次登台演讲经典粉色衣服拿出来,再让如今的他穿上看看后果。



Prompt:用上传的图片做主体参考。 把它改成极简主义的 90 年代美国时尚告白。 要完全保存主角的面部特点、比例、姿势和神情。完全保存双领Polo衫本来的色彩。 风格:干净、低调、高端时尚画报风。 穿搭:双层Polo造型(一件Polo叠穿在另一件上),经典剪裁,中性色或稍微柔和的色彩。 场景:无缝摄影棚背景纸,构图要简单。 布光:柔和平均的影棚光,带柔和暗影;肤色要天然。 情感:自负、松弛、不过时。 品牌写:GPT‑Shirt。 摄影风格:中画幅胶片质感,奥妙的颗粒感,比较度要克制。

气场这块,照样看本人。


Prompt:做一个超风格化的3D漂浮人头,要把主角做成那种娇蛮、迷人、一脸不爽和无感的版本:半眯着眼、挑眉、嘴角稍微上扬,透着经典的“苛刻辣妹”范儿。皮肤如果滑腻的亮胶质感,颧骨和鼻头打上强高光,捕获柔和的影棚光。眼影要全息偏光的,从紫到青渐变,带清楚的反光点。头发要稠密、顺滑、油亮,做成雕塑感的大年夜波浪或者利落的盘发,像抛光亚克力一样反光。加个金属铬的小鼻环(钉或环),带点拉丝金属反光。人头要悬浮在纯白中性背景上,倾斜15度,就像高等产品衬着图那样。用通亮漫射的影棚光,不要硬暗影,强调光泽感、塑胶感和次外面散射,做出来的深度要逼真。情感要娇蛮、时髦、冷淡抽离。机位要特写肖像,正视镜头,85mm焦段。材质要那种超腻滑、高光泽、卡通风格的塑料感皮肤、嘴唇和头发。


Prompt:把他放进一个2000年代的换装小游戏界面里,情况全搞成粉色系。确保这副墨镜也在套装里。

奥特曼的衣橱,很相符他的人设。并且,就连请求中的那副墨镜,也涌如今图片中。


平步青云,更进一步


ChatGPT还可以把奥特曼变成经典之作——“戴珍珠耳环的少女”。


还能让他为饮料告白代言。


Prompt:用附件里这个汉子的脸,为一个叫“SOTA”(一种新苏取水)的新饮料做一个复古汽水告白。标语写:nothing artificial about it(纯天然,无人工)。风格要忠诚还原那个时代。

一轮演示下来,ChatGPT Image创造力这块更具脑洞。比起GPT-4o主打的吉卜力风,新一疆土像模型更有创意。

Prompt:

Prompt:拿这两小我的照片做一张老派好莱坞黄金时代风格的片子海报,片名叫《codex》。戏服随便改,相符那个年代就行。 演员名字改成Wojciech Zaremba(左)和Greg Brockman(右)。 导演Sam Altman,制片Fidji Simo。制片方写:A Feel the AGI Pictures Production。

更听人话,6x6网格完美还原

跟第一版GPT Image比拟,1.5版本听批示的才能更强了。

这使得更精准的编辑以及更复杂的原创构图成为可能,元素之间的关系也能按照预期保存下来。

直接上地狱级难度——6x6网格,36个元素,GPT Image 1.5 丝滑、精确,一个不差。

Prompt:

第1行:希腊字母β、沙岸球、柠檬、机械人、鱼缸、青蛙

第2行:螳螂、名表、浴缸、墨镜、彩色蝴蝶、信封

第3行:邮票、相框、冒热气的饺子、单词miracle、双板滑雪板、字母Z

第4行:马桶、地铁代币、静音图标、喷鼻水、蜻蜓、滑板头盔

第5行:蓝牙图标、数字13、绿色的心、魔方、加拿大年夜鹅、士兵头盔

第6行:白狗、浮水衣、绳结、键盘、纸巾盒、数字14


左:新版模型;右:旧版模型

文本清楚衬着,直出编程


在文字衬着上,新模型又进了一步,能处理更密集、字号更小的文本。

如下,在一张图上介绍GPT-5.2,ChatGPT的Markdown衬着的才能,恐怖如斯。



下面这张卡路里信息图,细节还原度超乎想象。

Prompt:做一张图,图里要有一张打印出来的复古老照片。照片上有一年青亚裔男的和一年青白人男,俩人在酒吧里都戴着圣诞帽,个中一个手里还拿着酒。那张打印照片上得能看见相机闪光灯留下的反光点。照片还得带个那种可见的细白边儿,并且稍微歪着点放。


Prompt:

就连复杂的编程界面,ChatGPT都能编译出来。


Prompt:


更多晋升

在其他维度上,新模型也多有改进,让输出变得更直接可用。

比如,它能画好很多的人脸,并且看起来更天然。

让ChatGPT Image生成一张1970年代的伦敦,新(左)旧(右)两版比较差别明显。

在人脸细节上,1.5版本更强,更逼真。

但时,Google方才宣布了新旗舰模型Gemini 3和图像生成对象Nano Banana Pro,后者更是在多个基准测试中登顶LMArena排行榜。


Prompt:做一个1970年代伦敦切尔西的街景,要那种照片级的写实,全焦,纤毫毕现。街上人山人海,还要有一辆公交车,车上有个告白写着“ImageGen 1.5”,再加上OpenAI的标和副标题“Create what you imagine。整体风格要超写实的业余摄影,就像iPhone顺手拍出来似的……

再比如,人山人海的「大年夜排场”,新版(下图左)更逼真更天然,旧版(下图右)一眼过时:


Prompt:金门大年夜桥跟前,乌泱乌泱好几万人的大年夜排场。人群里头每小我的脸都得看得清清楚楚。

一位潜水员在海底弹钢琴,新版(左)写实更有一种人味儿。


Prompt:一个潜水员在水底下弹钢琴,旁边有丽人鱼围不雅。超写实的业余拍摄风格。


让它生成一张带眩光的照片,下面比较图,一眼就能看出右边后果更假。


为了评估机能,OpenAI从新跑了ChatGPT  Image 1.0宣布时的很多示例。

在各类案例中,新模型显示出明显的改进,尽管成果仍然不完美。固然此版本代表了有意义的进步,但在将来的迭代中仍有很大年夜的改进空间。

比如,日漫风展示海洋不合深度的生物剖面图,新(左)细节更多,但风格明显不如旧版(右)的更相符“日漫风”。


Prompt:做一张深海生物的海报,要展示不合深度的。搞一个竖着的海洋剖面图,风格就用那种特别精细、好看标日系动漫风。

而阴郁奇幻动漫风,新版(左)也比旧版(右)也出现了明显的懂得误差:


Prompt:给我画张像,风格要那种阴郁奇幻动漫里的感到。

对此,解决筹划是:尝尝用“图片”功能里的预设滤镜,应当能帮上忙。别的,上一版的ChatGPT Images如今也做成了一个自定义GPT,也可以直接去用旧版。

做一个6列6行的网格图,内容如下:


Prompt:能不克不及给他们都穿上印着“OpenAI”字样的T恤,然后让大年夜家都笑得高兴点。

人一多,新模型修图就很难精准地保持住每小我的长相特点了。

另一大年夜局限是多说话文字衬着,问题重重——

中文直接拉完了……更别提阿拉伯语和希伯来语等非英语说话了。



Prompt:能不克不及画张图,上面列点用中文点餐的根本常用语。

API:便宜了20%

API中的GPT Image 1.5供给了与ChatGPT Images雷同的所有改进。

在雷同提示词下,与GPT Image 1.5比拟Nano Banana生成的图像加倍逼真天然,在电商创意素材上极为有利。

举例来说,它在品牌标记和关键视觉后果在多次编辑中保持更一致,是以异常合适图形和Logo设计等营销和品牌工作,以及电商团队从单一来源图像生成完全的产品图库(不合变体、场景和角度)。

与GPT Image 1比拟,GPT Image 1.5的图像输入和输出价格如今便宜了20%,是以你可以用同样的预算生成和迭代更多图像。


今朝,各行各业的企业和始创公司,包含创意对象、电子商务、营销软件等,都已经用上了GPT Image 1.5。





阁下滑动查看


奥特曼亲手拉响紧急警报

此次更新,也是对Google的强势还击。

就在上个月,因GoogleGemini抢占市场份额,奥特曼紧急拉响“红色警报”(code red)。

面对Google步步紧逼,OpenAI敏捷加快节拍:大年夜约5天前,宣布了GPT-5.2;如今,又推出进级疆土像模型。

OpenAI的这波更新,显然是直面GoogleNano Banana Pro的挑衅——后者在开辟者中口碑极佳。

而OpenAI面对的敌手,还远不止Google。

本年8月,Qwen-Image就已支撑中英文可读文字生成;Black Forest Labs也宣布了开源图像模型Flux.2,实力不俗。

这场AI图像模型之争,显然已经进入白热化阶段,目标很明白:博得企业市场。

奥特曼强调了新模型诸多晋升和新的编辑功能。



她认为,经由过程ChatGPT Images及更多功能,缩短“所思”与“所得”之间的距离。

人类的思维,远不止于文字。事实上,那些最扣人心弦的灵感,往往最初只是脑海中的一幅画面、一段旋律、一个动作或一种模式。假如AI想助我们要释放全部潜能,它就必须用我们习惯的方法——去懂得、去表达、去沟通。

Fidji Simo泄漏,除了图像生成器,OpenAI还在周全进级ChatGPT的视觉体验:

以前几个月里,我一向在谈论 ChatGPT 的进化偏向:它正从一个被动的、基于文本的产品,演变为一个更直不雅、更能与你想要完成的义务慎密相连的智能助手。

从纯文本向多模态和动态 UI(用户界面)的改变,恰是这一变革的关键一环,能看到这些进展,我倍感高兴。

Fidji Simo泄漏,将来用户在搜刮问题时,将能看到更多可视化信息和清楚来源。例如换算单位、查比赛比分等场景,图示比文字更直不雅。

但体验过GPT Image 1.5和Nano Banana Pro的网友,直言此次OpenAI“黔驴技穷”:



一张用青蛙头恶搞奥特曼的梗图,开端传播:


悲哀蛙或佩佩蛙(左),整体上高度模仿OpenAI的预热图(右)——雷同的背景,雷同的文字,雷同的眼神,类似的服饰

这确切有些在内涵奥特曼了。

但最狠的评论,当属网友在OpenAI推文下直接“打脸”:

OpenAI彻底完了。


下图中,上两张为GPT Image 1.5生成,下两张为Nano Banana Pro生成。


提示词:53岁白人德国男性在卧室中,典范的意大年夜利风格卧室,架子上堆着箱子和书本,背景处有一张书桌,上面摆着 iMac 和散落遍地的纸张,身穿灰色连帽衫(带简约 logo),戴着婚戒,手段上有一条低调的红色手链,直视镜头,天然随拍的用户原创内容风格



不过,也有网友表示,GPT Image 1.5生成的“马斯克和奥特曼圣诞合影”,逼真到完全看不出一丝马脚。


推敲到Gemini 3.0 Flash立时要来了,新的Nano Banana图像生成功能或许速度更快、价格更便宜,不知道OpenAI此次的Image 1.5是不是“徒劳的挣扎”。


可以肯定的是,OpenAI的紧急警报,一时停不下来。

参考材料:HYJ

https://x.com/OpenAI/status/2000990989629161873

https://openai.com/index/new-chatgpt-images-is-here/

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部