
本年3月,OpenAI曾为ChatGPT的图像生成功能带来一次重大年夜进级,新模型一经上线便敏捷走红,一周内用户便在ChatGPT中生成了跨越7亿张图片。随后在4月,OpenAI经由过程宣布gpt-image-1接口,将同一代图像技巧开放给开辟者应用,使其可以或许在各类应用和办事中集成图像生成才能。
在如许的背景下推出的gpt-image-1.5,被OpenAI视为正面对标Gemini Nano Banana系列的新一代核心产品。新模型在图像编辑的精细度、品牌Logo和人脸等关键元素的保真度方面都有明显晋升,同时在懂得和履行用户指令方面也更为精准。OpenAI还强调,新模型在处理图像中文字时有明显加强,尤其是在密集文本和小字号文本的清楚度与精确性上。
不过,在9月登场的GoogleGemini Nano Banana模型敏捷抢占话题与市场,借由更强的图像生成和编辑表示,大年夜幅拉升了Gemini的用户覆盖。Nano Banana被认为在画面质量和编辑灵活性方面周全领先gpt-image-1,并获得全球开辟者的广泛采取。上个月,Google又在此基本上推出Gemini 3 Pro Image(代号Nano Banana Pro),借助Gemini在推理与实际世界常识上的优势,进一步晋升生成图像的精确性与一致性。
对开辟者而言,成本优化是gpt-image-1.5的一大年夜亮点:与上一代gpt-image-1比拟,新模型在图像输入与输出的计费上便宜约20%。开辟者依旧可以经由过程quality参数精细控制生成成本,而OpenAI声称,即便在较低质量设置下,新模型仍能保持相当强的生成后果。
面向通俗用户,gpt-image-1.5已经成为ChatGPT内置图像生成体验的底层引擎。OpenAI表示,该模型可以在保持光线、构图和人物特点等细节根本不变的前提下,进行精准编辑,相较上一代实现最多4倍的机能晋升,生成与编辑响应速度更快。
合营新模型,OpenAI还在ChatGPT中上线了全新的“Images”图像专区,已在移动应用和网页版同步开放。用户可在该专区中应用预设滤镜与提示词快速上手图像生成,这些预设会按期更新,以跟随最新的创意风格与风行趋势。OpenAI表示,新的图像生成模型及ChatGPT Images体验将向所有ChatGPT用户慢慢推送,将来将持续环绕易用性与创作效力进行迭代。

发表评论 取消回复