AI 人工智能

OpenAI宣布新一代图像模型gpt-image-1.5

OpenAI今日正式推出全新图像生成模型gpt-image-1.5,明确瞄准GoogleGemini体系下备受关注的NanoBanana系列,以提升在AI图像生成领域的竞争力。这一新模型将同时面向开发者和普通用户开放,并全面接管ChatGPT中的图像生成功能。

DeepSeek-OCR 2宣布:让AI像人一样“读懂”复杂文档

1月27日,DeepSeek团队发布《DeepSeek-OCR2:VisualCausalFlow》论文,并开源DeepSeek-OCR2模型。该模型采用创新的DeepEncoderV2新型编码器结构,它能够根据图像语义动态调整视觉信息的处理顺序,使模型在进行文字识别前先对视觉内容进行智能排序。这项技术突破源于对传统视觉语言模型处理方式的重新思考,旨在让机器更贴近人类的视觉阅读逻辑。