ChatGPT免费模型进级了：幻觉砍半/记忆更强/答复更简洁

138 阅读 0 评论 0 点赞

奥特曼特别强调，假如你比来都只用深度思虑模型了，不妨回来看看。

MMMU-Pro测试用于衡量模型处理文本和图像中专家级问题的才能，其精确率从69.2%晋升至76.0%。

第一刀先砍幻觉

作为默认模型，最先要补的是更精确，少编。

与前代比拟，GPT-5.5 Instant在事实精确性方面有了明显进步，特别是医疗、司法和金融等高风险提示中，产生的虚假陈述削减了52.5%。

在用户之前已标记为存在事实缺点的棘手对话中，不精确陈述削减了 37.3%。

OpenAI供给了一个代数问题作为示例：用户上传了一张手写方程式的照片，个中包含一个计算缺点。

GPT-5.3 Instant最初认同用户的解法，随后发明x=3不成立，却缺点地得出结论：该方程式无解。

GPT-5.5 Instant起先也认同用户的计算，但随后发清楚明了用户从新分列方程式时的缺点，并求解了修改后的二次方程。

这个变更放在默认模型上，意义更大年夜。

GPT-5.5 Instant从5月5日开端向所有ChatGPT用户滚动上线，替代GPT-5.3 Instant作为默认模型。

因为很多人天天问ChatGPT的问题，恰是合同、报销、病症解释、代码报错、功课思路。

这些场景里，模型一本正经掉言，比“不会”更麻烦。

基准测试成果也印证了这一点。在竞争激烈的数学测试AIME 2025中，精确率从65.4%升至81.2%。

测试博士程度科学推理才能的GPQA，精确率从78.5%晋升至85.6%。

解读和推理科学图表的基准测试CharXiv的精确率也从75.0%晋升至81.6%。

OmniDocBench 测试（用于从复杂文档中提取构造化数据）的缺点率则从14.6%降低至12.5%。

答得更准之后，还有另一个老问题。

答得太长。

以前同一个问题，有时刻会先来一大年夜段免责声明，再堆三层列表，最后还追问一句“你欲望我持续吗”。

如今OpenAI的说法是：削减过度格局化，削减不须要的追问，也削减没须要出现的神情符号。

在这个例子中，GPT-5.5 Instant应用的单词数削减了 30.2%，行数削减了29.2%。

针对不合情况供给了可用的筹划，并且对事纰谬人。

OpenAI认为，GPT-5.3 Instant给的谜底更周全，尤其是在“不该做什么”部分，但对于一个非正式的建议提示来说，显得有些过于复杂，构造和润饰可能超出了用户的实际需求。

记忆更强，但让你能控制。

GPT-5.5 Instant更善于应用你已经给过ChatGPT的高低文。

包含连接的邮箱，以前的汗青对话，上传过的文件。

关键它能断定什么时刻这些高低文真的能让答复变好，而不是每次都硬套记忆。

此次OpenAI还引入了“记忆来源”功能，会向用户显示哪些记忆影响了本次答复。

假如某笔记忆过时了，用户还可以更正或删除。

此次GPT-5.5 Instant的风格变更，核心是更短更聚焦，但不丢本质信息。

什么时刻能用上？

少说废话，也是一种才能

API里对应的是chat-latest。

旧模型不会急速消掉，付费用户还能在模型设备里持续拜访GPT-5.3 Instant三个月，之后再退役

把握了恰当的语气：非正式、实用且相符职场规范，避免了过度解释。

个性化加强功能会先向Plus和Pro用户的网页端推出，移动端随后上线。Free、Go、Business、Enterprise会在后续几周扩大。

点赞(0) 打赏

本文分类：互联网
本文标签：AI 人工智能 ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁
浏览次数：138 次浏览
发布日期：2026-05-07 09:54:48
本文链接：https://fqpy.com/internet/13628

上一篇 > 对标OpenClaw Meta被曝开辟个性化AI智能体
下一篇 > AMD全新X3D CPU现身 PRO产品线初次上16核

ChatGPT免费模型进级了：幻觉砍半/记忆更强/答复更简洁

评论列表共有 0 条评论

发表评论取消回复

ChatGPT免费模型进级了：幻觉砍半/记忆更强/答复更简洁

DeepSeek拟募资最高40亿美元 估值或达500亿美元

前沿AI模型同场竞技炒股成果亏多赚少 金融业最难的工作还得靠真人

ChatGPT教导研究被撤稿：AI进修红利证据并不坚固 统计办法遭质疑

Meta正在开辟名为“Hatch”的AI智能体及Instagram内置AI购物对象

评论列表 共有 0 条评论

发表评论 取消回复

DeepSeek拟募资最高40亿美元估值或达500亿美元

前沿AI模型同场竞技炒股成果亏多赚少金融业最难的工作还得靠真人

ChatGPT教导研究被撤稿：AI进修红利证据并不坚固统计办法遭质疑

评论列表共有 0 条评论

发表评论取消回复