阿里通义开源超长高低文与记忆治理模型 QwenLong-L1.5

46 阅读 0 评论 0 点赞

阿里巴巴通义Qwen团队宣布了最新的开源 QwenLong-L1.5 模型，主打超长高低文推理和记忆治理才能，构建于 Qwen3-30B-A3B-Thinking 模型之上，并加强记忆机制以处理超出其物理高低文窗口（256K）的义务。

QwenLong-L1.5三项核心立异：

1. 数据合成管线：开辟了新的合成流程，专注于创建须要多跳溯源和全局分布式证据推理的挑衅性义务，而非简单的“大年夜海捞针”义务。

2. 强化进修策略：引入了义务均衡采样（Task-balanced sampling）和自适应熵控策略优化（AEPO）等 RL 策略，以稳定长高低文练习。

3. 记忆治理框架：透过多阶段融合强化进修，在单次推理256 K 高低文窗口外，结合记忆更新机制处理更长义务在领先的长高低文基准测试中，QwenLong-L1.5 比其基线模型 Qwen3-30B-A3B-Thinking 平均赶过 9.9 分，机能可与 GPT-5 和 Gemini-2.5-Pro 等顶级模型媲美。

开源地址：https://github.com/Tongyi-Zhiwen/Qwen-Doc/tree/main/QwenLong-L1.5

点赞(0) 打赏

本文分类：互联网
本文标签：Qwen3 阿里通义开源超长上下文与记忆管理模型 QwenLong-L1.5
浏览次数：46 次浏览
发布日期：2025-12-24 20:13:39
本文链接：https://fqpy.com/index.php/internet/2851

阿里通义开源超长高低文与记忆治理模型 QwenLong-L1.5

评论列表共有 0 条评论

发表评论取消回复

阿里通义开源超长高低文与记忆治理模型 QwenLong-L1.5

阿里通义开源超长高低文与记忆治理模型 QwenLong-L1.5

阿里千问 App 宣布“2025 十大年夜 AI 提示词”榜单

阿里千问辟谣“干逝世豆包”：假的，图片系 AI 生成

阿里成立千问C端事业群

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复