腾讯混元 x MBZUAI 港中文新研究:将纠错纳入策略空间,Search-R2 重构搜刮加强推理进修方法 智能体性能优势并非来自更多尝试,而来自对失败路径的精确处理。 互联网 2026年02月13日 0 点赞 0 评论 279 浏览
微分智飞高飞:我们正处于通用飞翔智能爆发前夕丨GAIR 2025 “我们想要 answer back 黄仁勋那句「只有三种机器人可以大规模量产,人形机器人、无人机和汽车」。 ” 互联网 2025年12月31日 0 点赞 0 评论 360 浏览
清华刘知远团队论文:在严格可控情况下从新答复「强化进修可否教会大年夜模型新才能」丨ICLR 2026 强化学习改变了模型组织技能的方式,而非简单提升指标。 互联网 2026年02月10日 0 点赞 0 评论 261 浏览
摩尔线程最新财报:营收持续高增,推动十万卡级集群扶植 4月26日,国产GPU龙头摩尔线程(688795.SH)披露了2025年报及2026年一季报。根据公告,摩尔线程2025年实现营收15.05亿元,同比增长243 互联网 2026年05月12日 0 点赞 0 评论 217 浏览
计算所严肃玉团队新作: Attention 并非永远是瓶颈,多 GPU 并不必定更快 系统实验表明,模型推理分为计算受限的 Prefill 与内存受限的 Decode。 互联网 2025年12月30日 0 点赞 0 评论 302 浏览