计算所严肃玉团队新作: Attention 并非永远是瓶颈,多 GPU 并不必定更快 系统实验表明,模型推理分为计算受限的 Prefill 与内存受限的 Decode。 互联网 2025年12月22日 0 点赞 0 评论 241 浏览
腾讯 ARC Lab 胡文博:“若何实现三维感知的视频世界模型,这异常值得摸索”|GAIR 2025 我们正在努力创建一个具备三维感知能力的视频世界模型。 互联网 2026年01月03日 0 点赞 0 评论 236 浏览
清华刘洋团队论文:揭示为何 70B 的医疗模型,反而不如 8B 会问诊丨ILCR 2026 DOCTOR-R1:将临床问诊建模为 POMDP,用强化学习训练会动态提问的医疗智能体。 互联网 2026年02月26日 0 点赞 0 评论 226 浏览
港中文 MMlab×美团新研究:仅用一个模型,应对多种视觉推理义务 港中文岳翔宇教授团队提出统一多模态推理模型 OneThinker,验证任务泛化能力。 互联网 2025年12月19日 0 点赞 0 评论 222 浏览