AI
上科大年夜何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」
DA-DPO 不依赖额外标注,通过难度感知训练提升模型可靠性。
清华刘洋团队论文:揭示为何 70B 的医疗模型,反而不如 8B 会问诊丨ILCR 2026
DOCTOR-R1:将临床问诊建模为 POMDP,用强化学习训练会动态提问的医疗智能体。
清华大年夜学王智:工业大年夜模型「数据、算力、成本」三重门,我们若何体系破局?丨GAIR 2025
工业大模型的关键不在于“做得多大”,而在于是否能在真实产线的算力、成本与机理约束下稳定运行。
清华孙茂松团队 × 深言科技:以解释作为练习旌旗灯号,让 8B 模型在幻觉检测上反超闭源大年夜模型
FaithLens 模型在忠实性幻觉检测任务上,达到了当前最优效果。
