这篇由 Springer Nature 旗下期刊《Humanities & Social Sciences Communications》于 2025 年 5 月揭橥的论文,试图整合 51 项研究成果,评估学生在应用与不应用 ChatGPT 情况下的进修表示差别。 论文声称,应用 ChatGPT 对“晋升进修成就”有“明显正向影响”,对“改良进修感知”有中度正向影响,并能“促进高阶思维才能”。
这项研究揭橥后敏捷在学术与"大众,"舆论中“出圈”。 在 Springer Nature 体系内,它已被引用 262 次,整体引用次数跨越 500 次,浏览量接近 50 万。 凭借在社交媒体上的持续传播,这篇论文在期刊文章中的存眷度位列前百分位,被不少人算作“第一批关于 ChatGPT 有利于进修的硬证据”来引用和转述。 然而,在论文影响力敏捷扩散的同时,质疑声也开端累积,最终促成了此次撤稿。
对威廉姆森等研究者来说,这件事带来的挫败感并不止于一篇论文本身,而在于它所折射出的整体氛围。 在以前几年里,环绕生成式 AI 的评论辩论往往被“炒作”和乐不雅叙事主导,而真正严谨、有充分证据支撑的研究则明显不足。 他认为,此次撤稿提示人们:与其急于宣布“AI 已经彻底改变教导”,不如先扎实答复一个更根本的问题——这些对象在具体的教授教化实践中,毕竟是若何、在什么前提下影响学生和教师的行动与成果的。
爱丁堡大年夜学数字教导研究中间与 Edinburgh Futures Institute 高等讲师本·威廉姆森(Ben Williamson)指出,作者给出的结论极具“吸睛”后果,传播鼓吹 ChatGPT 能明显改良进修成果,是以被社交媒体广泛当成“金标准”证据来传播。 他批驳这项元分析在整合原始研究时办法令人担心:一方面,它似乎纳入了“质量异常低”的研究,另一方面,还把在办法、研究对象、样本等方面差别巨大年夜、根本弗成直接比较的研究成果硬性拼在一路。 在接收 Ars Technica 采访时,威廉姆森直言,这看起来是一篇“本不该该被揭橥”的论文。
时光维度上的抵触也激发了学界的当心。 ChatGPT 在 2022 岁尾才向"大众,"开放,留给研究者完成多项高质量、经同业评断的实证研究并最终汇总成元分析的时光窗口异常狭小。 威廉姆森认为,在如斯短的周期内,几乎弗成能出现几十项足以支撑严谨元分析的高质量研究,是以这本身就对论文的“样本基本”提出了根本性疑问。
除了威廉姆森,其他研究者也在早期就对这项研究发出了警告。 Meaning Processing Ltd. 首席科学家伊尔卡·图奥米(Ilkka Tuomi)在 LinkedIn 上批驳,像这类元分析往往会把实际上并弗成比的研究成果混在一路,从而基于模糊甚至不一致的指标得出结论。 他提示,复杂的统计对象很轻易营造出一种“高度科学”的错觉,即使底层数据质量并弗成靠,最终依然能产出看似靠谱的数字和图表。

跟着论文在社交媒体上赓续被转发,其本来在正文中存在的诸多“限制前提”和研究细节逐渐被稀释,只剩下“ChatGPT 明显晋升进修后果”如许的标题式结论在各类传播中反复出现。 威廉姆森指出,这种“只剩标语、没有高低文”的扩散方法,加剧了"大众,"对 AI 在教导范畴感化的误判,也弱化了学术界内部对证据质量的评论辩论空间。 他担心,即便论文已经被正式撤稿,此前引用或转发过它的研究者与从业者也未必会留心到这一更新。 这意味着,“ChatGPT 能明显改良进修表示”这一核心信息可能仍会在很多场合被算作既成事实持续传播。
此次撤稿产生的时光点,也与教导体系环绕生成式 AI 的博弈高度重叠。 一些黉舍和大年夜学仍在想办法限制 AI 在功课、测验中的滥用,尤其是防备借助聊天机械人进行“代写”和作弊;与此同时,科技公司则赓续推出各类“进修助手”“功课指导”功能,把聊天机械人包装为新一代进修对象。 与此并行的,还有对“周全数字化教室”的反思,有的国度已经从新强调纸质教材与手写功课的重要性,试图改正过度依附屏幕和在线平台的偏向。

发表评论 取消回复