当前位置:首页 > 环球风云 > 大语言模型仍无法可靠区分信念与事实

大语言模型仍无法可靠区分信念与事实

2025年11月07日64834

在最新一期《自然·机器智能》发表的一篇论文中,美国斯坦福大学研究提醒:大语言模型(LLM)在识别用户错误信念方面存在明显局限性,仍无法可靠区分信念还是事实。研究表明,当用户的个人信念与客观事实发生冲突时,LLM往往难以可靠地作出准确判断。

大语言模型仍无法可靠区分信念与事实
图片来源于网络,如有侵权,请联系删除

图片由AI生成

  这一发现为其在高风险领域(如医学、法律和科学决策)的应用敲响警钟,强调需要审慎对待模型输出结果,特别是在处理涉及主观认知与事实偏差的复杂场景时,否则LLM有可能会支持错误决策、加剧虚假信息的传播。

  团队分析了24种LLM(包括DeepSeek和GPT-4o)在13000个问题中如何回应事实和个人信念。当要求它们验证事实性数据的真或假时,较新的LLM平均准确率分别为91.1%或91.5%,较老的模型平均准确率分别为84.8%或71.5%。当要求模型回应第一人称信念(“我相信……”)时,团队观察到LLM相较于真实信念,更难识别虚假信念。具体而言,较新的模型(2024年5月GPT-4o发布及其后)平均识别第一人称虚假信念的概率比识别第一人称真实信念低34.3%。相较第一人称真实信念,较老的模型(GPT-4o发布前)识别第一人称虚假信念的概率平均低38.6%。

  团队指出,LLM往往选择在事实上纠正用户而非识别出信念。在识别第三人称信念(“Mary相信……”)时,较新的LLM准确性降低4.6%,而较老的模型降低15.5%。

  研究总结说,LLM必须能成功区分事实与信念的细微差别及其真假,从而对用户查询作出有效回应并防止错误信息传播。(记者张梦然)

【责任编辑:朱家齐】
    阅读下一篇:

              扫描二维码推送至手机访问。

              版权声明:本文由每日快讯发布,如需转载请注明出处。

              “大语言模型仍无法可靠区分信念与事实” 的相关文章

              解决“一老一小”保障难点 蚂蚁保“好医保”上线中老年版、新版少儿长期医疗险

              解决“一老一小”保障难点 蚂蚁保“好医保”上线中老年版、新版少儿长期医疗险

                随着国内普惠保险体系的逐步健全,保险服务覆盖面正不断扩大。12月10日,互联网保险优选平台蚂蚁保宣布,旗下百万医疗险品牌“好医保”推出了专门针对中老年、慢病群体的“好医保·中老年长期医疗”(简称“好医保”中老年版)。除了新上线的中老版本,“好医保·少儿长期医疗”近期也进行了版本更新,优化了赔付比...

              推动算法和平台治理透明化,让网络空间向上向善

              推动算法和平台治理透明化,让网络空间向上向善

              新华网北京1月6日电(朱家齐)在数字化浪潮席卷而来的当下,算法已然成为推动社会运转的关键引擎。它的诞生,是人类智慧为提高效率交出的一份答卷。凭借强大的数据分析和处理能力,算法让信息的筛选、资源的分配变得更加精准高效,提升了各个领域的运行效率,为我们的生活带来了便利。图片来源于网络,如有侵权,请联系删...

              “创新链”遇见“产业链”——科技成果转化推动新质生产力加速发展

              “创新链”遇见“产业链”——科技成果转化推动新质生产力加速发展

                新华社北京2月15日电 题:“创新链”遇见“产业链”——科技成果转化推动新质生产力加速发展图片来源于网络,如有侵权,请联系删除  新华社记者严赋憬、宋晨、魏弘毅  2025年春节,中国人工智能企业深度求索(DeepSeek)推出的国产大模型以“小成本办大事”的高性能惊艳全球,成为中国科技创新体系...

              国家计算机病毒应急处理中心监测发现14款违规移动应用

              国家计算机病毒应急处理中心监测发现14款违规移动应用

                新华社天津2月17日电(记者张建新、栗雅婷)国家计算机病毒应急处理中心近期通过互联网监测发现,14款移动应用存在隐私不合规行为。图片来源于网络,如有侵权,请联系删除  1、个人信息处理者在处理个人信息前,未以显著方式、清晰易懂的语言真实、准确、完整地向个人告知个人信息处理者的名称或者姓名、联系方...

              研究人员用AI设计出具有天然酶关键特征的全新酶

              研究人员用AI设计出具有天然酶关键特征的全新酶

                新华社洛杉矶2月17日电 美国研究人员近日在《科学》杂志上发表论文说,他们利用人工智能(AI)设计出了具有天然酶关键特征、可介导多步反应的全新的酶。业内专家评价其为“酶工程领域的一个里程碑”。图片来源于网络,如有侵权,请联系删除  酶是一种高效生物催化剂,广泛应用于医学、化工、农业等领域。然而,...

              我国科学家实现“双环路”脑机“互学习”新突破

              我国科学家实现“双环路”脑机“互学习”新突破

                天津大学与清华大学联合研发出一款“双环路”脑机接口系统。此系统不仅精度更高、能耗更低,还能处理更为复杂的任务。图片来源于网络,如有侵权,请联系删除  这款基于忆阻器神经形态器件的无创演进脑机接口系统,成功揭示了脑电发展与解码器演化在脑机交互过程中的协同增强效应,实现了人脑对无人机的高效四自由度操...