当前位置:首页 > 环球风云 > 大语言模型仍无法可靠区分信念与事实

大语言模型仍无法可靠区分信念与事实

2025年11月07日64851

在最新一期《自然·机器智能》发表的一篇论文中,美国斯坦福大学研究提醒:大语言模型(LLM)在识别用户错误信念方面存在明显局限性,仍无法可靠区分信念还是事实。研究表明,当用户的个人信念与客观事实发生冲突时,LLM往往难以可靠地作出准确判断。

大语言模型仍无法可靠区分信念与事实
图片来源于网络,如有侵权,请联系删除

图片由AI生成

  这一发现为其在高风险领域(如医学、法律和科学决策)的应用敲响警钟,强调需要审慎对待模型输出结果,特别是在处理涉及主观认知与事实偏差的复杂场景时,否则LLM有可能会支持错误决策、加剧虚假信息的传播。

  团队分析了24种LLM(包括DeepSeek和GPT-4o)在13000个问题中如何回应事实和个人信念。当要求它们验证事实性数据的真或假时,较新的LLM平均准确率分别为91.1%或91.5%,较老的模型平均准确率分别为84.8%或71.5%。当要求模型回应第一人称信念(“我相信……”)时,团队观察到LLM相较于真实信念,更难识别虚假信念。具体而言,较新的模型(2024年5月GPT-4o发布及其后)平均识别第一人称虚假信念的概率比识别第一人称真实信念低34.3%。相较第一人称真实信念,较老的模型(GPT-4o发布前)识别第一人称虚假信念的概率平均低38.6%。

  团队指出,LLM往往选择在事实上纠正用户而非识别出信念。在识别第三人称信念(“Mary相信……”)时,较新的LLM准确性降低4.6%,而较老的模型降低15.5%。

  研究总结说,LLM必须能成功区分事实与信念的细微差别及其真假,从而对用户查询作出有效回应并防止错误信息传播。(记者张梦然)

【责任编辑:朱家齐】
    阅读下一篇:

              扫描二维码推送至手机访问。

              版权声明:本文由每日快讯发布,如需转载请注明出处。

              “大语言模型仍无法可靠区分信念与事实” 的相关文章

              从“替代人”到“助力人” 人形机器人或迎“量产元年”

              从“替代人”到“助力人” 人形机器人或迎“量产元年”

                上春晚扭秧歌、街头漫步、进厂“打螺丝”……人形机器人近来频繁亮相,产业关注度不断提升,有望迎来“量产元年”。图片来源于网络,如有侵权,请联系删除  伴随热度,也有担忧。成本居高不下何解?机器人为何要做成人形?是否会带来一些负面社会效应?在不少业界人士看来,发力技术攻坚、降本增效的同时,机器人“像...

              研究人员用AI设计出具有天然酶关键特征的全新酶

              研究人员用AI设计出具有天然酶关键特征的全新酶

                新华社洛杉矶2月17日电 美国研究人员近日在《科学》杂志上发表论文说,他们利用人工智能(AI)设计出了具有天然酶关键特征、可介导多步反应的全新的酶。业内专家评价其为“酶工程领域的一个里程碑”。图片来源于网络,如有侵权,请联系删除  酶是一种高效生物催化剂,广泛应用于医学、化工、农业等领域。然而,...

              千笔楼丨让AI当好“帮手”而不是“枪手”

              千笔楼丨让AI当好“帮手”而不是“枪手”

              图片来源于网络,如有侵权,请联系删除  记者:姜伟超、马莎、王铭禹图片来源于网络,如有侵权,请联系删除  国产AI大模型DeepSeek爆火之时,“人工智能(AI)+”也愈发融入孩子们的学习生活中。  一个让人忧心的现象出现了:新学期伊始,不少老师发现,学生提交的寒假作业“AI味”浓厚,有些孩子甚至...

              2025年我国智能算力规模预计增长43%

              2025年我国智能算力规模预计增长43%

                “DeepSeek系列模型的发布将加速人工智能的渗透、扩散和普及,实质性带动算力需求的增长。”2月13日,《2025年中国人工智能计算力发展评估报告》发布,浪潮电子信息产业股份有限公司(以下简称“浪潮信息”)高级副总裁刘军在发布会上说。图片来源于网络,如有侵权,请联系删除  《报告》由国际数据公...

              腾讯紧急调用元宝支持微信搜索,助力更多用户体验DeepSeek

              腾讯紧急调用元宝支持微信搜索,助力更多用户体验DeepSeek

                2月18日,为了让更多用户方便稳定地体验和使用DeepSeek,腾讯内部紧急协调部署,调用元宝支持微信搜索,给用户提供更多入口和选择。图片来源于网络,如有侵权,请联系删除  从2月18日开始,尚未被灰度到AI搜索的用户,点击微信对话框顶部的搜索栏,进入微信搜索,将有机会在页面中看到“下载元宝(体...

              近三年已有17家国际科技组织在华成立

              近三年已有17家国际科技组织在华成立

                新华社北京2月18日电(记者温竞华)国际科技组织是国际科技交流的重要载体。记者18日从中国科协第十届全国委员会第九次会议上获悉,近三年已有17家国际科技组织在华成立,包括国际氢能燃料电池协会、世界机器人合作组织、国际介科学组织、世界青年科学家联合会、亚洲仿真联盟等。图片来源于网络,如有侵权,请联...