AI心理推断能力或与人类相当-天天微动态
时间:2024-05-23 09:49:44来源:科技日报


(资料图片仅供参考)

新一期《自然·人类行为》发表论文显示,在测试追踪他人心理状态能力——也称心智理论(Theory of Mind)的任务中,两类大语言模型(LLM)在特定情况下的表现与人类相似,甚至更好。

心智理论对人类社交互动十分重要,是人类沟通交流和产生共鸣的关键。之前的研究表明,LLM这类人工智能(AI)可以解决复杂的认知任务,如多选决策。不过,人们一直不清楚LLM在心智理论任务(被认为是人类独有的能力)中的表现是否也能比肩人类。

此次,德国汉堡—埃彭多夫大学医学中心团队选择了能测试心智理论不同方面的任务,包括发现错误想法、理解间接言语以及识别失礼。他们随后比较了1907人与两个热门LLM家族——GPT和LLaMA2模型完成任务的能力。

团队发现,GPT模型在识别间接要求、错误想法和误导方面的表现能达到甚至超越人类平均水平,而LLaMA2的表现逊于人类水平;在识别失礼方面,LLaMA2强于人类但GPT表现不佳。研究人员指出,LLaMA2的成功是因为回答的偏见程度较低,而不是因为真的对失礼敏感;GPT看起来的失利,其实是因为对坚持结论的超保守态度,而不是因为推理错误。

研究团队认为,LLM在心智理论任务上的表现堪比人类,不等于它们具有人类般的“情商”,也不意味着它们能掌握心智理论。但他们也指出,这些结果是未来研究的重要基础,并建议进一步研究LLM在心理推断上的表现,以及这些表现会如何影响人类在人机交互中的认知。

标签:

最新
  • AI心理推断能力或与人类相当-天天微动态

    新一期《自然·人类行为》发表论文显示,在测试追踪他人心理状态能

  • 1月18日,杭州品维网络科技有限公司对外宣布全资收购(海特汇 无人零售项目)

    海特汇 无人零售开创了国内首家特价无人零售,让无人零售也能特价

  • 世界头条:黑芝麻智能与Nullmax共同打造基于C1200平台的单芯片NOA行泊一体解决方案

    黑芝麻智能与Nullmax共同打造基于C1200平台的单芯片NOA行泊一体解决

  • 驻马店市安委会到开发区开源办事处开展安全生产工作开展年度考核 每日视点

    1月12日上午,驻马店市安委会考核组到驻马店开发区开源办事处开展2023

  • 热文:心系教育 情暖校园 源初公益基金会爱心捐助活动圆满举行

    2023年10月,天津市源初公益基金会一行来到山东省枣庄市台儿庄区明

  • 天天看点:擦亮城市旅游品牌

    刚刚过去的中秋国庆假期,各地旅游市场火爆,城市景区景点人流如织

  • 估值为0!昔日千亿房企“没有任何清算价值”

    又有退市股被公募基金猛砍估值,估值直接归零。8月22日,一家中大型基

  • 借条的时效性是多久

    借条的时效性是需要根据借款协议中规定的日期,如果没有规定的情况下,

  • 法尔克:图赫尔首发格雷茨卡是危险游戏,莱默尔会问他做错了什么

    直播吧8月21日讯在拜仁上周五晚4-0大胜不莱梅的德甲揭幕战中,首发的是

  • 我今天在软件贷款然后他说我银行卡填错了然后要我在我自己的银行

    我今天在软件贷款然后他说我银行卡填错了然后要我在我自己的银行

  • 已有50余种罕见病用药纳入医保药品目录

    已有50余种罕见病用药纳入医保药品目录,

  • 2023辽宁乡村文化旅游季活动尽显乡村旅游活力

    “2023辽宁乡村文化旅游季”系列推广活动日前在辽宁阜新市细河区四合镇

  • 硬核科普做成100万+趣味视频分秒帧如何帮央媒突破专业和效率瓶颈 具体是什么情况?

    【硬核科普做成100万+趣味视频,分秒帧如何帮央媒突破专业和效率瓶颈】

  • 2023年东北亚青年可持续发展研习营江西分团开营

    中新网南昌8月22日电(吴鹏泉刘思伟)2023年东北亚青年可持续发展研习营

  • 香港科技大学将于酒泉发射香港高教界首枚卫星

    8月21日,香港科技大学宣布,将于本周五(8月25日),在甘肃酒泉卫星发

  • 【商洛作文大赛】荷花的颜色艳丽夺目,粉的好似一张张婴儿那可爱的脸蛋

    美丽的荷花商洛市小学五年级2班刘馨逸周敦颐曾赞美荷花:“出淤泥而不

  • 旅游
    • 奔驰AMG C级和E级将重燃大排量发动机

    • 江苏盐城局地遭遇龙卷风 致2人死亡15人受伤

    • 拥抱加盟模式的喜茶,或许会走向悲剧

    • 朱桐(对于朱桐简单介绍)