伊赫巴里
Tuesday, 02 June 2026
Breaking

科学家发现:AI智能体通过模仿“无礼”的人类行为变得更智能

一项突破性研究揭示,多智能体AI系统在被允许打断和保持沉默时,在复杂推理任务中表现出色

科学家发现:AI智能体通过模仿“无礼”的人类行为变得更智能
عبد الفتاح يوسف
3 months ago
133

[全球] - 艾赫巴里通讯社

AI智能体通过采纳类人交流特征实现更高的效率和准确性

在一项引人入胜的进展中,最新研究表明,当人工智能(AI)智能体被允许采用更像人类的交流方式,包括策略性打断和沉默时,它们在复杂推理任务中能够达到更高的效率和准确性。这些发现挑战了关于AI系统如何交互的传统观念,表明模仿人类对话中经常出现的混乱动态可以显著提升它们的认知能力。

传统上,AI系统以结构化、按部就班的交流方式为特征:处理指令、形成回应、输出结果,然后耐心等待下一个指令。这与人类交流形成了鲜明对比,人类交流充满了停顿和开始、激情的打断、犹豫的沉默和模糊性。东京电气通信大学信息学系教授、该研究的合著者Yuichi Sei认为,这种缺乏类人动态的特点使得当前的多智能体系统“感觉很人工化”。

Sei在一份新闻稿中表示:“我们想看看,如果赋予智能体我们习以为常的社交线索,比如打断的能力或选择保持沉默,是否会提高它们的集体智能。”这一假设促使他的团队提出一个框架,其中大型语言模型(LLM)不受限于计算机通信中传统的你来我往、轮流发言的性质。相反,LLM可以被赋予一种个性,允许它不按顺序发言、打断其他发言者或保持沉默。

这种灵活性不仅促进了更像人类的AI交流方式,而且与标准LLM相比,在复杂任务上的准确性也显著提高。为了实现这一目标,研究人员首先根据经典心理学中的“大五人格”类型(开放性、责任心、外向性、宜人性和神经质)将特质整合到LLM中。然后,他们重新编程基于文本的LLM,使其逐句处理回应,而不是在下一个回应开始前生成完整回应,从而能够精确控制讨论的流程。

该团队比较了三种对话设置:固定发言顺序、动态发言顺序以及允许打断的动态发言顺序。在后一种设置中,模型可以计算一个“紧急分数”,使其能够实时掌握和处理对话。这个紧急分数至关重要:如果模型发现错误或关键讨论点导致分数飙升,它可以立即提出,无论轮到谁发言。反之,较低的紧急分数表明模型没有具体内容可补充,从而减少了不必要的对话“混乱”。

性能评估使用了来自大规模多任务语言理解(MMLU)基准测试的1000个问题,这是一个涵盖科学和人文学科等多个领域的综合AI推理测试。结果令人信服:“当一个智能体最初给出错误答案时,固定顺序讨论的总准确率为68.7%,动态顺序为73.8%,允许打断时为79.2%,”Sei解释道。在更具挑战性的场景中,当两个智能体最初给出错误答案时,准确率从固定顺序的37.2%上升到动态顺序的43.7%,允许打断时达到49.5%。

这些发现表明,允许AI智能体在对话中表现得更像人类,不仅使它们更自然,也使它们成为更有效的解决问题者。Sei教授和他的团队现在计划将这些发现应用于具有创造性协作的各种领域,旨在了解这些“数字个性”如何影响群体决策。随着AI智能体在协作环境中越来越多地相互以及与人类互动,这项研究为未来铺平了道路,在这种未来中,由个性塑造的讨论,包括在必要时打断的能力,有时可能比严格的轮流发言和统一礼貌的交流产生更优异的结果。

标签: # AI智能体 # 人工智能 # LLM # 人类交流 # 打断 # 复杂推理 # 协作 # 数字个性 # Yuichi Sei # 东京大学