科学家发现：AI智能体通过模仿“无礼”的人类行为变得更智能

一项突破性研究揭示，多智能体AI系统在被允许打断和保持沉默时，在复杂推理任务中表现出色

عبد الفتاح يوسف

3 months ago

133

[全球] - 艾赫巴里通讯社

AI智能体通过采纳类人交流特征实现更高的效率和准确性

在一项引人入胜的进展中，最新研究表明，当人工智能（AI）智能体被允许采用更像人类的交流方式，包括策略性打断和沉默时，它们在复杂推理任务中能够达到更高的效率和准确性。这些发现挑战了关于AI系统如何交互的传统观念，表明模仿人类对话中经常出现的混乱动态可以显著提升它们的认知能力。

传统上，AI系统以结构化、按部就班的交流方式为特征：处理指令、形成回应、输出结果，然后耐心等待下一个指令。这与人类交流形成了鲜明对比，人类交流充满了停顿和开始、激情的打断、犹豫的沉默和模糊性。东京电气通信大学信息学系教授、该研究的合著者Yuichi Sei认为，这种缺乏类人动态的特点使得当前的多智能体系统“感觉很人工化”。

另请阅读

Sei在一份新闻稿中表示：“我们想看看，如果赋予智能体我们习以为常的社交线索，比如打断的能力或选择保持沉默，是否会提高它们的集体智能。”这一假设促使他的团队提出一个框架，其中大型语言模型（LLM）不受限于计算机通信中传统的你来我往、轮流发言的性质。相反，LLM可以被赋予一种个性，允许它不按顺序发言、打断其他发言者或保持沉默。

这种灵活性不仅促进了更像人类的AI交流方式，而且与标准LLM相比，在复杂任务上的准确性也显著提高。为了实现这一目标，研究人员首先根据经典心理学中的“大五人格”类型（开放性、责任心、外向性、宜人性和神经质）将特质整合到LLM中。然后，他们重新编程基于文本的LLM，使其逐句处理回应，而不是在下一个回应开始前生成完整回应，从而能够精确控制讨论的流程。

该团队比较了三种对话设置：固定发言顺序、动态发言顺序以及允许打断的动态发言顺序。在后一种设置中，模型可以计算一个“紧急分数”，使其能够实时掌握和处理对话。这个紧急分数至关重要：如果模型发现错误或关键讨论点导致分数飙升，它可以立即提出，无论轮到谁发言。反之，较低的紧急分数表明模型没有具体内容可补充，从而减少了不必要的对话“混乱”。

性能评估使用了来自大规模多任务语言理解（MMLU）基准测试的1000个问题，这是一个涵盖科学和人文学科等多个领域的综合AI推理测试。结果令人信服：“当一个智能体最初给出错误答案时，固定顺序讨论的总准确率为68.7%，动态顺序为73.8%，允许打断时为79.2%，”Sei解释道。在更具挑战性的场景中，当两个智能体最初给出错误答案时，准确率从固定顺序的37.2%上升到动态顺序的43.7%，允许打断时达到49.5%。

科学家发现：AI智能体通过模仿“无礼”的人类行为变得更智能

一项突破性研究揭示，多智能体AI系统在被允许打断和保持沉默时，在复杂推理任务中表现出色

AI智能体通过采纳类人交流特征实现更高的效率和准确性

另请阅读

相关新闻

相关新闻

Al-Qadsia Club 与 Abu Al-Shamat 和 Dhikri 续约至 2031 年

西汉姆联队面临降级风险，大卫·苏利文承担责任

阿森纳时隔一代首夺英超冠军

阿森纳对阿尔特塔的信任得到回报，赢得英超冠军

搜索

最新消息

埃及金价上涨，21克拉金价达6800埃镑

开斋节第三日天气：炎热有风

Al-Qadsia Club 与 Abu Al-Shamat 和 Dhikri 续约至 2031 年

伊朗互联网部分恢复：愤怒、焦虑与泪水交织

苏门答腊大象死亡事件引发对其濒危状况的担忧

西汉姆联队面临降级风险，大卫·苏利文承担责任

前儿童网红Piper Rockelle转战OnlyFans：18岁成年后的争议与财富

埃隆·马斯克旗下X平台充斥虚假信息，用户为何仍坚守？

Netanyahu: "Hêzên Mezin li Libnanê" - Operasyona Leşkerî Berdewam e

ئەمەریکا و ئێران: دانوستان لەسەر ڕێککەوتنێکی کاتی بەردەوامە

ڕاپۆرتی هەواڵگری: ئاشکراکردنی گەشە سەندنە سەربازییە نهێنییەکانی ئێران

克里姆林宫欢迎“欧洲讨论”以寻找可接受的谈判代表以恢复联系

阅读最多