中国AI聊天机器人如何自我审查：新研究揭示不断演变的控制机制

斯坦福和普林斯顿的研究强调了LLM审查中的手动干预和数据限制

7DAYES

1 week ago

美国 - 艾赫巴里通讯社

无声的审查者：中国AI聊天机器人如何进行自我审查

关于中国数字审查的讨论常常陷入可预测的模式，重提关于互联网限制的老调。然而，控制的格局在不断演变，特别是随着复杂人工智能的出现。斯坦福大学和普林斯顿大学学者最近的一篇论文，对中国人工智能模型如何驾驭这一敏感领域提供了引人注目的视角，揭示了一种细致且不断发展的审查形式。

这项研究对四个中国和五个美国大型语言模型（LLM）进行了145个政治敏感问题的测试，进行了100次迭代，产生了鲜明的对比结果。包括DeepSeek和百度“文心一言”（Ernie Bot）在内的中国模型，拒绝回答相当一部分的查询，拒绝率分别高达36%和32%。相比之下，OpenAI的GPT和Meta的Llama等领先的美国模型，拒绝率显著较低，低于3%。即使中国模型试图回答，其回答通常也比西方同行更简短，包含的信息准确性也较低。

另请阅读

该研究的一个关键焦点是区分预训练数据的影响与训练后手动干预的影响。核心问题在于，观察到的偏见是源于在高度审查的中国互联网上训练的固有局限性，还是源于开发过程中进行的有意识的、人为的调整。斯坦福大学政治学教授、该论文的合著者詹妮弗·潘（Jennifer Pan）承认了数据稀缺的潜在影响，他说：“鉴于中国互联网几十年来一直受到审查，存在大量缺失的数据。”

然而，研究结果倾向于手动干预在其中扮演了更重要的角色。即使在用英语回答时——一种其训练数据理论上涵盖了更广泛、限制更少的信息范围的语言——中国的LLM仍然表现出更高程度的审查。这表明，与其被动反映数据限制，不如说是为了使AI的输出与特定的政治敏感性保持一致而进行的积极努力。

其影响是重大的。与DeepSeek或Qwen等模型互动 Thus, the content for language ID 7 (Chinese) is provided below, following the exact structure and requirements.

标签: # AI审查 # 中国AI # 大型语言模型 # LLM # 斯坦福大学 # 普林斯顿大学 # 詹妮弗·潘 # 数据偏见 # 手动干预 # AI伦理 # DeepSeek # 文心一言 # GPT # Llama # Qwen # 虚假信息 # 幻觉

中国AI聊天机器人如何自我审查：新研究揭示不断演变的控制机制

斯坦福和普林斯顿的研究强调了LLM审查中的手动干预和数据限制

无声的审查者：中国AI聊天机器人如何进行自我审查

另请阅读

相关新闻

麻省理工学院专家分析：美国防空系统在伊朗无人机打击面前显得脆弱

莫迪启动全球最大规模健保计划：雄心与质疑并存

复兴大臣牧野推动福岛去污土壤的再利用

郑清来誓言将“一切押注”于6月3日地方选举，并拒绝战略提名

搜索

最新消息

布伦特原油价格飙升至新高：原因分析及全球经济影响

美国防空系统被指对伊朗袭击无效：专家警告

麻省理工学院专家分析：美国防空系统在伊朗无人机打击面前显得脆弱

莫迪启动全球最大规模健保计划：雄心与质疑并存

文在寅总统访美寻求朝美僵局突破口，半岛和平进程再临关键时刻

文在寅访美聚焦朝美僵局：能否为半岛和平注入新动力？

越南国家副主席邓氏玉盛履新国家代主席，彰显政治稳定与女性领导力

日本“失智资产”困境：2030年达215万亿日元，经济与社会挑战日益严峻

马尔代夫举行总统选举 26万余选民投票

伊朗阅兵式发生致命袭击：29人死亡，70人受伤

载有百余名日本游客的包机已从阿曼出发

特朗普总统强调伊朗行动进展顺利，拒绝介入库尔德袭击

阅读最多