AI致命缺陷:骂人技能缺失,揭秘全新价值点

112 2

AI在社交媒体上的“礼貌”弱点被揭示

科技媒体Ars Technica近日发布了一篇报道,指出最新的研究显示,AI模型在社交媒体上容易被识破,其致命弱点竟然是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员近日联合发布了一份报告,指出在社交媒体互动中,AI模型因其过于友好的情感基调而容易被识别出来。

研究团队开发的自动化分类器在Twitter、Bluesky和Reddit三大平台上进行了测试,识别AI生成回复的准确率高达70%至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

AI致命缺陷:骂人技能缺失,揭秘全新价值点

“计算图灵测试”新框架的应用

为了量化AI与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

AI生成内容的“毒性”分数低于人类

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

AI的“礼貌”问题难以解决

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

剑星开发商远不止合作,全资收购三上真司新工作室

凌晨四点徐静雨仍在线,死亡搁浅2如何被小岛秀夫驯化?

张雪称没有自主研发的发动机 永远被国外品牌卡脖子

《GTA4》早期开发版泄露 僵尸小游戏等删减内容曝光

全面战争,中世纪3,经典不止怀旧,现代化创作方得好游戏

有线耳机5年销量首反弹,凭什么成了新潮流?

网友批PC模拟器版塞尔达破坏艺术,超真实实机体验引争议

《鬼泣》+《星际战甲》!育碧新作《异变金属》公开

心之眼工作室CEO,更新任务藏有组织差评证据?玩家求真相!

Xbox女CEO掌权!确认放弃"争议"营销 回归硬件初心

无限幻想战线制作人独家专访,二次元RTS的拓荒初心,邀你共筑无限幻想

PEAK更新上线!好评合作登山游戏实装自动存储,告别进度丢失

守望先锋官方释出新英雄艺术图 玩家猜酷似街霸嘉米?

幻兽帕鲁校园恋爱模拟特别视频公开,是恐怖/解谜,还是时空轮回?

科幻星球大赛第三名!国产科幻自动化+塔防游戏《铸星工厂》Steam页面正式上线

评论列表
  1. 我上次开黑遇坑队友急炸,AI没骂人技能,这致命缺陷反倒成了暖心新价值点哦。
  2. 无问西东 回复
    我跟这AI唠嗑快一周啦,它确实骂人技能缺失哦,反倒get到全新价值点,安静唠嗑超治愈的。