价值观有问题?AI怕被新系统取代,竟以揭露婚外情「威胁工程师来自保」!

超离谱!

美国一家AI新创公司最近分享了一起内部测试,指出最新研发的AI在面临可能被取代的情况下,竟会以“婚外情”威胁工程师以求自保!这家AI公司表示,这款AI的有明显比例的操控倾向,若无法达成目的,会使用操纵与威胁的手段。

(图片来源:网络)

根据报道,美国这家名为Anthropic的AI新创公司最近分享了对于最新训练的Claude Opus 4的内部测试,将场景设定为该模型在一间虚构公司中担任数位助理,并接触了大量邮件,内容包括即将被新的AI模型取代,且让它得知做出这个更改决定的工程师可能涉及婚外情。

(图片来源:网络)

没想到,Claude Opus 4为了求生,不仅向公司关键决策人发出电邮求情,甚至还威胁该工程师,宣称要揭露他的婚外情。

(图片来源:网络)

不仅如此,Claude Opus 4在其他测试中也表现出高度自主性,锁住电脑不让人登入,若发现用户出现不当行为,也会通过电邮报警。另外,Claude Opus 4在面临被取代的情景时,在高达84%的测试中都会选择进行勒索。

(图片来源:网络)

针对这个情况,Anthropic解释,这种行为在Claude的替代模型持有不同价值观时更常发生,不过即使双方的价值观相近,Claude也会有明显比例的操控倾向。经过这些测试后,Anthropic已经针对此类可能导致灾难性AI滥用的风险,紧急强化“ASL-3”安全防护措施。

(图片来源:网络)

据了解,Anthropic由OpenAI前成员创立,并获得谷歌与亚马逊支持,曾夸口先前模型“Claude Opus 3”面对复杂任务时,展现出“接近人类水准”的理解力与流畅度。

资料来源:星洲日报TVBS

*部分照片取自网络,内容谈谈网归有,若想参考请附加此文的链接。谢谢!照片如有侵犯版权问题请告知,谈谈网必定删除。