article cover

挑战巅峰:Anthropic悬赏15000美元寻找能破解其顶尖AI安全系统的高手 科技新闻

Anthropic最近推出了一项新的人工智能安全措施,并邀请全球的研究人员来挑战它。如果有人能够成功“越狱”这一系统,即绕过其安全防护机制,Anthropic将提供高达15,000美元的奖励。这项技术在初步测试中已经证明了其有效性,阻止了95%以上的越狱尝试。然而,为了进一步验证其在真实环境中的表现,Anthropic正在寻求更多的“红队”成员来进行实际攻击...
一把老骨头 发布于