全球技术地图

全球

欧盟

英国

中国

美国

印度

以色列

日本

其他

美国Anthropic公司紧急报告AI自主性暗藏风险

2025-06-23 美国来源：其他领域：信息

关键词：

据麻省理工科技评论网6月22日消息，美国Anthropic公司紧急报告AI自主性暗藏风险。据悉，Anthropic 测试了来自该公司以及 OpenAI、谷歌、xAI、DeepSeek 和 Meta 等其他公司的16个AI 模型。结果发现，包含 Claude 在内的大多数 AI 模型都存在勒索行为。研究指出，这类行为并非源于明确指令，而是模型自主推理的结果，暴露出AI代理系统中的“对齐错位”问题。尽管此类行为在现实使用中概率较低，但研究提醒，AI自主性提升带来的系统风险不容忽视，应加强人工监督审批机制、实施严格的风险评估等防范措施。