2025-06-23 美国 来源:其他 领域:信息
关键词:
据麻省理工科技评论网6月22日消息,美国Anthropic公司紧急报告AI自主性暗藏风险。据悉,Anthropic 测试了来自该公司以及 OpenAI、谷歌、xAI、DeepSeek 和 Meta 等其他公司的16个AI 模型。结果发现,包含 Claude 在内的大多数 AI 模型都存在勒索行为。研究指出,这类行为并非源于明确指令,而是模型自主推理的结果,暴露出AI代理系统中的“对齐错位”问题。尽管此类行为在现实使用中概率较低,但研究提醒,AI自主性提升带来的系统风险不容忽视,应加强人工监督审批机制、实施严格的风险评估等防范措施。