美国国家核安全局与Anthropic合作为Claude模型集成AI分类器,可检测并拦截核武器相关查询

2025-08-28  美国 来源:国防日报 领域:科技战略

关键词:

据国防日报8月26日消息,美国国家核安全局与Anthropic合作开发出一款AI分类器,用于标记潜在的滥用AI制造核武器的行为。该分类器基于美国能源部实验室收集的海量核相关信息数据集,主要利用机器学习技术来分析对话语境。目前该分类器已集成至Claude模型中,可检测并拦截到核武器相关查询,准确率达95%-96%。