2025-08-14 英国 来源:homelandsecurity 作者:戴吉 领域:生物
关键词:
据homelandsecurity网8月12日消息,英国牛津大学开发出一种新方法,通过过滤训练过程中的有害知识,构建出可抵御恶意更新的开放权重语言模型。该方法在生物威胁研究等敏感领域表现优异,且不影响模型的开放性和安全性。过滤后的模型在标准任务中表现卓越,即使在持续对抗性攻击下也能保持稳定。这一成果为全球人工智能治理提供了新思路,特别是在应对开放模型潜在风险方面。
https://www.homelandsecuritynewswire.com/dr20250812-filtered-data-stops-openly-available-ai-models-from-performing-dangerous-tasks