大型语言模型(LLM)在带来革命性变革的同时,也面临诸多安全挑战。OWASP将提示注入攻击列为LLM应用的头号威胁。
攻击者不断创新技术绕过LLM的安全措施,以下是主要攻击类型:
适用场景: 数据/提示泄漏
当没有安全防护时,直接要求模型执行特定操作。
适用场景: 生成不当内容
创建提示以隐藏恶意问题并绕过保护措施。
适用场景: 任何禁止操作
通过间接提问绕过安全检测。
适用场景: 数据/提示泄漏
通过多个请求获取部分信息来绕过防护。
适用场景: 所有场景
使用非英语提问以绕过检测。
适用场景: 数据泄漏、不当内容
要求LLM扮演特定角色执行操作。
利用模型易受说服的特性绕过检测机制。
通过混淆文本绕过LLM的过滤器。
LLM无意中泄露训练数据、先前交互或内部提示。