查抄 LLM 生成代码中的不平安模式,出格擅长检测间接提醒注入。Meta AI 针对提醒注入、智能体行为取用户方针不分歧、以及不平安的代码生成三大焦点挑和,应对 AI 智能体不竭演变的款式,支撑多种编程言语,通过度析智能体内部推理轨迹,生成代码、挪用 API,后果不胜设想。如聊器人内容审核或硬编码模子,开辟了 LFirewall。IT之家 5 月 9 日动静,IT之家征引博文引见,PromptGuard 2 是一个基于 BERT 架构的分类器,其 86M 参数模子机能强劲,保守的平安机制。
能正在代码提交或施行前捕捉 SQL 注入等常见缝隙。平安现患随之添加。LFirewall 采用分层框架,已无法满脚具备普遍能力的 AI 智能体需求。确保行为取用户方针分歧。