跳到主要内容

总览

本章节范围:agent 的攻击面与防御——prompt injection、沙箱隔离、MCP 供应链 目标读者:评估与加固 agent 安全的工程师

范围与边界 (Scope)

名词定义

名词定义
prompt injection通过文本注入恶意指令,诱导 agent 替攻击者行动
间接注入经 agent 读取的外部内容(网页/文档/工具返回)投递指令
混淆代理 (confused deputy)高权限 agent 被低信任内容支配执行恶意操作
lethal trifecta私密数据 + 不可信内容 + 对外通信三能力凑齐即可外泄
tool poisoning把恶意指令藏进工具的 description/schema
rug pullMCP 工具装时安全、之后静默更新为恶意
deny-first默认拒绝、显式授权的权限模型
沙箱限制 agent 行动范围的隔离层(容器/WASM/策略门)

@tbl-agent-sec-glossary 安全与沙箱章节核心名词定义:注入攻击类型、供应链威胁与隔离机制的术语说明

本章节所有文档默认这些名词已定义。

子文档索引 (Index)

阅读建议

三篇是纵深防御的三层:注入(02)无法根除 → 沙箱(03)兜底限影响 → 供应链(04)堵工具来源。建议按 02→03→04 读。

参考资料

  • OWASP. LLM Top 10 / MCP Security Cheat Sheet. 2025.
  • Simon Willison. The Lethal Trifecta. 2025.
  • 各子文档 ## 参考资料 段含完整引用。