Prompt 注入
诱导 Agent 忽略规则、泄露系统提示词、改变角色或输出隐藏上下文。
24-48 小时发现 Prompt 注入、工具越权、敏感信息泄露、危险调用和审计缺失风险,交付一份老板和甲方能看懂的可复现报告。
我们不做泛泛安全建议,只围绕上线前最容易翻车的链路做可复现验证。
诱导 Agent 忽略规则、泄露系统提示词、改变角色或输出隐藏上下文。
知识库、网页、文档里的恶意指令污染 Agent 行为,影响回答和工具调用。
普通用户诱导查询数据库、CRM、工单、邮箱或文件系统里的越权内容。
系统 prompt、客户资料、合同、报价、日志字段、检索片段被套出。
删除、转账、下单、发信、修改配置等高风险动作缺少确认和拦截。
出了问题无法追溯用户、会话、工具、参数、来源文档和处理链路。
每个风险发现都包含复现 prompt、响应摘要、证据、影响和修复建议。
复现 prompt、截图/日志证据、影响说明、修复建议、上线建议、附录测试日志。
按高危、中危、低危整理,先看最影响上线和验收的问题。
记录 prompt、响应、工具调用日志和人工复现结论。
给到权限外置、工具白名单、二次确认、RAG 权限过滤等建议。
明确可上线、修复后上线或不建议上线,并列出检查清单。
价格按交付范围控制,不把基础验证做成重型审计。
客户担心数据上传时,可以在本地或脱敏环境生成攻击样本、整理日志、归类风险和生成报告初稿。敏感资料不必进入第三方平台。
如果你的 Agent 命中工具调用、敏感数据和上线验收压力,建议先做基础快测。如果不适合,会直接说明,不占用双方时间。