Tags发布时间Oct 24, 2025摘要作者Michael Schlichtkrull 译者知道创宇404实验室翻译组 原文链接httpsarxiv.orgpdf2510.11238 摘要 当人工智能代理检索外部文档并进行推理时攻击者可能会操纵它们接收的数据以破坏其行为先前的研究探讨了间接提示注入攻击即攻击者注入恶意指令我们认为操纵代理并不需要注入指令攻击者反而可以提供带有偏见误导性或虚假的信息我...来源安全文摘