NeuGraphRAG jetzt in Early Beta

Glossar

Prompt Injection

Auch bekannt als: Prompt-Injection-Angriff, Indirect Prompt Injection

Definition

Bei einer Prompt Injection platziert eine Angreiferin manipulative Anweisungen direkt im Nutzer-Prompt (direct) oder versteckt sie in Dokumenten, Websites oder Tool-Ausgaben, die das Modell später liest (indirect). Ziel ist, das Modell zum Umgehen von Sicherheitsregeln, zur Offenlegung von System-Prompts oder zur unerwünschten Ausführung von Tool-Calls zu bewegen. Gegenmassnahmen kombinieren Input-Sanitisierung, strikte Tool-Policies, Role-Separation und Output-Filter.

So nutzt Swiss Knowledge Hub diesen Begriff

Swiss Knowledge Hub adressiert Prompt-Injection-Risiken durch getrennte System- und Kontext-Rollen, eine explizite Tool-Konfiguration pro Tenant sowie Audit-Logging von Tool-Ausführungen. Konkrete Härtungsmassnahmen hängen von der Workspace-Konfiguration und den gewählten MCP-Servern ab.

Verwandte Begriffe

Quellen

  1. OWASP Top 10 for LLM Applications — LLM01:2025 Prompt Injectionhttps://genai.owasp.org/llm-top-10/

Stand: