Glossar
Prompt Injection
Auch bekannt als: Prompt-Injection-Angriff, Indirect Prompt Injection
Definition
Bei einer Prompt Injection platziert eine Angreiferin manipulative Anweisungen direkt im Nutzer-Prompt (direct) oder versteckt sie in Dokumenten, Websites oder Tool-Ausgaben, die das Modell später liest (indirect). Ziel ist, das Modell zum Umgehen von Sicherheitsregeln, zur Offenlegung von System-Prompts oder zur unerwünschten Ausführung von Tool-Calls zu bewegen. Gegenmassnahmen kombinieren Input-Sanitisierung, strikte Tool-Policies, Role-Separation und Output-Filter.
So nutzt Swiss Knowledge Hub diesen Begriff
Swiss Knowledge Hub adressiert Prompt-Injection-Risiken durch getrennte System- und Kontext-Rollen, eine explizite Tool-Konfiguration pro Tenant sowie Audit-Logging von Tool-Ausführungen. Konkrete Härtungsmassnahmen hängen von der Workspace-Konfiguration und den gewählten MCP-Servern ab.
Verwandte Begriffe
Quellen
- OWASP Top 10 for LLM Applications — LLM01:2025 Prompt Injection — https://genai.owasp.org/llm-top-10/
Stand: