Technisch-evaluativer Intent · Landing Page
Enterprise RAG in der Schweiz — Anbieter & Kriterien
Was RAG im Enterprise-Kontext bedeutet
Retrieval-Augmented Generation (RAG) kombiniert einen Vektor-basierten Dokumenten-Retriever mit einem Sprachmodell, das die abgerufenen Passagen als Kontext nutzt und eine Antwort generiert. Die Demo-Variante dieses Musters ist an einem Nachmittag gebaut. Die Enterprise-Variante nicht.
Enterprise RAG muss in einem produktiven Schweizer Umfeld mehrere Eigenschaften gleichzeitig liefern: Datenhoheit (Residency, DPA, Subprozessoren), Berechtigungsgenauigkeit entlang der Quell-Systeme (SharePoint-ACLs bleiben erhalten), Auditierbarkeit jeder Abfrage, reproduzierbare Evaluierung, Upgrade-Pfade für Vector Store und LLM, sowie eine Provider-Flexibilität, die nicht in einer Lock-in-Situation endet.
Kriterien für die Anbieterauswahl
- Data Residency. Dokumente, Datenbank, Vector Store und idealerweise auch die Inferenz in der Schweiz. Siehe Data Residency.
- LLM-Provider-Flexibilität. Wechsel zwischen mehreren Modellen ohne Re-Implementation. BYOK für OpenAI, Anthropic, Gemini und Azure OpenAI; OpenAI-kompatible Custom Endpoints für eigene Deployments.
- Quellen-Treue. SharePoint-, OneDrive-, Google-Drive- und Dalux-Berechtigungen werden übernommen; keine flache Index-Struktur.
- Zitate mit Präzision. Quell-Chunk, Seitenzahl und direkter Sprung ins PDF — keine generischen „laut Dokument X"-Zitate.
- Audit und Observability. Jede Abfrage wird mit User, Zeit, Retrieval-Resultaten und finaler Antwort geloggt.
- Evaluierungs-Prozess. Eigene Gold-Sets, reproduzierbare Retrieval- und Antwort-Metriken, Regressions-Tests bei Modellwechsel.
- Deployment-Modelle. Multi-Tenant-SaaS, dedizierte Subscription oder On-Prem — skalierbar mit dem Reifegrad der Organisation.
Fakten-Block: Enterprise-RAG-Bausteine bei Swiss Knowledge Hub
- Quellen: SharePoint, OneDrive, Google Drive, Dalux, Zipro, URL-Import, Bulk-Upload sowie automatische Transkription von Audio- und Videodateien. Integrationen mit eigenen Tools über das Model Context Protocol (MCP) sind in Beta.
- Vector Stores: pgvector als Standard; Pinecone, LanceDB und ChromaDB optional konfigurierbar. Siehe Vector Store.
- LLM-Provider (Standard, Schweiz): DeepSeek V3, Kimi K2.5, Mistral Medium 2505 — alle via Azure AI Foundry in der Schweizer Region.
- LLM-Provider (BYOK): OpenAI, Azure OpenAI, Anthropic, Google Gemini, Mistral, DeepSeek, Azure DeepSeek und OpenAI-kompatible Custom Endpoints.
- Rechte: Workspace-, Page- und File-Level-Permissions, Custom Roles, LLM-Scope-Gates pro Organisation; Audit-Log auf jeder Abfrage.
- Zitate: Quell-Chunk, Seitenzahl, direkter Sprung ins PDF.
Technische Architektur-Bausteine
Ein produktives RAG-System zerfällt in sechs Schichten, die unabhängig voneinander evaluiert werden müssen: Ingestion, Chunking, Embedding, Retrieval, Generation und Evaluation. Jede Schicht bringt eigene Metriken und Failure-Modes.
- Ingestion. Verbinder zu SharePoint, OneDrive, Google Drive, Dalux, Zipro; OCR für eingescannte PDFs; Transkription für Audio und Video.
- Chunking. Dokumentstruktur-bewusst, Overlap-konfiguriert, nicht token-naiv. Siehe Chunking.
- Embedding. Qualität und Sprachabdeckung bestimmen Retrieval-Recall. Siehe Embedding.
- Retrieval. Hybrid aus semantischer (Vector) und lexikalischer (BM25) Suche liefert in typischen Korpora oft bessere Ergebnisse als rein semantische Suche — eignet sich aber nicht für jeden Einsatzfall.
- Generation. Prompt-Templates mit Zitierzwang und Halluzinationsgrenzen; LLM austauschbar.
- Evaluation. Eigenes Gold-Set, automatisierte Retrieval- und Antwort-Metriken, manuelle Sampling-Reviews.
Vector-Store-Optionen: pgvector, LanceDB, Pinecone, Chroma
| Option | Residency | Betrieb | Einsatzfall |
|---|---|---|---|
| pgvector | Azure CH (SKH Standard) | Integriert in Postgres | Standard, bis mittlere Millionen-Chunks |
| LanceDB | Lokal / Azure CH | Columnar, embedded | Grosse Indexe, Batch-Analytics |
| Pinecone | US / EU (managed) | SaaS, niedrige Latenz | Sehr grosse Indexe, Multi-Region |
| ChromaDB | Wahlfrei (self-hosted) | Open Source | Prototypen, kleine Teams |
Wie läuft eine RAG-Einführung in der Schweiz konkret ab?
- Quellen-Inventar. Welche Systeme (SharePoint, Dalux, Google Drive) enthalten welches Wissen? Welche ACLs gelten?
- Residency-Entscheid. Standard Schweizer Modelle oder BYOK zu einem externen Provider? Welche Daten dürfen die Schweiz verlassen?
- Pilot-Workspace. 10–50 Nutzende, 1–2 Abteilungen, echtes Dokumentenkorpus. Evaluations-Set aus 50–100 typischen Fragen.
- Evaluation. Retrieval-Metriken (Recall@k, nDCG) und Antwort-Metriken (Faithfulness, Answer Relevance) gegen das Gold-Set.
- Skalierung. Rollout auf weitere Abteilungen, Custom Roles, LLM-Scope-Gates pro Organisation. Upgrade auf Enterprise oder Custom-Plan.
- Operate. Monatliche Review der Audit-Logs, quartalsweise Re-Evaluation bei Modell- oder Embedding-Provider-Wechsel.
Wie Swiss Knowledge Hub diese Kriterien abdeckt
Swiss Knowledge Hub adressiert die sieben Anbieter-Kriterien wie folgt: Kerndaten (DB, Vector-Store, Storage, Service Bus) standardmässig in Azure Switzerland North (Frontend-Assets über West-Europe-CDN); neun konfigurierbare LLM-Provider, davon drei mit SKH-Default-Setup und die übrigen via Bring-Your-Own-Key, plus OpenAI-kompatible Custom Endpoints; Übernahme von SharePoint-ACLs sowie Workspace-/Page-/File-Level-Rechte mit Custom Roles; Zitate mit Quell-Chunk, Seitenzahl und PDF-Sprung; chronologisches Audit-Log pro Tenant; pgvector als Default-Vector-Store, LanceDB, Pinecone und ChromaDB zusätzlich konfigurierbar; Multi-Tenant-SaaS als Default, Custom-Plan mit dedizierter Subscription, On-Prem als Custom-Option auf Anfrage. Konkrete Qualitäts-Kennzahlen (Recall, Faithfulness, Latenz) sind je Korpus und Pilot unterschiedlich und werden gemeinsam gemessen — SKH macht dazu bewusst keine pauschalen Prozentangaben.
Verwandte Seiten
- Glossar: Retrieval-Augmented Generation
- Glossar: Vector Store
- Glossar: Chunking
- Glossar: Embedding
- Alle Vergleiche
- Schweizer ChatGPT-Alternative
- DSG-konforme KI
Häufige Fragen
- Was unterscheidet Enterprise RAG von einer Retrieval-Demo?
- Enterprise RAG muss drei Dinge mehr liefern als eine Retrieval-Demo: Berechtigungsgenauigkeit auf Dokument- und Feldebene, Auditierbarkeit jeder Abfrage und eine Evaluierungs-Pipeline, die Antwort-Qualität regressionssicher messbar macht. Ohne diese drei Bausteine bleibt jede RAG-Lösung ein Prototyp.
- Welche Vector Stores sind in einem Schweizer Enterprise-Setup sinnvoll?
- pgvector ist bei Swiss Knowledge Hub Standard — es läuft in derselben Postgres-Instanz wie die Business-Daten und bleibt in Azure Switzerland North. Für grössere Indexe sind LanceDB (lokal, columnar), Pinecone (managed, US/EU) und ChromaDB (Open Source) optional konfigurierbar. Die Wahl folgt Residency-, Skalierungs- und Team-Kompetenz-Kriterien.
- Wie messe ich die Qualität einer RAG-Lösung seriös?
- Drei Ebenen: Retrieval-Metriken (Recall@k, MRR, nDCG) auf einem eigenen Evaluationsset, Antwort-Metriken (Faithfulness, Answer Relevance, Context Precision) und Geschäfts-Metriken (Zeit bis zur Antwort, Deflection-Rate, Nutzerzufriedenheit). Ohne eigenes Gold-Set sind die Werte Theater.
- Was heisst BYOK im RAG-Kontext?
- Bring Your Own Key erlaubt der Kundenorganisation, eigene API-Schlüssel für externe LLM-Provider (z. B. OpenAI, Anthropic) zu hinterlegen. Anfragen gehen direkt an den gewählten Provider; die Vertragsbeziehung besteht zwischen Kunde und Provider. Für Embeddings lässt sich das gleiche Muster nutzen, wenn ein bestimmter Embedding-Provider vertraglich bevorzugt wird.
- Welche Deployment-Modelle bietet Swiss Knowledge Hub?
- Standard: Multi-Tenant-SaaS auf Azure Switzerland North. Custom-Plan: dedizierte Schweizer Subscription mit Customer-Managed Keys; On-Prem ist als Custom-Option auf Anfrage möglich (mit Zusatzkosten).
- Wie gehen Berechtigungen in einem RAG-System mit SharePoint-Quellen?
- SKH respektiert die Quell-Rechte: Eine Datei, die in SharePoint nur für Gruppe X sichtbar ist, taucht auch nur in Antworten für Mitglieder von Gruppe X auf. Dazu kommen Workspace-, Page- und File-Level-Permissions sowie Custom Roles pro Organisation. Ein reines ‚Alle sehen alles'-RAG ist im Enterprise-Kontext nicht tragbar.
- Was kostet Enterprise RAG bei SKH?
- Enterprise ab CHF 1'050 pro Monat (30 Nutzende, 120 GB). Custom-Plan auf Anfrage mit individuell verhandelbaren SLAs, dediziertem Onboarding und optional eigener Infrastruktur. Starter (CHF 250/Mt.) und Business (CHF 650/Mt.) stehen für Pilotprojekte bereit.
Architektur-Review mit dem SKH-Team.
30 Minuten, euer Anwendungsfall, konkrete Empfehlungen zu Vector Store, LLM-Provider und Deployment-Modell.
· Swiss Knowledge Hub GmbH, Liebefeld.