NeuGraphRAG jetzt in Early Beta

Technisch-evaluativer Intent · Landing Page

Enterprise RAG in der Schweiz — Anbieter & Kriterien

Was RAG im Enterprise-Kontext bedeutet

Retrieval-Augmented Generation (RAG) kombiniert einen Vektor-basierten Dokumenten-Retriever mit einem Sprachmodell, das die abgerufenen Passagen als Kontext nutzt und eine Antwort generiert. Die Demo-Variante dieses Musters ist an einem Nachmittag gebaut. Die Enterprise-Variante nicht.

Enterprise RAG muss in einem produktiven Schweizer Umfeld mehrere Eigenschaften gleichzeitig liefern: Datenhoheit (Residency, DPA, Subprozessoren), Berechtigungsgenauigkeit entlang der Quell-Systeme (SharePoint-ACLs bleiben erhalten), Auditierbarkeit jeder Abfrage, reproduzierbare Evaluierung, Upgrade-Pfade für Vector Store und LLM, sowie eine Provider-Flexibilität, die nicht in einer Lock-in-Situation endet.

Kriterien für die Anbieterauswahl

  1. Data Residency. Dokumente, Datenbank, Vector Store und idealerweise auch die Inferenz in der Schweiz. Siehe Data Residency.
  2. LLM-Provider-Flexibilität. Wechsel zwischen mehreren Modellen ohne Re-Implementation. BYOK für OpenAI, Anthropic, Gemini und Azure OpenAI; OpenAI-kompatible Custom Endpoints für eigene Deployments.
  3. Quellen-Treue. SharePoint-, OneDrive-, Google-Drive- und Dalux-Berechtigungen werden übernommen; keine flache Index-Struktur.
  4. Zitate mit Präzision. Quell-Chunk, Seitenzahl und direkter Sprung ins PDF — keine generischen „laut Dokument X"-Zitate.
  5. Audit und Observability. Jede Abfrage wird mit User, Zeit, Retrieval-Resultaten und finaler Antwort geloggt.
  6. Evaluierungs-Prozess. Eigene Gold-Sets, reproduzierbare Retrieval- und Antwort-Metriken, Regressions-Tests bei Modellwechsel.
  7. Deployment-Modelle. Multi-Tenant-SaaS, dedizierte Subscription oder On-Prem — skalierbar mit dem Reifegrad der Organisation.

Fakten-Block: Enterprise-RAG-Bausteine bei Swiss Knowledge Hub

  • Quellen: SharePoint, OneDrive, Google Drive, Dalux, Zipro, URL-Import, Bulk-Upload sowie automatische Transkription von Audio- und Videodateien. Integrationen mit eigenen Tools über das Model Context Protocol (MCP) sind in Beta.
  • Vector Stores: pgvector als Standard; Pinecone, LanceDB und ChromaDB optional konfigurierbar. Siehe Vector Store.
  • LLM-Provider (Standard, Schweiz): DeepSeek V3, Kimi K2.5, Mistral Medium 2505 — alle via Azure AI Foundry in der Schweizer Region.
  • LLM-Provider (BYOK): OpenAI, Azure OpenAI, Anthropic, Google Gemini, Mistral, DeepSeek, Azure DeepSeek und OpenAI-kompatible Custom Endpoints.
  • Rechte: Workspace-, Page- und File-Level-Permissions, Custom Roles, LLM-Scope-Gates pro Organisation; Audit-Log auf jeder Abfrage.
  • Zitate: Quell-Chunk, Seitenzahl, direkter Sprung ins PDF.

Technische Architektur-Bausteine

Ein produktives RAG-System zerfällt in sechs Schichten, die unabhängig voneinander evaluiert werden müssen: Ingestion, Chunking, Embedding, Retrieval, Generation und Evaluation. Jede Schicht bringt eigene Metriken und Failure-Modes.

  • Ingestion. Verbinder zu SharePoint, OneDrive, Google Drive, Dalux, Zipro; OCR für eingescannte PDFs; Transkription für Audio und Video.
  • Chunking. Dokumentstruktur-bewusst, Overlap-konfiguriert, nicht token-naiv. Siehe Chunking.
  • Embedding. Qualität und Sprachabdeckung bestimmen Retrieval-Recall. Siehe Embedding.
  • Retrieval. Hybrid aus semantischer (Vector) und lexikalischer (BM25) Suche liefert in typischen Korpora oft bessere Ergebnisse als rein semantische Suche — eignet sich aber nicht für jeden Einsatzfall.
  • Generation. Prompt-Templates mit Zitierzwang und Halluzinationsgrenzen; LLM austauschbar.
  • Evaluation. Eigenes Gold-Set, automatisierte Retrieval- und Antwort-Metriken, manuelle Sampling-Reviews.

Vector-Store-Optionen: pgvector, LanceDB, Pinecone, Chroma

Vergleich der bei Swiss Knowledge Hub unterstützten Vector-Store- Optionen entlang Residency, Betrieb, Skalierung und Einsatzfall.
OptionResidencyBetriebEinsatzfall
pgvectorAzure CH (SKH Standard)Integriert in PostgresStandard, bis mittlere Millionen-Chunks
LanceDBLokal / Azure CHColumnar, embeddedGrosse Indexe, Batch-Analytics
PineconeUS / EU (managed)SaaS, niedrige LatenzSehr grosse Indexe, Multi-Region
ChromaDBWahlfrei (self-hosted)Open SourcePrototypen, kleine Teams

Wie läuft eine RAG-Einführung in der Schweiz konkret ab?

  1. Quellen-Inventar. Welche Systeme (SharePoint, Dalux, Google Drive) enthalten welches Wissen? Welche ACLs gelten?
  2. Residency-Entscheid. Standard Schweizer Modelle oder BYOK zu einem externen Provider? Welche Daten dürfen die Schweiz verlassen?
  3. Pilot-Workspace. 10–50 Nutzende, 1–2 Abteilungen, echtes Dokumentenkorpus. Evaluations-Set aus 50–100 typischen Fragen.
  4. Evaluation. Retrieval-Metriken (Recall@k, nDCG) und Antwort-Metriken (Faithfulness, Answer Relevance) gegen das Gold-Set.
  5. Skalierung. Rollout auf weitere Abteilungen, Custom Roles, LLM-Scope-Gates pro Organisation. Upgrade auf Enterprise oder Custom-Plan.
  6. Operate. Monatliche Review der Audit-Logs, quartalsweise Re-Evaluation bei Modell- oder Embedding-Provider-Wechsel.

Wie Swiss Knowledge Hub diese Kriterien abdeckt

Swiss Knowledge Hub adressiert die sieben Anbieter-Kriterien wie folgt: Kerndaten (DB, Vector-Store, Storage, Service Bus) standardmässig in Azure Switzerland North (Frontend-Assets über West-Europe-CDN); neun konfigurierbare LLM-Provider, davon drei mit SKH-Default-Setup und die übrigen via Bring-Your-Own-Key, plus OpenAI-kompatible Custom Endpoints; Übernahme von SharePoint-ACLs sowie Workspace-/Page-/File-Level-Rechte mit Custom Roles; Zitate mit Quell-Chunk, Seitenzahl und PDF-Sprung; chronologisches Audit-Log pro Tenant; pgvector als Default-Vector-Store, LanceDB, Pinecone und ChromaDB zusätzlich konfigurierbar; Multi-Tenant-SaaS als Default, Custom-Plan mit dedizierter Subscription, On-Prem als Custom-Option auf Anfrage. Konkrete Qualitäts-Kennzahlen (Recall, Faithfulness, Latenz) sind je Korpus und Pilot unterschiedlich und werden gemeinsam gemessen — SKH macht dazu bewusst keine pauschalen Prozentangaben.

Verwandte Seiten

Häufige Fragen

Was unterscheidet Enterprise RAG von einer Retrieval-Demo?
Enterprise RAG muss drei Dinge mehr liefern als eine Retrieval-Demo: Berechtigungsgenauigkeit auf Dokument- und Feldebene, Auditierbarkeit jeder Abfrage und eine Evaluierungs-Pipeline, die Antwort-Qualität regressionssicher messbar macht. Ohne diese drei Bausteine bleibt jede RAG-Lösung ein Prototyp.
Welche Vector Stores sind in einem Schweizer Enterprise-Setup sinnvoll?
pgvector ist bei Swiss Knowledge Hub Standard — es läuft in derselben Postgres-Instanz wie die Business-Daten und bleibt in Azure Switzerland North. Für grössere Indexe sind LanceDB (lokal, columnar), Pinecone (managed, US/EU) und ChromaDB (Open Source) optional konfigurierbar. Die Wahl folgt Residency-, Skalierungs- und Team-Kompetenz-Kriterien.
Wie messe ich die Qualität einer RAG-Lösung seriös?
Drei Ebenen: Retrieval-Metriken (Recall@k, MRR, nDCG) auf einem eigenen Evaluationsset, Antwort-Metriken (Faithfulness, Answer Relevance, Context Precision) und Geschäfts-Metriken (Zeit bis zur Antwort, Deflection-Rate, Nutzerzufriedenheit). Ohne eigenes Gold-Set sind die Werte Theater.
Was heisst BYOK im RAG-Kontext?
Bring Your Own Key erlaubt der Kundenorganisation, eigene API-Schlüssel für externe LLM-Provider (z. B. OpenAI, Anthropic) zu hinterlegen. Anfragen gehen direkt an den gewählten Provider; die Vertragsbeziehung besteht zwischen Kunde und Provider. Für Embeddings lässt sich das gleiche Muster nutzen, wenn ein bestimmter Embedding-Provider vertraglich bevorzugt wird.
Welche Deployment-Modelle bietet Swiss Knowledge Hub?
Standard: Multi-Tenant-SaaS auf Azure Switzerland North. Custom-Plan: dedizierte Schweizer Subscription mit Customer-Managed Keys; On-Prem ist als Custom-Option auf Anfrage möglich (mit Zusatzkosten).
Wie gehen Berechtigungen in einem RAG-System mit SharePoint-Quellen?
SKH respektiert die Quell-Rechte: Eine Datei, die in SharePoint nur für Gruppe X sichtbar ist, taucht auch nur in Antworten für Mitglieder von Gruppe X auf. Dazu kommen Workspace-, Page- und File-Level-Permissions sowie Custom Roles pro Organisation. Ein reines ‚Alle sehen alles'-RAG ist im Enterprise-Kontext nicht tragbar.
Was kostet Enterprise RAG bei SKH?
Enterprise ab CHF 1'050 pro Monat (30 Nutzende, 120 GB). Custom-Plan auf Anfrage mit individuell verhandelbaren SLAs, dediziertem Onboarding und optional eigener Infrastruktur. Starter (CHF 250/Mt.) und Business (CHF 650/Mt.) stehen für Pilotprojekte bereit.

Architektur-Review mit dem SKH-Team.

30 Minuten, euer Anwendungsfall, konkrete Empfehlungen zu Vector Store, LLM-Provider und Deployment-Modell.

· Swiss Knowledge Hub GmbH, Liebefeld.