RAG Pipeline aufsetzen
Was ist RAG?
Retrieval-Augmented Generation (RAG) erweitert ein Sprachmodell um eine externe Wissensdatenbank. Statt nur auf Trainingsdaten zu antworten, sucht das Modell bei jeder Anfrage in deinen Dokumenten und liefert präzise, quellenbasierte Antworten.
Typische Anwendungsfälle:
- Interne Wissensdatenbank / Firmen-FAQ
- Dokumenten-Assistent (Verträge, Handbücher, Berichte)
- Support-Bot mit aktuellen Produktinfos
Architektur
Nutzer-Anfrage
↓
Mycelis Agent
↓
RAG-Retrieval (Qdrant Vektordatenbank)
↓
Relevante Dokumentenstellen werden als Kontext eingefügt
↓
LLM generiert Antwort mit Kontext
↓
Antwort (mit Quellen)
Schritt 1 — Knowledge Base erstellen
- Navigiere zu Dashboard → Wissensdatenbanken → Neue Knowledge Base
- Vergib einen Namen (z. B.
Produkthandbuch 2025) - Optional: Beschreibung hinzufügen
- Klicke Erstellen
Schritt 2 — Dokumente hochladen
Unterstützte Formate
| Format | Hinweise |
|---|---|
| Text wird automatisch extrahiert | |
| TXT | Plain Text, UTF-8 |
| Markdown (.md) | Struktur bleibt erhalten |
| DOCX | Word-Dokumente |
Upload
- Öffne die Knowledge Base
- Klicke Dokument hochladen
- Wähle eine oder mehrere Dateien aus
- Warte bis der Status auf Indiziert wechselt
Indizierungsprozess
Nach dem Upload werden die Dokumente automatisch:
- In Chunks aufgeteilt (standardmäßig ~512 Token pro Chunk)
- Embeddingst erzeugt (Vektoren für semantische Suche)
- In Qdrant gespeichert (Vektordatenbank)
Je nach Dateigröße dauert die Indizierung wenige Sekunden bis mehrere Minuten.
Schritt 3 — Knowledge Base im Agent aktivieren
- Gehe zu Dashboard → Agents → [Dein Agent]
- Tab Wissen & Tools
- Aktiviere die gewünschte Knowledge Base per Checkbox
- Speichern
Ab sofort fügt der Agent bei jeder Anfrage automatisch relevante Dokumentenstellen als Kontext ein.
Schritt 4 — RAG im Workflow-Editor (fortgeschritten)
Für mehr Kontrolle über den RAG-Prozess kannst du im Workflow-Editor einen KnowledgeBase-Node einbauen:
- Gehe zu Agent → Modelle & Routing → Workflow
- Wähle die Vorlage KB-Anreicherung oder füge manuell einen
KnowledgeBase-Node hinzu - Verbinde:
Input → KnowledgeBase-Node → Deployment - Im KnowledgeBase-Node: wähle die gewünschte Knowledge Base
Der Workflow-Ansatz ermöglicht:
- Mehrere Knowledge Bases parallel oder sequenziell abfragen
- RAG nur für bestimmte Anfrage-Typen aktivieren (via Condition-Node)
- Kombination mit MCP-Tools
Dokumente aktualisieren
Um Inhalte zu aktualisieren:
- Einzelnes Dokument löschen und neu hochladen — die alten Vektoren werden automatisch entfernt
- Ganze Knowledge Base leeren — alle Dokumente und Vektoren löschen
Änderungen sind nach der Indizierung sofort in neuen Anfragen sichtbar.
Best Practices
Chunking
- Kürzere Chunks (256–512 Token): Höhere Präzision, mehr Relevanz pro Chunk
- Längere Chunks (512–1024 Token): Mehr Kontext pro Treffer, besser bei langen Argumentationsketten
Dokumentenqualität
- Strukturierte Dokumente (mit Überschriften) werden besser indexiert
- Scans ohne OCR liefern schlechte Ergebnisse — nutze vorher OCR-Software
- Entferne irrelevante Inhalte (Seitenzahlen, Kopfzeilen) für bessere Treffer
System-Prompt anpassen
Ergänze den System-Prompt des Agents um eine Anweisung, die RAG-Inhalte richtig zu nutzen:
Dir werden relevante Dokumentenstellen als Kontext bereitgestellt.
Beziehe dich in deiner Antwort auf diese Quellen.
Wenn der Kontext keine passende Information enthält, sage das explizit.
Nächste Schritte
- Ersten Agent konfigurieren — Vollständige Agent-Einrichtung
- MCP Tools — Echtzeit-Daten zusätzlich zu statischen Dokumenten