In 5 Minuten: Dein erstes Modell deployen
Diese Anleitung führt dich Schritt für Schritt durch das Deployen deines ersten KI-Modells auf Mycelis — von der Account-Erstellung bis zum laufenden API-Endpunkt, in wenigen Minuten.
Voraussetzungen
Bevor du deployest, stelle sicher, dass drei Dinge vorhanden sind.
1. Ein Mycelis-Account
Falls du noch keinen Account hast, gehe zu mycelis.ai und registriere dich. Die Registrierung dauert weniger als eine Minute.
2. Ein Workspace
Nach dem Login erstelle einen Workspace. Ein Workspace ist deine isolierte Umgebung für Deployments, Agenten, Knowledge Bases und API-Keys. Gib ihm einen Namen — fertig.
3. Guthaben in deiner Wallet
Navigiere zu Dashboard → Wallet und lade Guthaben auf. Wie die Abrechnung funktioniert, hängt vom Modelltyp ab:
Open-Source-Modelle auf dedizierten GPUs werden stündlich abgerechnet — ab dem Moment, in dem das Deployment aktiv ist, unabhängig von der tatsächlichen Nutzung. Stoppe oder entferne das Deployment wenn du es nicht mehr brauchst, um unnötige Kosten zu vermeiden.
Kommerzielle Modelle über BYOK oder Managed Keys (z. B. OpenAI, Anthropic) werden per Token abgerechnet — du zahlst nur, wenn du tatsächlich Anfragen sendest.
Stelle sicher, dass du ausreichend Guthaben für den gewünschten Modelltyp hast.
Zum Model Marketplace navigieren
Klicke in deinem Workspace in der linken Seitenleiste auf Models Marketplace. Hier findest du mehrere hundert aktuelle Modelle. Du kannst:
- Nach einem bestimmten Modell suchen — über die Suchleiste oben
- Nach Kategorie filtern — Textgenerierung, Vision, Embeddings, Code und mehr
- Jedes vLLM-kompatible Hugging-Face-Modell laden, falls das gesuchte Modell noch nicht gelistet ist
Falls ein Modell fehlt, das du benötigst, melde dich gerne unter mycelis.ai/feedback oder per E-Mail an info@mycelis.ai — wir fügen es hinzu.
In dieser Anleitung deployen wir ein Open-Source-Modell auf einer dedizierten GPU. Wähle dein gewünschtes Modell aus und klicke auf Modell hinzufügen, um den Deployment-Wizard zu öffnen.
Der Deployment-Wizard
Der Wizard führt dich durch vier Schritte. Hier ist, was jeder Schritt bedeutet.
Schritt 1 — Skalierung & Zeitplan
Konfiguriere, wie das Modell skaliert werden soll und wie lange es täglich laufen soll.
Nutzerskalierung: Mycelis-Workspaces unterstützen Team-Zusammenarbeit mit mehreren Mitgliedern. Basierend auf deinen Anforderungen an gleichzeitige Anfragen wählt Mycelis automatisch die am besten geeignete GPU für dich aus. Ein Tutorial zu Team-Workspaces findest du hier: [Team-Workspaces — demnächst verfügbar].
Täglicher Zeitplan: Du kannst ein Zeitfenster definieren, in dem das Deployment aktiv sein soll — zum Beispiel 08:00–22:00 Uhr. Wenn du dieses Feld leer lässt, läuft das Deployment kontinuierlich, bis du es stoppst oder aus deinem Workspace entfernst.
Schritt 2 — Optional: LoRA Fine-Tuning
Dieser Schritt ist optional. Falls du das Modell vor dem Deployment mit eigenen Daten feinabstimmen möchtest, hinterlege einen Link zu einem JSONL-Datensatz.
- Mycelis startet vor dem Deployment einen LoRA-Trainingsvorgang
- Für das Training wird temporär eine leistungsstärkere GPU verwendet
- Nach Abschluss des Trainings wird das feinabgestimmte Modell unter My Models in deinem Workspace gespeichert
- Das Deployment verwendet dann deine angepasste Modellvariante
Wenn du kein Fine-Tuning benötigst, überspringe diesen Schritt einfach.
Schritt 3 — Optional: OpenWebUI
Mycelis hostet eine private OpenWebUI-Instanz für dich und dein Team. Hier kannst du dein Deployment verknüpfen, damit das Modell direkt in einer Chat-Oberfläche nutzbar ist.
Wichtige Hinweise:
- Um ein Deployment mit der OpenWebUI zu verknüpfen, muss diese zuerst unter Workspace-Einstellungen → OpenWebUI aktiviert werden
- Du kannst die Verknüpfung jederzeit hinzufügen oder entfernen — auch nach der Erstellung des Deployments
- Um Kosten zu sparen, ist die OpenWebUI-Instanz nur aktiv, wenn mindestens ein Deployment oder Agent damit verknüpft ist
Überspringe diesen Schritt wenn du gerade keine Chat-Oberfläche benötigst — du kannst sie jederzeit nachträglich aktivieren.
Schritt 4 — Übersicht & Deployment erstellen
Im letzten Schritt siehst du eine Zusammenfassung deiner gesamten Konfiguration: gewähltes Modell, GPU-Typ, Zeitplan und geschätzte Kosten. Überprüfe alles und klicke auf Deployment erstellen.
Je nach Modellgröße ist dein Deployment in 1–3 Minuten bereit. Sobald es aktiv ist, erscheint es in deinem Workspace mit einem live API-Endpunkt.
Du bist live!
Herzlichen Glückwunsch — dein erstes Modell läuft auf Mycelis. Was du als Nächstes tun kannst:
- Kopiere den API-Endpunkt aus der Deployment-Karte und sende deine ersten Anfragen
- Lies die API-Referenz für alle verfügbaren Endpunkte und Parameter
- Konfiguriere einen Agenten auf Basis deines Deployments
- Aktiviere die OpenWebUI unter Workspace-Einstellungen und verknüpfe dieses Deployment für eine Chat-Oberfläche