Dedicated Deployment erstellen
Voraussetzungen
Stelle vor dem Deployen sicher, dass drei Dinge vorhanden sind:
- Ein Mycelis-Account — registriere dich unter mycelis.ai, falls noch nicht geschehen
- Ein Workspace — erstelle einen nach dem Login
- Guthaben in der Wallet — navigiere zu Dashboard → Wallet und lade Guthaben auf
Dedicated-GPU-Deployments werden stündlich ab dem Moment der Aktivierung abgerechnet — unabhängig von der tatsächlichen Nutzung. Stoppe oder entferne das Deployment, wenn du es nicht mehr benötigst, um unnötige Kosten zu vermeiden.
Zum Model Marketplace navigieren
Klicke in der linken Navigation auf Models Marketplace. Hier findest du mehrere hundert aktuelle Modelle. Du kannst:
- Nach einem Modell suchen — über die Suchleiste oben
- Nach Kategorie filtern — Textgenerierung, Vision, Embeddings, Code und mehr
- Jedes vLLM-kompatible Hugging-Face-Modell laden, falls das gesuchte Modell noch nicht gelistet ist
Falls ein Modell fehlt, das du benötigst, melde dich unter mycelis.ai/feedback oder info@mycelis.ai.
Wähle dein Modell aus und klicke auf Modell hinzufügen, um den Deployment-Wizard zu öffnen.
Der Deployment-Wizard
Der Wizard führt dich durch vier Schritte.
Schritt 1 — Skalierung & Zeitplan
Konfiguriere, wie das Modell skaliert werden soll und wann es läuft.
Nutzerskalierung: Mycelis wählt basierend auf deinen Anforderungen an gleichzeitige Anfragen automatisch die am besten geeignete GPU aus.
Täglicher Zeitplan: Definiere ein Zeitfenster, in dem das Deployment aktiv sein soll (z. B. 08:00–22:00). Lasse das Feld leer für kontinuierlichen Betrieb — das Deployment läuft, bis du es stoppst oder entfernst.
Schritt 2 — Optional: LoRA Fine-Tuning
Überspringe diesen Schritt, wenn du kein Fine-Tuning benötigst. Falls du das Modell vor dem Deployment feinabstimmen möchtest, hinterlege einen Link zu einem JSONL-Datensatz:
- Mycelis startet vor dem Deployment einen LoRA-Trainingsvorgang
- Für das Training wird temporär eine leistungsstärkere GPU verwendet
- Nach Abschluss des Trainings wird das feinabgestimmte Modell unter My Models gespeichert
- Das Deployment verwendet dann deine angepasste Modellvariante
Schritt 3 — Optional: OpenWebUI
Mycelis hostet eine private OpenWebUI-Instanz für dich und dein Team. Verknüpfe dein Deployment hier, damit das Modell direkt in einer Chat-Oberfläche nutzbar ist.
Hinweise:
- Die OpenWebUI muss zuerst unter Workspace-Einstellungen → OpenWebUI aktiviert werden
- Die Verknüpfung kann jederzeit hinzugefügt oder entfernt werden — auch nach der Deployment-Erstellung
- Die OpenWebUI-Instanz ist nur aktiv, wenn mindestens ein Deployment oder Agent damit verknüpft ist
Schritt 4 — Übersicht & Deployment erstellen
Überprüfe deine gesamte Konfiguration — Modell, GPU-Typ, Zeitplan und geschätzte Kosten. Klicke auf Deployment erstellen.
Je nach Modellgröße ist dein Deployment in 1–3 Minuten bereit. Sobald es aktiv ist, erscheint es in deinem Workspace mit einem live API-Endpunkt.
Nächste Schritte
- Agenten konfigurieren — Routing, Knowledge Bases und MCP Tools auf dein Deployment legen
- Commercial Deployment erstellen (Managed Keys) — OpenAI-, Anthropic- oder Google-Modelle nutzen
- Commercial Deployment erstellen (BYOK) — Eigenen Provider-Key verwenden