Guide · 8 Min Lesezeit

Dedicated Deployment erstellen

Voraussetzungen

Stelle vor dem Deployen sicher, dass drei Dinge vorhanden sind:

Ein Mycelis-Account — registriere dich unter mycelis.ai, falls noch nicht geschehen
Ein Workspace — erstelle einen nach dem Login
Guthaben in der Wallet — navigiere zu Dashboard → Wallet und lade Guthaben auf

Dedicated-GPU-Deployments werden stündlich ab dem Moment der Aktivierung abgerechnet — unabhängig von der tatsächlichen Nutzung. Stoppe oder entferne das Deployment, wenn du es nicht mehr benötigst, um unnötige Kosten zu vermeiden.

Zum Model Marketplace navigieren

Klicke in der linken Navigation auf Models Marketplace. Hier findest du mehrere hundert aktuelle Modelle. Du kannst:

Nach einem Modell suchen — über die Suchleiste oben
Nach Kategorie filtern — Textgenerierung, Vision, Embeddings, Code und mehr
Jedes vLLM-kompatible Hugging-Face-Modell laden, falls das gesuchte Modell noch nicht gelistet ist

Falls ein Modell fehlt, das du benötigst, melde dich unter mycelis.ai/feedback oder info@mycelis.ai.

Wähle dein Modell aus und klicke auf Modell hinzufügen, um den Deployment-Wizard zu öffnen.

Der Deployment-Wizard

Der Wizard führt dich durch vier Schritte.

Schritt 1 — Skalierung & Zeitplan

Konfiguriere, wie das Modell skaliert werden soll und wann es läuft.

Nutzerskalierung: Mycelis wählt basierend auf deinen Anforderungen an gleichzeitige Anfragen automatisch die am besten geeignete GPU aus.

Täglicher Zeitplan: Definiere ein Zeitfenster, in dem das Deployment aktiv sein soll (z. B. 08:00–22:00). Lasse das Feld leer für kontinuierlichen Betrieb — das Deployment läuft, bis du es stoppst oder entfernst.

Schritt 2 — Optional: LoRA Fine-Tuning

Überspringe diesen Schritt, wenn du kein Fine-Tuning benötigst. Falls du das Modell vor dem Deployment feinabstimmen möchtest, hinterlege einen Link zu einem JSONL-Datensatz:

Mycelis startet vor dem Deployment einen LoRA-Trainingsvorgang
Für das Training wird temporär eine leistungsstärkere GPU verwendet
Nach Abschluss des Trainings wird das feinabgestimmte Modell unter My Models gespeichert
Das Deployment verwendet dann deine angepasste Modellvariante

Schritt 3 — Optional: OpenWebUI

Mycelis hostet eine private OpenWebUI-Instanz für dich und dein Team. Verknüpfe dein Deployment hier, damit das Modell direkt in einer Chat-Oberfläche nutzbar ist.

Hinweise:

Die OpenWebUI muss zuerst unter Workspace-Einstellungen → OpenWebUI aktiviert werden
Die Verknüpfung kann jederzeit hinzugefügt oder entfernt werden — auch nach der Deployment-Erstellung
Die OpenWebUI-Instanz ist nur aktiv, wenn mindestens ein Deployment oder Agent damit verknüpft ist

Schritt 4 — Übersicht & Deployment erstellen

Überprüfe deine gesamte Konfiguration — Modell, GPU-Typ, Zeitplan und geschätzte Kosten. Klicke auf Deployment erstellen.

Je nach Modellgröße ist dein Deployment in 1–3 Minuten bereit. Sobald es aktiv ist, erscheint es in deinem Workspace mit einem live API-Endpunkt.

Nächste Schritte

Agenten konfigurieren — Routing, Knowledge Bases und MCP Tools auf dein Deployment legen
Commercial Deployment erstellen (Managed Keys) — OpenAI-, Anthropic- oder Google-Modelle nutzen
Commercial Deployment erstellen (BYOK) — Eigenen Provider-Key verwenden

← Vorherige Commercial Deployment erstellen (Managed Keys)Nächste → Fine-Tuning Guide

Produkte

Compute

Intelligence

Integration

Use Cases

Entwickler & Private

KMU

Enterprise

Ressourcen

Lernen

Community & Updates

Support