Plattform

Produkte

Private KI-Infrastruktur — von Compute bis Agenten.

Zielgruppen

Use Cases

Für Enterprise, KMU und private Entwickler.

Wissen & Support

Ressourcen

Alles, was du brauchst, um erfolgreich mit Mycelis zu arbeiten.

Guide · 8 Min Lesezeit

Dedicated Deployment erstellen

Voraussetzungen

Stelle vor dem Deployen sicher, dass drei Dinge vorhanden sind:

  1. Ein Mycelis-Account — registriere dich unter mycelis.ai, falls noch nicht geschehen
  2. Ein Workspace — erstelle einen nach dem Login
  3. Guthaben in der Wallet — navigiere zu Dashboard → Wallet und lade Guthaben auf

Dedicated-GPU-Deployments werden stündlich ab dem Moment der Aktivierung abgerechnet — unabhängig von der tatsächlichen Nutzung. Stoppe oder entferne das Deployment, wenn du es nicht mehr benötigst, um unnötige Kosten zu vermeiden.


Zum Model Marketplace navigieren

Klicke in der linken Navigation auf Models Marketplace. Hier findest du mehrere hundert aktuelle Modelle. Du kannst:

  • Nach einem Modell suchen — über die Suchleiste oben
  • Nach Kategorie filtern — Textgenerierung, Vision, Embeddings, Code und mehr
  • Jedes vLLM-kompatible Hugging-Face-Modell laden, falls das gesuchte Modell noch nicht gelistet ist

Falls ein Modell fehlt, das du benötigst, melde dich unter mycelis.ai/feedback oder info@mycelis.ai.

Wähle dein Modell aus und klicke auf Modell hinzufügen, um den Deployment-Wizard zu öffnen.


Der Deployment-Wizard

Der Wizard führt dich durch vier Schritte.

Schritt 1 — Skalierung & Zeitplan

Konfiguriere, wie das Modell skaliert werden soll und wann es läuft.

Nutzerskalierung: Mycelis wählt basierend auf deinen Anforderungen an gleichzeitige Anfragen automatisch die am besten geeignete GPU aus.

Täglicher Zeitplan: Definiere ein Zeitfenster, in dem das Deployment aktiv sein soll (z. B. 08:00–22:00). Lasse das Feld leer für kontinuierlichen Betrieb — das Deployment läuft, bis du es stoppst oder entfernst.

Schritt 2 — Optional: LoRA Fine-Tuning

Überspringe diesen Schritt, wenn du kein Fine-Tuning benötigst. Falls du das Modell vor dem Deployment feinabstimmen möchtest, hinterlege einen Link zu einem JSONL-Datensatz:

  • Mycelis startet vor dem Deployment einen LoRA-Trainingsvorgang
  • Für das Training wird temporär eine leistungsstärkere GPU verwendet
  • Nach Abschluss des Trainings wird das feinabgestimmte Modell unter My Models gespeichert
  • Das Deployment verwendet dann deine angepasste Modellvariante

Schritt 3 — Optional: OpenWebUI

Mycelis hostet eine private OpenWebUI-Instanz für dich und dein Team. Verknüpfe dein Deployment hier, damit das Modell direkt in einer Chat-Oberfläche nutzbar ist.

Hinweise:

  • Die OpenWebUI muss zuerst unter Workspace-Einstellungen → OpenWebUI aktiviert werden
  • Die Verknüpfung kann jederzeit hinzugefügt oder entfernt werden — auch nach der Deployment-Erstellung
  • Die OpenWebUI-Instanz ist nur aktiv, wenn mindestens ein Deployment oder Agent damit verknüpft ist

Schritt 4 — Übersicht & Deployment erstellen

Überprüfe deine gesamte Konfiguration — Modell, GPU-Typ, Zeitplan und geschätzte Kosten. Klicke auf Deployment erstellen.

Je nach Modellgröße ist dein Deployment in 1–3 Minuten bereit. Sobald es aktiv ist, erscheint es in deinem Workspace mit einem live API-Endpunkt.


Nächste Schritte