Quickstart · 8 min Lesezeit

In 5 Minuten: Dein erstes Modell deployen

Diese Anleitung führt dich Schritt für Schritt durch das Deployen deines ersten KI-Modells auf Mycelis — von der Account-Erstellung bis zum laufenden API-Endpunkt, in wenigen Minuten.

Voraussetzungen

Bevor du deployest, stelle sicher, dass drei Dinge vorhanden sind.

1. Ein Mycelis-Account

Falls du noch keinen Account hast, gehe zu mycelis.ai und registriere dich. Die Registrierung dauert weniger als eine Minute.

2. Ein Workspace

Nach dem Login erstelle einen Workspace. Ein Workspace ist deine isolierte Umgebung für Deployments, Agenten, Knowledge Bases und API-Keys. Gib ihm einen Namen — fertig.

3. Guthaben in deiner Wallet

Navigiere zu Dashboard → Wallet und lade Guthaben auf. Wie die Abrechnung funktioniert, hängt vom Modelltyp ab:

Open-Source-Modelle auf dedizierten GPUs werden stündlich abgerechnet — ab dem Moment, in dem das Deployment aktiv ist, unabhängig von der tatsächlichen Nutzung. Stoppe oder entferne das Deployment wenn du es nicht mehr brauchst, um unnötige Kosten zu vermeiden.

Kommerzielle Modelle über BYOK oder Managed Keys (z. B. OpenAI, Anthropic) werden per Token abgerechnet — du zahlst nur, wenn du tatsächlich Anfragen sendest.

Stelle sicher, dass du ausreichend Guthaben für den gewünschten Modelltyp hast.

Zum Model Marketplace navigieren

Klicke in deinem Workspace in der linken Seitenleiste auf Models Marketplace. Hier findest du mehrere hundert aktuelle Modelle. Du kannst:

Nach einem bestimmten Modell suchen — über die Suchleiste oben
Nach Kategorie filtern — Textgenerierung, Vision, Embeddings, Code und mehr
Jedes vLLM-kompatible Hugging-Face-Modell laden, falls das gesuchte Modell noch nicht gelistet ist

Falls ein Modell fehlt, das du benötigst, melde dich gerne unter mycelis.ai/feedback oder per E-Mail an info@mycelis.ai — wir fügen es hinzu.

In dieser Anleitung deployen wir ein Open-Source-Modell auf einer dedizierten GPU. Wähle dein gewünschtes Modell aus und klicke auf Modell hinzufügen, um den Deployment-Wizard zu öffnen.

Der Deployment-Wizard

Der Wizard führt dich durch vier Schritte. Hier ist, was jeder Schritt bedeutet.

Schritt 1 — Skalierung & Zeitplan

Konfiguriere, wie das Modell skaliert werden soll und wie lange es täglich laufen soll.

Nutzerskalierung: Mycelis-Workspaces unterstützen Team-Zusammenarbeit mit mehreren Mitgliedern. Basierend auf deinen Anforderungen an gleichzeitige Anfragen wählt Mycelis automatisch die am besten geeignete GPU für dich aus. Ein Tutorial zu Team-Workspaces findest du hier: [Team-Workspaces — demnächst verfügbar].

Täglicher Zeitplan: Du kannst ein Zeitfenster definieren, in dem das Deployment aktiv sein soll — zum Beispiel 08:00–22:00 Uhr. Wenn du dieses Feld leer lässt, läuft das Deployment kontinuierlich, bis du es stoppst oder aus deinem Workspace entfernst.

Schritt 2 — Optional: LoRA Fine-Tuning

Dieser Schritt ist optional. Falls du das Modell vor dem Deployment mit eigenen Daten feinabstimmen möchtest, hinterlege einen Link zu einem JSONL-Datensatz.

Mycelis startet vor dem Deployment einen LoRA-Trainingsvorgang
Für das Training wird temporär eine leistungsstärkere GPU verwendet
Nach Abschluss des Trainings wird das feinabgestimmte Modell unter My Models in deinem Workspace gespeichert
Das Deployment verwendet dann deine angepasste Modellvariante

Wenn du kein Fine-Tuning benötigst, überspringe diesen Schritt einfach.

Schritt 3 — Optional: OpenWebUI

Mycelis hostet eine private OpenWebUI-Instanz für dich und dein Team. Hier kannst du dein Deployment verknüpfen, damit das Modell direkt in einer Chat-Oberfläche nutzbar ist.

Wichtige Hinweise:

Um ein Deployment mit der OpenWebUI zu verknüpfen, muss diese zuerst unter Workspace-Einstellungen → OpenWebUI aktiviert werden
Du kannst die Verknüpfung jederzeit hinzufügen oder entfernen — auch nach der Erstellung des Deployments
Um Kosten zu sparen, ist die OpenWebUI-Instanz nur aktiv, wenn mindestens ein Deployment oder Agent damit verknüpft ist

Überspringe diesen Schritt wenn du gerade keine Chat-Oberfläche benötigst — du kannst sie jederzeit nachträglich aktivieren.

Schritt 4 — Übersicht & Deployment erstellen

Im letzten Schritt siehst du eine Zusammenfassung deiner gesamten Konfiguration: gewähltes Modell, GPU-Typ, Zeitplan und geschätzte Kosten. Überprüfe alles und klicke auf Deployment erstellen.

Je nach Modellgröße ist dein Deployment in 1–3 Minuten bereit. Sobald es aktiv ist, erscheint es in deinem Workspace mit einem live API-Endpunkt.

Du bist live!

Herzlichen Glückwunsch — dein erstes Modell läuft auf Mycelis. Was du als Nächstes tun kannst:

Kopiere den API-Endpunkt aus der Deployment-Karte und sende deine ersten Anfragen
Lies die API-Referenz für alle verfügbaren Endpunkte und Parameter
Konfiguriere einen Agenten auf Basis deines Deployments
Aktiviere die OpenWebUI unter Workspace-Einstellungen und verknüpfe dieses Deployment für eine Chat-Oberfläche

Nächste → In 10 Minuten: Deinen ersten Agent bauen

Produkte

Compute

Intelligence

Integration

Use Cases

Entwickler & Private

KMU

Enterprise

Ressourcen

Lernen

Community & Updates

Support