Plattform
Private KI-Infrastruktur — von Compute bis Agenten.
Zielgruppen
Für Enterprise, KMU und private Entwickler.
Wissen & Support
Alles, was du brauchst, um erfolgreich mit Mycelis zu arbeiten.
Intelligence
Definiere Regeln — Mycelis wählt automatisch das günstigste passende Modell. Durchschnittlich 80% Kostenersparnis ohne eine Zeile Code zu ändern.
Das VirtualModel-Konzept
Ein VirtualModel ist ein benannter Endpunkt in deinem Workspace — z.B. my-assistant. Statt direkt ein Modell anzusprechen, gibst du nur diesen Namen an. Mycelis wertet deine Routing-Regeln aus und entscheidet bei jeder Anfrage, welches Deployment die Aufgabe am günstigsten löst.
Dein Code bleibt identisch — nur das VirtualModel-Deployment wechselt intern zwischen Modellen.
Smart Routing Regeln
Anfragen mit weniger als 500 Input-Token → kleines Modell (z.B. Llama 8B). Mehr als 500 Token → leistungsstarkes Modell (z.B. GPT-4o).
Zeitkritische Anfragen (stream=true, kurze Prompts) → schnellstes verfügbares Modell. Hintergrund-Jobs → günstigstes Modell.
Prompts mit 'Code' oder 'SQL' → spezialisiertes Coding-Modell. Allgemeine Fragen → Standard-Deployment.
70% der Anfragen → Modell A, 30% → Modell B. Für Qualitätsvergleiche ohne Code-Änderung.
In typischen Produktions-Workloads sind 60–80% aller Anfragen kurze, einfache Tasks (Klassifizierung, Extraktion, kurze Zusammenfassungen). Diese können von kleinen, günstigen Modellen wie Llama 3.1 8B erledigt werden — bei gleicher Ausgabequalität.
~890 €
nur GPT-4o / Monat
~178 €
mit Smart Routing / Monat
Code-Beispiel — VirtualModel nutzen
from openai import OpenAI
client = OpenAI(
base_url="https://api.mycelis.io/proxy/v1",
api_key="pat_..."
)
# Ändere nur den model-Parameter auf deinen VirtualModel-Namen
response = client.chat.completions.create(
model="my-assistant", # Mycelis routet automatisch
messages=[{"role": "user", "content": "Fasse den Vertrag zusammen."}]
)
# Routing: kurze Anfrage → Llama 3.1 8B (0,39€/h)
# statt → GPT-4o (0,005€/1k Token)Verbinde deine Knowledge Bases direkt mit Agents. Bei jeder Anfrage durchsucht Mycelis automatisch die relevanten Dokumente und fügt sie als Kontext ein — ohne eigene Vektorsuche-Implementierung.
Häufige Fragen
Konfiguriere dein erstes VirtualModel in unter 5 Minuten.
Kostenlos starten