Plattform

Produkte

Private KI-Infrastruktur — von Compute bis Agenten.

Zielgruppen

Use Cases

Für Enterprise, KMU und private Entwickler.

Wissen & Support

Ressourcen

Alles, was du brauchst, um erfolgreich mit Mycelis zu arbeiten.

Guide

So sparst du 80% API-Kosten mit Smart Routing

12. März 2025 · 7 Min Lesezeit

Viele Teams schicken jeden Prompt auf dasselbe Modell - selbst wenn die Anfrage simpel ist. Genau hier entsteht unnötiger Kostenverbrauch.

Grundidee

Lege ein VirtualModel an und route nach Anfrageklasse:

  • Low Cost fuer Routineaufgaben
  • Balanced fuer die meisten Workloads
  • High Quality fuer komplexe Aufgaben

Ergebnis

In typischen Support- und Assistenz-Szenarien sind Einsparungen von bis zu 80% realistisch, ohne dass die wahrgenommene Antwortqualitaet sinkt.

Minimalregel

if prompt_complexity < threshold => low_cost_model
else => high_quality_model

Starte klein, miss die Antwortqualitaet und optimiere dann die Schwellenwerte.

Zur Übersicht