KI-Kostenrechner pro LLM-Modell
Vergleichen Sie, was KI Ihr Team pro Monat kostet — bei OpenAI, Anthropic, Google und Mistral. Entwickelt für europäische KMU, die DSGVO-konforme KI ohne unerwartete Rechnungen benötigen. Keine Token zählen, keine Anmeldung, keine Kreditkarte.
Kosten pro Anbieter — günstiges vs. Flagship-Modell
| Anbieter | Günstiges Modell | Flagship-Modell |
|---|---|---|
| OpenAI | GPT-5.4 Mini €3/Monat · €31/Jahr | GPT-5.5 €17/Monat · €208/Jahr |
| Anthropic | Claude Haiku 4.5 €3/Monat · €37/Jahr | Claude Opus 4.7 €16/Monat · €187/Jahr |
Gemini 2.5 Flash €1/Monat · €15/Jahr | Gemini 3.1 Pro €7/Monat · €83/Jahr | |
| Mistral | Mistral Small 3 €0/Monat · €3/Jahr | Mistral Large 2 €5/Monat · €59/Jahr |
Die meisten KI-Tools senden jede Aufgabe an ein Modell. Mit Custos Multi-LLM wählen Sie pro Workflow das richtige Modell — und genau das ergibt die unten gezeigten Einsparungen.
€9.60/user/mo · €115/user/year
Schätzungen basieren auf typischen KMU-Nutzungsmustern. Tatsächliche Kosten variieren je nach Prompt-Länge, Antwortlänge und Caching. Anbieterpreise in USD, umgerechnet in EUR mit festem Kurs 0,92. Quellen: openai.com/api/pricing, anthropic.com/pricing, ai.google.dev/gemini-api/docs/pricing, mistral.ai/pricing. Zuletzt geprüft: 8. Mai 2026. Custos platform: €12/user/month, or €9.60/user/month with annual billing (-20%). All prices excl. VAT.
Wie Custos Rechnungsüberraschungen verhindert
Custos blockiert den API-Call, bevor er Geld kostet. Legen Sie ein monatliches Limit pro Nutzer oder Team fest. Das Limit hält — keine Überraschung im Nachhinein.
Was Sie sehen werden
Anbieter-Vergleich
Monatliche Kosten nebeneinander für die vier von Custos unterstützten Anbieter. Keine Herstellerpräferenz — Custos berechnet keine Marge auf KI-Nutzung. Sie zahlen den Anbieter direkt über Ihre eigenen Schlüssel.
Multi-LLM in einem Arbeitsbereich
Die meisten KI-Tools binden Sie an ein Modell. Custos gibt Ihnen alle vier Anbieter — OpenAI, Anthropic, Google, Mistral — in einem Arbeitsbereich. Sie wählen das richtige Modell pro Workflow: leichte Aufgaben auf günstigen Modellen, komplexe Aufgaben auf Premium-Modellen. Typische Einsparung bei gutem Einsatz: 60-80% gegenüber dem Betrieb auf einem Flagship-Modell.
Harte Ausgabendeckel
Custos blockiert den API-Call, bevor er Sie Geld kostet. Legen Sie ein monatliches Limit pro Nutzer oder Team fest. Kein nächtliches Zusehen, wie ein unkontrollierter Prompt Ihr Budget leert.
DSGVO-konform als Standard
Custos wird in Frankfurt und Amsterdam gehostet. Daten bleiben in der EU. Keine Datenspeicherung bei allen vier Anbietern. Konform mit DSGVO, AVG, GDPR und RGPD von Anfang an.
So wählen Sie in Custos das richtige Modell
Für leichte, hochvolumige Arbeit
Kunden-E-Mails, kurze Übersetzungen, Produktbeschreibungen, Klassifizierungen
→ Mistral Small 3 oder Gemini 2.5 Flash
Schnell, günstig, Qualität ausreichend für diese Arbeit.
€0,001 — €0,003 pro Aufruf
Für mittelschwere Arbeit
Zusammenfassungen, Geschäftstexte, E-Mail-Vorlagen, einfacher Code
→ GPT-5.4 Mini oder Claude Haiku 4.5
Gute Balance zwischen Preis und Qualität.
€0,01 — €0,05 pro Aufruf
Für anspruchsvolles Denken
Vertragsanalyse, lange Dokumente, komplexe Code-Review, juristische Argumentation
→ Claude Opus 4.7, GPT-5.5 oder Mistral Large 2
Premium-Preis, Premium-Ergebnis.
€0,15 — €0,40 pro Aufruf
Für lange Kontexte
200K+ Tokens, vollständige Akten, Codebases
→ GPT-5.5 (1M Token Kontext) oder Claude Opus 4.7 (200K)
Nichts anderes behält durchgehend den Überblick.
ab €0,50 pro Aufruf
In Custos sehen Sie diese Optionen mit Preisvergleich nebeneinander, bevor Sie den Chat starten. Wechseln Sie häufig? Stellen Sie Ihre Präferenz pro Projekt ein — Custos merkt sie sich. Einmal wählen, fortan automatisch das richtige Modell für Sie und Ihr Team.
Häufig gestellte Fragen
Was kostet KI pro Mitarbeiter pro Monat?
Für typisches KMU-Nutzung — E-Mails schreiben, Meetings zusammenfassen, Dokumente übersetzen — geben die meisten Teams €5 bis €25 pro Nutzer pro Monat für Anbieter-Gebühren aus, plus €12–€15 für den Custos-Arbeitsbereich. Intensivnutzer (Recht, technisches Schreiben, Code-Review) können €40–€80 erreichen. Das richtige Modell pro Workflow zu wählen reduziert dies typischerweise um 60-80%.
Was ist der Unterschied zwischen BYOK und einem verwalteten KI-Abonnement?
BYOK (Bring Your Own Key) bedeutet, dass Sie den KI-Anbieter — OpenAI, Anthropic, Google, Mistral — direkt bezahlen. Custos fügt keine Marge auf die Nutzung hinzu. Ein verwaltetes Abonnement bündelt KI und Plattform in einer Rechnung, meist mit einem 2x–3x Aufschlag. BYOK ist günstiger und transparenter für Unternehmen mit vorhersehbarem Verbrauch.
Welches KI-Modell ist am günstigsten für europäische KMU?
Für hochvolumige Routineaufgaben (Übersetzungen, Klassifizierungen, kurze E-Mails) sind Mistral Small 3 und Gemini 2.5 Flash am kosteneffizientesten. Für komplexes Schlussfolgern (Vertragsreview, lange Analysen) bietet Mistral Large 2 das beste Preis-Leistungs-Verhältnis. Custos wählt automatisch pro Aufgabe.
Sind diese Preise in Euro oder Dollar?
Anbieter-Listenpreise werden in USD veröffentlicht. Wir rechnen mit einem festen Kurs, der auf der Seite angezeigt wird, in EUR um. Custos' eigene Plattformgebühren werden in EUR berechnet (zzgl. MwSt.). Kunden in den Niederlanden fügen 21% MwSt. hinzu; EU B2B mit gültiger USt-IdNr. zahlt 0% (Umkehrung der Steuerschuld).
Berechnet Custos eine Marge auf KI-Nutzung?
Nein. Custos nutzt das BYOK-Modell — Sie verbinden Ihre eigenen API-Schlüssel und zahlen den Anbieter direkt. Wir berechnen eine feste Plattformgebühr pro Nutzer pro Monat und nehmen nie einen Prozentsatz Ihrer KI-Ausgaben. Ihre KI-Rechnung geht an OpenAI, Anthropic, Google oder Mistral, nicht an uns.
Wie verhindert Custos KI-Rechnungsschocks?
Harte Ausgabendeckel auf Proxy-Ebene. Sie legen ein monatliches Limit pro Nutzer, Team oder Arbeitsbereich fest. Custos prüft das Limit vor jedem API-Call und blockiert Anfragen, sobald Sie das Limit erreichen. Keine nachträgliche Überraschung — das Limit hält.