AI cost management

KI-Kostenrechner pro LLM-Modell

Vergleichen Sie, was KI Ihr Team pro Monat kostet — bei OpenAI, Anthropic, Google und Mistral. Entwickelt für europäische KMU, die DSGVO-konforme KI ohne unerwartete Rechnungen benötigen. Keine Token zählen, keine Anmeldung, keine Kreditkarte.

50
01050100250500
10
01050100250500
50
01050100250500
10
01050100250500
5
1255075100

Kosten pro Anbieter — günstiges vs. Flagship-Modell

AnbieterGünstiges ModellFlagship-Modell
OpenAI
GPT-5.4 Mini
€3/Monat · €31/Jahr
GPT-5.5
€17/Monat · €208/Jahr
Anthropic
Claude Haiku 4.5
€3/Monat · €37/Jahr
Claude Opus 4.7
€16/Monat · €187/Jahr
Google
Gemini 2.5 Flash
€1/Monat · €15/Jahr
Gemini 3.1 Pro
€7/Monat · €83/Jahr
Mistral
Mistral Small 3
€0/Monat · €3/Jahr
Mistral Large 2
€5/Monat · €59/Jahr

Die meisten KI-Tools senden jede Aufgabe an ein Modell. Mit Custos Multi-LLM wählen Sie pro Workflow das richtige Modell — und genau das ergibt die unten gezeigten Einsparungen.

€9.60/user/mo · €115/user/year

Mit Custos Multi-LLM: richtiges Modell pro Workflow
Custos platform (5 × €9.60)€48/Monat · €576/Jahr
Provider tokens (your model mix)€1/Monat · €11/Jahr
Total
€49/Monat·€587/Jahr
Ohne Auswahl (alles auf Flagship)
Custos platform (5 × €9.60)€48/Monat · €576/Jahr
Provider tokens€17/Monat · €208/Jahr
Total
€65/Monat·€784/Jahr
You save on AI tokens: €16/mo · €197/yr
14 Tage kostenlos testen

Schätzungen basieren auf typischen KMU-Nutzungsmustern. Tatsächliche Kosten variieren je nach Prompt-Länge, Antwortlänge und Caching. Anbieterpreise in USD, umgerechnet in EUR mit festem Kurs 0,92. Quellen: openai.com/api/pricing, anthropic.com/pricing, ai.google.dev/gemini-api/docs/pricing, mistral.ai/pricing. Zuletzt geprüft: 8. Mai 2026. Custos platform: €12/user/month, or €9.60/user/month with annual billing (-20%). All prices excl. VAT.

Wie Custos Rechnungsüberraschungen verhindert

Custos blockiert den API-Call, bevor er Geld kostet. Legen Sie ein monatliches Limit pro Nutzer oder Team fest. Das Limit hält — keine Überraschung im Nachhinein.

Was Sie sehen werden

Anbieter-Vergleich

Monatliche Kosten nebeneinander für die vier von Custos unterstützten Anbieter. Keine Herstellerpräferenz — Custos berechnet keine Marge auf KI-Nutzung. Sie zahlen den Anbieter direkt über Ihre eigenen Schlüssel.

Multi-LLM in einem Arbeitsbereich

Die meisten KI-Tools binden Sie an ein Modell. Custos gibt Ihnen alle vier Anbieter — OpenAI, Anthropic, Google, Mistral — in einem Arbeitsbereich. Sie wählen das richtige Modell pro Workflow: leichte Aufgaben auf günstigen Modellen, komplexe Aufgaben auf Premium-Modellen. Typische Einsparung bei gutem Einsatz: 60-80% gegenüber dem Betrieb auf einem Flagship-Modell.

Harte Ausgabendeckel

Custos blockiert den API-Call, bevor er Sie Geld kostet. Legen Sie ein monatliches Limit pro Nutzer oder Team fest. Kein nächtliches Zusehen, wie ein unkontrollierter Prompt Ihr Budget leert.

DSGVO-konform als Standard

Custos wird in Frankfurt und Amsterdam gehostet. Daten bleiben in der EU. Keine Datenspeicherung bei allen vier Anbietern. Konform mit DSGVO, AVG, GDPR und RGPD von Anfang an.

So wählen Sie in Custos das richtige Modell

Für leichte, hochvolumige Arbeit

Kunden-E-Mails, kurze Übersetzungen, Produktbeschreibungen, Klassifizierungen

Mistral Small 3 oder Gemini 2.5 Flash

Schnell, günstig, Qualität ausreichend für diese Arbeit.

€0,001 — €0,003 pro Aufruf

Für mittelschwere Arbeit

Zusammenfassungen, Geschäftstexte, E-Mail-Vorlagen, einfacher Code

GPT-5.4 Mini oder Claude Haiku 4.5

Gute Balance zwischen Preis und Qualität.

€0,01 — €0,05 pro Aufruf

Für anspruchsvolles Denken

Vertragsanalyse, lange Dokumente, komplexe Code-Review, juristische Argumentation

Claude Opus 4.7, GPT-5.5 oder Mistral Large 2

Premium-Preis, Premium-Ergebnis.

€0,15 — €0,40 pro Aufruf

Für lange Kontexte

200K+ Tokens, vollständige Akten, Codebases

GPT-5.5 (1M Token Kontext) oder Claude Opus 4.7 (200K)

Nichts anderes behält durchgehend den Überblick.

ab €0,50 pro Aufruf

In Custos sehen Sie diese Optionen mit Preisvergleich nebeneinander, bevor Sie den Chat starten. Wechseln Sie häufig? Stellen Sie Ihre Präferenz pro Projekt ein — Custos merkt sie sich. Einmal wählen, fortan automatisch das richtige Modell für Sie und Ihr Team.

Häufig gestellte Fragen

Was kostet KI pro Mitarbeiter pro Monat?

Für typisches KMU-Nutzung — E-Mails schreiben, Meetings zusammenfassen, Dokumente übersetzen — geben die meisten Teams €5 bis €25 pro Nutzer pro Monat für Anbieter-Gebühren aus, plus €12–€15 für den Custos-Arbeitsbereich. Intensivnutzer (Recht, technisches Schreiben, Code-Review) können €40–€80 erreichen. Das richtige Modell pro Workflow zu wählen reduziert dies typischerweise um 60-80%.

Was ist der Unterschied zwischen BYOK und einem verwalteten KI-Abonnement?

BYOK (Bring Your Own Key) bedeutet, dass Sie den KI-Anbieter — OpenAI, Anthropic, Google, Mistral — direkt bezahlen. Custos fügt keine Marge auf die Nutzung hinzu. Ein verwaltetes Abonnement bündelt KI und Plattform in einer Rechnung, meist mit einem 2x–3x Aufschlag. BYOK ist günstiger und transparenter für Unternehmen mit vorhersehbarem Verbrauch.

Welches KI-Modell ist am günstigsten für europäische KMU?

Für hochvolumige Routineaufgaben (Übersetzungen, Klassifizierungen, kurze E-Mails) sind Mistral Small 3 und Gemini 2.5 Flash am kosteneffizientesten. Für komplexes Schlussfolgern (Vertragsreview, lange Analysen) bietet Mistral Large 2 das beste Preis-Leistungs-Verhältnis. Custos wählt automatisch pro Aufgabe.

Sind diese Preise in Euro oder Dollar?

Anbieter-Listenpreise werden in USD veröffentlicht. Wir rechnen mit einem festen Kurs, der auf der Seite angezeigt wird, in EUR um. Custos' eigene Plattformgebühren werden in EUR berechnet (zzgl. MwSt.). Kunden in den Niederlanden fügen 21% MwSt. hinzu; EU B2B mit gültiger USt-IdNr. zahlt 0% (Umkehrung der Steuerschuld).

Berechnet Custos eine Marge auf KI-Nutzung?

Nein. Custos nutzt das BYOK-Modell — Sie verbinden Ihre eigenen API-Schlüssel und zahlen den Anbieter direkt. Wir berechnen eine feste Plattformgebühr pro Nutzer pro Monat und nehmen nie einen Prozentsatz Ihrer KI-Ausgaben. Ihre KI-Rechnung geht an OpenAI, Anthropic, Google oder Mistral, nicht an uns.

Wie verhindert Custos KI-Rechnungsschocks?

Harte Ausgabendeckel auf Proxy-Ebene. Sie legen ein monatliches Limit pro Nutzer, Team oder Arbeitsbereich fest. Custos prüft das Limit vor jedem API-Call und blockiert Anfragen, sobald Sie das Limit erreichen. Keine nachträgliche Überraschung — das Limit hält.