Question 1

Wie werden LLM-API-Tokens gezählt?

Accepted Answer

Tokens sind Teilwort-Einheiten — ungefähr 4 Zeichen oder 0,75 Wörter auf Englisch. Unser Schätzer gibt eine ±10 %-Annäherung. Exakte Zahlen hängen vom Tokenizer des jeweiligen Modells ab.

Question 2

Warum kosten Output-Tokens mehr als Input-Tokens?

Accepted Answer

Das Generieren von Text erfordert mehr Rechenleistung als das Lesen. Output-Tokens durchlaufen den vollständigen autoregressiven Dekodierungsprozess, der pro Token grundsätzlich teurer ist.

Question 3

Was ist gecachte Eingabepreisgestaltung?

Accepted Answer

Einige Anbieter (OpenAI, Anthropic, DeepSeek) bieten reduzierte Preise, wenn derselbe Kontextpräfix erneut gesendet wird. Das ist nützlich für Anwendungen mit großen System-Prompts, die sich selten ändern.

Question 4

Welche LLM-API ist am günstigsten?

Accepted Answer

Für die meisten Anwendungsfälle 2026 bieten Gemini 2.0 Flash und Mistral Small die niedrigsten Pro-Token-Kosten. DeepSeek V3 ist ebenfalls sehr wettbewerbsfähig. Die günstigste Option hängt von Ihren Qualitätsanforderungen ab.

Question 5

Wie oft ändern sich LLM-API-Preise?

Accepted Answer

Preise sinken regelmäßig — typischerweise alle 3–6 Monate. OpenAI und Anthropic haben beide die Preise mehrfach gesenkt. Wir überprüfen die Preise monatlich, empfehlen aber die Anbieterwebsites zu konsultieren.

LLM-API-Preisrechner & Token-Kalkulator

Wie werden KI-API-Kosten berechnet?

Welches Modell ist am günstigsten?

Häufig gestellte Fragen

Wie werden LLM-API-Tokens gezählt?

Warum kosten Output-Tokens mehr als Input-Tokens?

Was ist gecachte Eingabepreisgestaltung?

Welche LLM-API ist am günstigsten?

Wie oft ändern sich LLM-API-Preise?

Related Tools