Token-Preisvergleich

Wednesday 13th November 2024 02:50 AM

Übersicht über die Preise der wichtigsten großen Sprachmodelle in Abhängigkeit von der Anzahl der über deren API angeforderten Token. Die Preise können je nach Angebot völlig variieren.

LLMs werden nach „Token“ abgerechnet, einer Maßeinheit für Textsegmente, also Wörter oder Wortfragmente. Im Allgemeinen berechnen große Sprachmodelle (LLM) Eingabe-Tokens (die an das Modell gesendet werden) und Ausgabe-Tokens (die als Antwort generiert werden) separat. Diese Abrechnungsmethode ermöglicht es Benutzern, die Kosten basierend auf dem Datenvolumen abzuschätzen, das von den LLMs verarbeitet wird, die in Form einer API zur Verfügung gestellt werden. Nach der Definition von OpenAI entspricht ein Token im Englischen 0,75 Wörtern. Die folgende Tabelle fasst die geschätzten Preise pro Token für die wichtigsten LLMs auf dem Markt zusammen, unabhängig davon, ob sie ein- oder aussteigen.

Preis der Haupt-LLMs abhängig von der Anzahl der Token
Modell	Anbieter	Preis für 1000 Input-Tokens	Preis für 1000 ausgegebene Token	Gesamtzahl der unterstützten Token
GPT-4o (Omni)	OpenAI	0,05 Dollar	0,15 Dollar	128 000
GPT-4 Turbo	OpenAI	0,1 Dollar	0,3 Dollar	128 000
GPT-4	OpenAI	0,3 Dollar	0,6 Dollar	8 000
Claude 3 Haiku	Anthropisch	0,0025 Dollar	0,0125 Dollar	200 000
Claude 3 Sonett	Anthropisch	0,03 Dollar	0,15 Dollar	200 000
Schließen Sie 3 Arbeiten	Anthropisch	0,15 Dollar	0,75 Dollar	200 000
Rufen Sie 3 70b an	Meta (über AWS)	0,00265 Dollar	0,0035 Dollar	8 000
Rufen Sie 2 70b an	Meta (über AWS)	0,00195 Dollar	0,00256 Dollar	4 000
Gemini 1.0 Pro	Google	0,005 Dollar	0,015 Dollar	32 000
Gemini 1.5 Pro	Google	0,07 Dollar	0,21 Dollar	1.000.000
Befehl	Zusammenhängen	0,1 Dollar	0,2 Dollar	4 000
Befehl R	Zusammenhängen	0,005 Dollar	0,015 Dollar	132 000
Befehl R+	Zusammenhängen	0,03 Dollar	0,15 Dollar	128 000
Mixtral 8x7B	Mistral AI (über Anyscale)	0,005 Dollar	0,005 Dollar	32 000
Mistral Klein	Mistral-KI	0,02 Dollar	0,06 Dollar	32 000
Mistral Groß	Mistral-KI	0,08 Dollar	0,24 Dollar	32 000
GPT-3.5 Turbo	OpenAI	0,12 Dollar	0,16 Dollar	4 000
Palme 2	Google	0,02 Dollar	0,02 Dollar	8 000

Modellanalyse

GPT-4o und GPT-4 Turbo (OpenAI) – Innerhalb der LLM-Reihe von OpenAI ist GPT-4o eine leistungsstarke multimodale Version zu einem wettbewerbsfähigen Preis, während GPT-4 Turbo eine leichte Option zu reduzierten Kosten ist. GPT-4 bleibt die Hauptversion für komplexe Aufgaben, allerdings zu höheren Kosten.
Gemini 1.5 und 1.5 Pro (Google DeepMind) – Die von Google entwickelten Gemini-Vorlagen sind für Text und Bilder optimiert. Die Pro-Version ist leistungsfähiger und bietet eine höhere Token-Kapazität für fortgeschrittene Anwendungsfälle.
Claude 3.5 Sonett, Haiku et Opus (anthropisch) – Anthropic bietet verschiedene Versionen seines LLM für spezifische Bedürfnisse, schnelle Reaktionen (Haiku) oder lange und tiefgehende Interaktionen (Sonnet und Opus). Die Preise variieren je nach den Fähigkeiten jeder Person.
Call 3 70b und Call 2 70b (Ziel) – Diese von Meta entwickelten Modelle werden insbesondere von der Amazon-Cloud angeboten. Sie bieten mehr Flexibilität für kundenspezifische Aufgaben.
Command, Command R und Command R+ (Cohere) – Cohere bietet eine umfassende Palette an Modellen für Forschung und Analyse, die von kostengünstigen Optionen für die grundlegende Datenrecherche bis hin zu LLMs reichen, die auf komplexere Analysen zugeschnitten sind.
Mixtral und Mistral – Mistral-Französischmodelle sind für spezifische Sprachaufgaben (Mixtral) oder schnelle Interaktionen (Mistral Small) optimiert.
GPT-3.5 Turbo – Dies ist eine kostengünstige Option von OpenAI-Modellen, die für einfache Aufgaben mit begrenzter Token-Kapazität geeignet ist und eine gute Alternative für weniger intensive Anforderungen bietet.