Übersicht über die Preise der wichtigsten großen Sprachmodelle in Abhängigkeit von der Anzahl der über deren API angeforderten Token. Die Preise können je nach Angebot völlig variieren.
LLMs werden nach „Token“ abgerechnet, einer Maßeinheit für Textsegmente, also Wörter oder Wortfragmente. Im Allgemeinen berechnen große Sprachmodelle (LLM) Eingabe-Tokens (die an das Modell gesendet werden) und Ausgabe-Tokens (die als Antwort generiert werden) separat. Diese Abrechnungsmethode ermöglicht es Benutzern, die Kosten basierend auf dem Datenvolumen abzuschätzen, das von den LLMs verarbeitet wird, die in Form einer API zur Verfügung gestellt werden. Nach der Definition von OpenAI entspricht ein Token im Englischen 0,75 Wörtern. Die folgende Tabelle fasst die geschätzten Preise pro Token für die wichtigsten LLMs auf dem Markt zusammen, unabhängig davon, ob sie ein- oder aussteigen.
Modell | Anbieter | Preis für 1000 Input-Tokens | Preis für 1000 ausgegebene Token | Gesamtzahl der unterstützten Token |
---|---|---|---|---|
GPT-4o (Omni) | OpenAI | 0,05 Dollar | 0,15 Dollar | 128 000 |
GPT-4 Turbo | OpenAI | 0,1 Dollar | 0,3 Dollar | 128 000 |
GPT-4 | OpenAI | 0,3 Dollar | 0,6 Dollar | 8 000 |
Claude 3 Haiku | Anthropisch | 0,0025 Dollar | 0,0125 Dollar | 200 000 |
Claude 3 Sonett | Anthropisch | 0,03 Dollar | 0,15 Dollar | 200 000 |
Schließen Sie 3 Arbeiten | Anthropisch | 0,15 Dollar | 0,75 Dollar | 200 000 |
Rufen Sie 3 70b an | Meta (über AWS) | 0,00265 Dollar | 0,0035 Dollar | 8 000 |
Rufen Sie 2 70b an | Meta (über AWS) | 0,00195 Dollar | 0,00256 Dollar | 4 000 |
Gemini 1.0 Pro | 0,005 Dollar | 0,015 Dollar | 32 000 | |
Gemini 1.5 Pro | 0,07 Dollar | 0,21 Dollar | 1.000.000 | |
Befehl | Zusammenhängen | 0,1 Dollar | 0,2 Dollar | 4 000 |
Befehl R | Zusammenhängen | 0,005 Dollar | 0,015 Dollar | 132 000 |
Befehl R+ | Zusammenhängen | 0,03 Dollar | 0,15 Dollar | 128 000 |
Mixtral 8x7B | Mistral AI (über Anyscale) | 0,005 Dollar | 0,005 Dollar | 32 000 |
Mistral Klein | Mistral-KI | 0,02 Dollar | 0,06 Dollar | 32 000 |
Mistral Groß | Mistral-KI | 0,08 Dollar | 0,24 Dollar | 32 000 |
GPT-3.5 Turbo | OpenAI | 0,12 Dollar | 0,16 Dollar | 4 000 |
Palme 2 | 0,02 Dollar | 0,02 Dollar | 8 000 |
Modellanalyse
- GPT-4o und GPT-4 Turbo (OpenAI) – Innerhalb der LLM-Reihe von OpenAI ist GPT-4o eine leistungsstarke multimodale Version zu einem wettbewerbsfähigen Preis, während GPT-4 Turbo eine leichte Option zu reduzierten Kosten ist. GPT-4 bleibt die Hauptversion für komplexe Aufgaben, allerdings zu höheren Kosten.
- Gemini 1.5 und 1.5 Pro (Google DeepMind) – Die von Google entwickelten Gemini-Vorlagen sind für Text und Bilder optimiert. Die Pro-Version ist leistungsfähiger und bietet eine höhere Token-Kapazität für fortgeschrittene Anwendungsfälle.
- Claude 3.5 Sonett, Haiku et Opus (anthropisch) – Anthropic bietet verschiedene Versionen seines LLM für spezifische Bedürfnisse, schnelle Reaktionen (Haiku) oder lange und tiefgehende Interaktionen (Sonnet und Opus). Die Preise variieren je nach den Fähigkeiten jeder Person.
- Call 3 70b und Call 2 70b (Ziel) – Diese von Meta entwickelten Modelle werden insbesondere von der Amazon-Cloud angeboten. Sie bieten mehr Flexibilität für kundenspezifische Aufgaben.
- Command, Command R und Command R+ (Cohere) – Cohere bietet eine umfassende Palette an Modellen für Forschung und Analyse, die von kostengünstigen Optionen für die grundlegende Datenrecherche bis hin zu LLMs reichen, die auf komplexere Analysen zugeschnitten sind.
- Mixtral und Mistral – Mistral-Französischmodelle sind für spezifische Sprachaufgaben (Mixtral) oder schnelle Interaktionen (Mistral Small) optimiert.
- GPT-3.5 Turbo – Dies ist eine kostengünstige Option von OpenAI-Modellen, die für einfache Aufgaben mit begrenzter Token-Kapazität geeignet ist und eine gute Alternative für weniger intensive Anforderungen bietet.
Related News :