Mistral AI wirft eine Bombe namens Pixtral-Large ab, die Gemini 1.5 Pro und GPT-4o schlagen kann

Tuesday 19th November 2024 09:10 AM

Mistral AI beschleunigt das Tempo. Das bedeutendste französische Start-up im Bereich KI will sich beweisen. Und um dies zu erreichen, scheut das Unternehmen nicht davor zurück, bei der Weiterentwicklung seiner Modelle große Anstrengungen zu unternehmen. Der Beweis dafür ist das neueste Modell, das gerade veröffentlicht wurde: Pixtral Large. Im Detail handelt es sich um ein offen gewichtetes multimodales Modell mit 124 Milliarden Parametern (genau das), das auf der Grundlage von Mistral Large 2 erstellt wurde.

Als zweites Modell der Familie der multimodalen Modelle demonstriert es ein Verständnis für Bilder von „Grenzebene„, behauptet das Start-up und betont seine Fähigkeit, Dokumente, Grafiken und natürliche Bilder zu verstehen und gleichzeitig das hochmoderne Textverständnis von Mistral Large 2 beizubehalten. Es verfügt außerdem über ein Kontextfenster von 128.000 Token und kann mindestens 30 hochentwickelte Textdateien enthalten. Auflösungsbilder.

Mistral konkurriert mit Anthropic, Google und OpenAI

In Sachen Leistung bricht Pixtral Large Rekorde. Bei der Bewertung anhand von Grenzmodellen anhand einer Reihe standardmäßiger multimodaler Benchmarks erweist es sich als besser als die Modelle, die von Mistrals direkten Konkurrenten veröffentlicht wurden. So erreicht das Modell auf MathVista, das komplexe mathematische Überlegungen anhand visueller Daten bewertet, eine Punktzahl von 69,4 % und übertrifft damit alle anderen Modelle. Im Vergleich dazu erreicht Llama-3.2 90B 49,1 %, Gemini-1.5 Pro 67,8 %, GPT-4o 65,4 % und Claude-3.5 Sonnet 67,1 %.

Um die Denkfähigkeit bei komplexen Grafiken und Dokumenten zu beurteilen, verließen sich die Mistral-Teams auf die Tests ChartQA und DocVQA, bei denen Pixtral Large auch GPT-4o und Gemini-1.5 Pro übertrifft.

Schließlich demonstriert Pixtral Large seine Wettbewerbsfähigkeit im Open-Source-MM-MT-Bench-Test, der reale Anwendungsfälle multimodaler LLMs widerspiegeln soll. Es übertrifft Claude-3.5 Sonnet, Gemini-1.5 Pro und GPT-4o (neueste Version). Das Modell sei unter der Mistral Research License (MRL) für Forschungs- und Bildungszwecke erhältlich, sagt das Start-up und fügt hinzu, dass es auch unter der Mistral Commercial License für Experimente, Tests und Produktion zu kommerziellen Zwecken erhältlich sei.

Mistral Large aktualisiert

Zusätzlich zu Pixtral Large profitiert auch Mistral Large, sein im vergangenen Februar veröffentlichtes mehrsprachiges Modell, von einem Update. Es ist dem High-Level-Argumentation für komplexe Aufgaben gewidmet und ist jetzt auf pixtral-large-latest, der API des Start-ups, und unter dem Namen Mistral Large 24.11 auf Hugging Face unter der Mistral Research-Lizenz für Forschungszwecke oder mit einer kommerziellen Lizenz verfügbar von Mistral AI für die kommerzielle Nutzung.

Im Vergleich zu Large 24.07 profitiert diese Version von Verbesserungen beim Verständnis des langen Kontexts, der Hinzufügung einer Systemeingabeaufforderung und einem präziseren Funktionsaufruf. „Das Modell funktioniert sehr gut für RAG- und Agenten-Workflows und ist daher eine geeignete Wahl für Unternehmensanwendungsfälle wie Wissenserkundung und -freigabe, semantisches Dokumentverständnis, Automatisierungsaufgaben und Verbesserung des Kundenerlebnisses“, kommentiert das Start-up. Das Modell soll ab sofort schnell auf Anbieterplattformen verfügbar seincer von Google Cloud und Microsoft Azure innerhalb einer Woche.

Die Schnittstelle „Le Chat“, die mit ChatGPT konkurrieren kann

Mistral macht gerne bemerkenswerte Auftritte. Und die neueste Version seiner Konversationsoberfläche „Le Chat“ ist ein gutes Beispiel dafür. In ihrem neuesten Update profitiert die Schnittstelle von zahlreichen Ergänzungen, die OpenAI und sein berühmtes ChatGPT oder sogar Google mit Gemini im Vergleich verblassen lassen. Zu den neuesten Funktionen gehören: Websuche mit Zitaten, Leinwand für Ideenfindung, Online-Bearbeitung und -Export, Integration der neuesten Pixtral Large-Vorlage zum besseren Verständnis von Dokumenten und Bildern, Generierung von Bildern, unterstützt von Black Forest Labs Flux Pro.

Das Canvas-Tool ähnelt stark der gleichnamigen Schnittstelle, die OpenAI Anfang des Monats eingeführt hat. Einfach ausgedrückt wird die Benutzeroberfläche im Chat-Fenster angezeigt, wenn der Benutzer über Gespräche hinausgehen und mit der Erstellung beginnen muss. Es ist möglich, die verschiedenen Vorlagen von Mistral für freigegebene Ergebnisse zu verwenden und erstellte Inhalte direkt online zu bearbeiten, ohne Antworten neu zu generieren, Entwurfsversionen zu erstellen und Designs in der Vorschau anzuzeigen.

Mistral ist fest entschlossen, hervorzustechen und versichert, nicht weitermachen zu wollen „AGI um jeden Preis; unsere Mission ist es, modernste KI in Ihre Hände zu legen.“ Auf „Le Chat“ bietet das französische Flaggschiff daher ein kostenloses Level mit diesen Beta-Features an und arbeitet an der Entwicklung von Premium-Versionen mit höheren Servicegarantien.

Ausgewählt für dich