Abonnieren Sie unseren täglichen und wöchentlichen Newsletter, um die neuesten Updates und exklusiven Inhalte zur branchenführenden KI-Berichterstattung zu erhalten. Erfahren Sie mehr
Mistral hat sein Open-Source-Codierungsmodell Codestral aktualisiert, das sich bei Programmierern als beliebt erweist, und damit den Wettbewerb um codierungsorientierte Modelle für Entwickler ausgeweitet.
In einem Blog-Beitrag sagte das Unternehmen, dass es das Modell mit einer effizienteren Architektur aufgerüstet habe, um Codestral 25.01 zu erstellen, ein Modell, das Mistral verspricht, „der klare Marktführer für Codierung in seiner Gewichtsklasse“ zu sein und doppelt so schnell wie die Vorgängerversion.
Wie der ursprüngliche Codestral ist Codestral 25.01 für Aktionen mit geringer Latenz und hoher Frequenz optimiert und unterstützt Codekorrektur, Testgenerierung und Fill-in-the-Middle-Aufgaben. Das Unternehmen sagte, es könne für Unternehmen mit mehr Daten- und Modellresidenz-Anwendungsfällen hilfreich sein.
Benchmark-Tests zeigten, dass Codestral 25.01 bei Tests zur Codierung in Python eine bessere Leistung erbrachte und im HumanEval-Test 86,6 % erreichte. Es übertrifft die Vorgängerversionen von Codestral, Codellama 70B Instruct und DeepSeek Coder 33B Instruct.
Diese Version von Codestral steht Entwicklern zur Verfügung, die zu den IDE-Plugin-Partnern von Mistral gehören. Benutzer können Codestral 25.01 lokal über den Code-Assistenten Weiter bereitstellen. Sie können auch über Mistrals la Plateforme und Google Vertex AI auf die API des Modells zugreifen. Das Modell ist in der Vorschau auf Azure AI Foundry verfügbar und wird bald auf Amazon Bedrock verfügbar sein.
Immer mehr Codierungsmodelle
Mistral veröffentlichte Codestral im Mai letzten Jahres als sein erstes Code-fokussiertes Modell. Das 22B-Parametermodell konnte in 80 verschiedenen Sprachen programmieren und übertraf andere codezentrierte Modelle. Seitdem hat Mistral Codestral-Mamba veröffentlicht, ein Codegenerierungsmodell, das auf der Mamba-Architektur aufbaut und längere Codezeichenfolgen generieren und mehr Eingaben verarbeiten kann.
Und es scheint, dass es bereits großes Interesse an Codestral 25.01 gibt. Nur wenige Stunden nach der Ankündigung von Mistral stürmt das Modell bereits in der Copilot Arena die Bestenlisten nach oben.
Das Schreiben von Code war eine der frühesten Funktionen von Basismodellen, selbst für allgemeinere Modelle wie o3 von OpenAI und Claude von Anthropic. Allerdings haben sich die codierungsspezifischen Modelle im vergangenen Jahr verbessert und übertreffen oft größere Modelle.
Allein im vergangenen Jahr wurden Entwicklern mehrere codierungsspezifische Modelle zur Verfügung gestellt. Alibaba hat im November den Qwen2.5-Coder veröffentlicht. Chinas DeepSeek Coder war im Juni das erste Modell, das GPT-4 Turbo besiegte. Microsoft stellte außerdem GRIN-MoE vor, ein auf einer Expertenmischung (MOE) basierendes Modell, das mathematische Probleme programmieren und lösen kann.
Niemand hat die ewige Debatte über die Wahl eines Allzweckmodells gelöst, das alles lernt, oder eines fokussierten Modells, das nur programmieren kann. Einige Entwickler bevorzugen die Bandbreite an Optionen, die sie in einem Modell wie Claude finden, aber die Verbreitung von Codierungsmodellen zeigt einen Bedarf an Spezifität. Da Codestral auf das Codieren von Daten spezialisiert ist, ist es natürlich besser bei Codierungsaufgaben als beim Schreiben von E-Mails.
Tägliche Einblicke in geschäftliche Anwendungsfälle mit VB Daily
Wenn Sie Ihren Chef beeindrucken möchten, ist VB Daily genau das Richtige für Sie. Wir geben Ihnen Insider-Informationen darüber, was Unternehmen mit generativer KI machen, von regulatorischen Änderungen bis hin zu praktischen Einsätzen, damit Sie Erkenntnisse für einen maximalen ROI teilen können.
Lesen Sie unsere Datenschutzrichtlinie
Vielen Dank für Ihr Abonnement. Weitere VB-Newsletter finden Sie hier.
Es ist ein Fehler aufgetreten.