Im Gegensatz zu herkömmlichen LLMs benötigen diese SR-Modelle mehr Zeit, um Antworten zu liefern, und diese zusätzliche Zeit steigert oft die Leistung bei Aufgaben in den Bereichen Mathematik, Physik und Naturwissenschaften. Und dieses neueste offene Modell sorgt für Aufsehen, da es scheinbar schnell zu OpenAI aufschließt.
DeepSeek berichtet beispielsweise, dass R1 den o1 von OpenAI bei mehreren Benchmarks und Tests übertraf, darunter AIME (ein Test zum mathematischen Denken), MATH-500 (eine Sammlung von Textaufgaben) und SWE-bench Verified (ein Tool zur Bewertung der Programmierung). Wie wir immer wieder erwähnen, sind KI-Benchmarks mit Vorsicht zu genießen und diese Ergebnisse müssen noch unabhängig verifiziert werden.
TechCrunch berichtet, dass drei chinesische Labore – DeepSeek, Alibaba und Kimi von Moonshot AI – inzwischen Modelle veröffentlicht haben, von denen sie sagen, dass sie den Fähigkeiten von o1 entsprechen, wobei DeepSeek im November erstmals eine Vorschau auf R1 vorstellte.
Das neue DeepSeek-Modell hat jedoch einen Haken, wenn es in der Cloud-gehosteten Version ausgeführt wird: Da R1 chinesischen Ursprungs ist, wird es keine Antworten zu bestimmten Themen wie dem Platz des Himmlischen Friedens oder Taiwans Autonomie generieren, da es „grundlegende sozialistische Werte verkörpern“ muss Chinesische Internetbestimmungen. Diese Filterung erfolgt über eine zusätzliche Moderationsebene, die kein Problem darstellt, wenn das Modell lokal außerhalb Chinas ausgeführt wird.
Trotz der möglichen Zensur schrieb Dean Ball, ein KI-Forscher an der George Mason University, auf Hardware, fernab der Augen eines Top-Down-Kontrollregimes.“
Frankreich