Ein wenig bekanntes KI-Labor aus China hat im gesamten Silicon Valley Panik ausgelöst, nachdem es KI-Modelle herausgebracht hat, die die besten in Amerika übertreffen können, obwohl sie billiger und mit weniger leistungsstarken Chips gebaut sind.
DeepSeek, wie das Labor heißt, stellte Ende Dezember ein kostenloses, großsprachiges Open-Source-Modell vor, dessen Bau angeblich nur zwei Monate und weniger als 6 Millionen US-Dollar gedauert hat und das Chips von Nvidia mit reduzierter Leistungsfähigkeit namens H800s verwendet.
Die neuen Entwicklungen haben Besorgnis darüber ausgelöst, ob Amerikas globaler Vorsprung in der künstlichen Intelligenz schrumpft, und stellen die massiven Ausgaben großer Technologieunternehmen für den Aufbau von KI-Modellen und Datenzentren in Frage.
In einer Reihe von Benchmark-Tests Dritter schnitt das Modell von DeepSeek besser ab MetaDie Genauigkeit von Llama 3.1 von OpenAI, GPT-4o von OpenAI und Claude Sonnet 3.5 von Anthropic reicht von der Lösung komplexer Probleme bis hin zu Mathematik und Codierung.
DeepSeek veröffentlichte am Montag r1, ein Argumentationsmodell, das in vielen dieser Tests von Drittanbietern auch das neueste o1 von OpenAI übertraf.
„Das neue DeepSeek-Modell zu sehen, ist sehr beeindruckend, sowohl im Hinblick darauf, wie effektiv sie ein Open-Source-Modell erstellt haben, das diese Inferenzzeitberechnung durchführt, als auch äußerst recheneffizient ist“, sagte Satya Nadella, CEO von Microsoft, auf der World Wirtschaftsforum in Davos, Schweiz, am Mittwoch. „Wir sollten die Entwicklungen aus China sehr, sehr ernst nehmen.“
DeepSeek musste auch die strengen Halbleiterbeschränkungen bewältigen, die die US-Regierung China auferlegt hatte und die dem Land den Zugang zu den leistungsstärksten Chips wie Nvidias H100 verwehrten. Die jüngsten Fortschritte deuten darauf hin, dass DeepSeek entweder einen Weg gefunden hat, die Regeln zu umgehen, oder dass die Exportkontrollen nicht der von Washington beabsichtigte Würgegriff waren.
-„Sie können ein wirklich gutes, großes Modell nehmen und einen Prozess namens Destillation anwenden“, sagte Benchmark General Partner Chetan Puttagunta. „Grundsätzlich verwenden Sie ein sehr großes Modell, um Ihrem kleinen Modell dabei zu helfen, bei den Dingen, bei denen es intelligent werden soll, schlau zu werden. Das ist tatsächlich sehr kosteneffizient.“
Über das Labor und seinen Gründer Liang WenFeng ist wenig bekannt. Medienberichten zufolge ist DeepSeek aus einem chinesischen Hedgefonds namens High-Flyer Quant hervorgegangen, der ein Vermögen von rund 8 Milliarden US-Dollar verwaltet.
Aber DeepSeek ist nicht das einzige chinesische Unternehmen, das auf dem Vormarsch ist.
Der führende KI-Forscher Kai-Fu Lee sagte, sein Startup 01.ai sei mit nur 3 Millionen US-Dollar trainiert worden. Der TikTok-Mutterkonzern ByteDance hat am Mittwoch ein Update seines Modells veröffentlicht, das angeblich den o1 von OpenAI in einem wichtigen Benchmark-Test übertrifft.
„Not macht erfinderisch“, sagte Aravind Srinivas, CEO von Perplexity. „Da sie Workarounds finden mussten, haben sie letztendlich etwas viel Effizienteres gebaut.“
Sehen Sie sich dieses Video an, um mehr zu erfahren.