Um das Interesse dieses neuen Projekts zu verstehen, erinnern wir uns daran, dass es sich um eine Architektur namens „ Grace Blackwell », mit bis zu 20 CPU-Kernen basierend auf der ARM-Architektur und einer hochmodernen hauseigenen GPU, die mit Tensor-Kernen der fünften Generation ausgestattet ist. Das heißt, das System unterstützt große KI-Modelle, potenziell bis zu 200 Milliarden Parameter auf einer einzigen Einheit. Dies ist ein großer Schritt für diejenigen, die Sprachmodelle vom Typ LLM (Large Language Model) entwickeln oder anpassen möchten, ohne Serverfarmen mieten zu müssen.
Das Ergebnis? Eine Box, die einem Mini-Computer ähnelt und dennoch an eine Standardsteckdose angeschlossen werden kann, ohne dass ein monströses Kühlsystem erforderlich ist. Während seiner offiziellen Präsentationen betonte NVIDIA, dass mit dieser Konfiguration eine Leistung von bis zu 1 Petaflop erreichbar sei. Dies hindert die Plattform jedoch nicht daran, für anspruchsvollere Berechnungen aufzurüsten und somit ein breites Spektrum an Anwendungsfällen anzubieten.
Während NVIDIA bereits den Bereich GPUs und beschleunigtes Computing beherrscht, bringt MediaTek hier sein Know-how im Design von ARM-Chips mit reduziertem Stromverbrauch ein. Wir sprechen hier von 20 ARM-Kernen für den CPU-Teil, die alle über eine Hochgeschwindigkeitsschnittstelle mit dem Grafikchip verbunden sind. Ergebnis: deutlich reduzierte Kommunikationslatenz und kontrollierter Verbrauch auf einem einzigen SoC (System-on-Chip). Dieser einheitliche Ansatz fördert die Speicherkonsistenz und vermeidet die Notwendigkeit einer Vervielfachung von Speichermodulen, da jede Workstation bis zu 128 GB Arbeitsspeicher und mehrere Terabyte NVMe-Speicher transportieren kann.