Nvidia sorgte mit der offiziellen Ankündigung seiner kommenden Blackwell-GPUs der GeForce RTX 50-Serie während der CES 2025-Keynote für großes Aufsehen. Und während die Halo RTX 5090 sicherlich wie ein absolutes Monster aussieht, ist es für viele Leute die Mainstream-RTX 5070 für 549 US-Dollar, die der Star der Show sein wird. Die RTX 4070 war seit ihrer Einführung eine der besten Grafikkarten, und nun steht ihr Ersatz auf dem Weg.
Nvidia behauptet, dass der 5070 eine Leistung auf dem Niveau von „RTX 4090“ bieten wird, bei etwa einem Drittel des Preises und etwas mehr als der Hälfte der Leistung. Aber wie schneiden sie wirklich ab und wie schneidet die 5070 im Vergleich zur bestehenden RTX 4070 ab? Finden wir es heraus, und wir haben vorerst ein paar Kleinigkeiten mit Schätzungen ergänzt, aber die meisten Spezifikationen sind korrekt.
Grafikkarte | RTX 5070 | RTX 4090 | RTX 4070 |
---|---|---|---|
Architektur | GB205 | AD102 | 104 n. Chr |
Prozessknoten | TSMC 4NP | TSMC 4N | TSMC 4N |
Transistoren (Milliarden) | ? | 76,3 | 32 |
Matrizengröße (mm^2) | ? | 608.4 | 294,5 |
SMS | 48 | 128 | 46 |
GPU-Shader | 6144 | 16384 | 5888 |
Tensorkerne | 192 | 512 | 184 |
RT-Kerne | 48 | 128 | 46 |
Boost-Takt (MHz) | 2512 | 2520 | 2475 |
VRAM-Geschwindigkeit (Gbit/s) | 30? | 21 | 21 |
VRAM (GB) | 12 | 24 | 12 |
VRAM-Busbreite | 192 | 384 | 192 |
L2-Cache | 48? | 72 | 36 |
Ausgabeeinheiten rendern | 64? | 176 | 64 |
Texture-Mapping-Einheiten | 192 | 512 | 184 |
TFLOPS FP32 (Boost) | 30.9 | 82,6 | 29.1 |
TFLOPS FP16 (INT8 TOPS) | 494 (988) | 661 (1321) | 233 (466) |
Bandbreite (GB/s) | 720? | 1008 | 504 |
TBP (Watt) | 250 | 450 | 200 |
Startdatum | Februar 2025? | Okt. 2022 | April 2023 |
Einführungspreis | 549 $ | 1.599 $ | 599 $ |
Lassen Sie uns zunächst ganz klar sagen: Die Vorstellung, dass die RTX 5070 bei allen Arbeitsbelastungen mit der RTX 4090 mithalten kann, sieht wie eine sehr rosarote Brille aus. Es ist offensichtlich, dass Nvidia mit Blackwell großen Wert auf KI legt und auf DLSS 4 und andere neuronale Rendering-Techniken setzt, um den Unterschied auszugleichen. Bei vielen existierenden Spielen sind jedoch die reinen Spezifikationen immer noch von Bedeutung – es sei denn, es gibt eine treiberseitige Lösung, die eine höhere Leistung ermöglicht, ohne dass Patches und Updates erforderlich sind.
Die RTX 5070 verfügt über 48 SMs im Vergleich zu den 46 SMs der 4070. Das ist überhaupt keine große Veränderung und weit entfernt von den 128 SMs der 4090. Die Gesamtberechnung der FP32-Grafik beläuft sich auf 31 TFLOPS 5070, 29 TFLOPS beim 4070 und 83 TFLOPS beim 4090. Es ist äußerst schwer zu glauben, dass die Leistung des 5070 im Allgemeinen auch nur annähernd an die des 4090 herankommt, ohne DLSS 4 und verwandte Technologien zu nutzen.
Auch der VRAM ist zu berücksichtigen. Die 4090 hat 24 GB, verglichen mit der Hälfte dieser Menge bei der 4070 und 5070. Es gibt nicht viele Spiele, bei denen 12 GB nicht ausreichen, aber Indiana Jones and the Great Circle überschreitet mit voller RT und ohne Hochskalierung definitiv 12 GB bei 4K. Es werden wahrscheinlich weitere Spiele kommen, die bei höheren Auflösungen und Einstellungen mehr als 12 GB VRAM-Nutzung ermöglichen könnten.
Doch hier könnte „RTX Neural Material“ ins Spiel kommen. Das scheint die Ermöglichung der neuronalen Texturkomprimierung zu sein, die Nvidia bereits 2023 diskutierte und die vollständig in einem Spiel implementiert wurde. Wird es mit funktionieren? beliebig Spiel? Wahrscheinlich nicht, aber wir würden uns über eine fahrerseitige Lösung freuen, die eine solche Funktion Wirklichkeit werden lässt. Ohne NTC- oder RTX-Neuralmaterialien werden die 12 GB definitiv verhindern, dass der 5070 mit einem 4090 mithalten kann.
Auch die Bandbreite ist zu berücksichtigen. Die RTX 4090 verfügt über 21 Gbit/s GDDR6X auf einer 384-Bit-Schnittstelle, verglichen mit 28–32 Gbit/s GDDR7 der 5070 auf einer 192-Bit-Schnittstelle. Wir wissen, dass der 4090 eine Bandbreite von 1008 GB/s hat. Der 5070 sollte am Ende eine Bandbreite zwischen 672 GB/s und 768 GB/s haben. Auch hier gilt: Ohne NTC oder neuronale Materialien wird es bei höheren Auflösungen nicht mithalten können.
Auch KI-Workloads wie LLMs freuen sich über viel VRAM-Kapazität. Mit der Quantisierung kommt man nur bedingt weit, und die neuronale Komprimierung von LLMs spielt keine Rolle (soweit uns bekannt ist). Die RTX 4090 mit 24 GB VRAM kann einfach größere LLMs laden als die 5070, die nur hinsichtlich der KI-Modellgrößen mit der 4070 mithalten wird.
Anders verhält es sich, wenn wir die Rechenleistung der KI betrachten. Wir wissen, dass die RTX 50-Serie das FP4-Zahlenformat unterstützen wird, aber genauso wichtig ist, dass sie anscheinend über die doppelte Rechenleistung pro Tensorkern verfügt wie die RTX 40-Serie. Das ist zwar nicht genug Rechenleistung, um den 5070 zu übertreffen, aber die theoretische Leistung ist „nur“ etwa 25 % langsamer. Und wenn etwas FP4 auf dem 5070 nutzen kann, während der 4090 FP8 verwenden muss, dann läuft es möglicherweise besser auf dem 5070. Aber selbst die INT8 TOPS bevorzugen den 4090.
Der eigentliche Clou ist natürlich der Preis. Es gibt viele Gamer, die sich eine Grafikkarte für 1.599 US-Dollar einfach nicht leisten können – ganz zu schweigen von den durch Knappheit verursachten Preisen von über 2.000 US-Dollar, die wir derzeit für die 4090 sehen. Eine GPU für 549 US-Dollar ist, auch wenn sie in den meisten Spielen langsamer ist, eine ganz andere Sache . Die GPUs der xx70-Klasse von Nvidia waren traditionell der Lieblingsplatz für Mainstream-Gamer, und der 5070 scheint dieses Muster fortzusetzen. Auch wenn sie die 4090 nicht übertrifft, sollte sie am Ende äußerst erfolgreich sein, wenn sie konstant eine Leistung nahe dem Niveau der RTX 4080 liefern kann.
DLSS 4 | Neue Multi-Frame-Generation und alles verbessert – YouTube
Schauen Sie weiter
Aber eigentlich kommt es auf die KI-Funktionen und DLSS 4 an. Wir haben die Multi-Frame-Generierung noch nicht ausprobiert und sind nach unseren Erfahrungen mit der DLSS 3-Frame-Generierung bestenfalls skeptisch. Es hört sich so an, als würden bis zu drei Frames zwischen zwei gerenderten Frames generiert, was den Anschein erweckt, als würde es nur die Latenz erhöhen. Aber DLSS 4 scheint diese Frames auch schneller zu generieren, was bedeutet, dass das Nettoergebnis keine schlechtere Latenz als die Framegenerierung von DLSS 3 wäre, nur mit zusätzlichen Frames.
Weitaus vielversprechender als die Multi-Frame-Generierung sind unserer Ansicht nach die Verbesserungen und Upgrades der DLSS-Hochskalierung und der Strahlenrekonstruktion. Bisher verwendete DLSS ein CNN (Convolutional Neural Network) für das KI-Training und die Inferenz. Jetzt gibt es ein neues transformatorbasiertes Modell, das offenbar auf allen bestehenden DLSS 2/3-Spielen verwendet werden kann.
Transformer-Modelle haben viele Bereiche der KI-Entwicklung revolutioniert, und die Beispielsequenzen im obigen Video, die CNN vs. Transformer DLSS zeigen, sehen äußerst vielversprechend aus. Nvidia behauptet schon seit einiger Zeit, dass das Rendering von DLSS „besser als nativ“ sei, aber das DLSS-Transformer-Modell könnte diese Behauptungen endlich erfüllen. Wenn ja, könnte das das Killer-Feature sein, das die 50er-Serie den Eintrittspreis wert macht. Allerdings funktioniert das Transformer-Modell auch auf vorhandenen GPUs, also vielleicht nicht.
Wie wir in der Vergangenheit festgestellt haben, versprachen die RTX-GPUs zwar Raytracing als neue Technologie, doch im Laufe der Zeit waren es tatsächlich die KI-Funktionen, die als wichtigster Aspekt der RTX-Serie in den Vordergrund gerückt sind. Mit der RTX 50-Serie setzt Nvidia erneut auf KI und die unterstützende DLSS-Software übertrifft den RT-Aspekt weiterhin. Unabhängig davon, ob sich die Multi-Frame-Generierung als Killer-Feature erweist oder nicht: Wenn Sie nicht bereits über eine GPU der 40er-Serie verfügen, könnte die 50er-Serie einschließlich der RTX 5070 Sie zu einem Upgrade verleiten.