13

News des 13. März 2024

Gemäß Twitterer AGF, welcher früher oftmals wertvolle Hinweise auf NextGen-Hardware gegeben hat, soll nVidias "Blackwell"-Generation angeblich sogar den größten Generations-Sprung aller Zeiten hinlegen. Die Wortwahl dürfte leicht übertrieben sein, denn die Generations-Sprünge zum Anfang der 3D-Zeit (oder auch mit dem G80-Chip) sind heutzutage kaum noch zu übertreffen. Allerdings liefert der Twitterer auch eine vernünftige Begründung für diesen Ansatz: Zum einen war Blackwell ursprünglich mal gegen eine RDNA4-Ausführung im MCM-Ansatz geplant, musste also seitens der Konkurrenz von einem echten Angriff auf die Leistungsspitze ausgehen. Zu anderen dürfte Blackwell in seinem Verkaufszyklus nicht nur gegen AMDs RDNA4, sondern auch gegen AMDs RDNA5 antreten – gute Gründe also für eine eher dicke Hardware-Ansetzung.

People is confused about Nvidia Blackwell top die gaming GPU memory bus and VRAM capacity. I can't say too much right now but gen-to-gen performance uplift is the biggest ever. Don't forget that Blackwell was designed to compete with a monster 3nm MCM RDN4. More to come soon...
Quelle:  AGF @ Twitter am 13. März 2024
 
Biggest uplift ever?
Quelle:  Kendall Pino @ Twitter am 13. März 2024
 
Another factor to consider is that Blackwell will fight both RDN4 and RNDA5 during it's lifespan. So decisions will be different this round. It's a chess game...
Quelle:  AGF @ Twitter am 13. März 2024

Nebenbei ist dies auch ein Hinweis drauf, dass RDNA5 vergleichsweise zeitig zu erwarten ist und dass nVidia im Gaming-Bereich somit kaum von der bisherigen Regel abweichen wird, grob aller zwei Jahre eine neue Architektur bzw. Chip-Generation herauszubringen. Gemäß diesen Aussagen erscheinen die kolportierten Hardware-Daten zu "Gaming-Blackwell" nochmals magerer – vielleicht nicht beim GB202-Chip, aber in jedem Fall darunter. Allerdings könnten die kleineren Blackwell-Chips auch vergleichsweise spät im Designprozeß in Richtung weniger Hardware und damit kleinerer Chipfläche umdesignt worden sein. Schließlich war nVidia ab einem gewissen Zeitpunkt bekannt, dass AMD seine HighEnd-Ambitionen bei RDNA4 komplett aufgegeben hat und somit zumindest anfänglich an der Leistungsspitze niemand mit Blackwell konkurrieren kann.

Nichtsdestotrotz bleibt hier eine größere Lücke offen: Um auch nur annähernd etwas wie den "größten Generations-Sprung aller Zeiten" selbst nur beim GB202-Chip hinzulegen, muß nVidia auf der bekannten Hardware im verstärkten Maß mit anderen Faktoren anrücken, um dieser Zielsetzung nahezukommen. Dies wäre zum einen eine Steigerung der Taktraten, wobei dies wahrscheinlich ein limitierter Effekt ist, viel mehr als 20% Mehrtakt sind kaum zu erwarten (was dann ja auch nicht 1:1 in Mehrperformance umschlägt). Damit liegt die größte Verantwortung wahrscheinlich im Feld der Architektur-Verbesserungen – ein Punkt, welcher vor der Vorstellung der Hardware selten wirklich gut zu ergründen ist, da es hierbei zu sehr um Detail-Fragen geht (welche selten bei Leaks dabei sind). Man kann somit sicherlich sagen, dass "Blackwell" einen heftigen IPC-Sprung hinlegen muß, um auf Basis der bekannten Hardware-Daten einen großen insgesamten Performance-Sprung zu erzielen.

Daneben kommt seitens AGF auch noch eine Bestätigung, dass der "GB202"-Chip derzeit bereits in der "Qualification"-Phase ist und damit seinen Tape-Out augenscheinlich bereits hingelegt hat. Ein entsprechendes Top-Produkt – möglicherweise eine GeForce RTX 5090 – soll somit plangemäß tatsächlich noch dieses Jahr erscheinen. Gemäß der Regel für Grafikchips, dass man von Tape-Out bis Marktstart üblicherweise 2-3 Quartale benötigt, könnte jene GeForce RTX 5090 bei einem angenommenen Tape-Out im Februar/März somit frühestens im August und spätestens im Dezember erscheinen. Vermutlich wird es (weil es der erste Chip einer neuen Generation ist) allerdings eher ein Jahresend-Termin werden, weitere Blackwell-Grafikchips und -Grafikkarten dürften dann ein Thema des Jahres 2025 sein. Jene Meldung zeigt zudem darauf hin, dass der Tape-Out der kleineren Blackwell-Chips vor dem Sommer starten sollte, die finale Festsetzung von deren Hardware-Daten somit unmittelbar bevorstehen muß.

Is the flagship coming out this year?
Quelle:  Mik @ Twitter am 13. März 2024
 
yes of course. it's under qualification right now. No delay
Quelle:  AGF @ Twitter am 13. März 2024

Die PC Games Hardware berichtet über ein Forschungspapier an "Simultaneous and Heterogeneous Multithreading" (SHMT) welches neben SMT für Prozessoren selbiges auch noch für Grafikkarten und KI-Beschleuniger bieten soll. Zielsetzung ist wie bei SMT die bessere Ausnutzung der einmal vorhandenen Hardware, sprich die Anzapfung noch vorhandener Reserven an Rechenleistung. Im Extrem-Beispiel der Forscher soll dies mit bis zu +95% Performance zu sogar bis zu –51% Stromverbrauch bestmöglich gelungen sein, in der Praxis dürfte der Effekt sicherlich weniger stark ausfallen und nur eher selten mit einem geringeren Stromverbrauch einhergehen. Vor allem aber eignet sich dies wahrscheinlich kaum für gewöhnliche Spiele-Lasten, sondern eher nur für KI-Berechnungen, wo man zwischen verschiedenen Präzisionsstufen wechselt. Hierbei kann die richtige Wahl der Rechenwerke durchaus einige Performance- und eventuell sogar Stromverbrauchs-Vorteile ergeben.

Auf Computerspielen mit ihrem wild wechselnden Code, zeitlich engen Fenstern (Berechnungen müssen schnellstmöglich ausgeführt werden, können nicht zugunsten der Performance umgeschichtet werden) und eigentlich fest vorgegebener Präzisionsstufe ist das ganze kaum zu applizieren bzw. kann ein Wechsel zu den Recheneinheiten anderer Chips wenig bringen – jene Aufgaben sind auf Grafikkarten grundsätzlich am besten aufgehoben. Zur rein internen Beschleunigung nur eines Grafikchips taugt der Ansatz der Forscher jedoch wohl wenig bzw. dürften in der Frage der bestmöglichen Auslastung von Grafikchips deren Entwickler schlicht die besseren Ansprechpartner sein. Der Clou des ganzen liegt offenbar im Umschichten der Code-Ausführung auf das passende Rechenwerk, was aber bei Computerspielen aus Latenz-Gründen generell nicht möglich ist. Auch wenn sich der Ansatz somit auf den ersten Blick interessant anhört, ist hieraus wohl nichts zugunsten von Gaming-Grafikkarten zu erwarten.

Die Marktforscher von Canalys bringen eine eigene Statistik zu den Prozessoren-Marktanteilen im PC-Bereich – welche allerdings etwas anders wertet als die bekannten Marktzahlen von 'Mercury Research'. So betrachten letztere nur x86-Prozessoren, während Canalys Architektur-offen zählt, und somit auch Apple, ARM, Qualcomm und Mediatek in der Statistik auftauchen (die letzten drei allerdings mit minimalen Werten). Dennoch sind die jeweiligen Marktanteils-Zahlen zu PC-Prozessoren des Consumer-Segments nicht gänzlich abweichend: Bei Mercury Research sind es für das vierte Quartal 20,2% vs 79,8% zwischen AMD & Intel, während Canalys den Stückzahlen-Markt mit ~13% AMD, ~78% Intel und ~9% Apple beschreibt (beim Umsatz sind es ~9% AMD, ~76% Intel und ~15% Apple). Daneben lassen sich aus diesen Zahlen auch die Marktverhältnisse zwischen den großen PC-Herstellern sowie deren jeweiliger Anteil bei den Prozessoren-Zulieferern erkennen. Hierbei zeigen sich Dell sowie die kleineren PC-Hersteller als AMD-Verächter, während Acer, Asus, HP & Lenovo entweder normal oder gar überdurchschnittlich viele AMD-Prozessoren verbauen.

AMD Intel insgesamt Volumen
Acer 6% 7% ~6% ~4,0 Mio. Stück
Asus 14% 6% ~6% ~4,1 Mio. Stück
Dell 3% 19% ~15% ~9,7 Mio. Stück
HP 29% 23% ~22% ~13,8 Mio. Stück
Lenovo 40% 25% ~25% ~15,7 Mio. Stück
andere 8% 20% ~17% ~10,7 Mio. Stück
Apple - - ~9% 6 Mio. Stück
Hinweis: der insgesamt-Wert ist inklusive des Apple-Anteils berechnet