Kopite7kimi [1] hat kürzlich die interessante Bemerkung getätigt, wonach nVidias GB203-Chip – der zweitbeste Chip des Portfolios von "Gaming-Blackwell" – eventuell nur 6 Raster-Engines (GPC) trägt. Die Bemerkung ist wohl noch kein Leak, dürfte aber auch nicht gänzlich grundlos gefallen sein. Dabei ist dies kein großer Unterschied zum aktuellen AD103-Chip (7 GPC), zudem tariert gerade nVidia das Verhältnis zwischen Raster-Engines und Shader-Cluster (SM) in jeder Grafikchip-Generation immer wieder neu aus. Aber es deutet eventuell auf die Anzahl der Shader-Cluster jenes GB203-Chips hin: Jener könnte (im Ada-Lovelace-Schema) mit 12 SM per GPC auf 72 Shader-Cluster kommen, was angesichts des AD103-Chips mit 80 Shader-Clustern jedoch unwahrscheinlich ist. Passendere Auflösungen wären vielmehr 16 SM per GPC = 96 Shader-Cluster oder 20 SM per GPC = 120 Shader-Cluster. Die mittlere Auflösung würde dabei dem technischen Ansatz des GB202-Chips [2] entsprechen (16 SM per GPC).
I am just thinking that GB203 may only have 6 GPCs.
Quelle: Kopite7kimi @ Twitter [1] am 6. März 2024
Setzt man die drei denkbaren Modelle auf alle Grafikchips des Blackwell-Portfolios an, ergibt sich, dass 12 SM per GPC generell nicht passen dürfte, da teilweise kleine Grafikchips ergebend als bereits mit der Ada-Lovelace-Generation [3] vorhanden. 16 SM per GPC hat demnach die größten Chancen, 20 SM per GPC gewisse Außenseiter-Chancen. Denkbar ist auch ein Mix beider letztgenannten Modelle, auch bei "Ada Lovelace" ist der Ansatz von 12 SM per GPC schließlich nicht durchgehend (mit der Ausnahme des AD107-Chips). Die mittlere Variante könnte zudem eine Erklärung dafür liefern, wieso der GB205-Chip als "GB205" und nicht als "GB204" läuft: Bei 16 SM per GPC ist jeder der Blackwell-Chips beachtbar größer als der jeweilige Ada-Lovelace-Vorgänger, allein beim GB205 wäre dies mit 64 Shader-Clustern nur ein kleiner (nomineller) Fortschritt gegenüber den 60 Shader-Clustern des AD104-Chips.
GPC | 12 SM per GPC | 16 SM per GPC | 20 SM per GPC | Ada-Vorgänger | |
---|---|---|---|---|---|
GB202 | angbl. 12 | - | angbl. 192 SM | - | AD102: 12 GPC, 144 SM |
GB203 | angbl. 6 | 72 SM | 96 SM | 120 SM | AD103: 7 GPC, 80 SM |
GB205 | möglw. 4 | 48 SM | 64 SM | 80 SM | AD104: 5 GPC, 60 SM |
GB206 | möglw. 3 | 36 SM | 48 SM | 60 SM | AD106: 3 GPC, 36 SM |
GB207 | möglw. 2 | 24 SM | 32 SM | 40 SM | AD107: 3 GPC, 24 SM |
Hinweis: spekulative Annahmen, kein Leak |
Die mittlere Variante würde natürlich dennoch nur einen mittleren Hardware-Sprung ergeben, mit zudem einem auffallenden Ungleichgewicht an der Leistungsspitze: Der GB202-Chip wäre somit glatt doppelt so mächtig wie der GB203-Chip. Unter regulären Umständen wäre dies arg unwahrscheinlich, aber da nVidia mit der GeForce RTX 50 Serie mangels Konkurrenz an der Leistungsspitze nicht weiter springen muß, könnte dies durchaus so passieren. Es würde zudem die Tendenz nVidias unterstützen, den größten Grafikchip speziell im Gaming-Segment eher nur verhalten einzusetzen, lieber mehr mit den kleineren Chips darunter zu arbeiten (weil der größte Chip auch zu viel höheren Preisen im Profi-Segment absetzbar ist). Natürlich ist dieses herauskommende Bild der kleineren Blackwell-Chips nur ein potentielles Bild, Gewißheiten lassen sich aus diesen Überlegungen nicht ableiten.
Raster-Engines | Shader-Cluster | Speicherinterface | Ada-Vorgänger | |
---|---|---|---|---|
GB202 | angbl. 12 | angbl. 192 | angbl. 384 Bit | AD102: 12 GPC, 144 SM, 384 Bit |
GB203 | angbl. 6 | 96 oder 120 | whrschl. 256 Bit | AD103: 7 GPC, 80 SM, 256 Bit |
GB205 | möglw. 4 | 64 oder 80 | whrschl. 192 Bit | AD104: 5 GPC, 60 SM, 192 Bit |
GB206 | möglw. 3 | 48 oder 60 | 128 oder 192 Bit | AD106: 3 GPC, 36 SM, 128 Bit |
GB207 | möglw. 2 | 32 oder 40 | 96 oder 128 Bit | AD107: 3 GPC, 24 SM, 128 Bit |
Hinweis: spekulative Annahmen, kein Leak |
Dabei darf man davon ausgehen, dass nVidia intern die finale Design-Zielsetzung (Festlegung der zum Tape-Out zu bringenden Hardware-Konfiguration) zum GB202-Chip längst beschlossen hat, immerhin naht der anzunehmende Tape-Out in diesem Frühling. Bei den kleineren Grafikchips von "Gaming-Blackwell" hat nVidia etwas mehr Zeit, je nachdem von deren Release-Plan: Kommt ein Teil der kleineren Blackwell-Chips noch nahe des Jahreswechsels 2024/25 heraus, sollte deren Tape-Out grob zur Jahresmitte 2024 stattfinden müssen. Findet der Release von GB2023 & Co. hingegen erst später im Jahr 2025 statt, kann sich nVidia mehr Zeit lassen. In jedem Fall ist die Design-Zielsetzung von GB203 bis GB207 somit wohl noch nicht final. Jener Schritt ist allerdings demnächst zu erwarten und dürfte auch in einem Rutsch passieren, unabhängig des Tape-Out der kleinsten Chips: Denn natürlich muß das Chip-Portfolio insgesamt stimmig sein, womit sich nach der Festlegung der Hardware-Daten zu den größeren Chips die Hardware-Daten zu den kleineren Chips oftmals fast von selbst ergeben.
Verweise:
[1] https://twitter.com/kopite7kimi/status/1765269875608768604
[2] http://www.3dcenter.org/news/geruechtekueche-nvidia-blackwell-gb202-chip-mit-192-shader-cluster-einem-512-bit-speicherinterf
[3] http://www.3dcenter.org/news/nvidia-ada-lovelace