NVIDIA GeForce GTX 480 (GF100 / Fermi) im Performance Test (2/15)

GeForce GTX 470/480 Technisches

Über die Fermi Architektur, dem die GeForce GTX 480 und auch 470 mit ihrem GF100 zugrunde liegt, wurde ja bereits viel gesprochen und geschrieben. Wir möchten hier also nur noch einmal grob auf die Grundlagen eingehen, um die technischen Daten der GPU zu verdeutlichen. Wer tiefer ins Detail gehen will findet sogar bei NVIDIA selbst viele Informationen aus erster Hand und kann dort sogar die kompletten umfangreichen GF100 Whitepaper herunterladen. Zu finden sind diese unter http://www.nvidia.com/object/gf100.html.

Der Aufbau der GF100 verdeutlicht auf den ersten Blicke die Parallelisierung, die bei den GPUs immer weiter vorangetrieben wird. Auf den ersten Blick erinnert die GF100 GPU an einen "Quad Core Prozessor", denn sie besteht aus vier GPCs (Graphics Processing Clusters), denen zur Seite insgesamt sechs Memory Controller stehen und dazu noch ein L2 Cache.

Damit ist aber lange nicht Schluss, denn jeder dieser GPC wiederum besteht aus weiteren Einheiten, den sogenannten SM (Streaming Multiprozessoren) und je einer Raster Engine. In jedem SM wiederum verbergen sich eine PolyMorph Engine, erneut diverse Cache Elemente und die sogenannten CUDA Cores (Bei ATI Stream Prozessoren genannt), insgesamt sind es 32 Stück pro SM.

Im Raster- und PolyMoph-Engine finden wir wiederrum weitere Einheiten. So verbirgt sich in jedem PolyMoph-Engine l bei der GF100 zum Beispiel ein Tessellator. Hier liegt ein wesentlicher Unterschied zur aktuellen AMD Architektur, bei der der Tesselator "außerhalb" des Bereichs der Streaming Prozessoren liegt.

Insgesamt hat eine GF100 GPU also 4x4x32 = 512 CUDA Cores und 16 Tessellator-Einheiten. Auf der GeForce 480 sind allerdings nicht alle aktiv. Ein Streaming Multiprozessor ist hier deaktiviert, so dass man nur auf 480 CUDA Cores kommt. Bei der GeForce GTX 470 ist noch ein weiterer SM deaktiviert, was zu 448 CUDA Cores führt.

Die gesamte Architektur ist wie man sieht sehr flexibel, da sich beliebig SM oder auch ganze GPCs abschalten lassen. Wir werden also auf Basis dieser Architektur - so wie es AMD auch gemacht hat - weiter NVIDIA GPUs sehen.

	NVIDIA GeForce GTX 285	NVIDIA GeForce GTX 470	NVIDIA GeForce GTX 480	ATI Radeon HD5870

Chip (Codename)	GT200b	GF100	GF100	RV790
Fertigungsprozess	55nm	40nm	40nm	40nm
GPU-Takt (Vertex/Core)	648 MHz	607 MHz	700 MHz	850 MHz
Shader-Takt	1.476 MHz	1.215 MHz	1.404 MHz	850 MHz
Transistoren	1,4 Mrd	3 Mrd	3 Mrd	2.15 Mrd
Stream Prozessoren/ Cuda Cores	240	448	480	320 (5D)
Speichertakt	1.242 MHz	837 MHz	924 MHz	1.200 MHz
Speicherart	GDDR-III	GDDR-5	GDDR-5	GDDR-5
Speicherinterface	512-Bit	320 Bit	384 Bit	256 Bit
üblicher Speicherausbau	1.024 MB	1.280 MB	1.536 MB	1.024 MB

Verbrauch	TDP 183 W	TDP 215 W	TDP 250 W	idle 27 W, max. 188 W

Was die Technischen Daten angeht fällt es sehr schwer eine Beurteilung zu treffen ob nun AMD oder NVIDIA die Nase vorn hat. Deutlich wird jedoch das NVIDIA sehr viel mehr Aufwand in den Tessellation Part setzt.