NVIDIA GeForce GTX 480 (GF100 / Fermi) im Performance Test (2/15)
GeForce GTX 470/480 Technisches
Über die Fermi Architektur, dem die GeForce GTX 480 und auch
470 mit ihrem GF100 zugrunde liegt, wurde ja bereits viel
gesprochen und geschrieben. Wir möchten hier also nur noch
einmal grob auf die Grundlagen eingehen, um die technischen Daten der
GPU zu verdeutlichen. Wer tiefer ins Detail gehen will
findet sogar bei NVIDIA selbst viele Informationen aus
erster Hand und kann
dort sogar die kompletten umfangreichen GF100 Whitepaper
herunterladen. Zu finden sind diese unter
http://www.nvidia.com/object/gf100.html.
Der Aufbau der GF100 verdeutlicht auf den ersten Blicke die
Parallelisierung, die bei den GPUs immer weiter
vorangetrieben wird. Auf den ersten Blick erinnert die GF100
GPU an einen "Quad Core Prozessor", denn sie besteht
aus vier GPCs (Graphics Processing Clusters), denen zur
Seite insgesamt sechs Memory Controller stehen und dazu noch
ein L2 Cache.
Damit ist aber lange nicht Schluss, denn jeder dieser GPC
wiederum besteht aus weiteren Einheiten, den sogenannten SM
(Streaming Multiprozessoren) und je einer Raster Engine. In
jedem SM wiederum verbergen sich eine PolyMorph Engine,
erneut
diverse Cache Elemente und die sogenannten CUDA Cores (Bei
ATI Stream Prozessoren genannt),
insgesamt sind es 32 Stück pro SM.
Im Raster- und PolyMoph-Engine finden wir wiederrum
weitere Einheiten. So verbirgt sich in jedem PolyMoph-Engine
l bei der GF100 zum Beispiel ein Tessellator. Hier liegt ein
wesentlicher Unterschied zur aktuellen AMD Architektur, bei
der der Tesselator "außerhalb" des Bereichs der Streaming
Prozessoren liegt.
Insgesamt hat eine GF100 GPU also 4x4x32 = 512 CUDA Cores
und 16 Tessellator-Einheiten. Auf der GeForce 480 sind
allerdings nicht alle aktiv. Ein Streaming Multiprozessor
ist hier deaktiviert, so dass man nur auf 480 CUDA Cores
kommt. Bei der GeForce GTX 470 ist noch ein weiterer SM
deaktiviert, was zu 448 CUDA Cores führt.
Die gesamte Architektur ist wie man sieht sehr flexibel, da
sich beliebig SM oder auch ganze GPCs abschalten lassen. Wir
werden also auf Basis dieser Architektur - so wie es AMD
auch gemacht hat - weiter NVIDIA GPUs sehen.
|
NVIDIA GeForce
GTX
285 |
NVIDIA GeForce
GTX 470 |
NVIDIA GeForce
GTX 480 |
ATI Radeon HD5870 |
|
|
|
|
|
Chip (Codename) |
GT200b |
GF100 |
GF100 |
RV790 |
Fertigungsprozess |
55nm |
40nm |
40nm |
40nm |
GPU-Takt (Vertex/Core) |
648 MHz |
607 MHz |
700 MHz |
850 MHz |
Shader-Takt |
1.476 MHz |
1.215 MHz |
1.404 MHz |
850 MHz |
Transistoren |
1,4 Mrd |
3 Mrd |
3 Mrd |
2.15 Mrd |
Stream Prozessoren/ Cuda Cores |
240 |
448 |
480 |
320 (5D) |
Speichertakt |
1.242 MHz |
837 MHz |
924 MHz |
1.200 MHz |
Speicherart |
GDDR-III
|
GDDR-5
|
GDDR-5
|
GDDR-5
|
Speicherinterface |
512-Bit |
320 Bit |
384 Bit |
256 Bit |
üblicher Speicherausbau |
1.024 MB |
1.280 MB |
1.536 MB |
1.024 MB |
|
|
|
|
|
Verbrauch |
TDP 183 W |
TDP 215 W |
TDP 250 W |
idle 27 W, max. 188 W |
Was die Technischen Daten angeht fällt es sehr schwer eine
Beurteilung zu treffen ob nun AMD oder NVIDIA die Nase vorn
hat. Deutlich wird jedoch das NVIDIA sehr viel mehr Aufwand
in den Tessellation Part setzt.