TweakPC


NVIDIA GeForce GTX 480 (GF100 / Fermi) im Performance Test (2/15)

GeForce GTX 470/480 Technisches

Über die Fermi Architektur, dem die GeForce GTX 480 und auch 470 mit ihrem GF100 zugrunde liegt, wurde ja bereits viel gesprochen und geschrieben. Wir möchten hier also nur noch einmal grob auf die Grundlagen eingehen, um die technischen Daten der GPU zu verdeutlichen. Wer tiefer ins Detail gehen will findet sogar bei NVIDIA selbst viele Informationen aus erster Hand und kann dort sogar die kompletten umfangreichen GF100 Whitepaper herunterladen. Zu finden sind diese unter http://www.nvidia.com/object/gf100.html.

Der Aufbau der GF100 verdeutlicht auf den ersten Blicke die Parallelisierung, die bei den GPUs immer weiter vorangetrieben wird. Auf den ersten Blick erinnert die GF100 GPU an einen "Quad Core Prozessor", denn sie besteht aus vier GPCs (Graphics Processing Clusters), denen zur Seite insgesamt sechs Memory Controller stehen und dazu noch ein L2 Cache.

Damit ist aber lange nicht Schluss, denn jeder dieser GPC wiederum besteht aus weiteren Einheiten, den sogenannten SM (Streaming Multiprozessoren) und je einer Raster Engine. In jedem SM wiederum verbergen sich eine PolyMorph Engine, erneut diverse Cache Elemente und die sogenannten CUDA Cores (Bei ATI Stream Prozessoren genannt), insgesamt sind es 32 Stück pro SM.

Im Raster- und PolyMoph-Engine finden wir wiederrum weitere Einheiten. So verbirgt sich in jedem PolyMoph-Engine l bei der GF100 zum Beispiel ein Tessellator. Hier liegt ein wesentlicher Unterschied zur aktuellen AMD Architektur, bei der der Tesselator "außerhalb" des Bereichs der Streaming Prozessoren liegt.

Insgesamt hat eine GF100 GPU also 4x4x32 = 512 CUDA Cores und 16 Tessellator-Einheiten. Auf der GeForce 480 sind allerdings nicht alle aktiv. Ein Streaming Multiprozessor ist hier deaktiviert, so dass man nur auf 480 CUDA Cores kommt. Bei der GeForce GTX 470 ist noch ein weiterer SM deaktiviert, was zu 448 CUDA Cores führt.

Die gesamte Architektur ist wie man sieht sehr flexibel, da sich beliebig SM oder auch ganze GPCs abschalten lassen. Wir werden also auf Basis dieser Architektur - so wie es AMD auch gemacht hat - weiter NVIDIA GPUs sehen.

  NVIDIA GeForce
GTX 285
NVIDIA GeForce
GTX 470
NVIDIA GeForce
GTX 480
ATI
Radeon
HD5870
         
Chip (Codename) GT200b GF100 GF100 RV790
Fertigungsprozess 55nm 40nm 40nm 40nm
GPU-Takt (Vertex/Core) 648 MHz 607 MHz 700 MHz 850 MHz
Shader-Takt 1.476 MHz 1.215 MHz 1.404 MHz 850 MHz
Transistoren 1,4 Mrd 3 Mrd 3 Mrd 2.15 Mrd
Stream Prozessoren/ Cuda Cores 240 448 480 320 (5D)
Speichertakt 1.242 MHz 837 MHz 924 MHz 1.200 MHz
Speicherart GDDR-III GDDR-5 GDDR-5 GDDR-5
Speicherinterface 512-Bit 320 Bit 384 Bit 256 Bit
üblicher Speicherausbau 1.024 MB 1.280 MB 1.536 MB 1.024 MB
   
Verbrauch TDP 183 W TDP 215 W TDP 250 W idle 27 W,
max. 188 W

Was die Technischen Daten angeht fällt es sehr schwer eine Beurteilung zu treffen ob nun AMD oder NVIDIA die Nase vorn hat. Deutlich wird jedoch das NVIDIA sehr viel mehr Aufwand in den Tessellation Part setzt.

Inhaltsverzeichnis:

Übersicht der Benchmarks in diesem Artikel:


ueber TweakPC: Impressum, Datenschutz Copyright 1999-2017 TweakPC, Alle Rechte vorbehalten, all rights reserved