NVIDIA GeForce GTX 680 im Test (2/21)
GeForce GTX 680 - Technisches
Kepler GK104 - was ist neu, wo sind die Unterschiede
Ein großes Ziel bei der Entwicklung der Kepler-GPU war es bei NVIDIA
neben der üblichen Performance-Verbesserungen vor allem die Effizienz, also
Performance/Watt zu verbessern. Ruft man sich die GeForce GTX 480, also die
erste Karte mit Fermi-GPU ins Gedächtnis zurück, lagen genau dort die wohl größten Probleme
dieser GPU. Die Performance von Fermi war zum Launch alles andere als
schlecht, dennoch wurde die Karte aufgrund ihres sehr hohen Verbrauchs und
der daraus entstehenden Hitzeentwicklung und Lautstärke weitgehende kritisch
beurteilt. Mit der GTX 580 konnte Nvidia Fermi zwar etwas bändigen, aber die
grundlegenden Probleme lagen eben auch in der Architektur.
In die Kepler Architektur sind diese Erfahrungen natürlich eingeflossen und so sieht man
der GPU auch an, dass hier von Anfang an
Verbrauchssenkung stark im Fokus standen. Die GK104 GPU, die
erstmals auf der GeForce GTX 680 eingesetzt wird ist im 28 nm Prozess
hergestellt und jede interne Einheit der GPU wurde nicht wie bei Fermi nur
auf Performance optimiert, sondern eben auf das möglichst beste Leistung/Watt-Verhältnis.
So findet sich die wohl deutlichste Änderung bei der Kepler-Architektur dann
auch in den neuen Streaming-Multiprozessoren (SMX). Die Architektur wurde
grundlegend so geändert, dass der typische doppelte Shadertakt verschwindet,
der noch bei Fermi vorhanden war. Dafür hat man als Ausgleich die Anzahl der CUDA Cores
drastisch erhöht. Auf diese Weise kann signifikant Energie eingespart werden. Mit
1536 CUDA-Cores im GK104, erreicht Kepler die doppelte Leistung pro Watt
wie der alte Fermi (GF110), der auf der GeForce GTX 580 genutzt wird.
Die GPC-Einheiten sind die größten nahezu unabhängigen Einheiten in
der Kepler GPU. Jede GPC-Einheit hat ihre eigenen Ressourcen für Raster-Operationen, Shading, Texturing
und Compute, so dass die meisten Funktionen innerhalb
einer einzelnen GPC ausgeführt werden können. Die GPC nutzen darüber hinaus einen
gemeinsamen L2-Cache in der GPU.
Jede GPC besitzt zwei SMX-Einheiten, die ebenfalls relativ komplett
ausgestattet sind. Mit insgesamt acht dieser SMX-Einheiten kommt die GPU
damit auf insgesamt 1536 Cuda-Cores. In den SMX-Einheiten findet sich zum
Beispiel ein Tessellator und auch der L1 Cache der Kepler-GPU ist hier
angesiedelt, wie im folgenden Blockdiagram zu sehen ist.
Das Speicherinterface wurde bei Kepler ebenfalls neu gestaltet und ist nun nur
noch 256-Bit breit und damit gegenüber Fermi geschrumpft. Dafür arbeitet es
aber mit einer Taktrate von 6008 MHz, die deutlich über der Fermi GPU liegt.
Die theoretische Speicherbandbreite ist mit 192.384 MB/s zu 192.256 MB/s damit also quasi
gleich geblieben.
|
Radeon
HD 6950 |
Radeon
HD 6970 |
Radeon HD 7950 |
Radeon HD 7970 |
GeForce
GTX 570 |
GeForce
GTX 580 |
GeForce
GTX 590 |
GeForce
GTX 680 |
|
Cayman |
Cayman |
Tahiti |
Tahiti |
GF110 |
GF110 |
GF110 |
GK104 |
GPU |
|
|
|
|
|
|
|
|
Transistoren (Mrd) |
2,64 |
2,64 |
4,31 |
4,31 |
3 |
3 |
2x3 |
3.54 |
Fertigung (nm) |
40 |
40 |
28 |
28 |
40 |
40 |
40 |
28 |
Chiptakt (MHz) |
800 |
880 |
800 |
925 |
732 |
772 |
607 |
1006 |
Shadertakt (MHz) |
800 |
880 |
800 |
925 |
1.464 |
1.544 |
1.2 |
1006 |
Shader-Einheiten |
352 (4D) |
384 (4D) |
1792 (1D) |
2048 (1D) |
480 (1D) |
512 (1D) |
2x512 (1D) |
1536 (1D) |
ROPs |
32 |
32 |
32 |
32 |
40 |
48 |
2x48 |
32 |
TMUs |
88 |
88 |
80 |
80 |
60 |
64 |
2x64 |
128 |
Shader-Model |
5.0 |
5.0 |
5.1 |
5.1 |
5.0 |
5.0 |
5.0 |
5.0 |
Speicher |
|
|
|
|
|
|
|
|
Speichertakt (MHz DDR) |
2500 |
2750 |
2500 |
2750 |
1900 |
2004 |
1747 |
3004 |
Speichermenge (MB) |
2048 |
2048 |
3072 |
3072 |
1280 |
1536 |
2x1536 |
2048 |
Speichertyp |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
Speicherinterface |
256 Bit |
256 Bit |
384 Bit |
384 Bit |
320 Bit |
384 Bit |
2x384 Bit |
256 Bit |
Unserer Meinung nach deutlich spannender als die technischen Details,
sind die neuen Features der GTX 680. Diese bekommt der Gamer nämlich direkt
am eigenen Leib zu spüren.
Mit der GeForce 680 ziehen zum Beispiel zwei neue Anti-Aliasing-Modi ein,
FXAA und TXAA. FXAA ist wie MLAA bei AMD eine
Post-Processing-Kantenglättung. Hier wird nachdem das komplette Bild ohne
Kantenglättung fertiggestellt ist, ein Filter über das Bild gelegt, der
mittels Kantenerkennung arbeitet und starke Kanten quasi verwischt. FXAA
neigt gelegentlich dazu das Bild weich zu zeichnen, so dass es etwas
unscharf wirkt. Ob FXAA bessere Ergebnisse als das klassische normale MSAA
liefert hängt vom gewählten Game ab.
TXAA ist ein völlig neuer Modus, der FXAA und MSAA kombiniert. TXAA soll
eine deutlich verbesserte Bildqualität gegenüber klassischem MSAA liefern und
das bei deutlich besserer Performance. So ist das TXAA im Level 1 bereits
von der Qualität her besser als 8x MSAA aber so schnell wie 2x MSAA. Das
noch bessere TXAA 2 soll dann noch einmal bessere Bildqualität mit der
Performance von 4x MSAA liefern.
Leider muss TXAA vom Game selbst unterstützt werden und kann nicht
einfach über das Control-Panel zugeschaltet werden. Bislang gibt es aber
noch keine Games, die diesen Modus unterstützen, so dass er seine Fähigkeiten
später erst noch beweisen muss.
Auf den nächsten Seiten werden wir uns daher
ausführlicher mit den Features befassen, die bereits jetzt ihre Wirkung
zeigen und das sind GPU-Boost, die neue dynamischen Taktsteigerung der GPU,
Adaptive-Vsync und die Target Frame Rate.