NVIDIA GeForce GTX 680 im Test (2/21)

GeForce GTX 680 - Technisches

Kepler GK104 - was ist neu, wo sind die Unterschiede

Ein großes Ziel bei der Entwicklung der Kepler-GPU war es bei NVIDIA neben der üblichen Performance-Verbesserungen vor allem die Effizienz, also Performance/Watt zu verbessern. Ruft man sich die GeForce GTX 480, also die erste Karte mit Fermi-GPU ins Gedächtnis zurück, lagen genau dort die wohl größten Probleme dieser GPU. Die Performance von Fermi war zum Launch alles andere als schlecht, dennoch wurde die Karte aufgrund ihres sehr hohen Verbrauchs und der daraus entstehenden Hitzeentwicklung und Lautstärke weitgehende kritisch beurteilt. Mit der GTX 580 konnte Nvidia Fermi zwar etwas bändigen, aber die grundlegenden Probleme lagen eben auch in der Architektur.

In die Kepler Architektur sind diese Erfahrungen natürlich eingeflossen und so sieht man der GPU auch an, dass hier von Anfang an Verbrauchssenkung stark im Fokus standen. Die GK104 GPU, die erstmals auf der GeForce GTX 680 eingesetzt wird ist im 28 nm Prozess hergestellt und jede interne Einheit der GPU wurde nicht wie bei Fermi nur auf Performance optimiert, sondern eben auf das möglichst beste Leistung/Watt-Verhältnis.

So findet sich die wohl deutlichste Änderung bei der Kepler-Architektur dann auch in den neuen Streaming-Multiprozessoren (SMX). Die Architektur wurde grundlegend so geändert, dass der typische doppelte Shadertakt verschwindet, der noch bei Fermi vorhanden war. Dafür hat man als Ausgleich die Anzahl der CUDA Cores drastisch erhöht. Auf diese Weise kann signifikant Energie eingespart werden. Mit 1536 CUDA-Cores im GK104, erreicht Kepler die doppelte Leistung pro Watt wie der alte Fermi (GF110), der auf der GeForce GTX 580 genutzt wird.

Die GPC-Einheiten sind die größten nahezu unabhängigen Einheiten in der Kepler GPU. Jede GPC-Einheit hat ihre eigenen Ressourcen für Raster-Operationen, Shading, Texturing und Compute, so dass die meisten Funktionen innerhalb einer einzelnen GPC ausgeführt werden können. Die GPC nutzen darüber hinaus einen gemeinsamen L2-Cache in der GPU.

Jede GPC besitzt zwei SMX-Einheiten, die ebenfalls relativ komplett ausgestattet sind. Mit insgesamt acht dieser SMX-Einheiten kommt die GPU damit auf insgesamt 1536 Cuda-Cores. In den SMX-Einheiten findet sich zum Beispiel ein Tessellator und auch der L1 Cache der Kepler-GPU ist hier angesiedelt, wie im folgenden Blockdiagram zu sehen ist.

Das Speicherinterface wurde bei Kepler ebenfalls neu gestaltet und ist nun nur noch 256-Bit breit und damit gegenüber Fermi geschrumpft. Dafür arbeitet es aber mit einer Taktrate von 6008 MHz, die deutlich über der Fermi GPU liegt. Die theoretische Speicherbandbreite ist mit 192.384 MB/s zu 192.256 MB/s damit also quasi gleich geblieben.

	Radeon HD 6950	Radeon HD 6970	Radeon HD 7950	Radeon HD 7970	GeForce GTX 570	GeForce GTX 580	GeForce GTX 590	GeForce GTX 680
	Cayman	Cayman	Tahiti	Tahiti	GF110	GF110	GF110	GK104
GPU
Transistoren (Mrd)	2,64	2,64	4,31	4,31	3	3	2x3	3.54
Fertigung (nm)	40	40	28	28	40	40	40	28
Chiptakt (MHz)	800	880	800	925	732	772	607	1006
Shadertakt (MHz)	800	880	800	925	1.464	1.544	1.2	1006
Shader-Einheiten	352 (4D)	384 (4D)	1792 (1D)	2048 (1D)	480 (1D)	512 (1D)	2x512 (1D)	1536 (1D)
ROPs	32	32	32	32	40	48	2x48	32
TMUs	88	88	80	80	60	64	2x64	128
Shader-Model	5.0	5.0	5.1	5.1	5.0	5.0	5.0	5.0
Speicher
Speichertakt (MHz DDR)	2500	2750	2500	2750	1900	2004	1747	3004
Speichermenge (MB)	2048	2048	3072	3072	1280	1536	2x1536	2048
Speichertyp	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5
Speicherinterface	256 Bit	256 Bit	384 Bit	384 Bit	320 Bit	384 Bit	2x384 Bit	256 Bit

Unserer Meinung nach deutlich spannender als die technischen Details, sind die neuen Features der GTX 680. Diese bekommt der Gamer nämlich direkt am eigenen Leib zu spüren.

Mit der GeForce 680 ziehen zum Beispiel zwei neue Anti-Aliasing-Modi ein, FXAA und TXAA. FXAA ist wie MLAA bei AMD eine Post-Processing-Kantenglättung. Hier wird nachdem das komplette Bild ohne Kantenglättung fertiggestellt ist, ein Filter über das Bild gelegt, der mittels Kantenerkennung arbeitet und starke Kanten quasi verwischt. FXAA neigt gelegentlich dazu das Bild weich zu zeichnen, so dass es etwas unscharf wirkt. Ob FXAA bessere Ergebnisse als das klassische normale MSAA liefert hängt vom gewählten Game ab.

TXAA ist ein völlig neuer Modus, der FXAA und MSAA kombiniert. TXAA soll eine deutlich verbesserte Bildqualität gegenüber klassischem MSAA liefern und das bei deutlich besserer Performance. So ist das TXAA im Level 1 bereits von der Qualität her besser als 8x MSAA aber so schnell wie 2x MSAA. Das noch bessere TXAA 2 soll dann noch einmal bessere Bildqualität mit der Performance von 4x MSAA liefern.

Leider muss TXAA vom Game selbst unterstützt werden und kann nicht einfach über das Control-Panel zugeschaltet werden. Bislang gibt es aber noch keine Games, die diesen Modus unterstützen, so dass er seine Fähigkeiten später erst noch beweisen muss.

Auf den nächsten Seiten werden wir uns daher ausführlicher mit den Features befassen, die bereits jetzt ihre Wirkung zeigen und das sind GPU-Boost, die neue dynamischen Taktsteigerung der GPU, Adaptive-Vsync und die Target Frame Rate.

Zurück: GeForce GTX 680 |

Weiter: GPU-Boost

Inhaltsverzeichnis:

[1] GeForce GTX 680
[2] Technische Details
[3] GPU-Boost
[4] Adaptive-VSync
[5] Target Frame Rate
[6] GeForce GTX 680 - Die Karte
[7] Anschlüsse und Monitorkombinationen
[8] Testsystem
[9] Temperaturen
[10] Lautstärke
[11] Verbrauch

[12] Gaming Performance Überblick
[13] Gaming Performance Überblick DX11
[14] Gaming Performance Spielbarkeit
[15] Gaming Performance Spielbarkeit DX11
[16] Tessellation Performance
[17] PhysX Performance
[18] Vision Surround / Eyefinity Performance
[19] Vision Surround / Eyefinity Spielbarkeit
[20] GeForce GTX 680 Overclocking
[21] Performance Beurteilung und Fazit

Übersicht der Benchmarks in diesem Artikel:

[1] Far Cry Regulator Demo
[2] Quake 4
[3] F.E.A.R.
[4] Left 4 Dead
[5] Call of Juarez (DX10)
[6] Stalker Clear Sky (DX10)
[7] HAWX (DX10)
[8] Call of Duty 4
[9] Crysis Warhead (DX10)
[10] FarCry 2 (DX10)
[11] Stormrise (DX10)
[12] Battleforge (SSAO/DX11)
[13] Dawn of War 2 Chaos Rising
[14] Dirt 2 (DX11)
[15] F1 2010 (DX11)
[16] Battlefield Bad Company 2 (DX11)
[17] Just Cause 2 Dark Tower (DX11)
[18] Metro 2033 Benchmark (DX11/High/DOF)
[19] Alien vs Predator (DX11)
[20] Mafia 2 Benchmark

[21] Battlefield 3 (DX11)
[22] Dragon Age 2 (DX11/Hi-Tex)
[23] Batman Arham City (DX11)
[24] Crysis 2 (DX11/Hi-Tex)
[25] Heaven 2.5 Pro (DX11)
[26] Heaven 2.5 Pro (DX11/Extreme)
[27] Stone Giant (DX11)
[28] 3D Mark 2006
[29] 3D Mark Vantage
[30] 3D Mark GPU Score
[31] 3DMark 2011
[32] 3DMark 2011 GPU Score
[33] 3DMark 2011 Combined Score
[34] Performance Durchschnitt DX9/10
[35] Performance Durchschnitt DX11
[36] Performance Spielbarkeit DX9/10
[37] Performance Spielbarkeit DX11
[38] Mafia 2 Benchmark PhysX
[39] 3DMark PhysX

Forum News