TweakPC



NVIDIA GeForce GTX 680 im Test (2/21)

GeForce GTX 680  - Technisches

Kepler GK104 - was ist neu, wo sind die Unterschiede

Ein großes Ziel bei der Entwicklung der Kepler-GPU war es bei NVIDIA neben der üblichen Performance-Verbesserungen vor allem die Effizienz, also Performance/Watt zu verbessern. Ruft man sich die GeForce GTX 480, also die erste Karte mit Fermi-GPU ins Gedächtnis zurück, lagen genau dort die wohl größten Probleme dieser GPU. Die Performance von Fermi war zum Launch alles andere als schlecht, dennoch wurde die Karte aufgrund ihres sehr hohen Verbrauchs und der daraus entstehenden Hitzeentwicklung und Lautstärke weitgehende kritisch beurteilt. Mit der GTX 580 konnte Nvidia Fermi zwar etwas bändigen, aber die grundlegenden Probleme lagen eben auch in der Architektur.

In die Kepler Architektur sind diese Erfahrungen natürlich eingeflossen und so sieht man der GPU auch an, dass hier von Anfang an Verbrauchssenkung stark im Fokus standen. Die GK104 GPU, die erstmals auf der GeForce GTX 680 eingesetzt wird ist im 28 nm Prozess hergestellt und jede interne Einheit der GPU wurde nicht wie bei Fermi nur auf Performance optimiert, sondern eben auf das möglichst beste Leistung/Watt-Verhältnis.

So findet sich die wohl deutlichste Änderung bei der Kepler-Architektur dann auch in den neuen Streaming-Multiprozessoren (SMX). Die Architektur wurde grundlegend so geändert, dass der typische doppelte Shadertakt verschwindet, der noch bei Fermi vorhanden war. Dafür hat man als Ausgleich die Anzahl der CUDA Cores drastisch erhöht. Auf diese Weise kann signifikant Energie eingespart werden. Mit 1536 CUDA-Cores im GK104, erreicht Kepler die doppelte Leistung pro Watt wie der alte Fermi (GF110), der auf der GeForce GTX 580 genutzt wird.

Die GPC-Einheiten sind die größten nahezu unabhängigen Einheiten in der Kepler GPU. Jede GPC-Einheit hat ihre eigenen Ressourcen für Raster-Operationen, Shading, Texturing und Compute, so dass die meisten Funktionen innerhalb einer einzelnen GPC ausgeführt werden können. Die GPC nutzen darüber hinaus einen gemeinsamen L2-Cache in der GPU.

Jede GPC besitzt zwei SMX-Einheiten, die ebenfalls relativ komplett ausgestattet sind. Mit insgesamt acht dieser SMX-Einheiten kommt die GPU damit auf insgesamt 1536 Cuda-Cores. In den SMX-Einheiten findet sich zum Beispiel ein Tessellator und auch der L1 Cache der Kepler-GPU ist hier angesiedelt, wie im folgenden Blockdiagram zu sehen ist.

Das Speicherinterface wurde bei Kepler ebenfalls neu gestaltet und ist nun nur noch 256-Bit breit und damit gegenüber Fermi geschrumpft. Dafür arbeitet es aber mit einer Taktrate von 6008 MHz, die deutlich über der Fermi GPU liegt. Die theoretische Speicherbandbreite ist mit 192.384 MB/s zu 192.256 MB/s damit also quasi gleich geblieben.

Radeon
HD 6950
Radeon
HD 6970
Radeon
HD 7950
Radeon
HD 7970
GeForce
GTX 570
GeForce
GTX 580
GeForce
GTX 590
GeForce
GTX 680
  Cayman Cayman Tahiti Tahiti GF110 GF110 GF110 GK104
GPU
Transistoren (Mrd) 2,64 2,64  4,31  4,31  3  3  2x3 3.54
Fertigung (nm) 40 40 28 28 40 40 40 28
Chiptakt (MHz) 800 880 800 925 732 772 607 1006
Shadertakt (MHz) 800 880 800 925 1.464 1.544 1.2 1006
Shader-Einheiten
352 (4D) 384 (4D) 1792 (1D) 2048 (1D) 480 (1D) 512 (1D) 2x512 (1D) 1536 (1D)
ROPs 32 32 32 32 40 48 2x48 32
TMUs 88 88 80 80 60 64 2x64 128
Shader-Model 5.0 5.0 5.1 5.1 5.0 5.0 5.0 5.0
Speicher
Speichertakt (MHz DDR) 2500 2750 2500 2750 1900 2004 1747 3004
Speichermenge (MB) 2048 2048 3072 3072 1280 1536 2x1536 2048
Speichertyp GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Speicherinterface 256 Bit 256 Bit 384 Bit 384 Bit 320 Bit 384 Bit 2x384 Bit 256 Bit

Unserer Meinung nach deutlich spannender als die technischen Details, sind die neuen Features der GTX 680. Diese bekommt der Gamer nämlich direkt am eigenen Leib zu spüren.

Mit der GeForce 680 ziehen zum Beispiel zwei neue Anti-Aliasing-Modi ein,  FXAA und TXAA. FXAA ist wie MLAA bei AMD eine Post-Processing-Kantenglättung. Hier wird nachdem das komplette Bild ohne Kantenglättung fertiggestellt ist, ein Filter über das Bild gelegt, der mittels Kantenerkennung arbeitet und starke Kanten quasi verwischt. FXAA neigt gelegentlich dazu das Bild weich zu zeichnen, so dass es etwas unscharf wirkt. Ob FXAA bessere Ergebnisse als das klassische normale MSAA liefert hängt  vom gewählten Game ab.

TXAA ist ein völlig neuer Modus, der FXAA und MSAA kombiniert. TXAA soll eine deutlich verbesserte Bildqualität gegenüber klassischem MSAA liefern und das bei deutlich besserer Performance. So ist das TXAA im Level 1 bereits von der Qualität her besser als 8x MSAA aber so schnell wie 2x MSAA. Das noch bessere TXAA 2 soll dann noch einmal bessere Bildqualität mit der Performance von 4x MSAA liefern.

Leider muss TXAA vom Game selbst unterstützt werden und kann nicht einfach über das Control-Panel zugeschaltet werden. Bislang gibt es aber noch keine Games, die diesen Modus unterstützen, so dass er seine Fähigkeiten später erst noch beweisen muss.

Auf den nächsten Seiten werden wir uns daher ausführlicher mit den Features befassen, die bereits jetzt ihre Wirkung zeigen und das sind GPU-Boost, die neue dynamischen Taktsteigerung der GPU, Adaptive-Vsync und die Target Frame Rate.

Zurück: GeForce GTX 680 | Weiter: GPU-Boost
Inhaltsverzeichnis:

Übersicht der Benchmarks in diesem Artikel:


ueber TweakPC: Impressum, Datenschutz Copyright 1999-2020 TweakPC, Alle Rechte vorbehalten, all rights reserved. Mit * gekennzeichnete Links sind Affiliates.