XFX AMD Radeon HD 6950 und HD 6970 Test (2/18)
Radeon HD 69X0 (Cayman) - Technisches
Barts/Crypress + X
Bevor wir zu den eigentlichen Karten kommen, wollen wir zunächst wieder
auf die technischen Daten der neuen Radeon HD 6900 Serie eingehen. Werfen
wir dazu erst einmal einen Blick auf die übliche Übersichtstabellen. Wie man
hier erkennt, gibt es vor allem zwei Unterschiede in den Specs zwischen den
Radeon HD 6900 Modellen und der Radeon HD 5870. Zum einen hat sich die
Anzahl und Struktur der Shader-Einheiten geändert und zum anderen ist der Speicher der Karten gleich verdoppelt
worden. Dazu gibt es leichte
Taktsteigerungen beim Core und auch beim Speichertakt.
Die XFX Radeon HD 6950 ist auf 800 MHz Core und 1250 MHz
Speichertakte eingestellt und die XFX Radeon HD 6970 mit 880 MHz Core sowie
1375 MHz Speichertakt. XFX hält sich hier vorerst also an die Vorgaben von
AMD.
|
Radeon
HD 6870 |
Radeon
HD 6850 |
Radeon
HD 6950 |
Radeon
HD 6970 |
Radeon HD 5870 |
GeForce
GTX 570 |
GeForce
GTX 580 |
|
Barts |
Barts |
Cayman |
Cayman |
Cypress |
GF110 |
GF110 |
GPU |
|
|
|
|
|
|
|
Transistoren (Mrd) |
1,7 |
1,7 |
2,64 |
2,64 |
2,15 |
3 |
3 |
Fertigung (nm) |
40 |
40 |
40 |
40 |
40 |
40 |
40 |
Chiptakt (MHz) |
900 |
775 |
800 |
880 |
850 |
732 |
772 |
Shadertakt (MHz) |
900 |
775 |
800 |
880 |
850 |
1.464 |
1.544 |
Shader-Einheiten |
224 (5D) |
192 (5D) |
352 (4D) |
384 (4D) |
320 (5D) |
480 (1D) |
512 (1D) |
ROPs |
32 |
32 |
32 |
32 |
32 |
40 |
48 |
TMUs |
56 |
48 |
88 |
88 |
80 |
60 |
64 |
Shader-Model |
5.0 |
5.0 |
5.0 |
5.0 |
5.0 |
5.0 |
5.0 |
Speicher |
|
|
|
|
|
|
|
Speichertakt (MHz DDR) |
2100 |
2000 |
2500 |
2750 |
2400 |
1900 |
2004 |
Speichermenge (MB) |
1024 |
1024 |
2048 |
2048 |
1024 |
1280 |
1536 |
Speichertyp |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
Speicherinterface |
256 Bit |
256 Bit |
256 Bit |
256 Bit |
256 Bit |
320 Bit |
384 Bit |
Speicherbandbreite (MB/S) |
134.400 |
128.000 |
160.000 |
176.000 |
153.600 |
152.000 |
192.384 |
Die Architektur des Cayman ist eine Weiterentwicklung des Vorgänger
Cypress und enthält einige Neuerungen, die auch im Barts Chip der Radeon HD 6800 Serie noch nicht enthalten sind. Schaut man sich einmal die
Blockdiagramme von Barts und Cayman im Vergleich an, so fällt eine Sache
besonders auf.
GPU Diagramm Cayman
GPU
Diagramm Barts
Die gesamte Vorstufe, welche die SIMD Engines mit Daten versorgt, hat sich
im Cayman Chip gegenüber Cypress oder auch Barts verdoppelt. In der GPU sind
nun zwei komplette "Graphics Engines" enthalten. Dies ist eine der zwei großen Neuerungen im Grundaufbau des Cayman.
In den Graphics Engines stecken so wichtige Elemente wie der Geometry und
Vertex Assembler, die Tessellation Einheit, der Rasterizer und auch die
Hircachical-Z Einheit. All diese sind nun doppelt vorhanden. In
allen Belangen, welche diese Einheiten betreffen, ist damit die Leistung theoretisch verdoppelt
worden. Insbesondere trifft dies natürlich auch auf
die Tessellation Einheit zu, die zudem hier in der leistungsfähigeren
Generation 8 vorliegt.
Eine weitere wesentliche Änderung ist in den Stream Prozessoren des Cayman
zu finden. Waren diese seit langem immer in einer 5D-VLIW Anordnung
vorhanden, so hat AMD erstmals bei Cayman nun auf 4D-VLIW
umstrukturiert. Diese 4D Einheiten lassen sich besser auslasten und nehmen
zudem weniger "Platz" weg, so dass man hier die Effizienz, also die
Performance / mm˛˛ um 10% steigern konnte.
Insgesamt besteht die Cayman CPU aus 24 SIMD Engines, wovon jeder aus 16
dieser 4D SPUs besteht. Der Vollausbau einer Cayman GPU hat also 384 SPUs.
Geht man nun von der 4D Architektur aus bedeutet dies 4x384 also 1536
einzelne Recheneinheiten. Beim Cypress sind es interessanterweise durch die
5D Architektur mehr, nämlich 1600. Geht man aber von der angegebenen
Effizenzsteigerung von 10% aus, ist der Cayman Chip damit prinzipiell schneller als Cypress.
PowerTune
Komplett überwachter Chip
AMD hat in die Cayman GPU noch eine weitere Neuerung eingebaut und dieses
Feature PowerTune getauft. Die Cayman GPU ist in der Lage sich selbst zu
überwachen. Die Auslastung der GPU wird dabei dauerhaft an verschiedenen
Stellen gemessen und protokoliert. Sinn des Ganzen ist es die GPU vor
Überlastung zu schützen und zu verhindern, dass die Leistungsaufnahme einen
bestimmten vorgegebenen Maximalwert überschreitet. Ein ähnliches
Feature hat auch NVIDIA auf der neuen GTX 570/580 eingebaut.
Stellt die GPU fest, das sie "überlastet" wird, so wird der Takt in
Sekundenbruchteilen herunter geregelt. Dies geschieht absolut dynamisch und
kann mehrmals innerhalb der Berechnung eines einzelnen Bildes erfolgen. Der
Benutzer bekommt davon also nichts mit. Zudem wird der Takt nicht etwa - wie
im Idle Modus - auf einen vorgegebenen Wert abgesenkt, sondern die Absenkung
passt sich an und erfolgt nur so weit, dass sich die maximal erlaubte
Stromaufnahme wieder einstellt. Man könnte also sagen AMD hat den
"Spritverbrauch" dieses "Sportwagens" nach oben begrenzt, allerdings nicht
die Höchstgeschwindigkeit.
Die vorgegebenen Maximalwerte betragen bei der Radeon HD 6970 250 Watt
und bei der Radeon HD 6950 200 Watt. In normalen Games werden diese Werte
kaum erreicht, sie lassen sich aber mit Furmark oder ähnlichen Stress Tools
relativ leicht überschreiten und genau dann wird abgeregelt.
Interessant an PowerTune ist, dass AMD dem User sogar die Möglichkeit
gibt, die Vorgaben zu ändern. Und zwar kann man im CCC Powertune von -20%
bis +20% justieren und damit das Power Limit seiner Grafikkarte erhöhen
oder sogar reduzieren. Das kann zum Beispiel beim Overclocking nützlich
sein, wodurch sich bekanntlich die Stromaufnahme erhöht und PowerTune
eventuell die Karte wieder herunter takten würde. AMD hat diese Funktion
wohl hauptsächlich eingeführt, um zu demonstrieren, dass damit die
Performance der Karte nicht relevant beschnitten wird und dem User/Tester
auch die Möglichkeit zu geben dies nachzuvollziehen.
Problematisch daran ist, dass AMD bereits auf den Präsentationsfolien
angibt, dass das Überschreiten der default Board Power Limits leider die
Garantie zu Nichte macht und das unabhängig vom Übertakten. Die Ursache ist
vermutlich in Tools wie Furmark zu sehen, denn erhöht man das Limit und
lässt Programme wie Furmark dauerhaft laufen, kann dadurch die Karte
beschädigt werden. Es ist also nicht wirklich empfehlenswert diese Funktion
dauerhaft zu nutzen, wenn man Wert auf die Garantie legt.
Den Power Level zu verringern könnte vielleicht dem ein oder anderen User mit
einem schwachen Netzteil helfen Probleme zu beseitigen, wenn die Grafikkarte zu
viel Last aus dem Netzteil zieht. Die zusätzliche Reduktion der
Leistungsaufnahme einer HD 6900 Grafikkarte ist der praktibelste Einsatzbereich,
wenn man den PowerTune Regler im Catalyst Control Center manipuliert.