TweakPC



XFX AMD Radeon HD 6950 und HD 6970 Test (2/18)

Radeon HD 69X0 (Cayman) - Technisches

Barts/Crypress + X

Bevor wir zu den eigentlichen Karten kommen, wollen wir zunächst wieder auf die technischen Daten der neuen Radeon HD 6900 Serie eingehen. Werfen wir dazu erst einmal einen Blick auf die übliche Übersichtstabellen. Wie man hier erkennt, gibt es vor allem zwei Unterschiede in den Specs zwischen den Radeon HD 6900 Modellen und der Radeon HD 5870. Zum einen hat sich die Anzahl und Struktur der Shader-Einheiten geändert und zum anderen ist der Speicher der Karten gleich verdoppelt worden. Dazu gibt es leichte Taktsteigerungen beim Core und auch beim Speichertakt.

Die XFX Radeon HD 6950 ist auf  800 MHz Core und 1250 MHz Speichertakte eingestellt und die XFX Radeon HD 6970 mit 880 MHz Core sowie 1375 MHz Speichertakt. XFX hält sich hier vorerst also an die Vorgaben von AMD.

Radeon
HD 6870
Radeon
HD 6850
Radeon
HD 6950
Radeon
HD 6970
Radeon
HD 5870
GeForce
GTX 570
GeForce
GTX 580
  Barts Barts Cayman Cayman Cypress GF110 GF110
GPU
Transistoren (Mrd) 1,7 1,7 2,64 2,64  2,15  3  3
Fertigung (nm) 40 40 40 40 40 40 40
Chiptakt (MHz) 900 775 800 880 850 732 772
Shadertakt (MHz) 900 775 800 880 850 1.464 1.544
Shader-Einheiten
224 (5D) 192 (5D) 352 (4D) 384 (4D) 320 (5D) 480 (1D) 512 (1D)
ROPs 32 32 32 32 32 40 48
TMUs 56 48 88 88 80 60 64
Shader-Model 5.0 5.0 5.0 5.0 5.0 5.0 5.0
Speicher
Speichertakt (MHz DDR) 2100 2000 2500 2750 2400 1900 2004
Speichermenge (MB) 1024 1024 2048 2048 1024 1280 1536
Speichertyp GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Speicherinterface 256 Bit 256 Bit 256 Bit 256 Bit 256 Bit 320 Bit 384 Bit
Speicherbandbreite (MB/S) 134.400 128.000 160.000 176.000 153.600 152.000 192.384

Die Architektur des Cayman ist eine Weiterentwicklung des Vorgänger Cypress und enthält einige Neuerungen, die auch im Barts Chip der Radeon HD 6800 Serie noch nicht enthalten sind. Schaut man sich einmal die Blockdiagramme von Barts und Cayman im Vergleich an, so fällt eine Sache besonders auf.


GPU Diagramm Cayman


GPU Diagramm Barts

Die gesamte Vorstufe, welche die SIMD Engines mit Daten versorgt, hat sich im Cayman Chip gegenüber Cypress oder auch Barts verdoppelt. In der GPU sind nun zwei komplette "Graphics Engines" enthalten. Dies ist eine der zwei großen Neuerungen im Grundaufbau des Cayman.

In den Graphics Engines stecken so wichtige Elemente wie der Geometry und Vertex Assembler, die Tessellation Einheit, der Rasterizer und auch die Hircachical-Z Einheit. All diese sind nun doppelt vorhanden. In allen Belangen, welche diese Einheiten betreffen, ist damit die Leistung theoretisch verdoppelt worden. Insbesondere trifft dies natürlich auch auf die Tessellation Einheit zu, die zudem hier in der leistungsfähigeren Generation 8 vorliegt.

Eine weitere wesentliche Änderung ist in den Stream Prozessoren des Cayman zu finden. Waren diese seit langem immer in einer 5D-VLIW Anordnung vorhanden, so hat AMD erstmals bei Cayman nun auf 4D-VLIW umstrukturiert. Diese 4D Einheiten lassen sich besser auslasten und nehmen zudem weniger "Platz" weg, so dass man hier die Effizienz, also die Performance / mm˛˛ um 10% steigern konnte.

Insgesamt besteht die Cayman CPU aus 24 SIMD Engines, wovon jeder aus 16 dieser 4D SPUs besteht. Der Vollausbau einer Cayman GPU hat also 384 SPUs. Geht man nun von der 4D Architektur aus bedeutet dies 4x384 also 1536 einzelne Recheneinheiten. Beim Cypress sind es interessanterweise durch die 5D Architektur mehr, nämlich 1600. Geht man aber von der angegebenen Effizenzsteigerung von 10% aus, ist der Cayman Chip damit prinzipiell schneller als Cypress.

PowerTune

Komplett überwachter Chip

AMD hat in die Cayman GPU noch eine weitere Neuerung eingebaut und dieses Feature PowerTune getauft. Die Cayman GPU ist in der Lage sich selbst zu überwachen. Die Auslastung der GPU wird dabei dauerhaft an verschiedenen Stellen gemessen und protokoliert. Sinn des Ganzen ist es die GPU vor Überlastung zu schützen und zu verhindern, dass die Leistungsaufnahme einen bestimmten vorgegebenen Maximalwert überschreitet. Ein ähnliches Feature hat auch NVIDIA auf der neuen GTX 570/580 eingebaut.

Stellt die GPU fest, das sie "überlastet" wird, so wird der Takt in Sekundenbruchteilen herunter geregelt. Dies geschieht absolut dynamisch und kann mehrmals innerhalb der Berechnung eines einzelnen Bildes erfolgen. Der Benutzer bekommt davon also nichts mit. Zudem wird der Takt nicht etwa - wie im Idle Modus - auf einen vorgegebenen Wert abgesenkt, sondern die Absenkung passt sich an und erfolgt nur so weit, dass sich die maximal erlaubte Stromaufnahme wieder einstellt. Man könnte also sagen AMD hat den "Spritverbrauch" dieses "Sportwagens" nach oben begrenzt, allerdings nicht die Höchstgeschwindigkeit. 

Die vorgegebenen Maximalwerte betragen bei der Radeon HD 6970 250 Watt und bei der Radeon HD 6950 200 Watt. In normalen Games werden diese Werte kaum erreicht, sie lassen sich aber mit Furmark oder ähnlichen Stress Tools relativ leicht überschreiten und genau dann wird abgeregelt.

Interessant an PowerTune ist, dass AMD dem User sogar die Möglichkeit gibt, die Vorgaben zu ändern. Und zwar kann man im CCC Powertune von -20% bis +20% justieren und damit das Power Limit seiner Grafikkarte erhöhen oder sogar reduzieren. Das kann zum Beispiel beim Overclocking nützlich sein, wodurch sich bekanntlich die Stromaufnahme erhöht und PowerTune eventuell die Karte wieder herunter takten würde. AMD hat diese Funktion wohl hauptsächlich eingeführt, um zu demonstrieren, dass damit die Performance der Karte nicht relevant beschnitten wird und dem User/Tester auch die Möglichkeit zu geben dies nachzuvollziehen.

Problematisch daran ist, dass AMD bereits auf den Präsentationsfolien angibt, dass das Überschreiten der default Board Power Limits leider die Garantie zu Nichte macht und das unabhängig vom Übertakten. Die Ursache ist vermutlich in Tools wie Furmark zu sehen, denn erhöht man das Limit und lässt Programme wie Furmark dauerhaft laufen, kann dadurch die Karte beschädigt werden. Es ist also nicht wirklich empfehlenswert diese Funktion dauerhaft zu nutzen, wenn man Wert auf die Garantie legt.

Den Power Level zu verringern könnte vielleicht dem ein oder anderen User mit einem schwachen Netzteil helfen Probleme zu beseitigen, wenn die Grafikkarte zu viel Last aus dem Netzteil zieht. Die zusätzliche Reduktion der Leistungsaufnahme einer HD 6900 Grafikkarte ist der praktibelste Einsatzbereich, wenn man den PowerTune Regler im Catalyst Control Center manipuliert.

Inhaltsverzeichnis:

Übersicht der Benchmarks in diesem Artikel:


ueber TweakPC: Impressum, Datenschutz Copyright 1999-2019 TweakPC, Alle Rechte vorbehalten, all rights reserved. Mit * gekennzeichnete Links sind Affiliates.