Radeon HD 5870 im Test - Benchmarks und Infos zu AMD/ATIs DirectX 11 Karte (4/15)
Radeon HD 5870 Technisches
Gigantischer Chip mit gigantischen Daten
Die GPU der neuen Radeon HD 5870 (RV870) ist ein echter
Gigant. Hatte die Radeon HD 4870 mit dem RV770 schon satte 965 Millionen
Transistoren und eine GeForce GTX 285 mit dem GT200b stolze 1,4 Mrd.
Transistoren, so sind es jetzt beim RV870 fast schon
unglaubliche 2.15 Mrd Transistoren.
Die neue GPU enthält also mehr als doppelt so
viel Transistoren wie die vorherige Generation bei
AMD. Die Größe des Die ist aber nur auf das 1,27 fache
gestiegen und nun 334 mm˛ anstelle von 263 mm˛ beim RV770.
Damit einher geht eine Verdoppelung der
theoretischen Leistung der GPU. So zeigt AMD in einem
Diagramm wie sich die GFLOPS/W und GFLOPS/mm˛ im lauft der
Generationen entwickelt haben.
Dieses Diagramm ist recht interessant, da es auch zeigt,
wie seinerzeit die HD 2900 eher einen Stillstand bedeutete,
oder vielleicht sogar einen kleinen Knick in der
Entwicklung.
Nur wenig geändert haben sich die Taktraten der Radeon HD
5870 im Vergleich zum Vorgänger. Beim Core Takt ist man
gleichauf mit der Radeon HD 4890 geblieben, bei 850 MHz. Beim
Speichertakt konnte man den GDDR5 Speicher weiter optimieren
und auf 1200 MHz anheben, das sind immerhin etwa
30% mehr als bei der Radeon HD 4870, etwas mehr als 20% mehr
als bei der Radeon HD 4890. Die Speicherbandbreit konnte so
von 115 GB/Sek auf 153 GB/Sek erhöht werden.
Die TeraScale 2 Architektur der Radeon HD 5890 verfügt über
20 SIMD Engines. Jeder davon verfügt über über 16 Thread
Prozessoren mit je 5 Stream Cores (Shadereinheiten).
Insgesamt kommt man so auf 1600 Shadereinheiten anstelle von
800 bei der HD 4870, anstelle von 40 Textureneinheiten
finden sich nun 80, auch hier wurde also verdoppelt.
Schaut man sich die Daten einmal im direkten Vergleich an,
wird schnell deutlich, dass die größten Unterschiede
zwischen den Karten einfach in der Komplexität des Chips
liegen.
|
NVIDIA GeForce
275 |
NVIDIA GeForce
285 |
ATI Radeon HD4870
|
ATI Radeon HD4890
|
ATI Radeon HD5870 |
|
|
|
|
|
|
Chip (Codename) |
GT200b |
GT200b |
RV770 |
RV790 |
RV790 |
Fertigungsprozess |
55nm |
55nm |
55nm |
55nm |
40nm |
GPU-Takt (Vertex/Core) |
633 MHz |
648 MHz |
750 MHz |
850 MHz |
850 MHz |
Shader-Takt |
1486 MHz |
1476 MHz |
750 MHz |
850 MHz |
850 MHz |
Transistoren |
1,4 Mrd |
1,4 Mrd |
965 Mio |
965 Mio |
2.15 Mrd |
Shader Einheiten |
240 |
240 |
800 |
800 |
1600 |
Shader Model |
SM 4 |
SM4 |
SM4.1 |
SM 4.1 |
SM 5.0 |
|
|
|
|
|
|
Speichertakt |
1134 MHz |
1242 MHz |
900 MHz |
975 MHz |
1200 MHz |
Speicherart |
GDDR-III
|
GDDR-III
|
GDDR-5 |
GDDR-5
|
GDDR-5
|
Speicherinterface |
448 Bit |
512-Bit |
256-Bit |
256 Bit |
256 Bit |
üblicher Speicherausbau |
896 MB |
1024 MB |
512 MB/1GB |
1024 MB |
1024 MB |
|
|
|
|
|
|
Verbrauch |
TDP 219W |
TDP 183W |
TDP 159W |
TDP 190W |
idle 27W, max. 188W |
Neuheiten in der Graphics Engine
- Dual Rasterizers
- New TessellationUnit
- 6thGeneration Technology
- Programmable via DirectX 11 Hull & Domain Shaders
- New Algorithm that Can Reduce Artifacts
- Pull Model Interpolation
- New DirectX 11 Feature
- Uses Stream Processors for Interpolation with New Instructions
- Improved Flexibility, Negligible Performance Cost
- Improved Performance for Constant Buffer Updates
- Faster Geometry Shading
- OpenGL Enhancements
- Improved Line Rendering Performance and Clipping Speed
- 12-bitSubpixelPrecision
Daten der Thread Prozessoren
- 2.7 TeraFLOPSSingle Precision
- 544 GigaFLOPSDouble Precision
- Increased IPC
- More flexible dot products
- Co-issue MUL, dependent ADD in single clock
- Sum of Absolute Differences (SAD)
- 12x speed-up with native instruction
- Used for video encoding, computer vision
- Exposed via OpenCLextension
- DirectX 11 bit-level ops
- Bit count, insert, extract, etc.
- Fused Multiply-Add
- Each Thread Processor includes:
- 4 Stream Cores + 1 Special Function Stream Core
- Branch Unit
- General Purpose Registers
Leistungsdaten der Textureneinheiten
- Increased Texture Bandwidth
- Up to 68 billion bilinear filtered texels/sec
- Up to 272 billion 32-bit fetches/sec
- Increased Cache Bandwidth
- Up to 1 TB/sec L1 texture fetch bandwidth
- Up to 435 GB/sec between L1 & L2
- Doubled L2 Cache
- 128kB per memory controller
- New DirectX 11 Texture Features
- 16k x 16k max resolution
- New 32-bit and 64-bit HDRblock compression modes (BC6/7)