TweakPC



Radeon HD 5870 im Test - Benchmarks und Infos zu AMD/ATIs DirectX 11 Karte (4/15)

Radeon HD 5870 Technisches

Gigantischer Chip mit gigantischen Daten

Die GPU der neuen Radeon HD 5870 (RV870) ist ein echter Gigant. Hatte die Radeon HD 4870 mit dem RV770 schon satte 965 Millionen Transistoren und eine GeForce GTX 285 mit dem GT200b stolze 1,4 Mrd. Transistoren, so sind es jetzt beim RV870 fast schon unglaubliche 2.15 Mrd Transistoren.

Die neue GPU enthält also mehr als doppelt so viel Transistoren wie die vorherige Generation bei AMD. Die Größe des Die ist aber nur auf das 1,27 fache gestiegen und nun 334 mm˛ anstelle von 263 mm˛ beim RV770. Damit einher geht eine Verdoppelung der theoretischen Leistung der GPU. So zeigt AMD in einem Diagramm wie sich die GFLOPS/W und GFLOPS/mm˛ im lauft der Generationen entwickelt haben.

 

Dieses Diagramm ist recht interessant, da es auch zeigt, wie seinerzeit die HD 2900 eher einen Stillstand bedeutete, oder vielleicht sogar einen kleinen Knick in der Entwicklung.

Nur wenig geändert haben sich die Taktraten der Radeon HD 5870 im Vergleich zum Vorgänger. Beim Core Takt ist man gleichauf mit der Radeon HD 4890 geblieben, bei 850 MHz. Beim Speichertakt konnte man den GDDR5 Speicher weiter optimieren und auf 1200 MHz anheben, das sind immerhin etwa 30% mehr als bei der Radeon HD 4870, etwas mehr als 20% mehr als bei der Radeon HD 4890. Die Speicherbandbreit konnte so von 115 GB/Sek auf 153 GB/Sek erhöht werden.

Die TeraScale 2 Architektur der Radeon HD 5890 verfügt über 20 SIMD Engines. Jeder davon verfügt über über 16 Thread Prozessoren mit je 5 Stream Cores (Shadereinheiten). Insgesamt kommt man so auf 1600 Shadereinheiten anstelle von 800 bei der HD 4870, anstelle von 40 Textureneinheiten finden sich nun 80, auch hier wurde also verdoppelt.

Schaut man sich die Daten einmal im direkten Vergleich an, wird schnell deutlich, dass die größten Unterschiede zwischen den Karten einfach in der Komplexität des Chips liegen.

  NVIDIA GeForce
275
NVIDIA GeForce
285
ATI
Radeon
HD4870
ATI
Radeon
HD4890
ATI
Radeon
HD5870
           
Chip (Codename) GT200b GT200b RV770 RV790 RV790
Fertigungsprozess 55nm 55nm 55nm 55nm 40nm
GPU-Takt (Vertex/Core) 633 MHz 648 MHz 750 MHz 850 MHz 850 MHz
Shader-Takt 1486 MHz 1476 MHz 750 MHz 850 MHz 850 MHz
Transistoren 1,4 Mrd 1,4 Mrd 965 Mio 965 Mio 2.15 Mrd
Shader Einheiten 240 240 800 800 1600
Shader Model SM 4 SM4 SM4.1 SM 4.1 SM 5.0
           
Speichertakt 1134 MHz 1242 MHz 900 MHz 975 MHz 1200 MHz
Speicherart GDDR-III GDDR-III GDDR-5 GDDR-5 GDDR-5
Speicherinterface 448 Bit 512-Bit 256-Bit 256 Bit 256 Bit
üblicher Speicherausbau 896 MB 1024 MB 512 MB/1GB 1024 MB 1024 MB
Verbrauch TDP 219W TDP 183W TDP 159W TDP 190W idle 27W,
max. 188W

Neuheiten in der Graphics Engine

  • Dual Rasterizers
  • New TessellationUnit
    • 6thGeneration Technology
    • Programmable via DirectX 11 Hull & Domain Shaders
    • New Algorithm that Can Reduce Artifacts
  • Pull Model Interpolation
    • New DirectX 11 Feature
    • Uses Stream Processors for Interpolation with New Instructions
    • Improved Flexibility, Negligible Performance Cost
    • Improved Performance for Constant Buffer Updates
    • Faster Geometry Shading
    • OpenGL Enhancements
    • Improved Line Rendering Performance and Clipping Speed
    • 12-bitSubpixelPrecision

Daten der Thread Prozessoren

  • 2.7 TeraFLOPSSingle Precision
  • 544 GigaFLOPSDouble Precision
  • Increased IPC
    • More flexible dot products
    • Co-issue MUL, dependent ADD in single clock
    • Sum of Absolute Differences (SAD)
      • 12x speed-up with native instruction
      • Used for video encoding, computer vision
      • Exposed via OpenCLextension
    • DirectX 11 bit-level ops
      • Bit count, insert, extract, etc.
    • Fused Multiply-Add
  • Each Thread Processor includes:
    • 4 Stream Cores + 1 Special Function Stream Core
    • Branch Unit
    • General Purpose Registers

Leistungsdaten der Textureneinheiten

  • Increased Texture Bandwidth
    • Up to 68 billion bilinear filtered texels/sec
    • Up to 272 billion 32-bit fetches/sec
  • Increased Cache Bandwidth
    • Up to 1 TB/sec L1 texture fetch bandwidth
    • Up to 435 GB/sec between L1 & L2
  • Doubled L2 Cache
    • 128kB per memory controller
  • New DirectX 11 Texture Features
    • 16k x 16k max resolution
    • New 32-bit and 64-bit HDRblock compression modes (BC6/7)
ueber TweakPC: Impressum, Datenschutz Copyright 1999-2024 TweakPC, Alle Rechte vorbehalten, all rights reserved. Mit * gekennzeichnete Links sind Affiliates.