Kampf der Giganten

Transcription

Kampf der Giganten

Grafikkarten
Kampf der Giganten
Die Grafikkarten-Topmodelle im direkten Leistungsvergleich
Schneller geht es derzeit nicht: AMDs Radeon HD2900 XT und NVIDIAs GeForce 8800 GTX Ultra stellen derzeit die Krone der Grafikkartenschöpfung beider Hersteller dar. Doch auch „normale“ GeForce 8800-GTX-Modelle existieren in übertakteten Versionen und kämpfen um
einen Platz auf dem Treppchen. Neben einem Leistungsvergleich werden in diesem High-End-Artikel auch ATIs neue Chipfeatures des R600
und dessen Architektur diskutiert.
von N. Emig
AMD hat Mitte Mai endlich auch
den DirectX-10-Nachwuchs zur
Welt gebracht. Wo NVIDIA bereits
seit Ende 2006 Stückzahlen absetzt, müssen die Kanadier noch
ordentlich aufholen. Das derzeitige
Flaggschiff, die Radeon HD2900
XT konnte den hoch gesteckten
Erwartungen, auch aufgrund bislang schlecht optimierter Treiber,
noch nicht gerecht werden, zeigt
aber gute Ansätze in der Rohperformance.
Nichtsdestoweniger
haben sich die Ingenieure bei NVIDIA nicht auf die faule Haut gelegt,
sondern für Nachschub gesorgt.
Sowohl im Midrange-, als auch im
High-End-Segment wurden neue
Karten vorgestellt. Die GeForce
8800 GTX war bei den ersten Tests
der Radeon HD2900 XT in vielen
Bereichen überlegen. Trotzdem
setzt NVIDIA noch eins oben drauf
und präsentiert die GeForce 8800
Ultra mit weiter erhöhten Taktraten.
In Zahlen bedeutet das: 612 MHz
Chip-, 1080 MHz Speicher- und
38 - Hardwareluxx - 5/2007
1500 MHz Shadertakt. Eine standardmäßig getaktete GeForce
8800 GTX kann hier „nur“ 575, 900
und 1350 MHz vorweisen. Die weiteren Rohdaten sind gleich geblieben, so verfügt die GeForce 8800
Ultra weiterhin über 128 StreamProzessoren, 786 MB RAM und ein
384 Bit breites Speicher-Interface.
Auf der ATI-Karte werkelt hingegen ein mit 742 MHz getakteter
Chip, der über ein 512 Bit breites
Interface mit dem Speicher verbunden ist. Dieser arbeitet mit 828 MHz
und hat eine Größe von 512 MB.
Im Inneren des R600 schuften 320
Stream-Prozessoren mit 742 MHz
Takt. Wobei die Zahl nicht stur mit
den 128 Einheiten bei NVIDIA verglichen werden kann und darf: Architektonisch gesehen besitzt der
R600 64 Shader Einheiten, die bei
voller Auslastung je fünf Berechnungen pro Taktzyklus durchführen
können,
was
nach Multiplikation
zu den beschriebenen 320 StreamProzessoren führt. Der G80 verarbeitet pro Taktzyklus nur einen
bzw. maximal zwei Rechenschritte,
wobei die Taktfrequenz der Shader
deutlich höher liegt. Eine ständige
Vollauslastung der R600 Shader
Einheiten der Radeon HD2900 XT
würde wahrscheinlich in einer hervorragenden Performance resultieren, jedoch müssen die Anfragen
vom Treiber und den Prozessoren
vorgeschalteten Modulen auch
dahingehend aufbereitet werden.
Diese müssten permanent fünf Berechnungsanfragen in die Pipeline
schicken, um die Vollauslastung
zu gewährleisten. Wahrscheinlich
liegt hier der Flaschenhals, der
den R600 noch ausbremst. AMD
wird daher sicherlich noch Anpassungen am Treiber vornehmen, die
auch gute Aussichten
auf eine spürbare
Performanceverbesserung haben.
Derartige
Verbesserungen
hielten bereits mit den ersten Treiberupdates Einzug. Der Versionssprung des Catylst auf 8.37.4.2
hatte in einigen Anwendungen
deutliche Leistungszuwächse zur
Folge. Besonders der starke Performance-Verlust bei Zuschaltung
von Antialiasing oder anisotropem
Filter wurde eingedämmt.
ATIs neue Kleider
Neben den architektonischen Neuheiten des R600-Chips (siehe Kasten auf Seite 43) werden natürlich
auch technologische Innovationen
implementiert und vorgestellt.
Dazu gehören etwa Features wie
das Custom Filter Antialiasing
(CFAA) und Tesselation. CFAA ist
ein neuer Antialiasing-Modus, der
zur Farbbestimmung eines Pixels
weitere Samples aus benachbarten Pixeln in die Berechnung mit
einbezieht. Das geschieht, indem
sozusagen ein kleineres oder grö-
Grafikkarten
ßeres Zelt um das jeweilige Pixel
gespannt wird und anschließend
überprüft wird, welche Samples
der Nachbarpixel innerhalb der virtuellen Grenze liegen. Diese werden dann zu unterschiedlichen Gewichtungen - je nach Entfernung
zum Zentrum - in die Berechnung
des Farbwertes mit einbezogen.
Da hier Informationen über eine
größere Fläche interpoliert und
anschließend auf die Farbe eines
einzelnen Pixels kondensiert werden, sowie dieselben Subpixel in
die Berechnung für verschiedene
Pixelfarbwerte eingehen, entsteht
zwangsläufig eine Unschärfe. Wie
stark diese ausfällt hängt vom verwendeten Modus ab. Je größer
das gespannte Zelt ist, umso mehr
Informationen werden interpoliert
und umso größer wird die Unschärfe. ATI unterscheidet hier zwischen
einem Narrow- und einem WideTent-Modus, die bezeichnend
für die Größe der verwendeten
Samplingfläche stehen. Besonders
bei dünnen und linienhaften Strukturen kann eine allzu großzügige
Bedienung an Nachbarsamples
problematisch werden. Ein dünnes,
schwarzes Kabel vor einem hellen Himmel wird so schnell in ein
graues Fädchen mutieren.
Neben den „Zelt-Filtern“ existiert noch ein weiterer Modus, der
Edge Detect Filter. Dieser sucht
im gerenderten Bild nach Kanten.
Die dortigen Pixel werden dann mit
einer höheren Anzahl an Samples
entlang der Kante gefiltert. Kantenferne Bildinhalte erfahren eine
Standardbehandlung im Sinne einer gewöhnlichen MSAA-„Box“-Filterung. Das spart Performance und
glättet treppchenaffine Bildinhalte
an den Kanten stärker.
CFAA erfordert allerdings keine hardwareseitige Unterstützung.
Alles nötige kann im Treiber erledigt
werden. NVIDIAs GeForce 8800 ist
also theoretisch auch in der Lage,
CFAA oder sonstige „Costum Filter“ nachzurüsten. Allerdings ist es
fraglich, ob die Kalifornier diesen
Weg einschlagen werden, denn die
schlechten Erfahrungen mit dem
CFAA-ähnlichen Filter Quincunx,
der mit der GeForce-3-Generation
vorgestellt wurde und das gesamte
Bild durch geringe Schärfe verunstaltete, wollen kein zweites mal
gemacht werden.
Mehr neue Kleider
Eine weitere Neuerung ist der so
genannte Tessellator (Tessellation: zu Deutsch das Mosaik). Diese
Hardwareeinheit ist in der Lage, ein
Polygon in mehrere Untereinheiten
aufzuteilen und somit den Detailgrad eines Modells deutlich zu
erhöhen. In Kombination mit Tech-
niken wie Displacement Mapping
können so sehr realistische Charaktere und Modelle geschaffen
werden. Da es mehrere Wege gibt
eine Fläche aufzuteilen, wurde der
Tesselator darauf ausgelegt, flexibel zu sein und verschiedene Unterteilungsalgorithmen (etwa Catmull-Clark) anwenden zu können.
Die Unterteilung kann sukzessive
bis zu 15x durchgeführt werden.
Der Vorteil liegt auf der Hand: Alle
Daten für die Detailverbesserung
bleiben auf der GPU und die CPU
bleibt weitestgehend davon befreit.
Darüber hinaus kann mit weniger
Polygonen pro Modell gearbeitet
werden, was die Performance als
auch den Speicherbedarf optimiert.
Die Animation der detailreicheren
Modelle erfordert ebenfalls keinen
größeren Rechenaufwand, denn
die Tessellierung wird erst nach
dem Animieren durchgeführt. Die
bereits jetzt implementierte Tessellation-Einheit gewährt auch ein gewisses Maß an Zukunftssicherheit,
denn die nächste API-Roadmap
von Microsoft sieht vor, eine solche Einheit für eine der nächsten
DirectX-Versionen verpflichtend zu
machen.
EVGA E-GeForce
8800 Ultra Superclocked
Campingplatz: Für das „neue“ CFAA bezieht die GPU Samples aus benachbarten Pixeln mit in die Farbwertberechnung ein. Je nach Modus
variieren die Gewichtung sowie die Anzahl der Samples.
Das Postfix „Superclocked“ deutet
es bereits an: Die EVGA E-GeForce
8800 Ultra Superclocked wird mit
noch höheren Frequenzen betrieben, als eine normale GeForce
8800 GTX Ultra. Mit 655  MHz
Chip-, 1125 MHz Speicher- und
1660 MHz Shadertakt greift EVGA
nach der Performance-Krone. Äußerlich wirkt der Bolide aus dem
Hause EVGA jedoch recht unscheinbar, wie eine normale GeForce 8800 GTX Ultra.
Der großzügig dimensionierte
Kühler sorgt für moderate Temperaturen von maximal 82°C unter
Volldampf. Bei gemäßigtem Betrieb herrschen Temperaturen von
rund 62°C. Der Lüfter wurde leicht
versetzt und steht etwa 2 cm über
den Platinenrand hervor. Auf der
Rückseite verteilt eine mit Lamellen versehene Platte die Abwärme,
um sie besser an die Umgebung
abzuführen. Die Lautstärke der
Kühlung ist sowohl unter Last als
auch im Idle-Betrieb
der einer
normalen GeForce 8800 GTS sehr
ähnlich und Unterschiede sind
wohl nur im Direktvergleich auszumachen.
Die Leistungsfähigkeit der
EVGA Superclocked ist enorm.
Mit 12240 Punkten im 3DMark
06 bricht sie souverän durch die
12000-Punkte-Hürde. Die ohnehin
bereits stark übertaktete Karte ließ
allerdings keine nennenswerten
Taktsteigerungen unter der Referenzkühlung mehr zu. Ohnehin
kann die hervorragende Performance nur mit einem passenden
Unterbau
ausgereizt
werden.
Besonders die CPU steht hier in
der Verantwortung, genug Daten
herbei zu schaffen, sonst wird sie
schnell zum limitierenden Faktor.
Wer viel leistet, verbraucht
auch viel. Dieser Tradition verweigert sich auch die EVGA Superclocked nicht und schraubt den Verbrauch unseres Testsystems auf
bis zu 320 Watt.
ASUS
EN8800GTX Aquatank
Eine Wasserkühlung ist meist
ein Garant für eine leise Kühlung
bei gleichzeitig guten Overclockingleistungen. Das dies nicht
immer gilt, zeigen nun immer mehr
Hersteller mit ausgefuchsten Hybridkombinationen aus luftgekühlter High-End-Grafikkarte mit massiven Extrasteckkarten, die eine
Mini-Wasserkühlung
beinhalten.
Die ASUS EN8800GTX Aquatank
CFAA Kombinationen
Modus
Filter
4x CFAA
2x MSAA + Narrow Tent
6x CFAA
2x MSAA + Wide Tent oder 4x MSAA + Narrow Tent
8x CFAA
4x MSAA + Wide Tent
12x CFAA
8x MSAA + Narrow Tent oder 4x MSAA + Edge Detect
16x CFAA
8x MSAA + Wide Tent
24x CFAA
8x MSAA + Edge Detect
Hardwareluxx - 5/2007 - 39
Grafikkarten
[1]
Der Leistungsvergleich
Unsere Benchmarks wurden mit den Treibern der Versionsnummern
158.22 für NVIDIAs ForceWare durchgeführt. Die Sapphire Radeon HD
2900 XT wurde mit dem Treiber der Version 8.37.4.2 durch den Testparcours geschickt. Aus Platzgründen finden sich hier nur einige ausgesuchte Benchmarks. Unsere komplette Leistungsanalyse gibt es unter
dem LUXXLink 01268.
F.E.A.R.: - 1600 x 1200, 4x AA, 16x AF
Grafikkarte
Ergebnisse (Werte in fps)
EVGA GeForce 8800 Ultra SC
107 fps
ASUS EN8800GTX Aquatank
96 fps
MSI NX8800GTX OC
96 fps
Sapphire HD 2900 XT
66 fps
NVIDIA GeForce 8800 GTS
61 fps
0
20
40
60
80
100
120
Die hier zu Tage tretende Reihung entspräche auch der eines preislichen
Vergleichs. Die GeForce 8800 GTS ist geringfügig günstiger als die Sapphire HD 2900 XT und sortiert sich auch in diesem Performance Vergleich
knapp dahinter ein.
Call of Duty 2 - 1280 x 1024
Grafikkarte
81,8 fps
Sapphire HD 2900 XT
80,6 fps
73,0 fps
MSI NX8800GTX OC
72,2 fps
NVIDIA Geforce 8800GTS
60,8 fps
0
20
40
60
80
100
Bei niedrigen Auflösungen und ohne bildverbessernde Filter zeigt die
R600 Karte ihre Rohperformance, die nahezu gleich auf liegt mit der
EVGA e-GeForce 8800 GTX Ultra Superclocked. Ihre direkte Konkurrenz
in Form der GeForce 8800 GTS liegt etwa 20 fps dahinter. Der Unterschied beträgt über 30%.
Prey - 1600 x 1200
Grafikkarte
161,1 fps
146,3 fps
MSI NX8800GTX OC
145,9 fps
Sapphire HD 2900 XT
136,3 fps
103,3 fps
0
50
100
150
200
Hier können die GeForce 8800GTX-Modelle wieder ihre überlegenen
Shadertakte ausspielen. Aber auch hier schlägt die ATI Radeon HD2900
XT die GeForce 8800 GTS deutlich.
ist ein Vertreter dieser Gattung.
Der verwendete G80-Chip wird auf
630 MHz übertaktet. Ihm stehen
768 MB RAM mit 1030 MHz zur
Verfügung. Mit diesen Frequenzen
und der daraus resultierenden
Wärmeentwicklung wird die doppelte Kühlung spielend fertig, was
die Temperaturen von 46 °C bzw.
69 °C beweisen. Allerdings zwingt
die hierbei an den Tag gelegte
Lautstärke selbst jeden Wasserkühlungs-Laien zum Kopfschütteln. Der auf der Karte angebrachte
Lüfter dreht sich konstant und auf
kaum hörbarem Geräuschniveau.
Die mitgelieferte Zusatzkarte fällt
allerdings sehr negativ auf. Die
Pumpe ist mit einem hochfrequenten Geräusch sehr deutlich zu
hören, auch aus einem geschlossenen Gehäuse heraus. Der rote
Lüfter verursacht ein Rauschen,
das durchaus von etwas lauteren
Komponenten übertönt werden
kann. Dies wiederum nur auf der
„Low-Speed“-Option: An der Karte
befindet sich ein großer Schiebeschalter, der es erlaubt, zwischen
High- und Low-Speed zu wechseln. Die hochtourige Einstellung
verwandelt den Ventilator in einen
Fön und spätestens jetzt tönt die
ASUS Aquatank-Kombination aus
jedem gedämmten Gehäuse. An
den Temperaturen auf der Karte
ändert diese Einstellung hingegen
recht wenig. Eine dynamische,
adaptive Regelung existiert für die
beiden Lüfter leider nicht. Diese
werden direkt über zwei 12-V-Molex-Stecker gespeist.
Die aufwändige Kühlung verbraucht im Schnitt auf Low-Speed
etwa zwei Watt mehr als die Standardausführung. Mit 162 respektive
275 Watt liegt sie knapp über der in
den Taktraten vergleichbaren MSI
GeForce 8800GTX OC. Schaltet
man den Fön hinzu, steigert sich
die Energieaufnahme um etwa
zwei weitere Watt.
Der kleine Vorsprung im Bereich der Übertaktbarkeit ist marginal und spricht sich leider auch
nicht für die Hybridkühlung aus.
Bei einem Straßenpreis von etwa
600 Euro hätte man von dem gut
ein Kilogramm schweren Duo etwas mehr erwartet.
MSI
NX8800GTX T2D768E O
MSI präsentiert mit der NX8800GTX
OC ein Modell mit vergleichbaren
Taktraten wie dem ASUS Aquatank-Monstrum. Allerdings findet
Serious Sam 2 - 1600 x 1200, 4x AA, 16x AF
Grafikkarte
98,1 fps
90,9 fps
MSI NX8800GTX OC
89,1 fps
Sapphire HD 2900 XT
78,1 fps
60,3 fps
0
20
40
60
80
100
120
Der Unterschied zwischen den letzten beiden Plätzen beträgt wiederum
etwa 30%. Um weitere Positionen gutzumachen fehlen dem ATI-Modell
20 fps.
[1] Testsytem: Intel Core 2 Extreme X6800 (2,9 Ghz), Intel D975XBX, 2 x 1 GB CellShock DDR2/800, Samsung
SP2504C, Sony AW-G170A, Seasonic 750-Watt-Netzteil, Windows XP Pro SP 2
Ambivalent: Die ASUS EN8800 GTX Aquatank, sowie die meisten anderen Retail-Kombinationen mit einer Wasserkühlung-Extrakarte, vereint die
Nachteile von Luft- und Wasserkühlung perfekt.
Grafikkarten
Sisyphus: Die neue Tessellation-Einheit im R600 erhöht den Detailgrad von Modellen mit relativ geringer Polygonanzahl drastisch. Kombiniert mit
Techniken wie Displacement Mapping entstehen so realistische Abbildungen, ohne nennenswerten Performance-Verlust.
bei MSI die Referenzkühlung Verwendung. Diese hat nicht nur einen
Gewichtsvorteil, sondern verschafft
der GPU ausreichend Freiraum,
um die hochgeschraubten Taktraten zu stabilisieren. Zudem ist sie
im Handel deutlich günstiger zu
erwerben und kostet nur unwesentlich mehr als die Standardvariante desselben Herstellers. Große
Schwächen offenbart das Modell
jedenfalls nicht und für das Quäntchen Mehrleistung lohnt sich diese
Karte auf jeden Fall.
Sapphire HD 2900 XT
Lange hat es gedauert: Die ständigen Verschiebungen des R600Launch verärgerten viele, sonst
begeisterte ATI-Kunden. Nun ist
ATIs neuester Chip-Sprössling
bereits seit gut einem Monat auf
dem Markt, es wurden schon die
anfänglichen
Kinderkrankheiten
im Treibercode behandelt und die
ersten Käufer konnten bereits Er-
fahrungen mit dem roten Boliden
machen. Der erwartete, vielmehr
ersehnte Paukenschlag vieler ATIAnhänger, der NVIDIAs GeForce
8800 GTX in den Boden stampfen
sollte, ist ausgeblieben. Mittlerweile prophezeien die Nimmermüden
dies für das Chip-Update, welches
wohl im Herbst erfolgen soll.
Wenn man aber die erste Enttäuschung beiseite räumt, entsteht
ein ganz anderes Bild. Für den
vergleichbaren Preis zu einer GeForce 8800 GTS bietet die Radeon
HD2900 XT durchgehend bessere
Performance. Zusätzlich erkauft
sich der Nutzer die Hoffnung, dass
zukünftige Treiberupdates die Situation noch weiter verbessern.
Sapphire stellte uns ein Retail-Sample der Radeon HD2900
XT zur Verfügung, welches innerhalb der Referenzspezifikationen
betrieben wird. Die Taktfrequenzen
von ATIs Topmodell belaufen sich
auf krumme 743 MHz Chip- sowie
828 MHz Speichertakt. Die internen
Shadereinheiten arbeiten ebenfalls
mit 828 MHz. ATI setzt hier also auf
synchrone Taktraten im Gegensatz
zu NVIDIA, die ihre Stream-Prozessoren deutlich schneller schlagen lassen als die G80-GPU selber. Der R600 ist, genau wie die
Vorgängerrevision R580+, für die
Verwendung von GDDR4 Speicher vorgesehen. Das derzeit
(ebenso wie bei NVIDIA) noch
auf GDDR3-RAM zurückgegriffen
wird, ist schlicht und ergreifend
eine Kostenfrage. Die aggressive
Preispolitik von ATI erfordert hier
eine kühle Kalkulation. Trotzdem
ermöglicht ein spätererer Einsatz
von GDDR4-Speicher noch einen
weiteren Leistungsschub. Der G80
kann zwar auch mit dem schnellen Speichertyp umgehen, diesen
allerdings nur über einen 384 Bit
breiten Bus ansprechen. Der R600
verfügt hier über ein 512 Bit breites
Interface und sollte daher in speicherlastigen Anwendungen einige
Vorteile genießen. Bereits heute
sind ähnliche Phänomene ersichtlich. In der Rohperformance, bei
niedrigen Auflösungen und ohne
bildverbessernde Filter überholt
die HD2900 XT bereits heute eine
GeForce 8800 GTX und liegt nur
ganz knapp hinter der GeForce
8800 GTX Ultra Superclocked von
EVGA (vgl. Benchmarks auf der
nächsten Seite).
Im Overclocking zeigte sich
die Sapphire-Karte durchaus tolerant. Der Speicher ließ sich auf
bis zu 935 MHz übertakten, was
einer Steigerung von knapp 13 %
entspricht. Die GPU machte knapp
14 % mit und lief bis zu 845 MHz
8x NT
Es lässt sich gut erkennen, dass
die
Wide-Tent-(WT)-Einstellung
gegenüber vergleichbaren Narrow-Tent-(NT)-Modi eine sichtbare
Unschärfe (besonders am Zaun)
erzeugt, welche das Bild im Direktvergleich zwar beeinträchtigt,
im Spielbetrieb aber nicht zwangsläufig stört. Die, über ein kleines
Extra Tool freigeschalteten, EdgeDetect-(ED)-Modi wirken hingegen
deutlich schärfer, sogar als das mit
Narrow-Tent-Verfahren durchgeführte Antialiasing. Die kompletten
Screenshots gibt es unter LUXXLink LL01281.
CFAA Modi im Vergleich
Ohne AA
2x NT
2x WT
Screenshots aus dem Spiel Half-Life 2 von Valve.
4x NT
4x WT
4x ED
8x WT
8x ED
Grafikkarten
stabil. Aus einschlägigen Foren
sind, besonders unter Wasserkühlung, noch deutlich höhere Ergebnisse bekannt. Mit den erreichten
Taktraten wurden 11447 Punkte im
3DMark 06 ermittelt, unübertaktet
immer noch gute 10806 Punkte.
ATI verbaut auf der Platine
einen 6-Pol- und einen 8-PolStromanschluss. Letzterer bietet
allerdings auch die Möglichkeit, ein
normales 6-poliges PCI-ExpressStromkabel einzuklinken, was nach
unseren Tests keinerlei Nachteile
zur Folge hatte. Auch das Übertakten funktionierte damit problemlos.
In Sachen Stromverbrauch hat die
ATI-Karte die Nase vorn. Im Gegensatz zur Konkurrenz gönnt sie
sich gerne einen etwas größeren
Schluck aus dem örtlichen
Energienetz. Unser
Testsystem
v e r -
brauchte bei eingebauter HD2900
XT 172 Watt im Idle-Betrieb, sowie
310 Watt unter Volllast. Der Wert
unter maximaler Auslastung ist
unter Verwendung des aktuellsten
Treibers im Vergleich zu dessen
Vorgänger leicht angestiegen.
Der verbaute Kühler erinnert
entfernt an den NVIDIA G80-Kühlkörper und arbeitet auch ähnlich
effektiv. Mit 62 °C bei fehlender
Auslastung blieb die GPU angenehm temperiert. Die Geräuschentwicklung ist nahe an der Unhörbarkeitsgrenze. Unter Last ändert sich
das natürlich und der Abstand zur
hervorragenden G80-Kühlung vergrößert sich leider etwas, denn ATI
sorgt ein bisschen lauter für Frischluft als die schwarz gefärbten Luftverwirbler bei NVIDIA.
In der Verpackung findet sich
ein DVI- auf HDMI-Adapter, welcher in der Lage ist, neben dem
HD-Videosignal auch Audiodaten
Richtung Wiedergabegerät zu
schicken. Die Radeon
HD2000 GPU besitzt darüber hinaus
einen eigenen Audio-Controller, der
den Tonpfad selbst
verwalten kann und so
nicht mehr auf eine externe Zuführung des Audiosignals von der Soundkarte
angewiesen ist. Eine Soundkar-
te oder ein Onboard-Sound wird
allerdings weiterhin benötigt.
Fazit
NVIDIA hat immer noch die Performance-Krone auf dem Haupt.
ATIs Generationswechsel auf die
HD2000er-Serie konnte daran
nichts ändern. Natürlich ist die
Konkurrenz zwischen hochgezüchteten und am Markt bereits situierten Grafikkarten und dem gerade
erschienenen R600 in seiner Release-Revision nicht hundertprozentig fair. Aber die HD2900 XT
ist nunmal das Schnellste, was ATI
derzeit zu bieten hat - und dies zu
einem unschlagbaren Preis.
Das Topmodell der Kanadier
wildert eher in Preisregionen der
GeForce 8800 GTS, bietet aber
meist bessere Leistung. In manchen Anwendungen kann sie sogar NVIDIAs GeForce 8800 GTX
überholen. Hierfür bekommt sie
unseren
Preis-/Leistungsaward.
Gerade mit der Verbesserung der
Treiber konnte uns die Karte immer
besser gefallen.
EVGA bietet mit der e-GeForce 8800 GTX Ultra Superclocked nicht nur einen enorm langen
Produktnamen, sondern vor allem
eines: brachiale Leistung zu einem
brachialen Preis. Unter einer Retail-Luftkühlung entwickelt sich nir-
gendwo mehr Power als hier. Wer
genug Geld übrig hat, auf PreisLeistungsverhältnisse keinen Wert
legt und dazu noch etwas Prestige
ernten will, kann hier absolut zugreifen. Für die überragende Leistung ist natürlich der Hardwareluxx
Excellent Hardware Award prädestiniert.
Die ASUS EN8800GTX Aquatank meint es gut und schickt sich
an, eine Wasserkühlung einfach
und unkompliziert zu machen, was
ihr auch hervorragend gelingt. Aber
mit der Einfachheit holt man sich
leider auch einen unerwünschten
Nebeneffekt ins Boot. Die Lautstärke des Gespanns zeugt nicht
von einer Wasserkühlung und die
Übertaktbarkeit hielt sich bei unseren Tests auch in Grenzen. Die
Aquatank und viele weitere derartige Hybrid-Produkte vereinen nicht
die Vorteile von Luft- und Wasserkühlung: Einfachheit und gute Performance bei geringer Lautstärke,
sondern deren Nachteile: Lautstärke und Preis.
Die MSI NX8800GTX bietet
hier ein besseres Preis-/Leistungsverhältnis. Die Referenzkühlung
ist für die gesteigerten Taktraten
absolut ausreichend und produziert deutlich weniger Lärm. Neben
MSI bieten auch andere Hersteller
derartige Karten an. Ein Vergleich
lohnt sich hier besonders.
Alle Grafikkarten im Vergleich
Hersteller und
Bezeichnung
Straßenpreis
Homepage
ASUS
EN8800GTX Aquatank
EVGA
e-GeForce 8800 Ultra Superclocked
MSI
NX8800GTX T2D768E OC
ATI/Sapphire
Radeon HD2900XT
600 €
770 €
540 €
320 €
www.ASUS.de
www.evga.com
www.msi-computer.de
www.sapphiretech.com
Technische Details
GPU
G80
G80
G80
R600
GPU-Takt
630 MHz
655 MHz
630 MHz
743 MHz
Speichertakt
1030 MHz
1125 MHz
1000 MHz
Speichertyp
828 MHz
GDDR-III
GDDR-III
Speichergröße
786 MB
512 MB
Speicherinterface
384 Bit
Speicherbandbreite
98,8 GB/s
Shader Model Version
96,0 GB/s
106,0 GB/s
4
Stream Prozessoren
Stream Prozessor Takt
512 Bit
108,0 GB/s
128
1460 MHz
1660 MHz
GPU-Takt
640 MHz
Speichertakt
1060 MHz
3DMark06 (standard)
11592 Punkte
3DMark06 (übertaktet)
11701 Punkte
320 (5*64)
1450 MHz
828 MHz
-
630 MHz
845 MHz
-
1040 MHz
935 MHz
12240 Punkte
11541 Punkte
10806 Punkte
11602 Punkte
11447 Punkte
Overclocking
Stromverbrauch
Idle-Modus
162 Watt
187 Watt
160 Watt
172 Watt
Last-Modus
275 Watt
320 Watt
275 Watt
310 Watt
Software
Treiber-CD, 3DMark06, Ghost
Recon: Advanced Warfighter, GTI
Racing
Treiber-CD
Treiber-CD, Company of Heroes,
CyberLink PowerCinema, Cyberlink
Power2Go
Treiber-CD, 3DMark06, CyberLink
PowerDVD 6, CyberLink PowerDirector 4 DE
Hardware
DVI/VGA Konverter, 2 PCI-E Stromadapter, Komponenten/S-Video
Adapter
2 DVI/VGA Konverter, 2 PCI-E Stromadapter, Komponenten/S-Video
Adapter, S-Video Kabel
DVI/VGA Konverter, 2 PCI-E Stromadapter, Komponenten/S-Video
Adapter, S-Video Kabel
2 DVI/VGA Konverter, DVI/HDMI
Adapter, Crossfire Bridge, Komponenten Adapter, Cinch/S-Video
Adapter
Lieferumfang
Grafikkarten
R600-Architektur im Überblick
Die 700 Millionen Transistoren des
R600 werden in einer 80-nm-Bauweise von TSMC gefertigt. Spätere
Chip-Releases sollen dann auf
65 nm basieren und entsprechend
höhere Taktraten und eine bessere
TDP bieten.
ATI setzt zum ersten Mal
eine
Unified-Shader-Architektur
bei einer PC-Grafik ein und verabschiedet sich von dedizierten Vertex- und Pixelshadern. Die Shader
Einheiten sind in der Lage sowohl
Pixel-, Vertex- als auch Geometrieoperationen durchzuführen. Die
Entwickler konnten hier auf Erfahrung aus der Fertigung der Xbox
360 GPU „Xenos“ zurückgreifen.
Der von ATI entwickelte Chip ist der
architektonische Vater des R600
und hat mit ihm mehr Gemeinsamkeiten als etwa die Vorgänger aus
der PC-Grafik.
Am Beginn der Verarbeitungskette steht der Command Processor. Dieser nimmt die Daten vom
Grafikkartentreiber entgegen und
führt Microcode aus. Hiermit entlastet er die CPU um bis zu 30%
(Angabe von ATI) sowohl bei DirectX-9-, als auch DirectX-10-Anwendungen. Der nachgeschaltete
Komplex der Setup Engine bereitet
die Daten für eine Verarbeitung in
den Stream Prozessoren auf und
übermittelt sie sortiert nach den
Funktionen für Vertex-, Geometrie- und Pixelshader an den UltraThreaded Dispatch Processor.
Die Daten gelangen je nach
Typ in eine Command Queue, um
anschließend als Thread weiterverarbeitet zu werden. Jeder Thread
besteht aus einigen Instruktionen,
die auf einen Eingabedatenblock
angewendet werden.
Die eigentlichen Stream-Prozessoren sind in vier SIMD (Single
Instruction, Multiple Data) organisiert. Diese werden von je zwei Arbitern und Sequencern mit Threads
gefüttert. Die duale Ausführung erlaubt es, immer zwei Operationen
gleichzeitig in der Pipeline für die
SIMD Arrays zu haben.
Für Texture- und Vertex-Fetch
Operationen stehen dedizierte
Arbiter und Sequencer zur Verfügung, die unabhängig von den Berechnungsoperationen angesteuert
werden können. Schon in Bearbeitung befindliche Threads können
auch in einen Wartezustand versetzt werden, wenn ein Thread mit
höherer Priorität aus der Command
Queue gezogen wird.
Die eigentlichen Shader bestehen aus fünf skalaren Funktionseinheiten, die pro Taktzyklus auch fünf
arithmetische Operationen (FP32
MADD) durchführen können. Bei
64 solcher Einheiten (organisiert
in vier SIMD Arrays) können also
320 solcher Operationen pro Takt
durchgeführt werden. Eine der fünf
Einheiten kann darüber hinaus
auch transzendente Operationen,
wie Sinus oder Cosinus berechnen.
Die Branch Execution Unit kümmert sich um die Kontrolle des Datenflusses und entbindet somit die
fünf Stream-Prozessor-Einheiten
von dieser Aufgabe. Das General
Purpose Register speichert Werte
der Ein- und Ausgabedaten sowie
temporäre Informationen.
Parallel zu den Shader Prozessoren liegen die Texture Units.
Diese erhalten Anfragen von dem
Filter Units, die für Aufgaben wie
die anisotrope Filterung zuständig
sind. Auf jeder der Einheiten sitzen
zudem noch je 20 Texture Samplers. Diese sind pro Taktzyklus in
der Lage einen Wert aus dem Cache abzurufen.
Die Render Back Ends bilden die Schnittstelle zum Grafikspeicher. Nachdem die Farb-, Alpha- (Transparenz) und Z-Werte
(Tiefeninformation) bereits in den
vorigen Schritten festgelegt wurden, ist es nun an den Render Back
Ends festzustellen, ob ein Pixel
überhaupt sichtbar ist oder durch
dedizierten Texture Fetch Arbiter
und Sequencer. Insgesamt stehen
auf dem Radeon HD2900 XT vier
Textureinheiten zur Verfügung. Auf
jeder Texture Unit befinden sich
acht Einheiten zur Textur-Adressierung im Cache und vier Texture
andere verdeckt wird (depth/stencil
Test). Die HD2900 schleust 32 Pixel pro Takt durch diesen Test. Die
Einheit für das Multisampling Antialiasing (MSAA) ist programmierbar
und erlaubt so das neu eingeführte
Costum Filter Antialiasing (CFAA).
Hardwareluxx - 5/2007 - 45

Kampf der Giganten

Transcription

Similar documents

Sicher übertakten

Transmissionselektronenmikroskopie im Rahmen der LV

Der Umsturz des postural-strukturalen biomechanischen

CableMaster CM400 - Softing IT Networks

Allgemeine Bedingungen des Schlussscheins „Germania

2006 - Donzi Marine

Schwarzhandel - Hardwareluxx

Mitsubishi HC5000

SMARTguide - Cleverdis

Klassenkampf für Spieler

CPU Kühler - ARCTIC Catalog