Kampf der Giganten
Transcription
Kampf der Giganten
Grafikkarten Kampf der Giganten Die Grafikkarten-Topmodelle im direkten Leistungsvergleich Schneller geht es derzeit nicht: AMDs Radeon HD2900 XT und NVIDIAs GeForce 8800 GTX Ultra stellen derzeit die Krone der Grafikkartenschöpfung beider Hersteller dar. Doch auch „normale“ GeForce 8800-GTX-Modelle existieren in übertakteten Versionen und kämpfen um einen Platz auf dem Treppchen. Neben einem Leistungsvergleich werden in diesem High-End-Artikel auch ATIs neue Chipfeatures des R600 und dessen Architektur diskutiert. von N. Emig AMD hat Mitte Mai endlich auch den DirectX-10-Nachwuchs zur Welt gebracht. Wo NVIDIA bereits seit Ende 2006 Stückzahlen absetzt, müssen die Kanadier noch ordentlich aufholen. Das derzeitige Flaggschiff, die Radeon HD2900 XT konnte den hoch gesteckten Erwartungen, auch aufgrund bislang schlecht optimierter Treiber, noch nicht gerecht werden, zeigt aber gute Ansätze in der Rohperformance. Nichtsdestoweniger haben sich die Ingenieure bei NVIDIA nicht auf die faule Haut gelegt, sondern für Nachschub gesorgt. Sowohl im Midrange-, als auch im High-End-Segment wurden neue Karten vorgestellt. Die GeForce 8800 GTX war bei den ersten Tests der Radeon HD2900 XT in vielen Bereichen überlegen. Trotzdem setzt NVIDIA noch eins oben drauf und präsentiert die GeForce 8800 Ultra mit weiter erhöhten Taktraten. In Zahlen bedeutet das: 612 MHz Chip-, 1080 MHz Speicher- und 38 - Hardwareluxx - 5/2007 1500 MHz Shadertakt. Eine standardmäßig getaktete GeForce 8800 GTX kann hier „nur“ 575, 900 und 1350 MHz vorweisen. Die weiteren Rohdaten sind gleich geblieben, so verfügt die GeForce 8800 Ultra weiterhin über 128 StreamProzessoren, 786 MB RAM und ein 384 Bit breites Speicher-Interface. Auf der ATI-Karte werkelt hingegen ein mit 742 MHz getakteter Chip, der über ein 512 Bit breites Interface mit dem Speicher verbunden ist. Dieser arbeitet mit 828 MHz und hat eine Größe von 512 MB. Im Inneren des R600 schuften 320 Stream-Prozessoren mit 742 MHz Takt. Wobei die Zahl nicht stur mit den 128 Einheiten bei NVIDIA verglichen werden kann und darf: Architektonisch gesehen besitzt der R600 64 Shader Einheiten, die bei voller Auslastung je fünf Berechnungen pro Taktzyklus durchführen können, was nach Multiplikation zu den beschriebenen 320 StreamProzessoren führt. Der G80 verarbeitet pro Taktzyklus nur einen bzw. maximal zwei Rechenschritte, wobei die Taktfrequenz der Shader deutlich höher liegt. Eine ständige Vollauslastung der R600 Shader Einheiten der Radeon HD2900 XT würde wahrscheinlich in einer hervorragenden Performance resultieren, jedoch müssen die Anfragen vom Treiber und den Prozessoren vorgeschalteten Modulen auch dahingehend aufbereitet werden. Diese müssten permanent fünf Berechnungsanfragen in die Pipeline schicken, um die Vollauslastung zu gewährleisten. Wahrscheinlich liegt hier der Flaschenhals, der den R600 noch ausbremst. AMD wird daher sicherlich noch Anpassungen am Treiber vornehmen, die auch gute Aussichten auf eine spürbare Performanceverbesserung haben. Derartige Verbesserungen hielten bereits mit den ersten Treiberupdates Einzug. Der Versionssprung des Catylst auf 8.37.4.2 hatte in einigen Anwendungen deutliche Leistungszuwächse zur Folge. Besonders der starke Performance-Verlust bei Zuschaltung von Antialiasing oder anisotropem Filter wurde eingedämmt. ATIs neue Kleider Neben den architektonischen Neuheiten des R600-Chips (siehe Kasten auf Seite 43) werden natürlich auch technologische Innovationen implementiert und vorgestellt. Dazu gehören etwa Features wie das Custom Filter Antialiasing (CFAA) und Tesselation. CFAA ist ein neuer Antialiasing-Modus, der zur Farbbestimmung eines Pixels weitere Samples aus benachbarten Pixeln in die Berechnung mit einbezieht. Das geschieht, indem sozusagen ein kleineres oder grö- Grafikkarten ßeres Zelt um das jeweilige Pixel gespannt wird und anschließend überprüft wird, welche Samples der Nachbarpixel innerhalb der virtuellen Grenze liegen. Diese werden dann zu unterschiedlichen Gewichtungen - je nach Entfernung zum Zentrum - in die Berechnung des Farbwertes mit einbezogen. Da hier Informationen über eine größere Fläche interpoliert und anschließend auf die Farbe eines einzelnen Pixels kondensiert werden, sowie dieselben Subpixel in die Berechnung für verschiedene Pixelfarbwerte eingehen, entsteht zwangsläufig eine Unschärfe. Wie stark diese ausfällt hängt vom verwendeten Modus ab. Je größer das gespannte Zelt ist, umso mehr Informationen werden interpoliert und umso größer wird die Unschärfe. ATI unterscheidet hier zwischen einem Narrow- und einem WideTent-Modus, die bezeichnend für die Größe der verwendeten Samplingfläche stehen. Besonders bei dünnen und linienhaften Strukturen kann eine allzu großzügige Bedienung an Nachbarsamples problematisch werden. Ein dünnes, schwarzes Kabel vor einem hellen Himmel wird so schnell in ein graues Fädchen mutieren. Neben den „Zelt-Filtern“ existiert noch ein weiterer Modus, der Edge Detect Filter. Dieser sucht im gerenderten Bild nach Kanten. Die dortigen Pixel werden dann mit einer höheren Anzahl an Samples entlang der Kante gefiltert. Kantenferne Bildinhalte erfahren eine Standardbehandlung im Sinne einer gewöhnlichen MSAA-„Box“-Filterung. Das spart Performance und glättet treppchenaffine Bildinhalte an den Kanten stärker. CFAA erfordert allerdings keine hardwareseitige Unterstützung. Alles nötige kann im Treiber erledigt werden. NVIDIAs GeForce 8800 ist also theoretisch auch in der Lage, CFAA oder sonstige „Costum Filter“ nachzurüsten. Allerdings ist es fraglich, ob die Kalifornier diesen Weg einschlagen werden, denn die schlechten Erfahrungen mit dem CFAA-ähnlichen Filter Quincunx, der mit der GeForce-3-Generation vorgestellt wurde und das gesamte Bild durch geringe Schärfe verunstaltete, wollen kein zweites mal gemacht werden. Mehr neue Kleider Eine weitere Neuerung ist der so genannte Tessellator (Tessellation: zu Deutsch das Mosaik). Diese Hardwareeinheit ist in der Lage, ein Polygon in mehrere Untereinheiten aufzuteilen und somit den Detailgrad eines Modells deutlich zu erhöhen. In Kombination mit Tech- niken wie Displacement Mapping können so sehr realistische Charaktere und Modelle geschaffen werden. Da es mehrere Wege gibt eine Fläche aufzuteilen, wurde der Tesselator darauf ausgelegt, flexibel zu sein und verschiedene Unterteilungsalgorithmen (etwa Catmull-Clark) anwenden zu können. Die Unterteilung kann sukzessive bis zu 15x durchgeführt werden. Der Vorteil liegt auf der Hand: Alle Daten für die Detailverbesserung bleiben auf der GPU und die CPU bleibt weitestgehend davon befreit. Darüber hinaus kann mit weniger Polygonen pro Modell gearbeitet werden, was die Performance als auch den Speicherbedarf optimiert. Die Animation der detailreicheren Modelle erfordert ebenfalls keinen größeren Rechenaufwand, denn die Tessellierung wird erst nach dem Animieren durchgeführt. Die bereits jetzt implementierte Tessellation-Einheit gewährt auch ein gewisses Maß an Zukunftssicherheit, denn die nächste API-Roadmap von Microsoft sieht vor, eine solche Einheit für eine der nächsten DirectX-Versionen verpflichtend zu machen. EVGA E-GeForce 8800 Ultra Superclocked Campingplatz: Für das „neue“ CFAA bezieht die GPU Samples aus benachbarten Pixeln mit in die Farbwertberechnung ein. Je nach Modus variieren die Gewichtung sowie die Anzahl der Samples. Das Postfix „Superclocked“ deutet es bereits an: Die EVGA E-GeForce 8800 Ultra Superclocked wird mit noch höheren Frequenzen betrieben, als eine normale GeForce 8800 GTX Ultra. Mit 655 MHz Chip-, 1125 MHz Speicher- und 1660 MHz Shadertakt greift EVGA nach der Performance-Krone. Äußerlich wirkt der Bolide aus dem Hause EVGA jedoch recht unscheinbar, wie eine normale GeForce 8800 GTX Ultra. Der großzügig dimensionierte Kühler sorgt für moderate Temperaturen von maximal 82°C unter Volldampf. Bei gemäßigtem Betrieb herrschen Temperaturen von rund 62°C. Der Lüfter wurde leicht versetzt und steht etwa 2 cm über den Platinenrand hervor. Auf der Rückseite verteilt eine mit Lamellen versehene Platte die Abwärme, um sie besser an die Umgebung abzuführen. Die Lautstärke der Kühlung ist sowohl unter Last als auch im Idle-Betrieb der einer normalen GeForce 8800 GTS sehr ähnlich und Unterschiede sind wohl nur im Direktvergleich auszumachen. Die Leistungsfähigkeit der EVGA Superclocked ist enorm. Mit 12240 Punkten im 3DMark 06 bricht sie souverän durch die 12000-Punkte-Hürde. Die ohnehin bereits stark übertaktete Karte ließ allerdings keine nennenswerten Taktsteigerungen unter der Referenzkühlung mehr zu. Ohnehin kann die hervorragende Performance nur mit einem passenden Unterbau ausgereizt werden. Besonders die CPU steht hier in der Verantwortung, genug Daten herbei zu schaffen, sonst wird sie schnell zum limitierenden Faktor. Wer viel leistet, verbraucht auch viel. Dieser Tradition verweigert sich auch die EVGA Superclocked nicht und schraubt den Verbrauch unseres Testsystems auf bis zu 320 Watt. ASUS EN8800GTX Aquatank Eine Wasserkühlung ist meist ein Garant für eine leise Kühlung bei gleichzeitig guten Overclockingleistungen. Das dies nicht immer gilt, zeigen nun immer mehr Hersteller mit ausgefuchsten Hybridkombinationen aus luftgekühlter High-End-Grafikkarte mit massiven Extrasteckkarten, die eine Mini-Wasserkühlung beinhalten. Die ASUS EN8800GTX Aquatank CFAA Kombinationen Modus Filter 4x CFAA 2x MSAA + Narrow Tent 6x CFAA 2x MSAA + Wide Tent oder 4x MSAA + Narrow Tent 8x CFAA 4x MSAA + Wide Tent 12x CFAA 8x MSAA + Narrow Tent oder 4x MSAA + Edge Detect 16x CFAA 8x MSAA + Wide Tent 24x CFAA 8x MSAA + Edge Detect Hardwareluxx - 5/2007 - 39 Grafikkarten [1] Der Leistungsvergleich Unsere Benchmarks wurden mit den Treibern der Versionsnummern 158.22 für NVIDIAs ForceWare durchgeführt. Die Sapphire Radeon HD 2900 XT wurde mit dem Treiber der Version 8.37.4.2 durch den Testparcours geschickt. Aus Platzgründen finden sich hier nur einige ausgesuchte Benchmarks. Unsere komplette Leistungsanalyse gibt es unter dem LUXXLink 01268. F.E.A.R.: - 1600 x 1200, 4x AA, 16x AF Grafikkarte Ergebnisse (Werte in fps) EVGA GeForce 8800 Ultra SC 107 fps ASUS EN8800GTX Aquatank 96 fps MSI NX8800GTX OC 96 fps Sapphire HD 2900 XT 66 fps NVIDIA GeForce 8800 GTS 61 fps 0 20 40 60 80 100 120 Die hier zu Tage tretende Reihung entspräche auch der eines preislichen Vergleichs. Die GeForce 8800 GTS ist geringfügig günstiger als die Sapphire HD 2900 XT und sortiert sich auch in diesem Performance Vergleich knapp dahinter ein. Call of Duty 2 - 1280 x 1024 Grafikkarte Ergebnisse (Werte in fps) EVGA GeForce 8800 Ultra SC 81,8 fps Sapphire HD 2900 XT 80,6 fps ASUS EN8800GTX Aquatank 73,0 fps MSI NX8800GTX OC 72,2 fps NVIDIA Geforce 8800GTS 60,8 fps 0 20 40 60 80 100 Bei niedrigen Auflösungen und ohne bildverbessernde Filter zeigt die R600 Karte ihre Rohperformance, die nahezu gleich auf liegt mit der EVGA e-GeForce 8800 GTX Ultra Superclocked. Ihre direkte Konkurrenz in Form der GeForce 8800 GTS liegt etwa 20 fps dahinter. Der Unterschied beträgt über 30%. Prey - 1600 x 1200 Grafikkarte Ergebnisse (Werte in fps) EVGA GeForce 8800 Ultra SC 161,1 fps ASUS EN8800GTX Aquatank 146,3 fps MSI NX8800GTX OC 145,9 fps Sapphire HD 2900 XT 136,3 fps NVIDIA Geforce 8800GTS 103,3 fps 0 50 100 150 200 Hier können die GeForce 8800GTX-Modelle wieder ihre überlegenen Shadertakte ausspielen. Aber auch hier schlägt die ATI Radeon HD2900 XT die GeForce 8800 GTS deutlich. ist ein Vertreter dieser Gattung. Der verwendete G80-Chip wird auf 630 MHz übertaktet. Ihm stehen 768 MB RAM mit 1030 MHz zur Verfügung. Mit diesen Frequenzen und der daraus resultierenden Wärmeentwicklung wird die doppelte Kühlung spielend fertig, was die Temperaturen von 46 °C bzw. 69 °C beweisen. Allerdings zwingt die hierbei an den Tag gelegte Lautstärke selbst jeden Wasserkühlungs-Laien zum Kopfschütteln. Der auf der Karte angebrachte Lüfter dreht sich konstant und auf kaum hörbarem Geräuschniveau. Die mitgelieferte Zusatzkarte fällt allerdings sehr negativ auf. Die Pumpe ist mit einem hochfrequenten Geräusch sehr deutlich zu hören, auch aus einem geschlossenen Gehäuse heraus. Der rote Lüfter verursacht ein Rauschen, das durchaus von etwas lauteren Komponenten übertönt werden kann. Dies wiederum nur auf der „Low-Speed“-Option: An der Karte befindet sich ein großer Schiebeschalter, der es erlaubt, zwischen High- und Low-Speed zu wechseln. Die hochtourige Einstellung verwandelt den Ventilator in einen Fön und spätestens jetzt tönt die ASUS Aquatank-Kombination aus jedem gedämmten Gehäuse. An den Temperaturen auf der Karte ändert diese Einstellung hingegen recht wenig. Eine dynamische, adaptive Regelung existiert für die beiden Lüfter leider nicht. Diese werden direkt über zwei 12-V-Molex-Stecker gespeist. Die aufwändige Kühlung verbraucht im Schnitt auf Low-Speed etwa zwei Watt mehr als die Standardausführung. Mit 162 respektive 275 Watt liegt sie knapp über der in den Taktraten vergleichbaren MSI GeForce 8800GTX OC. Schaltet man den Fön hinzu, steigert sich die Energieaufnahme um etwa zwei weitere Watt. Der kleine Vorsprung im Bereich der Übertaktbarkeit ist marginal und spricht sich leider auch nicht für die Hybridkühlung aus. Bei einem Straßenpreis von etwa 600 Euro hätte man von dem gut ein Kilogramm schweren Duo etwas mehr erwartet. MSI NX8800GTX T2D768E O MSI präsentiert mit der NX8800GTX OC ein Modell mit vergleichbaren Taktraten wie dem ASUS Aquatank-Monstrum. Allerdings findet Serious Sam 2 - 1600 x 1200, 4x AA, 16x AF Grafikkarte Ergebnisse (Werte in fps) EVGA GeForce 8800 Ultra SC 98,1 fps ASUS EN8800GTX Aquatank 90,9 fps MSI NX8800GTX OC 89,1 fps Sapphire HD 2900 XT 78,1 fps NVIDIA Geforce 8800GTS 60,3 fps 0 20 40 60 80 100 120 Der Unterschied zwischen den letzten beiden Plätzen beträgt wiederum etwa 30%. Um weitere Positionen gutzumachen fehlen dem ATI-Modell 20 fps. [1] Testsytem: Intel Core 2 Extreme X6800 (2,9 Ghz), Intel D975XBX, 2 x 1 GB CellShock DDR2/800, Samsung SP2504C, Sony AW-G170A, Seasonic 750-Watt-Netzteil, Windows XP Pro SP 2 40 - Hardwareluxx - 5/2007 Ambivalent: Die ASUS EN8800 GTX Aquatank, sowie die meisten anderen Retail-Kombinationen mit einer Wasserkühlung-Extrakarte, vereint die Nachteile von Luft- und Wasserkühlung perfekt. Grafikkarten Sisyphus: Die neue Tessellation-Einheit im R600 erhöht den Detailgrad von Modellen mit relativ geringer Polygonanzahl drastisch. Kombiniert mit Techniken wie Displacement Mapping entstehen so realistische Abbildungen, ohne nennenswerten Performance-Verlust. bei MSI die Referenzkühlung Verwendung. Diese hat nicht nur einen Gewichtsvorteil, sondern verschafft der GPU ausreichend Freiraum, um die hochgeschraubten Taktraten zu stabilisieren. Zudem ist sie im Handel deutlich günstiger zu erwerben und kostet nur unwesentlich mehr als die Standardvariante desselben Herstellers. Große Schwächen offenbart das Modell jedenfalls nicht und für das Quäntchen Mehrleistung lohnt sich diese Karte auf jeden Fall. Sapphire HD 2900 XT Lange hat es gedauert: Die ständigen Verschiebungen des R600Launch verärgerten viele, sonst begeisterte ATI-Kunden. Nun ist ATIs neuester Chip-Sprössling bereits seit gut einem Monat auf dem Markt, es wurden schon die anfänglichen Kinderkrankheiten im Treibercode behandelt und die ersten Käufer konnten bereits Er- fahrungen mit dem roten Boliden machen. Der erwartete, vielmehr ersehnte Paukenschlag vieler ATIAnhänger, der NVIDIAs GeForce 8800 GTX in den Boden stampfen sollte, ist ausgeblieben. Mittlerweile prophezeien die Nimmermüden dies für das Chip-Update, welches wohl im Herbst erfolgen soll. Wenn man aber die erste Enttäuschung beiseite räumt, entsteht ein ganz anderes Bild. Für den vergleichbaren Preis zu einer GeForce 8800 GTS bietet die Radeon HD2900 XT durchgehend bessere Performance. Zusätzlich erkauft sich der Nutzer die Hoffnung, dass zukünftige Treiberupdates die Situation noch weiter verbessern. Sapphire stellte uns ein Retail-Sample der Radeon HD2900 XT zur Verfügung, welches innerhalb der Referenzspezifikationen betrieben wird. Die Taktfrequenzen von ATIs Topmodell belaufen sich auf krumme 743 MHz Chip- sowie 828 MHz Speichertakt. Die internen Shadereinheiten arbeiten ebenfalls mit 828 MHz. ATI setzt hier also auf synchrone Taktraten im Gegensatz zu NVIDIA, die ihre Stream-Prozessoren deutlich schneller schlagen lassen als die G80-GPU selber. Der R600 ist, genau wie die Vorgängerrevision R580+, für die Verwendung von GDDR4 Speicher vorgesehen. Das derzeit (ebenso wie bei NVIDIA) noch auf GDDR3-RAM zurückgegriffen wird, ist schlicht und ergreifend eine Kostenfrage. Die aggressive Preispolitik von ATI erfordert hier eine kühle Kalkulation. Trotzdem ermöglicht ein spätererer Einsatz von GDDR4-Speicher noch einen weiteren Leistungsschub. Der G80 kann zwar auch mit dem schnellen Speichertyp umgehen, diesen allerdings nur über einen 384 Bit breiten Bus ansprechen. Der R600 verfügt hier über ein 512 Bit breites Interface und sollte daher in speicherlastigen Anwendungen einige Vorteile genießen. Bereits heute sind ähnliche Phänomene ersichtlich. In der Rohperformance, bei niedrigen Auflösungen und ohne bildverbessernde Filter überholt die HD2900 XT bereits heute eine GeForce 8800 GTX und liegt nur ganz knapp hinter der GeForce 8800 GTX Ultra Superclocked von EVGA (vgl. Benchmarks auf der nächsten Seite). Im Overclocking zeigte sich die Sapphire-Karte durchaus tolerant. Der Speicher ließ sich auf bis zu 935 MHz übertakten, was einer Steigerung von knapp 13 % entspricht. Die GPU machte knapp 14 % mit und lief bis zu 845 MHz 8x NT Es lässt sich gut erkennen, dass die Wide-Tent-(WT)-Einstellung gegenüber vergleichbaren Narrow-Tent-(NT)-Modi eine sichtbare Unschärfe (besonders am Zaun) erzeugt, welche das Bild im Direktvergleich zwar beeinträchtigt, im Spielbetrieb aber nicht zwangsläufig stört. Die, über ein kleines Extra Tool freigeschalteten, EdgeDetect-(ED)-Modi wirken hingegen deutlich schärfer, sogar als das mit Narrow-Tent-Verfahren durchgeführte Antialiasing. Die kompletten Screenshots gibt es unter LUXXLink LL01281. CFAA Modi im Vergleich Ohne AA 2x NT 2x WT Screenshots aus dem Spiel Half-Life 2 von Valve. 42 - Hardwareluxx - 5/2007 4x NT 4x WT 4x ED 8x WT 8x ED Grafikkarten stabil. Aus einschlägigen Foren sind, besonders unter Wasserkühlung, noch deutlich höhere Ergebnisse bekannt. Mit den erreichten Taktraten wurden 11447 Punkte im 3DMark 06 ermittelt, unübertaktet immer noch gute 10806 Punkte. ATI verbaut auf der Platine einen 6-Pol- und einen 8-PolStromanschluss. Letzterer bietet allerdings auch die Möglichkeit, ein normales 6-poliges PCI-ExpressStromkabel einzuklinken, was nach unseren Tests keinerlei Nachteile zur Folge hatte. Auch das Übertakten funktionierte damit problemlos. In Sachen Stromverbrauch hat die ATI-Karte die Nase vorn. Im Gegensatz zur Konkurrenz gönnt sie sich gerne einen etwas größeren Schluck aus dem örtlichen Energienetz. Unser Testsystem v e r - brauchte bei eingebauter HD2900 XT 172 Watt im Idle-Betrieb, sowie 310 Watt unter Volllast. Der Wert unter maximaler Auslastung ist unter Verwendung des aktuellsten Treibers im Vergleich zu dessen Vorgänger leicht angestiegen. Der verbaute Kühler erinnert entfernt an den NVIDIA G80-Kühlkörper und arbeitet auch ähnlich effektiv. Mit 62 °C bei fehlender Auslastung blieb die GPU angenehm temperiert. Die Geräuschentwicklung ist nahe an der Unhörbarkeitsgrenze. Unter Last ändert sich das natürlich und der Abstand zur hervorragenden G80-Kühlung vergrößert sich leider etwas, denn ATI sorgt ein bisschen lauter für Frischluft als die schwarz gefärbten Luftverwirbler bei NVIDIA. In der Verpackung findet sich ein DVI- auf HDMI-Adapter, welcher in der Lage ist, neben dem HD-Videosignal auch Audiodaten Richtung Wiedergabegerät zu schicken. Die Radeon HD2000 GPU besitzt darüber hinaus einen eigenen Audio-Controller, der den Tonpfad selbst verwalten kann und so nicht mehr auf eine externe Zuführung des Audiosignals von der Soundkarte angewiesen ist. Eine Soundkar- te oder ein Onboard-Sound wird allerdings weiterhin benötigt. Fazit NVIDIA hat immer noch die Performance-Krone auf dem Haupt. ATIs Generationswechsel auf die HD2000er-Serie konnte daran nichts ändern. Natürlich ist die Konkurrenz zwischen hochgezüchteten und am Markt bereits situierten Grafikkarten und dem gerade erschienenen R600 in seiner Release-Revision nicht hundertprozentig fair. Aber die HD2900 XT ist nunmal das Schnellste, was ATI derzeit zu bieten hat - und dies zu einem unschlagbaren Preis. Das Topmodell der Kanadier wildert eher in Preisregionen der GeForce 8800 GTS, bietet aber meist bessere Leistung. In manchen Anwendungen kann sie sogar NVIDIAs GeForce 8800 GTX überholen. Hierfür bekommt sie unseren Preis-/Leistungsaward. Gerade mit der Verbesserung der Treiber konnte uns die Karte immer besser gefallen. EVGA bietet mit der e-GeForce 8800 GTX Ultra Superclocked nicht nur einen enorm langen Produktnamen, sondern vor allem eines: brachiale Leistung zu einem brachialen Preis. Unter einer Retail-Luftkühlung entwickelt sich nir- gendwo mehr Power als hier. Wer genug Geld übrig hat, auf PreisLeistungsverhältnisse keinen Wert legt und dazu noch etwas Prestige ernten will, kann hier absolut zugreifen. Für die überragende Leistung ist natürlich der Hardwareluxx Excellent Hardware Award prädestiniert. Die ASUS EN8800GTX Aquatank meint es gut und schickt sich an, eine Wasserkühlung einfach und unkompliziert zu machen, was ihr auch hervorragend gelingt. Aber mit der Einfachheit holt man sich leider auch einen unerwünschten Nebeneffekt ins Boot. Die Lautstärke des Gespanns zeugt nicht von einer Wasserkühlung und die Übertaktbarkeit hielt sich bei unseren Tests auch in Grenzen. Die Aquatank und viele weitere derartige Hybrid-Produkte vereinen nicht die Vorteile von Luft- und Wasserkühlung: Einfachheit und gute Performance bei geringer Lautstärke, sondern deren Nachteile: Lautstärke und Preis. Die MSI NX8800GTX bietet hier ein besseres Preis-/Leistungsverhältnis. Die Referenzkühlung ist für die gesteigerten Taktraten absolut ausreichend und produziert deutlich weniger Lärm. Neben MSI bieten auch andere Hersteller derartige Karten an. Ein Vergleich lohnt sich hier besonders. Alle Grafikkarten im Vergleich Hersteller und Bezeichnung Straßenpreis Homepage ASUS EN8800GTX Aquatank EVGA e-GeForce 8800 Ultra Superclocked MSI NX8800GTX T2D768E OC ATI/Sapphire Radeon HD2900XT 600 € 770 € 540 € 320 € www.ASUS.de www.evga.com www.msi-computer.de www.sapphiretech.com Technische Details GPU G80 G80 G80 R600 GPU-Takt 630 MHz 655 MHz 630 MHz 743 MHz Speichertakt 1030 MHz 1125 MHz 1000 MHz Speichertyp 828 MHz GDDR-III GDDR-III Speichergröße 786 MB 512 MB Speicherinterface 384 Bit Speicherbandbreite 98,8 GB/s Shader Model Version 96,0 GB/s 106,0 GB/s 4 Stream Prozessoren Stream Prozessor Takt 512 Bit 108,0 GB/s 128 1460 MHz 1660 MHz GPU-Takt 640 MHz Speichertakt 1060 MHz 3DMark06 (standard) 11592 Punkte 3DMark06 (übertaktet) 11701 Punkte 320 (5*64) 1450 MHz 828 MHz - 630 MHz 845 MHz - 1040 MHz 935 MHz 12240 Punkte 11541 Punkte 10806 Punkte 11602 Punkte 11447 Punkte Overclocking Stromverbrauch Idle-Modus 162 Watt 187 Watt 160 Watt 172 Watt Last-Modus 275 Watt 320 Watt 275 Watt 310 Watt Software Treiber-CD, 3DMark06, Ghost Recon: Advanced Warfighter, GTI Racing Treiber-CD Treiber-CD, Company of Heroes, CyberLink PowerCinema, Cyberlink Power2Go Treiber-CD, 3DMark06, CyberLink PowerDVD 6, CyberLink PowerDirector 4 DE Hardware DVI/VGA Konverter, 2 PCI-E Stromadapter, Komponenten/S-Video Adapter 2 DVI/VGA Konverter, 2 PCI-E Stromadapter, Komponenten/S-Video Adapter, S-Video Kabel DVI/VGA Konverter, 2 PCI-E Stromadapter, Komponenten/S-Video Adapter, S-Video Kabel 2 DVI/VGA Konverter, DVI/HDMI Adapter, Crossfire Bridge, Komponenten Adapter, Cinch/S-Video Adapter Lieferumfang 44 - Hardwareluxx - 5/2007 Grafikkarten R600-Architektur im Überblick Die 700 Millionen Transistoren des R600 werden in einer 80-nm-Bauweise von TSMC gefertigt. Spätere Chip-Releases sollen dann auf 65 nm basieren und entsprechend höhere Taktraten und eine bessere TDP bieten. ATI setzt zum ersten Mal eine Unified-Shader-Architektur bei einer PC-Grafik ein und verabschiedet sich von dedizierten Vertex- und Pixelshadern. Die Shader Einheiten sind in der Lage sowohl Pixel-, Vertex- als auch Geometrieoperationen durchzuführen. Die Entwickler konnten hier auf Erfahrung aus der Fertigung der Xbox 360 GPU „Xenos“ zurückgreifen. Der von ATI entwickelte Chip ist der architektonische Vater des R600 und hat mit ihm mehr Gemeinsamkeiten als etwa die Vorgänger aus der PC-Grafik. Am Beginn der Verarbeitungskette steht der Command Processor. Dieser nimmt die Daten vom Grafikkartentreiber entgegen und führt Microcode aus. Hiermit entlastet er die CPU um bis zu 30% (Angabe von ATI) sowohl bei DirectX-9-, als auch DirectX-10-Anwendungen. Der nachgeschaltete Komplex der Setup Engine bereitet die Daten für eine Verarbeitung in den Stream Prozessoren auf und übermittelt sie sortiert nach den Funktionen für Vertex-, Geometrie- und Pixelshader an den UltraThreaded Dispatch Processor. Die Daten gelangen je nach Typ in eine Command Queue, um anschließend als Thread weiterverarbeitet zu werden. Jeder Thread besteht aus einigen Instruktionen, die auf einen Eingabedatenblock angewendet werden. Die eigentlichen Stream-Prozessoren sind in vier SIMD (Single Instruction, Multiple Data) organisiert. Diese werden von je zwei Arbitern und Sequencern mit Threads gefüttert. Die duale Ausführung erlaubt es, immer zwei Operationen gleichzeitig in der Pipeline für die SIMD Arrays zu haben. Für Texture- und Vertex-Fetch Operationen stehen dedizierte Arbiter und Sequencer zur Verfügung, die unabhängig von den Berechnungsoperationen angesteuert werden können. Schon in Bearbeitung befindliche Threads können auch in einen Wartezustand versetzt werden, wenn ein Thread mit höherer Priorität aus der Command Queue gezogen wird. Die eigentlichen Shader bestehen aus fünf skalaren Funktionseinheiten, die pro Taktzyklus auch fünf arithmetische Operationen (FP32 MADD) durchführen können. Bei 64 solcher Einheiten (organisiert in vier SIMD Arrays) können also 320 solcher Operationen pro Takt durchgeführt werden. Eine der fünf Einheiten kann darüber hinaus auch transzendente Operationen, wie Sinus oder Cosinus berechnen. Die Branch Execution Unit kümmert sich um die Kontrolle des Datenflusses und entbindet somit die fünf Stream-Prozessor-Einheiten von dieser Aufgabe. Das General Purpose Register speichert Werte der Ein- und Ausgabedaten sowie temporäre Informationen. Parallel zu den Shader Prozessoren liegen die Texture Units. Diese erhalten Anfragen von dem Filter Units, die für Aufgaben wie die anisotrope Filterung zuständig sind. Auf jeder der Einheiten sitzen zudem noch je 20 Texture Samplers. Diese sind pro Taktzyklus in der Lage einen Wert aus dem Cache abzurufen. Die Render Back Ends bilden die Schnittstelle zum Grafikspeicher. Nachdem die Farb-, Alpha- (Transparenz) und Z-Werte (Tiefeninformation) bereits in den vorigen Schritten festgelegt wurden, ist es nun an den Render Back Ends festzustellen, ob ein Pixel überhaupt sichtbar ist oder durch dedizierten Texture Fetch Arbiter und Sequencer. Insgesamt stehen auf dem Radeon HD2900 XT vier Textureinheiten zur Verfügung. Auf jeder Texture Unit befinden sich acht Einheiten zur Textur-Adressierung im Cache und vier Texture andere verdeckt wird (depth/stencil Test). Die HD2900 schleust 32 Pixel pro Takt durch diesen Test. Die Einheit für das Multisampling Antialiasing (MSAA) ist programmierbar und erlaubt so das neu eingeführte Costum Filter Antialiasing (CFAA). Hardwareluxx - 5/2007 - 45