Laborbericht - Weblearn
Transcription
Laborbericht - Weblearn
Rechnerstrukturen Labor (RST-L WS 2004/05) Laborbericht Untersuchung der PCI-Express-Schnittstelle bei Herrn Prof. Dr. Risse an der Hochschule Bremen Brünje Appelmann 9. März 2005 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Inhaltsverzeichnis Tabellenverzeichnis 2 Abbildungsverzeichnis 3 1 Einleitung 4 2 Vorbetrachtung 5 3 Versuchsbeschreibung 6 4 Versuchsanforderungen 4.1 Verwendete Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Verwendete Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 8 5 Versuchsanordnung 13 5.1 Versuchsaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 5.2 Versuchseinstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 6 Versuchsdurchführung 17 6.1 PCI-Express x16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 6.2 Klebetrick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 7 Versuchsauswertung 25 7.1 Benchmark-Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 8 Fazit 40 9 Anhang 41 9.1 Links . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Literaturverzeichnis 9. März 2005 42 Seite 1 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Tabellenverzeichnis 8 4.1 Verwendete Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Hardware-Konfiguration für die Testdurchläufe . . . . . . . . . . . . . . . . . . . . . . . 14 5.2 Konfiguration von UMark . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 5.3 Einstellungen für Doom3, High und Ultra Quality . . . . . . . . . . . . . . . . . . . . . 16 7.1 7.2 7.3 7.4 7.5 7.6 SPECViewperf 8.0, Ergebnisse aus dem Benchmarks . . . . . . . . 3DMark03, Ergebnisse aus den Benchmarks . . . . . . . . . . . . . 3DMark05, Ergebnisse aus den Benchmarks . . . . . . . . . . . . . UMark/ Unreal Tournament 2004, Ergebnisse aus den Benchmarks Doom3 High Quality, Ergebnisse aus dem Timedemo-Benchmark . Doom3 Ultra Quality, Ergebnisse aus dem Timedemo-Benchmark . 9. März 2005 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 31 33 35 37 37 Seite 2 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildungsverzeichnis 4.1 Systemplatine von Gigabyte GA-K8NXP-SLI . . . . . . . . . . . . . . . . . . . . . . . 4.2 Grafikkarte von MSI NX 6600GT TD 128 E . . . . . . . . . . . . . . . . . . . . . . . . 7 8 5.1 Versuchsaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 6.10 6.11 6.12 6.13 6.14 6.15 6.16 6.17 6.18 6.19 Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x16 . . . . . . . . . . . PCI-Express Schnittstellenbelegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . erster Abklebeversuch mit x8 (Vorderseite), der so nicht funktioniert . . . . . . . . . . erster Abklebeversuch mit x8 (Rückseite), der so nicht funktioniert . . . . . . . . . . . Vorderseite der Steckkarte zur Konfiguration der Systemplatine mit zwei Grafikkarten Rückseite der Steckkarte zur Konfiguration der Systemplatine mit zwei Grafikkarten . Bildschirmanzeige von CPU-Z mit PCI-Express x8, Systemplatine im SLI-Betrieb . . . neuer Abklebeversuch mit x8 (Vorderseite) . . . . . . . . . . . . . . . . . . . . . . . . neuer Abklebeversuch mit x8 (Rückseite) . . . . . . . . . . . . . . . . . . . . . . . . . Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x8, neu Abgeklebt . . . neuer Abklebeversuch mit x4 (Vorderseite) . . . . . . . . . . . . . . . . . . . . . . . . neuer Abklebeversuch mit x4 (Rückseite) . . . . . . . . . . . . . . . . . . . . . . . . . Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x4, neu Abgeklebt . . . neuer Abklebeversuch mit x2 (Vorderseite) . . . . . . . . . . . . . . . . . . . . . . . . neuer Abklebeversuch mit x2 (Rückseite) . . . . . . . . . . . . . . . . . . . . . . . . . Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x2, neu Abgeklebt . . . neuer Abklebeversuch mit x1 (Vorderseite) . . . . . . . . . . . . . . . . . . . . . . . . neuer Abklebeversuch mit x1 (Rückseite) . . . . . . . . . . . . . . . . . . . . . . . . . Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x1, neu Abgeklebt . . . 17 18 19 19 19 19 20 21 21 21 22 22 22 23 23 23 24 24 24 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 Formel für die Berechnung der ”Weighted Geometric Mean” . . Benchmark Ergebnisse von SPECViewperf mit Konfiguration 1 Benchmark Ergebnisse von SPECViewperf mit Konfiguration 2 Benchmark Ergebnisse von SPECViewperf mit Konfiguration 3 Benchmark Ergebnisse von SPECViewperf mit Konfiguration 4 Benchmark Ergebnisse von 3DMark03 . . . . . . . . . . . . . . Benchmark Ergebnisse von 3DMark05 . . . . . . . . . . . . . . Benchmark Ergebnisse von UMark/ Unreal Tournament 2004 . Benchmark Ergebnisse von Doom3 mit High Quality . . . . . . Benchmark Ergebnisse von Doom3 mit Ultra Quality . . . . . . 25 27 28 29 30 32 34 36 38 39 9. März 2005 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Seite 3 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Kapitel 1 Einleitung In Anlehnung an den Artikel 1 ”PCI Express durchleuchtet: Alle Modi im Test” von der Internetseite vom tom’s hardware guide, in dem die verschiedenen PCI-Express Modi mit unterschiedlichen PCIExpress Grafikkarten untersucht werden, möchte ich diese Untersuchung des PCI-Express Busses im Rahmen der Rechnerstrukturen-Labor Veranstalltung mit einer Grafikkarte nachstellen. Im folgenden Dokument wird die Vorgehensweise bei der Untersuchung beschrieben und die Ergebnisse vorgestellt. 1 [THG] siehe 9.1 Links 9. März 2005 Seite 4 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Kapitel 2 Vorbetrachtung PCI-Express ist ein serielles Bussystem und besteht aus jeweils zwei Leitungen, eine sogenannte Lane. Der Bus ist bidirektional, so besteht eine Verbindung, wie z.B. bei PCI-Express x1, aus zwei Lanes, jeweils zwei Leitungen zum Senden bzw. Empfangen. Eine weitere Besonderheit ist die freie Skalierbarkeit des Busses, es ist möglich die Anzahl der Lanes und somit die Breite der Schnittstelle bis zu PCI-Express x16 zu erweitert, mit jeweils 16 Lanes in beide Richtungen. Eine genauere Beschreibung von PCI-Express für Grafikkarten ist in dem Dokument ”PCI Express als Grafikschnittstelle” zu finden, das ich im Rahmen der RechnerstrukturenLabor Veranstalltung erarbeitet habe. PCI-Express x16 wird als neue Grafikkartenschnittstelle verwendet. In dem oben genannten Artikel 1 werden den Grafikkarten die verschiedenen PCI-Express Modi mittels abkleben der Schnittstelle entlockt und die Ergebnisse aus Benchmark Programmen miteinander verglichen. [1] 1 [THG] siehe 9.1 Links 9. März 2005 Seite 5 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Kapitel 3 Versuchsbeschreibung In den Versuchen möchte ich einer PCI-Express Grafikkarte die verschiedenen Modi von PCIExpress entlocken und somit die Felxibilität der Schnittstelle untersuchen. Mittels Klebeband werden die Datenleitungen der Schnittstelle abgeklebt, um verschiedene PCIExpress Modi zu simulieren. Untersucht werden die PCI-Express Modi x16, x8, x4, x2 und x1, um einen Vergleich zwischen den Modi zu verdeutlichen, werden verschiedene Benchmark-Programme eingesetzt, die in Abschnitt 4.2 Verwendete Software näher beschrieben werden. 9. März 2005 Seite 6 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Kapitel 4 Versuchsanforderungen Die Anforderungen an die Hardware für die Untersuchung der PCI-Express Schnittstelle sind eine Systemplatine mit PCI-Express x16 Schnittstelle und eine PCI-Express Grafikkarte. Mittlerweile sind auch Systemplatinen mit PCI-Express für alle Prozessoren erhältlich. Bei den Gerätetreibern sind die vom Hersteller bereitgestellten Versionen verwendt worden. Die Programme zur Erstellung der Benchmarks sind hauptsächlich frei erhältlich Demoversionen. 4.1 Verwendete Hardware Für die Versuche habe ich ein 64bit System mit AMD-Prozessor ausgewählt. Die Systemplatine von Gigabyte ist mit dem neuen Chipsatz von NVIDIA nForce4-SLI ausgerüstet und bietet neben der PCI-Express Unterstützung auch die Möglichkeit das System mit zwei PCIExpress Grafikkarten zu betreiben, siehe Abbildung 4.1. Abbildung 4.1: Systemplatine von Gigabyte GA-K8NXP-SLI 9. März 2005 Seite 7 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Die verwendete Grafikkarte von MSI, auf Abbildung 4.2 zusehen, besitzt einen NVIDIA GeForce 6600GT Grafikprozessor und verfügt über 128 MB Speicher auf der Karte. Abbildung 4.2: Grafikkarte von MSI NX 6600GT TD 128 E Hier sind die verwendeten Hardware-Komponeten in einer Tabelle aufgeführt. Prozessor: Systemplatine: Arbeitsspeicher: Grafikkarte: Festplatte: DVD/CD-Rom: AMD Athlon 64 3000+ 1800MHz Sockel 939; Hyper Transport Gigabyte GA-K8NXP-SLI NVIDIA nForce4-SLI Chipsatz BIOS F6 2x 512 MB DDR-400 PC3200 TakeMS CL2,5 Dual-Channel MSI NX 6600GT TD 128 E nVidia GeForce 6600 GT 128 MB GDDR3-SDRAM Maxtor 200 GB, 8 MB, 7200 U/Min, SATA 150 MB/s LG Super Multi DVD-Brenner GSA-4040B Tabelle 4.1: Verwendete Hardware 4.2 Verwendete Software Hier ist eine Zusammenstellung aller verwendeten Programme und Treiber. Neben den Benchmark-Programmen wurden auch Spiele eingesetzt, um die Unterschiede der PCIExpress Modi zu verdeutlichen. 4.2.1 Betriebssystem Als Betriebssystem wurde Windows XP Profssional verwendet, erweitert mit Service Pack 1, um die neuste DirectX Version zu verwenden. DirectX stellt die Schnittstellen zwischen Anwendungen und Gerätetreibern zur Verfügung, mit DirectX 9.0c ist die Voraussetzung gegeben, um die Benchmark-Programme und Spiele laufen zu lassen. [2], [3] 9. März 2005 Seite 8 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle 4.2.2 RST-L WS 04/05 Treiber Der mitgelieferte Grafikkartentreiber hat bei den Benchmarks nicht die erwarteten Ergebnisse geliefert. Aber auf der Internetseite des Herstellers MSI gab es eine neue Version des Treibers, den ich für die Versuche verwendet habe. Grafikkartentreiber: NVIDIA Detornator W2K/XP v71.22 Für das Mainboard habe ich den mitgelieferten Treiber verwendet. Chipsatztreiber: 4.2.3 NVIDIA Chipset Driver Version 6.31 Systeminformationsprogramm Um zu sehen, ob der Bertrieb mit den PCI-Express Modi auch funktioniert, verwende ich das freie Programm CPU-Z 1 . Es zeigt umfangreiche Infomationen zu den im System befindlichen HardwareKomponenten an. 4.2.4 Benchmark-Programme In diesem Abschnitt werden die verwendeten Benchmark-Programme vorgestellt. Benchmark-Programme werden für zur Ermittlung von Hardware-Leistung in Computersystemen eingesetzt. Es sind genormte Testverfahren mit denen die Ergebnisse nach bestimmten Kriterien miteinander verglichen werden können. [4] SPECViewperf 8 SPECViewperf 8 2 ist ein Benchmark-Programm von der Standard Performance Evaluation Corporation 3 , es ist frei erhältlich und verwendet OpenGL als Schnittstellen zwischen Anwendungen und Gerätetreiber. SPECViewperf beansprucht alle Komponenten der Grafikschnittstelle und die Auswirkungen auf das System ohne den Aufwand einer vollen Anwendung. Es besteht aus einer Sammlung von verschiedenen Tests: 3dsmax-03, basiert auf SPECapc für 3DStudio Max 3.1 konfiguriert mit Open GL-Treiber; umfasst drei Modelle, das jedes eine durchschnittliche Anzahl von 1,5 Million Eckpunkten4 besitzt und prüft Leistung von Szenen mit unterschiedlichen Niveaus der Beleuchtung. catia-01, basiert auf Dassaults CATIA, mit Modellen, die bis zu zwei Million Eckpunkte enthalten. ensight-01, basiert auf CEIs EnSight technischer und wissenschaftlicher Visualisierungsanwendung, es umfasst Anzeigenlisten und Echtzeit-Arbeitsbelastungen5 . 1 [CPU-Z] siehe 9.1 Links siehe 9.1 Links 3 [SPEC] siehe 9.1 Links 4 vertices 5 display-list- and immediate-mode workloads 2 [SPECViewperf] 9. März 2005 Seite 9 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 light-07, basiert auf Ausschnitten aus Discreets Lightscape Anwendung. maya-01, basiert auf Ausschnitten aus Maya 5. proe-03, basiert auf SPECapc für Pro/ENGINEER 2001, misst zwei Modelle in drei Modi - schattiert, als Drahtgittermodell und verstecker Linienabbau 6 . sw-01, basiert auf Ausschnitten der Anwendung 2004 Solidworks von Dassault Systemes. ugs-04, basiert auf SPECapc für Unigraphics V17, prüft die Leistung eines Motormodelles, das 4,1 Million Eckpunkte enthält. Diese Arten von Programmen übertragen gewöhnlich große Datenmengen, alle acht Ansichten stellen verhältnismäßig umfangreiche Anwendungen dar. [5], [6], [7] 3DMark03 3DMark03 7 von Futuremark 8 ist eines der bekanntesten Benchmark-Programme und wird oft als Referenz für Grafikkartenbewertungen verwendet. Es nutzt die Eigenschaften von einer älteren DirectX Version, DirectX 9.0a, die in DirectX 9.0c enthalten sind. In der freien Version werden leider nicht alle Eigenschaften des Programms ausgenutzt, es reicht jedoch aus, um einen Vergleich zwischen den PCI-Express Modi zu zeigen. Minimale Systemanforderung: • x86 kompatibler Prozessor, 1000MHz (PCMark2002 CPU Wertung von über 2500) • 256MB RAM (512MB empfohlen) • 400MB freier Festplattenspeicher (installiert) R 98/SE/ME/2000/XP • Windows R • DirectX9.0c oder neuer • DirectX 9 kompatible Grafikkarte mit mindestens 32MB Speicher und voller DirectX 7 Unterstützung. [8] 6 hidden-line removal (HLR) siehe 9.1 Links 8 [Futuremark] siehe 9.1 Links 7 [3DMark03] 9. März 2005 Seite 10 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 3DMark05 3DMark05 9 auch von Futuremark wird zusätzlich zu 3DMark03 als Referenz für die Bewertung von Grafikkarten eingesetzt, die die Eigenschaften von DircetX 9.0c nutzen. Auch hier, in der frei erhältlichen Version, sind wie bei 3DMark03 nicht alle Eigenschaften des Programms freigeschaltet. Minimale Systemanforderung: • DirectX 9 kompatible Grafikkarte mit Unterstützung von Pixel Shader 2.0 oder höher und Grafikspeicher von mindestens 128 MB. • Intel oder AMD kompatibler Prozessor mit mindestens 2 GHz Taktung. • mindestens 512 MB RAM. • 1.5 GB freier Festplattenspeicher. • Windows 2000 oder XP Betreibssystem mit dem neusten Service Pack und Erweiterungen installiert. • DirectX 9.0c installiert. • Microsoft Internet Explorer 6 installiert, für die Funktionalität von 3DMark. • Microsoft Excel 2000, 2003 oder XP, für die Funktionalität von 3DMark. [9] UMark/ Unreal Tournament 2004 UMark 10 ist ein Open Source Programm mit dem man leicht Benchmarks für Spiele der Unreal Tournament 200x Reihe konfigurieren kann. Ich verwende für die Benchmarks die Demoversion von Unreal Tournament 2004 11 . Das Spiel nutzt die Eigenschaften von DircetX 8.1. Mit der Demoversion kann nur der Botmatch 12 Benchmark eingesetzt werden. Aber auch dies reicht aus um die Unterschiede der verschiedenen PCI-Express Modi zu verdeutlichen. Minimale Systemanforderung: • Betriebssystem: Windows 98/Me/2000/XP • Prozessor: einen Pentium III oder AMD Athlon 1.0 GHz Prozessor (ab 1.5 GHz getaktetem Prozessor empfohlen) • Arbeitsspeicher: 128 MB RAM (256 MB empfohlen) • Festplattenspeicher: 5.5 GB frei • Grafik: eine Windows kompatible Grafikkarte (NVIDIA GeForce 2 oder ATI Radeon mit mindestens 64 MB Grafikspeicher empfohlen) • Ton: Windows kompatible Soundkarte. • DirectX: DirectX Version 8.1(enthalten) oder höher [10] 9 [3DMark05] siehe 9.1 Links siehe 9.1 Links 11 auch UT2004 genannt, [UT2004] siehe 9.1 Links 12 computergenerierte Spieler, sogenannte Bots, die gegeneinander antreten. 10 [UMark] 9. März 2005 Seite 11 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Doom3 Das Spiel Doom3 13 von idSoftware wird oft als Referenzspiel für Grafikkartenbewertungen eingesetzt. In dem Spiel ist ein FPS 14 -Test eingebaut, mit dem Befehl timedemo demo1 , der in die Konsole eingegeben werden muss. Die Konsole kann mit ( ALT + STRG + ˆ ) geöffnet werden. Minimale Systemanforderung: R 9.0b kompatibel mit 64 MB • 3D Hardware Beschleuniger Karte erforderlich - 100% DirectX Grafikspeicher und den neusten Treiber. • Microsoft Windows 2000/XP • einen Pentium IV 1.5 GHz oder Athlon XP 1500+ Prozessor • 384 MB RAM • 8x CD-ROM Laufwerk • 2.2 GB unkomprimierter freier Festplattenspeicher (plus 400 MB für Windows Auslagerungsdateien) • 100% DirectX 9.0b kompatible 16-bit Soundkarte und den neusten Treiber • 100% Windows 2000/XP kompatible Maus, Tastertur und die neusten Treiber R 9.0b (enthalten) • DirectX [11], [12] 13 [Doom3], 14 FPS, siehe 9.1 Links Frames per second, Bilder pro Sekunde 9. März 2005 Seite 12 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Kapitel 5 Versuchsanordnung In diesem Kapitel werden der Versuchsaufbau, die Vorbereitung und die Einstellungen für die Durchführung der Versuche beschrieben. 5.1 Versuchsaufbau Im Versuchsaufbau, der auf Abbildung 5.1 zu sehen ist, sind die verwendeten Hardware Komponenten zu sehen. Abbildung 5.1: Versuchsaufbau 5.2 Versuchseinstellungen In diesem Abschnitt sind die Einstellungen für die Versuchsdurchführung zu finden. 9. März 2005 Seite 13 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle 5.2.1 RST-L WS 04/05 Hardware Einstellungen Die Schnittstelle der PCI-Express Grafikkarte wird für die Versuche mit Klebeband abgeklebt, die Technik wird in Abschnitt 6.2 näher beschrieben. Die Einstellungen des Grafikkartentreibers für die Versuche sind im Betriebssystem, unter Windows, konfiguriert worden. In jedem PCI-Express Modus wurden 4 Testdurchläufe mit 4 verschiedene Einstellungen für die Grafikkarte durchgeführt, die in der folgenden Tabelle zusammengefasst sind. Konfiguration 1: Konfiguration 2: Konfiguration 3: Konfiguration 4: 1024 x 768, kein AA a , kein AF b , hohe Leistung, VSyncc anwendungsgesteuert 1024 x 768, 2x AA, 2x AF, hohe Qualität, VSync: Anwendungsgesteuert 1024 x 768, 4x AA, 4x AF, hohe Qualität, VSync: Anwendungsgesteuert 1024 x 768, 8x AA, 16x AF, hohe Qualität, VSync: Anwendungsgesteuert Tabelle 5.1: Hardware-Konfiguration für die Testdurchläufe a Antialiasing, siehe AA in Abschnitt 5.2.1 Filter, siehe AF in Abschnitt 5.2.1 c auch vertikalen Synchronisation, siehe VSync in Abschnitt 5.2.1 b Anisotropische AA, Antialiasing Unter Antialiasing oder Treppeneffektglättung bei der Bildschirmausgabe versteht man das Beseitigen des so genannten Treppeneffekts (eine Auswirkung vom Aliasing), der bei der Rasterung einer Form (Linie, Kreis, Schrift u. ä.) entsteht. Weiterhin wird so genanntes Line Popping reduziert, welches in Bewegung auftritt. [13] AF, Anisotropische Filter Beim anisotropischen Filtern (Anisotropic Filtering) werden alle Objekte eines Spiels, Akteure und Kulissen in der sogenannten Graphikpipeline zuerst in Basiselemente, zumeist Dreiecke, zerlegt. Wenn zu einem späteren Zeitpunkt die entstandenen Dreiecke oder Polygone mit Texturen versehen werden, so werden die Probleme, die in den Überlappungs- bzw. Grenzbereichen dieser Elemente entstehen, durch sogenannte Filter gemildert. [14] VSync, vertikale Synchronisation Leider ist mir erst nachdem ich alle Teste durchgeführt hatte aufgefallen, dass die Einstellung für die vertikale Synchronisation der Grafik1 auf ”anwendungsgesteuert” eingestellt war. Es ist also von dem Programm abhängig, ob die vertikale Synchronisation an oder ausgeschaltet ist. Der Standardwert für VSync ist bei den hier verwendeten Programmen allerdings auf ein gesetzt. Wenn VSync ausgeschaltet ist, bekommt man einen höheren Wert bei den FPS2 . [15] 1 vertikale 2 Frame Synchronisation der Grafik, auch VSync genannt per second, Bilder pro Sekunde 9. März 2005 Seite 14 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle 5.2.2 RST-L WS 04/05 Software Einstellungen Im folgenden Abschnitt werden die Einstellung der Programme beschrieben. SPECViewperf 8 SPECvieperf bietet umfangreiche Einstellmöglichkeiten. Von mir wurden allerdings nur das Programm mit den Standard Einstellungen ausgeführt. 3DMark03 Bei der frei erhältlichen Version von 3DMark03 gibt es leider nicht die Möglichkeit, Einstellungen im Programm vorzunehmen. 3DMark05 Wie auch bei 3DMark03 können in der freien Version von 3DMark05 keine Einstellungen für das Programm vorgenommen werden. UMark/ Unreal Tournament 2004 UMark bietet neben der Wahl des Spiels aus der Unreal Tournament 200x Reihe auch die Wahl der Auflösung. Bei den Detailstufen besteht die Wahl zwischen Hoher Leistung, Hoher Qualität, derzeitigen Einstellungen oder der Angabe einer Datei, in der die Einstellungen definiert sind. Die Einstellung für den Benchmark sind bei der Demoversion von UT 20043 nur auf das Botmatch begrenzt, bei dem noch die Anzahl der Bots festgelegt werden kann. Die Auswahl des TimedemoBenchmarks ist nur mit der Vollversion des Spiels möglich. Für den Benchmark steht noch die Wahl einer Map4 zur Verfügung, wahlweise kann auch ein vorgefertigte Liste mit mehreren Spielplänen abgearbeitet werden. Diese Liste kann auch selbst zusammengestellt werden. In der folgenden Tabelle sind die Versuchseinstellungen zu finden. UT 200x Version: Benchmark Auflösung: Benchmark Einstellungen: Detailstufe: UT 2004 Demoversion, Fullscreen 1024 x 768 12 Bots, vordefinierte Liste mit Mapsa aus der Demoversion derzeitige Einstellungen Tabelle 5.2: Konfiguration von UMark a Spielplänen 3 Unreal Tournament 2004 oder Karte auf der gespielt wird 4 Spielplan 9. März 2005 Seite 15 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Doom3 Die Einstellungen für das Spiel werden auch für den Timedemo-Benchmark übernommen. Die Video Qualität ist auswählbar, zur Wahl stehen Low, Medium, High oder Ultra Quality. Bei der Einstellung für Ultra Quality werden die Texturen unkomprimiert in die Grafikkarte geladen, diese sind rund 500 MB groß, empfohlen wird eine Grafikkarte mit 512 MB Speicher. Außerdem kann die Auflösung und der Vollbid Modus deaktiviert werden. Unter den erweiterten Optionen gibt es noch zusätzliche Einstellungsmöglichkeiten, die Aktivierung von hohen Qualitätsspezialeffekten und die Aktivierung von Schatten-, Glanzlicht- und BumpmapEffekten. Bumpmapping ist eine Darstellungsart bei der Oberflächenunebenheiten simuliert werden, die in der Geometrie des Modells gar nicht vorhanden sind. Die nötigen Informationen werden in eine Textur gepackt, mit deren Hilfe Schattierungen auf eine Oberfläche gezeichnet werden. Außerdem besteht die Möglichkeit die Aktivierung der vertikalen Synchronisation5 und die Einstellung von Antialiasing vorzunehmen. Wird die Einstellung bei Antialiasing ausgeschaltet, so werden die Einstellungen der Grafikkartentreiber vom Betriebssystem übernommen. [16], [17] In der folgenden Tabelle sind die Einstellungen für die Versuche zu finden. Ich habe mich für zwei verschiedene Qualitätseinstellungen entschieden, um die Unterschiede der verschiedenen PCIExpress Modi zu verdeutlichen. Video Qualität: Auflösung: Vollbild: Erweiterte Optionen: HQ Spezialeffekte: Aktivierung der Schatteneffekte: Aktivierung der Glanzlichteffekte: Aktivierung der Bumpmap-Effekte: vertikale Synchronisation: Antialiasing: High Quality Ultra Quality 1024 x 768 ja ja ja ja ja nein aus Tabelle 5.3: Einstellungen für Doom3, High und Ultra Quality 5 siehe VSync in Abschnitt 5.2.1 9. März 2005 Seite 16 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Kapitel 6 Versuchsdurchführung Bevor die Benchmark Programme durchführt werden können, muss die Schnittstelle vorbereitet werden. Hierzu wird die Schnittstelle mit Klebeband abgeklebt, dies wird im flogenden Abschnitt 6.2 näher beschrieben. 6.1 PCI-Express x16 Der erste Durchlauf der Benchmark Programme unter PCI-Express x16 lief problemlos, wie auf der Abbildung 6.1 der Bildschirmanzeige von CPU-Z zu sehen ist. Die Ergebnisse zu diesem und den weiteren Tests sind in dem Kapitel 7.1 Benchmark Ergebnisse zu finden. Abbildung 6.1: Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x16 9. März 2005 Seite 17 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle 6.2 RST-L WS 04/05 Klebetrick Auf einer der Internetseiten mit dem Artikel1 von toms’s hardware guide ist eine Abbildung mit der Belegung der PCI-Express Schnittstelle zu finden, leider sind dort die Modi nicht korrekt eingezeichnet. Eine überarbeitete Version ist auf Abbildung 6.2 zu sehen, in der die Schnittstellenmodi von PCI-Express eingezeichnet sind. Abbildung 6.2: PCI-Express Schnittstellenbelegung 1 [THG] siehe 9.1 Links 9. März 2005 Seite 18 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle 6.2.1 RST-L WS 04/05 Fehlversuch Das Abkleben der Schnittstelle, wie es in dem Artikel von tom’s hardware guide beschrieben wird, hat so nicht funktioniert. Dort wird ein Teil der Schnittstelle mit einem Stück Klebeband überklebt, siehe Abbildung 6.3 und Abbildung 6.4. Beim Einschalten des Rechners ertönte von der Systemplatine ein akustischer Fehlersignalcode, der auf einen Fehler bei der Grafikarte hinweist und der Rechner nicht hochfuhrt. Abbildung 6.3: erster Abklebeversuch mit x8 (Vorderseite), der so nicht funktioniert Abbildung 6.4: erster Abklebeversuch mit x8 (Rückseite), der so nicht funktioniert 6.2.2 PCI-Express x8 mit SLI-Steckkarte Durch diesen Fehlschlag nicht entmutigt, fiel mir ein, dass die Systemplatine die Möglichkeit besitzt, das System mit zwei PCI-Express Grafikkarten zu betreiben. Hierzu wird eine Steckkarte, siehe Abbildung 6.5 und Abbildung 6.6, auf der Systemplatine einfach umgedreht und ermöglicht so den Betreib mit zwei PCI-Express Grafikkarten im x8 Modus. Es liegt an der Architektur des Chipsatzes, der nur für den x16 Modus bei der Grafikschnittstelle ausgelegt ist, somit teilen sich die Grafikkarten die Breite des Busses. Abbildung 6.5: Vorderseite der Steckkarte zur Konfiguration der Systemplatine mit zwei Grafikkarten Abbildung 6.6: Rückseite der Steckkarte zur Konfiguration der Systemplatine mit zwei Grafikkarten 9. März 2005 Seite 19 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Wie ist es wohl, wenn man die Systemplatine für den Betrieb mit zwei Grafikkarten kofiguriert und nur eine Grafikkarte verwendet ? Ich habe die Systemplatine für den SLI-Betrieb2 vorbereitet und mit nur einer Grafikkarte das System hochgefahren. Es hat funktioniert, wie auf der Abbildung 6.7 der Bildschirmanzeige von CPU-Z zusehen ist. Die Ergebnisse der Benchmark Programme sind im Kapitel 7.1 zu finden. Abbildung 6.7: Bildschirmanzeige von CPU-Z mit PCI-Express x8, Systemplatine im SLI-Betrieb 2 Betrieb mit zwei Grafikkarten 9. März 2005 Seite 20 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle 6.2.3 RST-L WS 04/05 neuer Klebetrick, mit PCI-Express x8, x4, x2, x1 Aber so konnte ich nur den x8 Modus von PCI-Express testen. Also musste ich mir etwas anderes überlegen. Der Klebetrick, der im Artikel von tom’s hardware guide beschrieben wurde, funktionierte nicht, da dort nicht nur die Datenleitungen sondern auch Masse und andere Leitungen überklebt worden sind. Durch eine Modifikation des Klebebandes auf der abgeklebten Schnittstelle in dem nur die Datenleitungen abgeklebt sind, siehe Abbilding 6.8 und Abbildung 6.9, konnte ich die Grafikkarten in den Betrieb vom PCI-Express Modus x8 bringen, wie auf der Abbildung 6.10 der Bildschirmanzeige von CPU-Z zu sehen ist. Abbildung 6.8: neuer Abklebeversuch mit x8 (Vorderseite) Abbildung 6.9: neuer Abklebeversuch mit x8 (Rückseite) Abbildung 6.10: Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x8, neu Abgeklebt 9. März 2005 Seite 21 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Durch das Abkleben der Datenleitungen sind auch die Tests der anderen PCI-Express Modi zu verwirklichen, wie auf den folgenden Abbildungen zu sehen ist. Abbildung 6.11: neuer Abklebeversuch mit x4 (Vorderseite) Abbildung 6.12: neuer Abklebeversuch mit x4 (Rückseite) Abbildung 6.13: Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x4, neu Abgeklebt 9. März 2005 Seite 22 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildung 6.14: neuer Abklebeversuch mit x2 (Vorderseite) Abbildung 6.15: neuer Abklebeversuch mit x2 (Rückseite) Abbildung 6.16: Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x2, neu Abgeklebt 9. März 2005 Seite 23 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildung 6.17: neuer Abklebeversuch mit x1 (Vorderseite) Abbildung 6.18: neuer Abklebeversuch mit x1 (Rückseite) Abbildung 6.19: Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x1, neu Abgeklebt 9. März 2005 Seite 24 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Kapitel 7 Versuchsauswertung In diesem Kapitel sind die Ergebnisse der Benchmark Programme zusammengefasst. 7.1 7.1.1 Benchmark-Ergebnisse SPECViewperf 8 Nach einem Durchlauf von SPECViewperf erhält man für jeden Testabschnitt einen Wert, den ”Weighted Geometric Mean”: Abbildung 7.1: Formel für die Berechnung der ”Weighted Geometric Mean” Die Formel zum Errechnen der ”Weighted Geometric Mean” setzt sich wie folgt zusammen, n ist die Anzahl der einzelnen Tests einer Ansicht und w ist die Gewichtung jedes einzelnen Tests, mit einem Wert zwischen 0.0 und 1.0 (Ein Test mit einer Gewichtung von ”10.0%” ist ein w von 0.10. Merke, die Summe der Gewichtung der einzelnen Tests muss 1.00 betragen). Im Endeffekt ist ein höherer Wert besser, was auf eine bessere Leistung schließen lässt. Eine umfangreiche Erklärung zu ”Weighted Geometric Mean” ist auf der Internetseite von SPEC zu finden, der Link ist im Literaturverzeichniss zufinden. [18] 9. März 2005 Seite 25 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Hier sind die Ergebnisse in einer Tabelle und im Anschluss nochmal in einem Diagramm verdeutlicht. Benchmark x16 Konfiguration 1: 3dsmax-03 14,47 catia-01 11,07 ensight-01 9,12 ligth-07 8,8 maya-01 18,1 proe-03 15,97 sw-01 14,07 ugs-04 6,37 Konfiguration 2: 3dsmax-03 14,57 catia-01 11,04 ensight-01 8,67 ligth-07 8,72 maya-01 18,02 proe-03 15,53 sw-01 13,2 ugs-04 5,75 Konfiguration 3: 3dsmax-03 14,37 catia-01 10,32 ensight-01 8,56 ligth-07 8,65 maya-01 18,03 proe-03 14,16 sw-01 12,59 ugs-04 5,55 Konfiguration 4: 3dsmax-03 15,31 catia-01 10,65 ensight-01 8,67 ligth-07 9,31 19,25 maya-01 proe-03 16,27 sw-01 13,65 ugs-04 5,66 x8 (SLI) x8 x4 x2 x1 14,57 11,07 9,12 8,78 18,07 15,97 14,05 6,37 14,53 11,07 9,11 8,78 18,07 15,97 14,04 6,37 14,38 10,62 8,04 8,75 18,03 14,18 12,89 6,32 9,68 7,56 5,62 6,64 13,8 8,81 7,65 5,8 5,32 4,11 3,48 3,32 7,09 4,98 4,18 4,8 14,5 11,03 8,67 8,72 18,03 15,52 13,18 5,73 14,45 11,03 8,67 8,72 18,03 15,58 13,18 5,73 14,5 10,51 7,75 8,71 18,01 13,59 12,02 5,68 9,61 7,54 5,37 6,63 13,8 8,81 7,57 5,36 5,29 4,08 3,43 3,32 7,05 4,98 4,16 4,41 14,32 10,29 8,56 8,64 18,03 14,16 12,53 5,55 14,29 10,31 8,56 8,64 18,03 14,16 12,53 5,54 14,27 9,66 7,66 8,62 18,01 12,7 11,45 5,51 9,54 7,12 5,3 6,5 13,8 8,81 7,56 5,2 5,24 4,03 3,39 3,31 7,05 4,98 4,18 4,35 13,71 9,83 8,12 8,55 16,73 13,9 12,02 5,41 13,74 9,83 8,11 8,55 16,73 13,91 12,02 5,41 13,42 9,46 7,03 8,53 15,97 12,62 11,07 5,38 9,3 6,96 4,68 6,36 12,31 8,43 7,4 5,02 5,18 4,01 2,89 3,26 6,38 4,82 4,11 3,97 Tabelle 7.1: SPECViewperf 8.0, Ergebnisse aus dem Benchmarks 9. März 2005 Seite 26 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildung 7.2: Benchmark Ergebnisse von SPECViewperf mit Konfiguration 1 9. März 2005 Seite 27 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildung 7.3: Benchmark Ergebnisse von SPECViewperf mit Konfiguration 2 9. März 2005 Seite 28 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildung 7.4: Benchmark Ergebnisse von SPECViewperf mit Konfiguration 3 9. März 2005 Seite 29 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildung 7.5: Benchmark Ergebnisse von SPECViewperf mit Konfiguration 4 9. März 2005 Seite 30 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle 7.1.2 RST-L WS 04/05 3DMark03 Bei 3DMark03 wird das Ergebnis in einer Score dargestellt und setzt sich wie folgt zusammen: 3DMark03 score = (Game Test 1 frame-rate x 7.3) + (Game Test 2 frame-rate x 37) + (Game Test 3 frame-rate x 47.1) + (Game Test 4 frame-rate x 38.7) [19] x16 x8 (SLI) Konfiguration 1: Punkte 8062 8059 Konfiguration 2: Punkte 6075 6058 Konfiguration 3: Punkte 4259 4230 Konfiguration 4: Punkte 2373 2323 x8 x4 x2 x1 8065 8020 7894 7234 6062 6025 5954 5512 4222 4132 3978 3642 2317 2186 1999 1803 Tabelle 7.2: 3DMark03, Ergebnisse aus den Benchmarks 9. März 2005 Seite 31 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildung 7.6: Benchmark Ergebnisse von 3DMark03 9. März 2005 Seite 32 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle 7.1.3 RST-L WS 04/05 3DMark05 Die Score bei 3DMark05 setzt sich so zusammen: 3DMark05 score = (Game Test 1 * Game Test 2 * Game Test 3)ˆ 0.33 * 250 [20] x16 x8 (SLI) Konfiguration 1: Punkte 3554 3497 Konfiguration 2: Punkte 3068 2993 Konfiguration 3: Punkte 2749 2508 Konfiguration 4: Punkte 2240 2060 x8 x4 x2 x1 3501 3249 2956 2428 2968 2611 2168 1634 2570 1964 1416 894 2007 1376 905 580 Tabelle 7.3: 3DMark05, Ergebnisse aus den Benchmarks 9. März 2005 Seite 33 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildung 7.7: Benchmark Ergebnisse von 3DMark05 9. März 2005 Seite 34 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle 7.1.4 RST-L WS 04/05 UMark/ Unreal Tournament 2004 Die Tests mit UMark bzw. Unreal Tournament 2004 ergaben pro Map1 einen durchschnittlichen Wert der FPS2 , die ich dann zu einem Mittelwert zusammengefasst habe. Mapa Konfiguration 1: AS-Convoy BR-Colossus CTF-BridgeOfFate CTF-FaceClassic DM-Rankin ONS-Primeval ONS-Torlan Mittelwert von Konfiguration 1 Konfiguration 2: AS-Convoy BR-Colossus CTF-BridgeOfFate CTF-FaceClassic DM-Rankin ONS-Primeval ONS-Torlan Mittelwert von Konfiguration 2 Konfiguration 3: AS-Convoy BR-Colossus CTF-BridgeOfFate CTF-FaceClassic DM-Rankin ONS-Primeval ONS-Torlan Mittelwert von Konfiguration 3 Konfiguration 4: AS-Convoy BR-Colossus CTF-BridgeOfFate CTF-FaceClassic DM-Rankin ONS-Primeval ONS-Torlan Mittelwert von Konfiguration 4 x16 x8 (SLI) x8 x4 x2 x1 58,8 102,4 141,6 137,3 86,8 83,2 86,4 99,5 58,7 102,5 141,7 137,3 86,9 83,3 86,6 99,6 58,8 102,4 141,5 137,3 86,9 83,2 86,5 99,5 58,7 102,4 141,7 137,4 86,9 83,2 86,4 99,5 58,5 101,9 140,8 135,9 86,4 82,6 86,3 98,9 58,6 102,5 141,9 133,6 87 81,3 86,6 98,8 58,7 102,1 140 136 86,8 81,2 86,5 98,8 58,7 102,4 140,1 136,1 86,8 81,3 86,5 98,8 58,7 102,4 140 136,1 86,7 81,2 86,6 98,8 58,7 102,3 140 135,6 86,8 80,9 86,7 98,7 58,4 101,9 138,6 133,5 86,3 78,7 86,3 97,7 58,3 101,9 134,9 129 85,4 72,9 86,5 95,6 57,9 96,8 128,5 125,3 84,3 65,4 81,7 91,4 58,1 96,8 128,4 125,2 84,1 65,1 81,7 91,3 58,1 96,7 128,4 125,1 84,1 65,2 81,8 91,3 58 96,2 127,5 124,4 83,6 64,1 81,4 90,7 57,5 94 124,3 121,5 81,5 61,5 80,3 88,7 56,9 88 114,1 115,4 75,6 56 77,6 83,4 45,1 53,5 56,3 78 47,5 27,4 44,3 50,3 44,9 53,4 56,3 77,8 47,3 27,3 44,3 50,2 44,9 53,4 56,3 77,8 47,3 27,3 44,3 50,2 44,5 53 56 77 46,7 27 44,1 49,8 43,3 52 55,3 75,1 45,2 26,2 43,7 48,7 40,7 49,5 53,2 70,4 42 24,6 42,6 46,1 Tabelle 7.4: UMark/ Unreal Tournament 2004, Ergebnisse aus den Benchmarks a Spielplan 1 Spielplan 2 Frames per second, Bilder pro Sekunde 9. März 2005 Seite 35 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildung 7.8: Benchmark Ergebnisse von UMark/ Unreal Tournament 2004 9. März 2005 Seite 36 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle 7.1.5 RST-L WS 04/05 Doom3 Der Timedemo-Test von Doom3 musste zweimal durchgeführt werden, um ein brauchbares Ergebnis zu liefern. Das liegt dadran, dass einige Objekte während der Laufzeit generiert werden, so dass nach dem ersten Durchlauf die Daten schon im Speicher vorhanden sind, das das Ergebnis deutlich verbessert. Die Werte in den Klammern sind die Ergebnisse des ersten Druchlaufs, daneben die des zweiten, die auch in den Diagrammen zu finden sind. x16 Konfiguration 1: s (37,1) 24,6 FPS (57,9) 87,5 Konfiguration 2: s (40,6) 34,9 FPS (52,8) 61,5 Konfiguration 3: s (59,1) 54 FPS (36,3) 39,8 Konfiguration 4: s (102,4) 97,5 FPS (21) 22 x8 (SLI) x8 x4 x2 x1 (37,2) 26,7 (57,8) 80,5 (37,2) 26,7 (57,8) 80,6 (37,9) 27,9 (56,7) 78,6 (39,5) 29,3 (54,3) 73,2 (42,7) 35,5 (50,3) 60,5 (40,9) 35,1 (52,6) 61,1 (40,9) 35,1 (52,5) 61,1 (42,1) 36,4 (51) 59 (45,9) 40,4 (46,8) 53,1 (56,5) 51,4 (38) 41,8 (59,4) 54,4 (36,1) 39,5 (59,5) 54,4 (36,1) 39,5 (61,2) 56,2 (35,1) 38,2 (66) 61,1 (32,6) 35,2 (78,2) 73,6 (27,5) 29,2 (104,3) 97,9 (20,6) 21,9 (102,3) 97,9 (21) 22 (104) 99,6 (20,7) 21,6 (108,6) 104,1 (19,8) 20,6 (122,9) 116 (17,5) 18,5 Tabelle 7.5: Doom3 High Quality, Ergebnisse aus dem Timedemo-Benchmark x16 Konfiguration 1: s (39,9) 27,4 FPS (53,8) 78,4 Konfiguration 2: s (43,8) 37 FPS (49) 58 Konfiguration 3: s (64,3) 57,5 FPS (33,4) 37,4 Konfiguration 4: s (110,3) 104,9 FPS (19,5) 20,5 x8 (SLI) x8 x4 x2 x1 (39,5) 27,7 (54,4) 77,5 (40,5) 27,6 (53) 77,8 (41,9) 29,2 (51,3) 73,5 (45,7) 34,5 (47) 62,2 (62,2) 50,5 (34,5) 42,5 (45,3) 38,1 (47,5) 56,4 (45,1) 37,8 (47,6) 56,8 (48,7) 41,5 (44,1) 51,8 (57) 48,5 (37,7) 44,3 (72,8) 69,2 (29,5) 31 (67,3) 59,4 (31,9) 36,1 (66,4) 59,5 (32,3) 36,1 (72,4) 64,2 (29,7) 33,5 (86,4) 77 (24,9) 27,9 (118,5) 107,1 (18,1) 20,1 (118,6) 111,8 (18,1) 19,2 (116,6) 110,6 (18,4) 19,4 (134,7) 132,3 (15,9) 16,2 (158,4) 153,9 (19,8) 14 (235,6) 229,3 (9,1) 9,4 Tabelle 7.6: Doom3 Ultra Quality, Ergebnisse aus dem Timedemo-Benchmark 9. März 2005 Seite 37 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildung 7.9: Benchmark Ergebnisse von Doom3 mit High Quality 9. März 2005 Seite 38 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Abbildung 7.10: Benchmark Ergebnisse von Doom3 mit Ultra Quality 9. März 2005 Seite 39 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Kapitel 8 Fazit SPECViewperf und Doom3 sind mit PCI-Express x4 noch gut zurechtgekommen. Für 3DMark03 und UMark bzw. Unreal Tournament 2004 war der PCI-Express x1 Modus noch akzeptabel, das liegt an der etwas älteren Grafikberechnung. Bei 3DMark05 hingegen merkte man schon bei PCI-Express x4 einen kleinen Engpass bei der Datenübertragung, aber es lieferte noch akzeptabele Werte. Die Ergebnisse zeigen, dass in den meisten Fällen die Schnittstellenbreite von PCI-Express x4 ausreichen würde. Es kommt natürlich auf die gewünschten Einstellungen der Grafikkarte an. Mit Antialiasing und Anisotropische Filter auf höchster Stufe sieht zwar die Grafik perfekt aus, aber das Spiel bzw. die Anwendung kann zu einer Dia-Show werden. Beim Einsatz von zwei Grafikkarten, die sich dann die x16 Schnittstelle teilen, ist keine Leistungseinbuße hinsichtlich der halben Bandbreite mit jeweils x8 zu befürchten. Bei Spielen bzw. Anwendungen für den Endverbraucher kommt es noch nicht zu so hohen Datenmengen das die volle Bandbreite von PCI-Express x16 gebraucht wird. Das wird sich voraussichtlich mit den nächsten Grafkkarten-Generationen ändern. 9. März 2005 Seite 40 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Kapitel 9 Anhang 9.1 Links THG Patrick Schmid, Achim Roos: PCI Express durchleuchtet: Alle Modi im Test; tom’s hardware guide, 5. November 2004, http://www.de.tomshardware.com/graphic/20041105/index.html CPU-Z CPU-Z http://www.cpuid.com/cpuz.php SPEC Standard Performance Evaluation Corporation http://www.spec.org/ SPECViewperf SPECViewperf 8 http://www.spec.org/ Futuremark Futuremark http://www.futuremark.com/ 3DMark03 3DMark03 http://www.futuremark.com/products/3dmark03/ 3DMark05 3DMark05 http://www.futuremark.com/products/3dmark05/ UMark UMark http://unrealmark.net/index.php UT2004 Unreal Tournament 2004 http://www.unrealtournament.com/ut2004/ Doom3 Doom3 http://www.doom3.com/ 9. März 2005 Seite 41 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 Literaturverzeichnis [1] Patrick Schmid, Achim Roos: PCI Express durchleuchtet: Alle Modi im Test; tom’s hardware guide, 5. November 2004, http://www.de.tomshardware.com/graphic/20041105/index.html [2] Wikipedia: Application Programming Interface; Wikipedia, 16. Feb 2005, http://de.wikipedia.org/wiki/Application_Programming_Interface [3] Wikipedia: DirectX; Wikipedia, 19. Feb 2005, http://de.wikipedia.org/wiki/Directx [4] Wikipedia: Benchmark; Wikipedia, 2. Mär 2005, http://de.wikipedia.org/wiki/Benchmark [5] Wikipedia: OpenGL; Wikipedia, 19. Feb 2005, http://de.wikipedia.org/wiki/OpenGL [6] SPEC: A Summary of SPECviewperf Attributes; Standard Performance Evaluation Corporation, 13. Febuar 2004, http://www.spec.org/gpc/opc.static/attributes.html [7] Rob Putney / Simon Green / Chris Watts / Bill Licea-Kane / Allen Jensen / Ian Williams: What is This Thing Called ”SPECviewperf”?; Standard Performance Evaluation Corporation, 6. August 2004, http://www.spec.org/gpc/opc.static/whatis_vp8.html [8] Futuremark: 3DMark03 Minimum System Recommendations; Futuremark Corporation, 2005, http://www.futuremark.com/products/3dmark03/?minreq [9] Futuremark: 3DMark05 Minimum System Recommendations; Futuremark Corporation, 2005, http://www.futuremark.com/products/3dmark05/?minreq 9. März 2005 Seite 42 Rechnerstrukturen Labor Laborbericht: Untersuchung der PCI-Express-Schnittstelle RST-L WS 04/05 R Tournament 2004 System Specs; [10] Epic Games: Unreal Epic Games, Inc., 2004, http://www.unrealtournament.com/ut2004/specs.php [11] id Software: Doom3 System Requirements; id Software Inc., 2004-2005; http://www.doom3.com/ [12] Doom3.de: TimeDemo; Doom3.de, 08/03/04 http://doom3.ingame.de/article.php?intID=1279\&intTemplate=7\&intSite=5 [13] Wikipedia: Antialiasing; Wikipedia, 17. Febuar 2005, http://de.wikipedia.org/wiki/Antialiasing [14] Hermann Eiden: Trends 1999: Entwicklungen im 3D-Chipmarkt; tom’s hardware guide, 1. April 1999, http://www.de.tomshardware.com/graphic/19990401/3dtrends-03.html [15] Wikipedia: VSync; Wikipedia, 10. Januar 2005, http://de.wikipedia.org/wiki/Vsync [16] Frank Schräer: Doom 3 VGA Leistungscheck; Hartware.net, 09. August 2004, http://www.hartware.net/review_417_3.html [17] Wikipedia: Bumpmapping; Wikipedia, 25. Febuar 2005, http://de.wikipedia.org/wiki/Bumpmapping [18] Bill Licea-Kane: Weighted Geometric Mean Selected for SPECviewperf Composite Numbers; Standard Performance Evaluation Corporation, 15. Oktober 2003, http://www.spec.org/gpc/opc.static/geometric.html [19] Maneesh Dhagat: 3DMark03 Whitepaper; Futuremark Corporation, 11. Febuar 2003, http://www.futuremark.com/companyinfo/3dmark03_whitepaper.pdf [20] Patric Ojala & Nicklas Renqvist: 3DMark05 Whitepaper v1.0; Futuremark Corporation, 22. September 2004, http://www.futuremark.com/companyinfo/3DMark05_Whitepaper_v1_0.pdf 9. März 2005 Seite 43