Laborbericht - Weblearn

Transcription

Laborbericht - Weblearn
Rechnerstrukturen Labor
(RST-L WS 2004/05)
Laborbericht
Untersuchung der PCI-Express-Schnittstelle
bei Herrn Prof. Dr. Risse
an der Hochschule Bremen
Brünje Appelmann
9. März 2005
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Inhaltsverzeichnis
Tabellenverzeichnis
2
Abbildungsverzeichnis
3
1 Einleitung
4
2 Vorbetrachtung
5
3 Versuchsbeschreibung
6
4 Versuchsanforderungen
4.1 Verwendete Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Verwendete Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
7
8
5 Versuchsanordnung
13
5.1 Versuchsaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.2 Versuchseinstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
6 Versuchsdurchführung
17
6.1 PCI-Express x16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6.2 Klebetrick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
7 Versuchsauswertung
25
7.1 Benchmark-Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
8 Fazit
40
9 Anhang
41
9.1 Links . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Literaturverzeichnis
9. März 2005
42
Seite 1
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Tabellenverzeichnis
8
4.1 Verwendete Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 Hardware-Konfiguration für die Testdurchläufe . . . . . . . . . . . . . . . . . . . . . . . 14
5.2 Konfiguration von UMark . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
5.3 Einstellungen für Doom3, High und Ultra Quality . . . . . . . . . . . . . . . . . . . . . 16
7.1
7.2
7.3
7.4
7.5
7.6
SPECViewperf 8.0, Ergebnisse aus dem Benchmarks . . . . . . . .
3DMark03, Ergebnisse aus den Benchmarks . . . . . . . . . . . . .
3DMark05, Ergebnisse aus den Benchmarks . . . . . . . . . . . . .
UMark/ Unreal Tournament 2004, Ergebnisse aus den Benchmarks
Doom3 High Quality, Ergebnisse aus dem Timedemo-Benchmark .
Doom3 Ultra Quality, Ergebnisse aus dem Timedemo-Benchmark .
9. März 2005
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
26
31
33
35
37
37
Seite 2
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildungsverzeichnis
4.1 Systemplatine von Gigabyte GA-K8NXP-SLI . . . . . . . . . . . . . . . . . . . . . . .
4.2 Grafikkarte von MSI NX 6600GT TD 128 E . . . . . . . . . . . . . . . . . . . . . . . .
7
8
5.1 Versuchsaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
6.1
6.2
6.3
6.4
6.5
6.6
6.7
6.8
6.9
6.10
6.11
6.12
6.13
6.14
6.15
6.16
6.17
6.18
6.19
Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x16 . . . . . . . . . . .
PCI-Express Schnittstellenbelegung . . . . . . . . . . . . . . . . . . . . . . . . . . . .
erster Abklebeversuch mit x8 (Vorderseite), der so nicht funktioniert . . . . . . . . . .
erster Abklebeversuch mit x8 (Rückseite), der so nicht funktioniert . . . . . . . . . . .
Vorderseite der Steckkarte zur Konfiguration der Systemplatine mit zwei Grafikkarten
Rückseite der Steckkarte zur Konfiguration der Systemplatine mit zwei Grafikkarten .
Bildschirmanzeige von CPU-Z mit PCI-Express x8, Systemplatine im SLI-Betrieb . . .
neuer Abklebeversuch mit x8 (Vorderseite) . . . . . . . . . . . . . . . . . . . . . . . .
neuer Abklebeversuch mit x8 (Rückseite) . . . . . . . . . . . . . . . . . . . . . . . . .
Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x8, neu Abgeklebt . . .
neuer Abklebeversuch mit x4 (Vorderseite) . . . . . . . . . . . . . . . . . . . . . . . .
neuer Abklebeversuch mit x4 (Rückseite) . . . . . . . . . . . . . . . . . . . . . . . . .
Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x4, neu Abgeklebt . . .
neuer Abklebeversuch mit x2 (Vorderseite) . . . . . . . . . . . . . . . . . . . . . . . .
neuer Abklebeversuch mit x2 (Rückseite) . . . . . . . . . . . . . . . . . . . . . . . . .
Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x2, neu Abgeklebt . . .
neuer Abklebeversuch mit x1 (Vorderseite) . . . . . . . . . . . . . . . . . . . . . . . .
neuer Abklebeversuch mit x1 (Rückseite) . . . . . . . . . . . . . . . . . . . . . . . . .
Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x1, neu Abgeklebt . . .
17
18
19
19
19
19
20
21
21
21
22
22
22
23
23
23
24
24
24
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
7.10
Formel für die Berechnung der ”Weighted Geometric Mean” . .
Benchmark Ergebnisse von SPECViewperf mit Konfiguration 1
Benchmark Ergebnisse von SPECViewperf mit Konfiguration 2
Benchmark Ergebnisse von SPECViewperf mit Konfiguration 3
Benchmark Ergebnisse von SPECViewperf mit Konfiguration 4
Benchmark Ergebnisse von 3DMark03 . . . . . . . . . . . . . .
Benchmark Ergebnisse von 3DMark05 . . . . . . . . . . . . . .
Benchmark Ergebnisse von UMark/ Unreal Tournament 2004 .
Benchmark Ergebnisse von Doom3 mit High Quality . . . . . .
Benchmark Ergebnisse von Doom3 mit Ultra Quality . . . . . .
25
27
28
29
30
32
34
36
38
39
9. März 2005
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Seite 3
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Kapitel 1
Einleitung
In Anlehnung an den Artikel 1 ”PCI Express durchleuchtet: Alle Modi im Test” von der Internetseite
vom tom’s hardware guide, in dem die verschiedenen PCI-Express Modi mit unterschiedlichen PCIExpress Grafikkarten untersucht werden, möchte ich diese Untersuchung des PCI-Express Busses
im Rahmen der Rechnerstrukturen-Labor Veranstalltung mit einer Grafikkarte nachstellen.
Im folgenden Dokument wird die Vorgehensweise bei der Untersuchung beschrieben und die Ergebnisse vorgestellt.
1 [THG]
siehe 9.1 Links
9. März 2005
Seite 4
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Kapitel 2
Vorbetrachtung
PCI-Express ist ein serielles Bussystem und besteht aus jeweils zwei Leitungen, eine sogenannte
Lane. Der Bus ist bidirektional, so besteht eine Verbindung, wie z.B. bei PCI-Express x1, aus zwei
Lanes, jeweils zwei Leitungen zum Senden bzw. Empfangen.
Eine weitere Besonderheit ist die freie Skalierbarkeit des Busses, es ist möglich die Anzahl der Lanes und somit die Breite der Schnittstelle bis zu PCI-Express x16 zu erweitert, mit jeweils 16 Lanes
in beide Richtungen. Eine genauere Beschreibung von PCI-Express für Grafikkarten ist in dem Dokument ”PCI Express als Grafikschnittstelle” zu finden, das ich im Rahmen der RechnerstrukturenLabor Veranstalltung erarbeitet habe.
PCI-Express x16 wird als neue Grafikkartenschnittstelle verwendet.
In dem oben genannten Artikel 1 werden den Grafikkarten die verschiedenen PCI-Express Modi
mittels abkleben der Schnittstelle entlockt und die Ergebnisse aus Benchmark Programmen miteinander verglichen.
[1]
1 [THG]
siehe 9.1 Links
9. März 2005
Seite 5
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Kapitel 3
Versuchsbeschreibung
In den Versuchen möchte ich einer PCI-Express Grafikkarte die verschiedenen Modi von PCIExpress entlocken und somit die Felxibilität der Schnittstelle untersuchen.
Mittels Klebeband werden die Datenleitungen der Schnittstelle abgeklebt, um verschiedene PCIExpress Modi zu simulieren.
Untersucht werden die PCI-Express Modi x16, x8, x4, x2 und x1, um einen Vergleich zwischen den
Modi zu verdeutlichen, werden verschiedene Benchmark-Programme eingesetzt, die in Abschnitt 4.2
Verwendete Software näher beschrieben werden.
9. März 2005
Seite 6
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Kapitel 4
Versuchsanforderungen
Die Anforderungen an die Hardware für die Untersuchung der PCI-Express Schnittstelle sind eine
Systemplatine mit PCI-Express x16 Schnittstelle und eine PCI-Express Grafikkarte. Mittlerweile sind
auch Systemplatinen mit PCI-Express für alle Prozessoren erhältlich.
Bei den Gerätetreibern sind die vom Hersteller bereitgestellten Versionen verwendt worden. Die
Programme zur Erstellung der Benchmarks sind hauptsächlich frei erhältlich Demoversionen.
4.1
Verwendete Hardware
Für die Versuche habe ich ein 64bit System mit AMD-Prozessor ausgewählt.
Die Systemplatine von Gigabyte ist mit dem neuen Chipsatz von NVIDIA nForce4-SLI ausgerüstet
und bietet neben der PCI-Express Unterstützung auch die Möglichkeit das System mit zwei PCIExpress Grafikkarten zu betreiben, siehe Abbildung 4.1.
Abbildung 4.1: Systemplatine von Gigabyte GA-K8NXP-SLI
9. März 2005
Seite 7
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Die verwendete Grafikkarte von MSI, auf Abbildung 4.2 zusehen, besitzt einen NVIDIA GeForce
6600GT Grafikprozessor und verfügt über 128 MB Speicher auf der Karte.
Abbildung 4.2: Grafikkarte von MSI NX 6600GT TD 128 E
Hier sind die verwendeten Hardware-Komponeten in einer Tabelle aufgeführt.
Prozessor:
Systemplatine:
Arbeitsspeicher:
Grafikkarte:
Festplatte:
DVD/CD-Rom:
AMD Athlon 64 3000+ 1800MHz
Sockel 939; Hyper Transport
Gigabyte GA-K8NXP-SLI
NVIDIA nForce4-SLI Chipsatz
BIOS F6
2x 512 MB DDR-400 PC3200 TakeMS CL2,5
Dual-Channel
MSI NX 6600GT TD 128 E
nVidia GeForce 6600 GT 128 MB GDDR3-SDRAM
Maxtor 200 GB, 8 MB, 7200 U/Min, SATA 150 MB/s
LG Super Multi DVD-Brenner GSA-4040B
Tabelle 4.1: Verwendete Hardware
4.2
Verwendete Software
Hier ist eine Zusammenstellung aller verwendeten Programme und Treiber.
Neben den Benchmark-Programmen wurden auch Spiele eingesetzt, um die Unterschiede der PCIExpress Modi zu verdeutlichen.
4.2.1
Betriebssystem
Als Betriebssystem wurde Windows XP Profssional verwendet, erweitert mit Service Pack 1, um die
neuste DirectX Version zu verwenden.
DirectX stellt die Schnittstellen zwischen Anwendungen und Gerätetreibern zur Verfügung, mit DirectX 9.0c ist die Voraussetzung gegeben, um die Benchmark-Programme und Spiele laufen zu
lassen.
[2], [3]
9. März 2005
Seite 8
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
4.2.2
RST-L WS 04/05
Treiber
Der mitgelieferte Grafikkartentreiber hat bei den Benchmarks nicht die erwarteten Ergebnisse geliefert. Aber auf der Internetseite des Herstellers MSI gab es eine neue Version des Treibers, den ich
für die Versuche verwendet habe.
Grafikkartentreiber:
NVIDIA Detornator W2K/XP v71.22
Für das Mainboard habe ich den mitgelieferten Treiber verwendet.
Chipsatztreiber:
4.2.3
NVIDIA Chipset Driver Version 6.31
Systeminformationsprogramm
Um zu sehen, ob der Bertrieb mit den PCI-Express Modi auch funktioniert, verwende ich das freie
Programm CPU-Z 1 . Es zeigt umfangreiche Infomationen zu den im System befindlichen HardwareKomponenten an.
4.2.4
Benchmark-Programme
In diesem Abschnitt werden die verwendeten Benchmark-Programme vorgestellt.
Benchmark-Programme werden für zur Ermittlung von Hardware-Leistung in Computersystemen
eingesetzt. Es sind genormte Testverfahren mit denen die Ergebnisse nach bestimmten Kriterien
miteinander verglichen werden können.
[4]
SPECViewperf 8
SPECViewperf 8 2 ist ein Benchmark-Programm von der Standard Performance Evaluation Corporation 3 , es ist frei erhältlich und verwendet OpenGL als Schnittstellen zwischen Anwendungen und
Gerätetreiber.
SPECViewperf beansprucht alle Komponenten der Grafikschnittstelle und die Auswirkungen auf
das System ohne den Aufwand einer vollen Anwendung. Es besteht aus einer Sammlung von
verschiedenen Tests:
3dsmax-03, basiert auf SPECapc für 3DStudio Max 3.1 konfiguriert mit Open GL-Treiber; umfasst
drei Modelle, das jedes eine durchschnittliche Anzahl von 1,5 Million Eckpunkten4 besitzt und
prüft Leistung von Szenen mit unterschiedlichen Niveaus der Beleuchtung.
catia-01, basiert auf Dassaults CATIA, mit Modellen, die bis zu zwei Million Eckpunkte enthalten.
ensight-01, basiert auf CEIs EnSight technischer und wissenschaftlicher Visualisierungsanwendung, es umfasst Anzeigenlisten und Echtzeit-Arbeitsbelastungen5 .
1 [CPU-Z]
siehe 9.1 Links
siehe 9.1 Links
3 [SPEC] siehe 9.1 Links
4 vertices
5 display-list- and immediate-mode workloads
2 [SPECViewperf]
9. März 2005
Seite 9
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
light-07, basiert auf Ausschnitten aus Discreets Lightscape Anwendung.
maya-01, basiert auf Ausschnitten aus Maya 5.
proe-03, basiert auf SPECapc für Pro/ENGINEER 2001, misst zwei Modelle in drei Modi - schattiert, als Drahtgittermodell und verstecker Linienabbau 6 .
sw-01, basiert auf Ausschnitten der Anwendung 2004 Solidworks von Dassault Systemes.
ugs-04, basiert auf SPECapc für Unigraphics V17, prüft die Leistung eines Motormodelles, das 4,1
Million Eckpunkte enthält.
Diese Arten von Programmen übertragen gewöhnlich große Datenmengen, alle acht Ansichten stellen verhältnismäßig umfangreiche Anwendungen dar.
[5], [6], [7]
3DMark03
3DMark03 7 von Futuremark 8 ist eines der bekanntesten Benchmark-Programme und wird oft als
Referenz für Grafikkartenbewertungen verwendet. Es nutzt die Eigenschaften von einer älteren DirectX Version, DirectX 9.0a, die in DirectX 9.0c enthalten sind.
In der freien Version werden leider nicht alle Eigenschaften des Programms ausgenutzt, es reicht
jedoch aus, um einen Vergleich zwischen den PCI-Express Modi zu zeigen.
Minimale Systemanforderung:
• x86 kompatibler Prozessor, 1000MHz (PCMark2002 CPU Wertung von über 2500)
• 256MB RAM (512MB empfohlen)
• 400MB freier Festplattenspeicher (installiert)
R 98/SE/ME/2000/XP
• Windows
R
• DirectX9.0c
oder neuer
• DirectX 9 kompatible Grafikkarte mit mindestens 32MB Speicher und voller DirectX 7 Unterstützung.
[8]
6 hidden-line
removal (HLR)
siehe 9.1 Links
8 [Futuremark] siehe 9.1 Links
7 [3DMark03]
9. März 2005
Seite 10
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
3DMark05
3DMark05 9 auch von Futuremark wird zusätzlich zu 3DMark03 als Referenz für die Bewertung von
Grafikkarten eingesetzt, die die Eigenschaften von DircetX 9.0c nutzen.
Auch hier, in der frei erhältlichen Version, sind wie bei 3DMark03 nicht alle Eigenschaften des Programms freigeschaltet.
Minimale Systemanforderung:
• DirectX 9 kompatible Grafikkarte mit Unterstützung von Pixel Shader 2.0 oder höher und Grafikspeicher von mindestens 128 MB.
• Intel oder AMD kompatibler Prozessor mit mindestens 2 GHz Taktung.
• mindestens 512 MB RAM.
• 1.5 GB freier Festplattenspeicher.
• Windows 2000 oder XP Betreibssystem mit dem neusten Service Pack und Erweiterungen
installiert.
• DirectX 9.0c installiert.
• Microsoft Internet Explorer 6 installiert, für die Funktionalität von 3DMark.
• Microsoft Excel 2000, 2003 oder XP, für die Funktionalität von 3DMark.
[9]
UMark/ Unreal Tournament 2004
UMark 10 ist ein Open Source Programm mit dem man leicht Benchmarks für Spiele der Unreal
Tournament 200x Reihe konfigurieren kann. Ich verwende für die Benchmarks die Demoversion von
Unreal Tournament 2004 11 .
Das Spiel nutzt die Eigenschaften von DircetX 8.1. Mit der Demoversion kann nur der Botmatch 12 Benchmark eingesetzt werden. Aber auch dies reicht aus um die Unterschiede der verschiedenen
PCI-Express Modi zu verdeutlichen.
Minimale Systemanforderung:
• Betriebssystem: Windows 98/Me/2000/XP
• Prozessor: einen Pentium III oder AMD Athlon 1.0 GHz Prozessor (ab 1.5 GHz getaktetem
Prozessor empfohlen)
• Arbeitsspeicher: 128 MB RAM (256 MB empfohlen)
• Festplattenspeicher: 5.5 GB frei
• Grafik: eine Windows kompatible Grafikkarte (NVIDIA GeForce 2 oder ATI Radeon mit mindestens 64 MB Grafikspeicher empfohlen)
• Ton: Windows kompatible Soundkarte.
• DirectX: DirectX Version 8.1(enthalten) oder höher
[10]
9 [3DMark05]
siehe 9.1 Links
siehe 9.1 Links
11 auch UT2004 genannt, [UT2004] siehe 9.1 Links
12 computergenerierte Spieler, sogenannte Bots, die gegeneinander antreten.
10 [UMark]
9. März 2005
Seite 11
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Doom3
Das Spiel Doom3 13 von idSoftware wird oft als Referenzspiel für Grafikkartenbewertungen eingesetzt. In dem Spiel ist ein FPS 14 -Test eingebaut, mit dem Befehl
timedemo demo1
, der in die Konsole eingegeben werden muss. Die Konsole kann mit ( ALT + STRG + ˆ ) geöffnet
werden.
Minimale Systemanforderung:
R 9.0b kompatibel mit 64 MB
• 3D Hardware Beschleuniger Karte erforderlich - 100% DirectX
Grafikspeicher und den neusten Treiber.
• Microsoft Windows 2000/XP
• einen Pentium IV 1.5 GHz oder Athlon XP 1500+ Prozessor
• 384 MB RAM
• 8x CD-ROM Laufwerk
• 2.2 GB unkomprimierter freier Festplattenspeicher (plus 400 MB für Windows Auslagerungsdateien)
• 100% DirectX 9.0b kompatible 16-bit Soundkarte und den neusten Treiber
• 100% Windows 2000/XP kompatible Maus, Tastertur und die neusten Treiber
R 9.0b (enthalten)
• DirectX
[11], [12]
13 [Doom3],
14 FPS,
siehe 9.1 Links
Frames per second, Bilder pro Sekunde
9. März 2005
Seite 12
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Kapitel 5
Versuchsanordnung
In diesem Kapitel werden der Versuchsaufbau, die Vorbereitung und die Einstellungen für die Durchführung der Versuche beschrieben.
5.1
Versuchsaufbau
Im Versuchsaufbau, der auf Abbildung 5.1 zu sehen ist, sind die verwendeten Hardware Komponenten zu sehen.
Abbildung 5.1: Versuchsaufbau
5.2
Versuchseinstellungen
In diesem Abschnitt sind die Einstellungen für die Versuchsdurchführung zu finden.
9. März 2005
Seite 13
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
5.2.1
RST-L WS 04/05
Hardware Einstellungen
Die Schnittstelle der PCI-Express Grafikkarte wird für die Versuche mit Klebeband abgeklebt, die
Technik wird in Abschnitt 6.2 näher beschrieben. Die Einstellungen des Grafikkartentreibers für die
Versuche sind im Betriebssystem, unter Windows, konfiguriert worden.
In jedem PCI-Express Modus wurden 4 Testdurchläufe mit 4 verschiedene Einstellungen für die
Grafikkarte durchgeführt, die in der folgenden Tabelle zusammengefasst sind.
Konfiguration 1:
Konfiguration 2:
Konfiguration 3:
Konfiguration 4:
1024 x 768, kein AA a , kein AF b , hohe Leistung,
VSyncc anwendungsgesteuert
1024 x 768, 2x AA, 2x AF, hohe Qualität,
VSync: Anwendungsgesteuert
1024 x 768, 4x AA, 4x AF, hohe Qualität,
VSync: Anwendungsgesteuert
1024 x 768, 8x AA, 16x AF, hohe Qualität,
VSync: Anwendungsgesteuert
Tabelle 5.1: Hardware-Konfiguration für die Testdurchläufe
a Antialiasing,
siehe AA in Abschnitt 5.2.1
Filter, siehe AF in Abschnitt 5.2.1
c auch vertikalen Synchronisation, siehe VSync in Abschnitt 5.2.1
b Anisotropische
AA, Antialiasing
Unter Antialiasing oder Treppeneffektglättung bei der Bildschirmausgabe versteht man das Beseitigen des so genannten Treppeneffekts (eine Auswirkung vom Aliasing), der bei der Rasterung einer
Form (Linie, Kreis, Schrift u. ä.) entsteht. Weiterhin wird so genanntes Line Popping reduziert, welches in Bewegung auftritt.
[13]
AF, Anisotropische Filter
Beim anisotropischen Filtern (Anisotropic Filtering) werden alle Objekte eines Spiels, Akteure und
Kulissen in der sogenannten Graphikpipeline zuerst in Basiselemente, zumeist Dreiecke, zerlegt.
Wenn zu einem späteren Zeitpunkt die entstandenen Dreiecke oder Polygone mit Texturen versehen
werden, so werden die Probleme, die in den Überlappungs- bzw. Grenzbereichen dieser Elemente
entstehen, durch sogenannte Filter gemildert.
[14]
VSync, vertikale Synchronisation
Leider ist mir erst nachdem ich alle Teste durchgeführt hatte aufgefallen, dass die Einstellung für
die vertikale Synchronisation der Grafik1 auf ”anwendungsgesteuert” eingestellt war. Es ist also von
dem Programm abhängig, ob die vertikale Synchronisation an oder ausgeschaltet ist. Der Standardwert für VSync ist bei den hier verwendeten Programmen allerdings auf ein gesetzt. Wenn VSync
ausgeschaltet ist, bekommt man einen höheren Wert bei den FPS2 .
[15]
1 vertikale
2 Frame
Synchronisation der Grafik, auch VSync genannt
per second, Bilder pro Sekunde
9. März 2005
Seite 14
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
5.2.2
RST-L WS 04/05
Software Einstellungen
Im folgenden Abschnitt werden die Einstellung der Programme beschrieben.
SPECViewperf 8
SPECvieperf bietet umfangreiche Einstellmöglichkeiten. Von mir wurden allerdings nur das Programm mit den Standard Einstellungen ausgeführt.
3DMark03
Bei der frei erhältlichen Version von 3DMark03 gibt es leider nicht die Möglichkeit, Einstellungen im
Programm vorzunehmen.
3DMark05
Wie auch bei 3DMark03 können in der freien Version von 3DMark05 keine Einstellungen für das
Programm vorgenommen werden.
UMark/ Unreal Tournament 2004
UMark bietet neben der Wahl des Spiels aus der Unreal Tournament 200x Reihe auch die Wahl
der Auflösung. Bei den Detailstufen besteht die Wahl zwischen Hoher Leistung, Hoher Qualität,
derzeitigen Einstellungen oder der Angabe einer Datei, in der die Einstellungen definiert sind.
Die Einstellung für den Benchmark sind bei der Demoversion von UT 20043 nur auf das Botmatch
begrenzt, bei dem noch die Anzahl der Bots festgelegt werden kann. Die Auswahl des TimedemoBenchmarks ist nur mit der Vollversion des Spiels möglich. Für den Benchmark steht noch die Wahl
einer Map4 zur Verfügung, wahlweise kann auch ein vorgefertigte Liste mit mehreren Spielplänen
abgearbeitet werden. Diese Liste kann auch selbst zusammengestellt werden.
In der folgenden Tabelle sind die Versuchseinstellungen zu finden.
UT 200x Version:
Benchmark Auflösung:
Benchmark Einstellungen:
Detailstufe:
UT 2004 Demoversion, Fullscreen
1024 x 768
12 Bots, vordefinierte Liste
mit Mapsa aus der Demoversion
derzeitige Einstellungen
Tabelle 5.2: Konfiguration von UMark
a Spielplänen
3 Unreal
Tournament 2004
oder Karte auf der gespielt wird
4 Spielplan
9. März 2005
Seite 15
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Doom3
Die Einstellungen für das Spiel werden auch für den Timedemo-Benchmark übernommen. Die
Video Qualität ist auswählbar, zur Wahl stehen Low, Medium, High oder Ultra Quality.
Bei der Einstellung für Ultra Quality werden die Texturen unkomprimiert in die Grafikkarte geladen,
diese sind rund 500 MB groß, empfohlen wird eine Grafikkarte mit 512 MB Speicher. Außerdem
kann die Auflösung und der Vollbid Modus deaktiviert werden.
Unter den erweiterten Optionen gibt es noch zusätzliche Einstellungsmöglichkeiten, die Aktivierung
von hohen Qualitätsspezialeffekten und die Aktivierung von Schatten-, Glanzlicht- und BumpmapEffekten.
Bumpmapping ist eine Darstellungsart bei der Oberflächenunebenheiten simuliert werden, die in
der Geometrie des Modells gar nicht vorhanden sind. Die nötigen Informationen werden in eine
Textur gepackt, mit deren Hilfe Schattierungen auf eine Oberfläche gezeichnet werden.
Außerdem besteht die Möglichkeit die Aktivierung der vertikalen Synchronisation5 und die Einstellung von Antialiasing vorzunehmen. Wird die Einstellung bei Antialiasing ausgeschaltet, so werden
die Einstellungen der Grafikkartentreiber vom Betriebssystem übernommen.
[16], [17]
In der folgenden Tabelle sind die Einstellungen für die Versuche zu finden. Ich habe mich für zwei
verschiedene Qualitätseinstellungen entschieden, um die Unterschiede der verschiedenen PCIExpress Modi zu verdeutlichen.
Video Qualität:
Auflösung:
Vollbild:
Erweiterte Optionen:
HQ Spezialeffekte:
Aktivierung der Schatteneffekte:
Aktivierung der Glanzlichteffekte:
Aktivierung der Bumpmap-Effekte:
vertikale Synchronisation:
Antialiasing:
High Quality Ultra Quality
1024 x 768
ja
ja
ja
ja
ja
nein
aus
Tabelle 5.3: Einstellungen für Doom3, High und Ultra Quality
5 siehe
VSync in Abschnitt 5.2.1
9. März 2005
Seite 16
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Kapitel 6
Versuchsdurchführung
Bevor die Benchmark Programme durchführt werden können, muss die Schnittstelle vorbereitet werden. Hierzu wird die Schnittstelle mit Klebeband abgeklebt, dies wird im flogenden Abschnitt 6.2
näher beschrieben.
6.1
PCI-Express x16
Der erste Durchlauf der Benchmark Programme unter PCI-Express x16 lief problemlos, wie auf der
Abbildung 6.1 der Bildschirmanzeige von CPU-Z zu sehen ist.
Die Ergebnisse zu diesem und den weiteren Tests sind in dem Kapitel 7.1 Benchmark Ergebnisse
zu finden.
Abbildung 6.1: Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x16
9. März 2005
Seite 17
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
6.2
RST-L WS 04/05
Klebetrick
Auf einer der Internetseiten mit dem Artikel1 von toms’s hardware guide ist eine Abbildung mit der
Belegung der PCI-Express Schnittstelle zu finden, leider sind dort die Modi nicht korrekt eingezeichnet. Eine überarbeitete Version ist auf Abbildung 6.2 zu sehen, in der die Schnittstellenmodi von
PCI-Express eingezeichnet sind.
Abbildung 6.2: PCI-Express Schnittstellenbelegung
1 [THG]
siehe 9.1 Links
9. März 2005
Seite 18
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
6.2.1
RST-L WS 04/05
Fehlversuch
Das Abkleben der Schnittstelle, wie es in dem Artikel von tom’s hardware guide beschrieben wird,
hat so nicht funktioniert. Dort wird ein Teil der Schnittstelle mit einem Stück Klebeband überklebt,
siehe Abbildung 6.3 und Abbildung 6.4.
Beim Einschalten des Rechners ertönte von der Systemplatine ein akustischer Fehlersignalcode,
der auf einen Fehler bei der Grafikarte hinweist und der Rechner nicht hochfuhrt.
Abbildung 6.3: erster Abklebeversuch mit x8 (Vorderseite), der so nicht funktioniert
Abbildung 6.4: erster Abklebeversuch mit x8 (Rückseite), der so nicht funktioniert
6.2.2
PCI-Express x8 mit SLI-Steckkarte
Durch diesen Fehlschlag nicht entmutigt, fiel mir ein, dass die Systemplatine die Möglichkeit besitzt,
das System mit zwei PCI-Express Grafikkarten zu betreiben.
Hierzu wird eine Steckkarte, siehe Abbildung 6.5 und Abbildung 6.6, auf der Systemplatine einfach
umgedreht und ermöglicht so den Betreib mit zwei PCI-Express Grafikkarten im x8 Modus.
Es liegt an der Architektur des Chipsatzes, der nur für den x16 Modus bei der Grafikschnittstelle
ausgelegt ist, somit teilen sich die Grafikkarten die Breite des Busses.
Abbildung 6.5: Vorderseite der Steckkarte zur Konfiguration der Systemplatine mit zwei Grafikkarten
Abbildung 6.6: Rückseite der Steckkarte zur Konfiguration der Systemplatine mit zwei Grafikkarten
9. März 2005
Seite 19
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Wie ist es wohl, wenn man die Systemplatine für den Betrieb mit zwei Grafikkarten kofiguriert und
nur eine Grafikkarte verwendet ? Ich habe die Systemplatine für den SLI-Betrieb2 vorbereitet und
mit nur einer Grafikkarte das System hochgefahren. Es hat funktioniert, wie auf der Abbildung 6.7
der Bildschirmanzeige von CPU-Z zusehen ist. Die Ergebnisse der Benchmark Programme sind im
Kapitel 7.1 zu finden.
Abbildung 6.7: Bildschirmanzeige von CPU-Z mit PCI-Express x8, Systemplatine im SLI-Betrieb
2 Betrieb
mit zwei Grafikkarten
9. März 2005
Seite 20
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
6.2.3
RST-L WS 04/05
neuer Klebetrick, mit PCI-Express x8, x4, x2, x1
Aber so konnte ich nur den x8 Modus von PCI-Express testen. Also musste ich mir etwas anderes
überlegen. Der Klebetrick, der im Artikel von tom’s hardware guide beschrieben wurde, funktionierte
nicht, da dort nicht nur die Datenleitungen sondern auch Masse und andere Leitungen überklebt
worden sind. Durch eine Modifikation des Klebebandes auf der abgeklebten Schnittstelle in dem nur
die Datenleitungen abgeklebt sind, siehe Abbilding 6.8 und Abbildung 6.9, konnte ich die Grafikkarten in den Betrieb vom PCI-Express Modus x8 bringen, wie auf der Abbildung 6.10 der Bildschirmanzeige von CPU-Z zu sehen ist.
Abbildung 6.8: neuer Abklebeversuch mit x8 (Vorderseite)
Abbildung 6.9: neuer Abklebeversuch mit x8 (Rückseite)
Abbildung 6.10: Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x8, neu Abgeklebt
9. März 2005
Seite 21
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Durch das Abkleben der Datenleitungen sind auch die Tests der anderen PCI-Express Modi zu
verwirklichen, wie auf den folgenden Abbildungen zu sehen ist.
Abbildung 6.11: neuer Abklebeversuch mit x4 (Vorderseite)
Abbildung 6.12: neuer Abklebeversuch mit x4 (Rückseite)
Abbildung 6.13: Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x4, neu Abgeklebt
9. März 2005
Seite 22
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildung 6.14: neuer Abklebeversuch mit x2 (Vorderseite)
Abbildung 6.15: neuer Abklebeversuch mit x2 (Rückseite)
Abbildung 6.16: Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x2, neu Abgeklebt
9. März 2005
Seite 23
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildung 6.17: neuer Abklebeversuch mit x1 (Vorderseite)
Abbildung 6.18: neuer Abklebeversuch mit x1 (Rückseite)
Abbildung 6.19: Abbildung der Bildschirmanzeige von CPU-Z mit PCI-Express x1, neu Abgeklebt
9. März 2005
Seite 24
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Kapitel 7
Versuchsauswertung
In diesem Kapitel sind die Ergebnisse der Benchmark Programme zusammengefasst.
7.1
7.1.1
Benchmark-Ergebnisse
SPECViewperf 8
Nach einem Durchlauf von SPECViewperf erhält man für jeden Testabschnitt einen Wert, den
”Weighted Geometric Mean”:
Abbildung 7.1: Formel für die Berechnung der ”Weighted Geometric Mean”
Die Formel zum Errechnen der ”Weighted Geometric Mean” setzt sich wie folgt zusammen, n ist die
Anzahl der einzelnen Tests einer Ansicht und w ist die Gewichtung jedes einzelnen Tests, mit einem
Wert zwischen 0.0 und 1.0 (Ein Test mit einer Gewichtung von ”10.0%” ist ein w von 0.10. Merke,
die Summe der Gewichtung der einzelnen Tests muss 1.00 betragen).
Im Endeffekt ist ein höherer Wert besser, was auf eine bessere Leistung schließen lässt. Eine umfangreiche Erklärung zu ”Weighted Geometric Mean” ist auf der Internetseite von SPEC zu finden,
der Link ist im Literaturverzeichniss zufinden. [18]
9. März 2005
Seite 25
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Hier sind die Ergebnisse in einer Tabelle und im Anschluss nochmal in einem Diagramm verdeutlicht.
Benchmark
x16
Konfiguration 1:
3dsmax-03 14,47
catia-01
11,07
ensight-01
9,12
ligth-07
8,8
maya-01
18,1
proe-03
15,97
sw-01
14,07
ugs-04
6,37
Konfiguration 2:
3dsmax-03 14,57
catia-01
11,04
ensight-01
8,67
ligth-07
8,72
maya-01
18,02
proe-03
15,53
sw-01
13,2
ugs-04
5,75
Konfiguration 3:
3dsmax-03 14,37
catia-01
10,32
ensight-01
8,56
ligth-07
8,65
maya-01
18,03
proe-03
14,16
sw-01
12,59
ugs-04
5,55
Konfiguration 4:
3dsmax-03 15,31
catia-01
10,65
ensight-01
8,67
ligth-07
9,31
19,25
maya-01
proe-03
16,27
sw-01
13,65
ugs-04
5,66
x8 (SLI)
x8
x4
x2
x1
14,57
11,07
9,12
8,78
18,07
15,97
14,05
6,37
14,53
11,07
9,11
8,78
18,07
15,97
14,04
6,37
14,38
10,62
8,04
8,75
18,03
14,18
12,89
6,32
9,68
7,56
5,62
6,64
13,8
8,81
7,65
5,8
5,32
4,11
3,48
3,32
7,09
4,98
4,18
4,8
14,5
11,03
8,67
8,72
18,03
15,52
13,18
5,73
14,45
11,03
8,67
8,72
18,03
15,58
13,18
5,73
14,5
10,51
7,75
8,71
18,01
13,59
12,02
5,68
9,61
7,54
5,37
6,63
13,8
8,81
7,57
5,36
5,29
4,08
3,43
3,32
7,05
4,98
4,16
4,41
14,32
10,29
8,56
8,64
18,03
14,16
12,53
5,55
14,29
10,31
8,56
8,64
18,03
14,16
12,53
5,54
14,27
9,66
7,66
8,62
18,01
12,7
11,45
5,51
9,54
7,12
5,3
6,5
13,8
8,81
7,56
5,2
5,24
4,03
3,39
3,31
7,05
4,98
4,18
4,35
13,71
9,83
8,12
8,55
16,73
13,9
12,02
5,41
13,74
9,83
8,11
8,55
16,73
13,91
12,02
5,41
13,42
9,46
7,03
8,53
15,97
12,62
11,07
5,38
9,3
6,96
4,68
6,36
12,31
8,43
7,4
5,02
5,18
4,01
2,89
3,26
6,38
4,82
4,11
3,97
Tabelle 7.1: SPECViewperf 8.0, Ergebnisse aus dem Benchmarks
9. März 2005
Seite 26
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildung 7.2: Benchmark Ergebnisse von SPECViewperf mit Konfiguration 1
9. März 2005
Seite 27
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildung 7.3: Benchmark Ergebnisse von SPECViewperf mit Konfiguration 2
9. März 2005
Seite 28
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildung 7.4: Benchmark Ergebnisse von SPECViewperf mit Konfiguration 3
9. März 2005
Seite 29
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildung 7.5: Benchmark Ergebnisse von SPECViewperf mit Konfiguration 4
9. März 2005
Seite 30
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
7.1.2
RST-L WS 04/05
3DMark03
Bei 3DMark03 wird das Ergebnis in einer Score dargestellt und setzt sich wie folgt zusammen:
3DMark03 score = (Game Test 1 frame-rate x 7.3) +
(Game Test 2 frame-rate x 37) +
(Game Test 3 frame-rate x 47.1) +
(Game Test 4 frame-rate x 38.7)
[19]
x16
x8 (SLI)
Konfiguration 1:
Punkte 8062
8059
Konfiguration 2:
Punkte 6075
6058
Konfiguration 3:
Punkte 4259
4230
Konfiguration 4:
Punkte 2373
2323
x8
x4
x2
x1
8065
8020
7894
7234
6062
6025
5954
5512
4222
4132
3978
3642
2317
2186
1999
1803
Tabelle 7.2: 3DMark03, Ergebnisse aus den Benchmarks
9. März 2005
Seite 31
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildung 7.6: Benchmark Ergebnisse von 3DMark03
9. März 2005
Seite 32
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
7.1.3
RST-L WS 04/05
3DMark05
Die Score bei 3DMark05 setzt sich so zusammen:
3DMark05 score = (Game Test 1 * Game Test 2 * Game Test 3)ˆ 0.33 * 250
[20]
x16
x8 (SLI)
Konfiguration 1:
Punkte 3554
3497
Konfiguration 2:
Punkte 3068
2993
Konfiguration 3:
Punkte 2749
2508
Konfiguration 4:
Punkte 2240
2060
x8
x4
x2
x1
3501
3249
2956
2428
2968
2611
2168
1634
2570
1964
1416
894
2007
1376
905
580
Tabelle 7.3: 3DMark05, Ergebnisse aus den Benchmarks
9. März 2005
Seite 33
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildung 7.7: Benchmark Ergebnisse von 3DMark05
9. März 2005
Seite 34
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
7.1.4
RST-L WS 04/05
UMark/ Unreal Tournament 2004
Die Tests mit UMark bzw. Unreal Tournament 2004 ergaben pro Map1 einen durchschnittlichen Wert
der FPS2 , die ich dann zu einem Mittelwert zusammengefasst habe.
Mapa
Konfiguration 1:
AS-Convoy
BR-Colossus
CTF-BridgeOfFate
CTF-FaceClassic
DM-Rankin
ONS-Primeval
ONS-Torlan
Mittelwert von Konfiguration 1
Konfiguration 2:
AS-Convoy
BR-Colossus
CTF-BridgeOfFate
CTF-FaceClassic
DM-Rankin
ONS-Primeval
ONS-Torlan
Mittelwert von Konfiguration 2
Konfiguration 3:
AS-Convoy
BR-Colossus
CTF-BridgeOfFate
CTF-FaceClassic
DM-Rankin
ONS-Primeval
ONS-Torlan
Mittelwert von Konfiguration 3
Konfiguration 4:
AS-Convoy
BR-Colossus
CTF-BridgeOfFate
CTF-FaceClassic
DM-Rankin
ONS-Primeval
ONS-Torlan
Mittelwert von Konfiguration 4
x16
x8 (SLI)
x8
x4
x2
x1
58,8
102,4
141,6
137,3
86,8
83,2
86,4
99,5
58,7
102,5
141,7
137,3
86,9
83,3
86,6
99,6
58,8
102,4
141,5
137,3
86,9
83,2
86,5
99,5
58,7
102,4
141,7
137,4
86,9
83,2
86,4
99,5
58,5
101,9
140,8
135,9
86,4
82,6
86,3
98,9
58,6
102,5
141,9
133,6
87
81,3
86,6
98,8
58,7
102,1
140
136
86,8
81,2
86,5
98,8
58,7
102,4
140,1
136,1
86,8
81,3
86,5
98,8
58,7
102,4
140
136,1
86,7
81,2
86,6
98,8
58,7
102,3
140
135,6
86,8
80,9
86,7
98,7
58,4
101,9
138,6
133,5
86,3
78,7
86,3
97,7
58,3
101,9
134,9
129
85,4
72,9
86,5
95,6
57,9
96,8
128,5
125,3
84,3
65,4
81,7
91,4
58,1
96,8
128,4
125,2
84,1
65,1
81,7
91,3
58,1
96,7
128,4
125,1
84,1
65,2
81,8
91,3
58
96,2
127,5
124,4
83,6
64,1
81,4
90,7
57,5
94
124,3
121,5
81,5
61,5
80,3
88,7
56,9
88
114,1
115,4
75,6
56
77,6
83,4
45,1
53,5
56,3
78
47,5
27,4
44,3
50,3
44,9
53,4
56,3
77,8
47,3
27,3
44,3
50,2
44,9
53,4
56,3
77,8
47,3
27,3
44,3
50,2
44,5
53
56
77
46,7
27
44,1
49,8
43,3
52
55,3
75,1
45,2
26,2
43,7
48,7
40,7
49,5
53,2
70,4
42
24,6
42,6
46,1
Tabelle 7.4: UMark/ Unreal Tournament 2004, Ergebnisse aus den Benchmarks
a Spielplan
1 Spielplan
2 Frames
per second, Bilder pro Sekunde
9. März 2005
Seite 35
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildung 7.8: Benchmark Ergebnisse von UMark/ Unreal Tournament 2004
9. März 2005
Seite 36
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
7.1.5
RST-L WS 04/05
Doom3
Der Timedemo-Test von Doom3 musste zweimal durchgeführt werden, um ein brauchbares Ergebnis zu liefern. Das liegt dadran, dass einige Objekte während der Laufzeit generiert werden, so dass
nach dem ersten Durchlauf die Daten schon im Speicher vorhanden sind, das das Ergebnis deutlich
verbessert. Die Werte in den Klammern sind die Ergebnisse des ersten Druchlaufs, daneben die
des zweiten, die auch in den Diagrammen zu finden sind.
x16
Konfiguration 1:
s
(37,1) 24,6
FPS
(57,9) 87,5
Konfiguration 2:
s
(40,6) 34,9
FPS
(52,8) 61,5
Konfiguration 3:
s
(59,1) 54
FPS
(36,3) 39,8
Konfiguration 4:
s
(102,4) 97,5
FPS
(21) 22
x8 (SLI)
x8
x4
x2
x1
(37,2) 26,7
(57,8) 80,5
(37,2) 26,7
(57,8) 80,6
(37,9) 27,9
(56,7) 78,6
(39,5) 29,3
(54,3) 73,2
(42,7) 35,5
(50,3) 60,5
(40,9) 35,1
(52,6) 61,1
(40,9) 35,1
(52,5) 61,1
(42,1) 36,4
(51) 59
(45,9) 40,4
(46,8) 53,1
(56,5) 51,4
(38) 41,8
(59,4) 54,4
(36,1) 39,5
(59,5) 54,4
(36,1) 39,5
(61,2) 56,2
(35,1) 38,2
(66) 61,1
(32,6) 35,2
(78,2) 73,6
(27,5) 29,2
(104,3) 97,9
(20,6) 21,9
(102,3) 97,9
(21) 22
(104) 99,6
(20,7) 21,6
(108,6) 104,1
(19,8) 20,6
(122,9) 116
(17,5) 18,5
Tabelle 7.5: Doom3 High Quality, Ergebnisse aus dem Timedemo-Benchmark
x16
Konfiguration 1:
s
(39,9) 27,4
FPS
(53,8) 78,4
Konfiguration 2:
s
(43,8) 37
FPS
(49) 58
Konfiguration 3:
s
(64,3) 57,5
FPS
(33,4) 37,4
Konfiguration 4:
s
(110,3) 104,9
FPS
(19,5) 20,5
x8 (SLI)
x8
x4
x2
x1
(39,5) 27,7
(54,4) 77,5
(40,5) 27,6
(53) 77,8
(41,9) 29,2
(51,3) 73,5
(45,7) 34,5
(47) 62,2
(62,2) 50,5
(34,5) 42,5
(45,3) 38,1
(47,5) 56,4
(45,1) 37,8
(47,6) 56,8
(48,7) 41,5
(44,1) 51,8
(57) 48,5
(37,7) 44,3
(72,8) 69,2
(29,5) 31
(67,3) 59,4
(31,9) 36,1
(66,4) 59,5
(32,3) 36,1
(72,4) 64,2
(29,7) 33,5
(86,4) 77
(24,9) 27,9
(118,5) 107,1
(18,1) 20,1
(118,6) 111,8
(18,1) 19,2
(116,6) 110,6
(18,4) 19,4
(134,7) 132,3
(15,9) 16,2
(158,4) 153,9
(19,8) 14
(235,6) 229,3
(9,1) 9,4
Tabelle 7.6: Doom3 Ultra Quality, Ergebnisse aus dem Timedemo-Benchmark
9. März 2005
Seite 37
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildung 7.9: Benchmark Ergebnisse von Doom3 mit High Quality
9. März 2005
Seite 38
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Abbildung 7.10: Benchmark Ergebnisse von Doom3 mit Ultra Quality
9. März 2005
Seite 39
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Kapitel 8
Fazit
SPECViewperf und Doom3 sind mit PCI-Express x4 noch gut zurechtgekommen. Für 3DMark03
und UMark bzw. Unreal Tournament 2004 war der PCI-Express x1 Modus noch akzeptabel, das
liegt an der etwas älteren Grafikberechnung.
Bei 3DMark05 hingegen merkte man schon bei PCI-Express x4 einen kleinen Engpass bei der
Datenübertragung, aber es lieferte noch akzeptabele Werte.
Die Ergebnisse zeigen, dass in den meisten Fällen die Schnittstellenbreite von PCI-Express x4
ausreichen würde. Es kommt natürlich auf die gewünschten Einstellungen der Grafikkarte an. Mit
Antialiasing und Anisotropische Filter auf höchster Stufe sieht zwar die Grafik perfekt aus, aber das
Spiel bzw. die Anwendung kann zu einer Dia-Show werden.
Beim Einsatz von zwei Grafikkarten, die sich dann die x16 Schnittstelle teilen, ist keine Leistungseinbuße hinsichtlich der halben Bandbreite mit jeweils x8 zu befürchten.
Bei Spielen bzw. Anwendungen für den Endverbraucher kommt es noch nicht zu so hohen Datenmengen das die volle Bandbreite von PCI-Express x16 gebraucht wird. Das wird sich voraussichtlich
mit den nächsten Grafkkarten-Generationen ändern.
9. März 2005
Seite 40
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Kapitel 9
Anhang
9.1
Links
THG Patrick Schmid, Achim Roos: PCI Express durchleuchtet: Alle Modi im Test;
tom’s hardware guide, 5. November 2004,
http://www.de.tomshardware.com/graphic/20041105/index.html
CPU-Z CPU-Z
http://www.cpuid.com/cpuz.php
SPEC Standard Performance Evaluation Corporation
http://www.spec.org/
SPECViewperf SPECViewperf 8
http://www.spec.org/
Futuremark Futuremark
http://www.futuremark.com/
3DMark03 3DMark03
http://www.futuremark.com/products/3dmark03/
3DMark05 3DMark05
http://www.futuremark.com/products/3dmark05/
UMark UMark
http://unrealmark.net/index.php
UT2004 Unreal Tournament 2004
http://www.unrealtournament.com/ut2004/
Doom3 Doom3
http://www.doom3.com/
9. März 2005
Seite 41
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
Literaturverzeichnis
[1] Patrick Schmid, Achim Roos: PCI Express durchleuchtet: Alle Modi im Test;
tom’s hardware guide, 5. November 2004,
http://www.de.tomshardware.com/graphic/20041105/index.html
[2] Wikipedia: Application Programming Interface;
Wikipedia, 16. Feb 2005,
http://de.wikipedia.org/wiki/Application_Programming_Interface
[3] Wikipedia: DirectX;
Wikipedia, 19. Feb 2005,
http://de.wikipedia.org/wiki/Directx
[4] Wikipedia: Benchmark;
Wikipedia, 2. Mär 2005,
http://de.wikipedia.org/wiki/Benchmark
[5] Wikipedia: OpenGL;
Wikipedia, 19. Feb 2005,
http://de.wikipedia.org/wiki/OpenGL
[6] SPEC: A Summary of SPECviewperf Attributes;
Standard Performance Evaluation Corporation, 13. Febuar 2004,
http://www.spec.org/gpc/opc.static/attributes.html
[7] Rob Putney / Simon Green / Chris Watts / Bill Licea-Kane /
Allen Jensen / Ian Williams: What is This Thing Called ”SPECviewperf”?;
Standard Performance Evaluation Corporation, 6. August 2004,
http://www.spec.org/gpc/opc.static/whatis_vp8.html
[8] Futuremark: 3DMark03 Minimum System Recommendations;
Futuremark Corporation, 2005,
http://www.futuremark.com/products/3dmark03/?minreq
[9] Futuremark: 3DMark05 Minimum System Recommendations;
Futuremark Corporation, 2005,
http://www.futuremark.com/products/3dmark05/?minreq
9. März 2005
Seite 42
Rechnerstrukturen Labor
Laborbericht: Untersuchung der PCI-Express-Schnittstelle
RST-L WS 04/05
R Tournament 2004 System Specs;
[10] Epic Games: Unreal
Epic Games, Inc., 2004,
http://www.unrealtournament.com/ut2004/specs.php
[11] id Software: Doom3 System Requirements;
id Software Inc., 2004-2005; http://www.doom3.com/
[12] Doom3.de: TimeDemo;
Doom3.de, 08/03/04
http://doom3.ingame.de/article.php?intID=1279\&intTemplate=7\&intSite=5
[13] Wikipedia: Antialiasing;
Wikipedia, 17. Febuar 2005,
http://de.wikipedia.org/wiki/Antialiasing
[14] Hermann Eiden: Trends 1999: Entwicklungen im 3D-Chipmarkt;
tom’s hardware guide, 1. April 1999,
http://www.de.tomshardware.com/graphic/19990401/3dtrends-03.html
[15] Wikipedia: VSync;
Wikipedia, 10. Januar 2005,
http://de.wikipedia.org/wiki/Vsync
[16] Frank Schräer: Doom 3 VGA Leistungscheck;
Hartware.net, 09. August 2004,
http://www.hartware.net/review_417_3.html
[17] Wikipedia: Bumpmapping;
Wikipedia, 25. Febuar 2005,
http://de.wikipedia.org/wiki/Bumpmapping
[18] Bill Licea-Kane: Weighted Geometric Mean Selected for SPECviewperf Composite Numbers;
Standard Performance Evaluation Corporation, 15. Oktober 2003,
http://www.spec.org/gpc/opc.static/geometric.html
[19] Maneesh Dhagat: 3DMark03 Whitepaper;
Futuremark Corporation, 11. Febuar 2003,
http://www.futuremark.com/companyinfo/3dmark03_whitepaper.pdf
[20] Patric Ojala & Nicklas Renqvist: 3DMark05 Whitepaper v1.0;
Futuremark Corporation, 22. September 2004,
http://www.futuremark.com/companyinfo/3DMark05_Whitepaper_v1_0.pdf
9. März 2005
Seite 43