Performance Report PRIMERGY RX2540 M1

Transcription

Performance Report PRIMERGY RX2540 M1
White Paper  Performance Report PRIMERGY RX2540 M1
White Paper
FUJITSU Server PRIMERGY
Performance Report PRIMERGY RX2540 M1
In diesem Dokument sind alle Benchmarks zusammengefasst, die für den FUJITSU
Server PRIMERGY RX2540 M1 durchgeführt wurden.
Ferner werden die Leistungsdaten der PRIMERGY RX2540 M1 mit denen anderer
PRIMERGY Modelle verglichen und diskutiert. Neben den Benchmark-Ergebnissen als
solchen wird jeder Benchmark und die Umgebung, in der der Benchmark durchgeführt
wurde, kurz erläutert.
Version
1.4
2015-07-02
http://www.fujitsu.com/de/primergy
Seite 1 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Inhalt
Dokumenthistorie ................................................................................................................................................ 3
Technische Daten ............................................................................................................................................... 5
SPECcpu2006 .................................................................................................................................................... 8
SPECpower_ssj2008 ........................................................................................................................................ 14
Disk-I/O: Performance von Speichermedien .................................................................................................... 19
Disk-I/O: Performance von RAID-Controllern ................................................................................................... 24
SAP SD ............................................................................................................................................................. 33
OLTP-2 ............................................................................................................................................................. 36
TPC-E ............................................................................................................................................................... 40
vServCon .......................................................................................................................................................... 44
VMmark V2 ....................................................................................................................................................... 51
STREAM ........................................................................................................................................................... 58
Literatur ............................................................................................................................................................. 61
Kontakt .............................................................................................................................................................. 62
Seite 2 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Dokumenthistorie
Version 1.0
Neu:






Technische Daten
SPECcpu2006
®
®
Messungen mit Intel Xeon Processor E5-2600 v3 Product Family
Disk-I/O: Performance von Speichermedien
Ergebnisse für 3.5"-Speichermedien
SAP SD
Zertifikationsnummer 2014028
OLTP-2
®
®
Ergebnisse für Intel Xeon Processor E5-2600 v3 Product Family
VMmark V2
Messung mit Xeon E5-2699 v3
Version 1.1
Neu:




SPECpower_ssj2008
Messung mit Xeon E5-2699 v3
Disk-I/O: Performance von RAID-Controllern
Messungen mit „LSI SW RAID on Intel C610 (Onboard SATA)“ und „PRAID EP400i“ Controllern
TPC-E
Messung mit Xeon E5-2699 v3
vServCon
®
®
Ergebnisse für Intel Xeon Processor E5-2600 v3 Product Family
Aktualisiert:



SPECcpu2006
®
®
Weitere Messungen mit Intel Xeon Processor E5-2600 v3 Product Family
OLTP-2
®
®
Neue Ergebnisse für Intel Xeon Processor E5-2600 v3 Product Family
VMmark V2
„Performance with Server Power“ Messung mit Xeon E5-2699 v3
„Performance with Server and Storage Power“ Messung mit Xeon E5-2699 v3
Version 1.2
Aktualisiert:


Technische Daten
Modellvariante PY RX2540 M1 12x 3.5" hinzugefügt
Modular PSU 450W platinum hp hinzugefügt
Modular PSU 1200W platinum hp hinzugefügt
SPECcpu2006
®
®
Weitere Messungen mit Intel Xeon Processor E5-2600 v3 Product Family
http://www.fujitsu.com/de/primergy
Seite 3 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Version 1.3
Aktualisiert:






Technische Daten
Modellvariante PY RX2540 M1 8x 2.5" expandable hinzugefügt
Modellvariante PY RX2540 M1 24x 2.5" hinzugefügt
Speichermodul 32GB (1x32GB) 2Rx4 DDR4-2133 R ECC hinzugefügt
Max. Anzahl interner Festplatten durch Option für 4x REAR 2.5" SAS/SATA HDD/SSD erhöht
SPECcpu2006
Schätzwerte für 1-Sockel-Konfigurationen eingefügt
SPECpower_ssj2008
Wettbewerbsvergleich eingefügt
OLTP-2
Neue PRIMERGY Systeme hinzugefügt
Kleinere Korrekturen
vServCon
Neue PRIMERGY Systeme hinzugefügt
Kleinere Korrekturen
VMmark V2
Neue Bezeichnungen „Server PPKW Score“ und „Server and Storage PPKW Score“
Kleinere Korrekturen
Version 1.4
Neu:

STREAM
®
®
Messungen mit Intel Xeon Processor E5-2600 v3 Product Family
Aktualisiert:


Technische Daten
Speichermodul 64GB (1x64GB) 4Rx4 DDR4-2133 LR ECC hinzugefügt
Disk-I/O: Performance von RAID-Controllern
Modellvariante PY RX2540 M1 12x 3.5" hinzugefügt
Modellvariante PY RX2540 M1 8x 2.5" expandable hinzugefügt
Modellvariante PY RX2540 M1 24x 2.5" hinzugefügt
Zweite Controller-Instanz in „LSI SW RAID on Intel C610 (Onboard SATA)“ hinzugefügt
„PRAID CP400i“ und „PRAID EP420i“ Controller hinzugefügt
Kleinere Korrekturen
Seite 4 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Technische Daten
PRIMERGY RX2540 M1
In diesem White Paper werden bei Maßeinheiten Dezimalpräfixe nach SI-Standard verwendet (z.B. 1 GB =
9
10 Byte). Abweichend hiervon sind bei Kapazitäten von Caches und Speichermodulen diese Präfixe als
30
Binärpräfixe (z.B. 1 GB = 2 Byte) zu interpretieren. Im Falle weiterer Ausnahmen wird an entsprechender
Stelle gesondert darauf hingewiesen.
Modell
PRIMERGY RX2540 M1
Modellvarianten
PY RX2540 M1 4x 3.5' expandable
PY RX2540 M1 12x 3.5"
PY RX2540 M1 8x 2.5" expandable
PY RX2540 M1 24x 2.5"
Formfaktor
Rack Server
Chipsatz
Intel C610
Anzahl Sockel
2
Anzahl bestellbarer Prozessoren
1 oder 2
Prozessortyp
Intel Xeon Processor E5-2600 v3 Product Family
Anzahl Speichersteckplätze
24 (12 pro Prozessor)
Maximaler Speicherausbau
1536 GB
Onboard HDD-Controller
PCI-Steckplätze
Max. Anzahl interner Festplatten
http://www.fujitsu.com/de/primergy
®
®
®
PY RX2540 M1 4x 3.5' expandable, PY RX2540 M1 12x 3.5":
Controller mit RAID 0, RAID 1 oder RAID 10 für bis zu 4 × 3.5" SATA
HDDs
PY RX2540 M1 8x 2.5" expandable, PY RX2540 M1 24x 2.5":
Controller mit RAID 0, RAID 1 oder RAID 10 für bis zu 8 × 2.5" SATA
HDDs
5 × PCI-Express 3.0 x8
2 × PCI-Express 3.0 x16
PY RX2540 M1 4x 3.5' expandable: 8 × 3.5" + 4 × 2.5"
PY RX2540 M1 12x 3.5":
12 × 3.5" + 4 × 2.5"
PY RX2540 M1 8x 2.5" expandable: 28 × 2.5"
PY RX2540 M1 24x 2.5":
28 × 2.5"
Seite 5 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Cache
Xeon E5-2623 v3
4
8
10
8.00
3.00
3.50
1866
105
Xeon E5-2637 v3
4
8
15
9.60
3.50
3.70
2133
135
Xeon E5-2603 v3
6
6
15
6.40
1.60
entf.
1600
85
Xeon E5-2609 v3
6
6
15
6.40
1.90
entf.
1600
85
Xeon E5-2620 v3
6
12
15
8.00
2.40
3.20
1866
85
Xeon E5-2643 v3
6
12
20
9.60
3.40
3.70
2133
135
Xeon E5-2630L v3 8
16
20
8.00
1.80
2.90
1866
55
Xeon E5-2630 v3
8
16
20
8.00
2.40
3.20
1866
85
Xeon E5-2640 v3
8
16
20
8.00
2.60
3.40
1866
90
Xeon E5-2667 v3
8
16
20
9.60
3.20
3.60
2133
135
Xeon E5-2650 v3
10
20
25
9.60
2.30
3.00
2133
105
Xeon E5-2660 v3
10
20
25
9.60
2.60
3.3
2133
105
Xeon E5-2650L v3 12
24
30
9.60
1.80
2.50
2133
65
Xeon E5-2670 v3
12
24
30
9.60
2.30
3.10
2133
120
Xeon E5-2680 v3
12
24
30
9.60
2.50
3.30
2133
120
Xeon E5-2690 v3
12
24
30
9.60
2.60
3.50
2133
135
Xeon E5-2683 v3
14
28
35
9.60
2.00
3.00
2133
120
Xeon E5-2695 v3
14
28
35
9.60
2.30
3.30
2133
120
Xeon E5-2697 v3
14
28
35
9.60
2.60
3.60
2133
145
Xeon E5-2698 v3
16
32
40
9.60
2.30
3.60
2133
135
Xeon E5-2699 v3
18
36
45
9.60
2.30
3.60
2133
145
Prozessor
Cores
Threads
Prozessoren (seit System-Release)
QPISpeed
Nominalfrequenz
[Ghz]
Max.
Turbofrequenz
[Ghz]
Max.
Speicherfrequenz
[MHz]
[MB]
[GT/s]
TDP
[Watt]
Alle mit der PRIMERGY RX2540 M1 bestellbaren Prozessoren außer Xeon E5-2603 v3 und Xeon E5-2609
®
v3 unterstützen Intel Turbo Boost Technology 2.0. Diese Technologie ermöglicht den Betrieb des
Prozessors mit höheren Frequenzen als der Nominalfrequenz. In der Prozessortabelle steht „Max.
Turbofrequenz“ für das theoretische Frequenzmaximum bei nur einem aktiven Core pro Prozessor. Die
tatsächlich erreichbare Maximalfrequenz ist abhängig von der Anzahl aktiver Cores, dem Stromverbrauch,
der elektrischen Leistungsaufnahme und der Temperatur des Prozessors.
Das Erreichen der maximalen Turbofrequenz wird von Intel grundsätzlich nicht garantiert. Dies hängt mit
Fertigungstoleranzen zusammen, aus denen eine Varianz bezüglich der Performance verschiedener
Exemplare eines Prozessormodells folgt. Das Spektrum der Varianz überdeckt den gesamten Bereich
zwischen der Nominalfrequenz und der maximalen Turbofrequenz.
Die Turbo-Funktionalität ist per BIOS-Option einstellbar. Grundsätzlich empfiehlt Fujitsu die „Turbo Mode“Option auf der Standardeinstellung „Enabled“ zu belassen, denn durch die höheren Frequenzen wird die
Performance deutlich gesteigert. Da die höheren Frequenzen jedoch abhängig von Randbedingungen und
nicht immer garantiert sind, kann es für Anwendungsszenarien mit intensiver Verwendung von AVXInstruktionen und hoher Anzahl Instruktionen pro Takteinheit, aber auch solchen, in denen eine konstante
Performance oder eine niedrige elektrische Leistungsaufnahme gefordert ist, von Vorteil sein die „Turbo
Mode“-Option auszuschalten.
Seite 6 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Registered
ECC
4
2133


Load reduced
1
Low voltage
8
Bitbreite der
Speicherchips
Ranks
8GB (1x8GB) 1Rx4 DDR4-2133 R ECC
Kapazität [GB]
Speichermodul
Frequenz [MHz]
Speichermodule (seit System-Release)
8
2
8
2133


16GB (1x16GB) 2Rx4 DDR4-2133 R ECC
16
2
4
2133


32GB (1x32GB) 2Rx4 DDR4-2133 R ECC
32
2
4
2133


32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC
32
4
4
2133



64GB (1x64GB) 4Rx4 DDR4-2133 LR ECC
64
4
4
2133



8GB (1x8GB) 2Rx8 DDR4-2133 R ECC
Netzteile (seit System-Release)
max. Anzahl
Modular PSU 450W platinum hp
2
Modular PSU 800W platinum hp
2
Modular PSU 800W titanium hp
2
Modular PSU 1200W platinum hp
2
Einige Komponenten sind möglicherweise nicht in allen Ländern/Vertriebsregionen verfügbar.
Detaillierte technische Informationen finden Sie im Datenblatt PRIMERGY RX2540 M1.
http://www.fujitsu.com/de/primergy
Seite 7 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
SPECcpu2006
Benchmark-Beschreibung
SPECcpu2006 ist ein Benchmark, der die Systemeffizienz bei Integer- und Fließkomma-Operationen misst.
Er besteht aus einer Integer-Testsuite (SPECint2006), die 12 Applikationen enthält, und einer FließkommaTestsuite (SPECfp2006), die 17 Applikationen enthält. Beide Testsuiten sind extrem rechenintensiv und
konzentrieren sich auf die CPU und den Speicher. Andere Komponenten, wie Disk-I/O und Netzwerk,
werden von diesem Benchmark nicht vermessen.
SPECcpu2006 ist nicht an ein spezielles Betriebssystem gebunden. Der Benchmark ist als Source-Code
verfügbar und wird vor der eigentlichen Messung kompiliert. Daher beeinflussen auch die verwendete
Compiler-Version und deren Optimierungseinstellungen das Messergebnis.
SPECcpu2006 beinhaltet zwei verschiedene Methoden der Performance-Messung: Die erste Methode
(SPECint2006 bzw. SPECfp2006) ermittelt die Zeit, die für die Bearbeitung einer einzelnen Aufgabe benötigt
wird. Die zweite Methode (SPECint_rate2006 bzw. SPECfp_rate2006) ermittelt den Durchsatz, d.h. wie viele
Aufgaben parallel erledigt werden können. Beide Methoden werden zusätzlich noch in zwei Messläufe
unterteilt, „base“ und „peak“, die sich in der Verwendung der Compiler-Optimierung unterscheiden. Bei der
Publikation von Ergebnissen werden immer „base“-Werte verwendet, „peak“-Werte sind optional.
Benchmark
Arithmetik
Typ
CompilerOptimierung
SPECint2006
Integer
peak
aggressiv
SPECint_base2006
Integer
base
konservativ
SPECint_rate2006
Integer
peak
aggressiv
SPECint_rate_base2006
Integer
base
konservativ
SPECfp2006
Fließkomma
peak
aggressiv
SPECfp_base2006
Fließkomma
base
konservativ
SPECfp_rate2006
Fließkomma
peak
aggressiv
SPECfp_rate_base2006
Fließkomma
base
konservativ
Messergebnis
Anwendung
Geschwindigkeit
Singlethreaded
Durchsatz
Multithreaded
Geschwindigkeit
Singlethreaded
Durchsatz
Multithreaded
Bei den Messergebnissen handelt es sich um das geometrische Mittel aus normalisierten Verhältniswerten,
die für die Einzel-Benchmarks ermittelt wurden. Das geometrische Mittel führt gegenüber dem
arithmetischen Mittel dazu, dass bei unterschiedlich hohen Einzelergebnissen eine Gewichtung zugunsten
der niedrigeren Einzelergebnisse erfolgt. Normalisiert heißt, dass gemessen wird, wie schnell das
Testsystem verglichen mit einem Referenzsystem ist. Der Wert „1“ wurde für die SPECint_base2006-,
SPECint_rate_base2006,
SPECfp_base2006
und
SPECfp_rate_base2006-Ergebnisse
des
Referenzsystems festgelegt. So bedeutet beispielsweise ein SPECint_base2006-Wert von 2, dass das
Messsystem diesen Benchmark etwa doppelt so schnell wie das Referenzsystem bewältigt hat. Ein
SPECfp_rate_base2006-Wert von 4 bedeutet, dass das Messsystem diesen Benchmark etwa 4/[# base
copies] mal so schnell wie das Referenzsystem bewältigt hat. „# base copies“ gibt hierbei an, wie viele
parallele Instanzen des Benchmarks ausgeführt worden sind.
Nicht alle SPECcpu2006-Messungen werden von uns zur Veröffentlichung bei SPEC eingereicht. Daher
erscheinen auch nicht alle Ergebnisse auf den Web-Seiten von SPEC. Da wir für alle Messungen die
Protokolldateien archivieren, können wir jederzeit den Nachweis für die korrekte Durchführung der
Messungen erbringen.
Seite 8 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Umgebung
System Under Test (SUT)
Hardware
Modell
PRIMERGY RX2540 M1
Prozessor
2 Prozessoren der Intel Xeon Processor E5-2600 v3 Product Family
Speicher
16 × 16GB (1x16GB) 2Rx4 DDR4-2133 R ECC
®
®
Software
Betriebssystem
SPECint_base2006, SPECint2006:
Xeon E5-2603 v3, E5-2609 v3, E5-2620 v3, E5-2630 v3, E5-2630L v3, E5-2650 v3, E52690 v3, E5-2695 v3, E5-2697 v3, E5-2698 v3:
Red Hat Enterprise Linux Server release 7.0
Alle anderen:
Red Hat Enterprise Linux Server release 6.5
SPECint_rate_base2006, SPECint_rate2006:
Xeon E5-2620 v3, E5-2630 v3, E5-2698 v3:
Red Hat Enterprise Linux Server release 7.0
Alle anderen: Red Hat Enterprise Linux Server release 6.5
SPECfp_base2006, SPECfp2006, SPECfp_rate_base2006, SPECfp_rate2006:
Xeon E5-2699 v3: Red Hat Enterprise Linux Server release 6.5
Alle anderen:
Red Hat Enterprise Linux Server release 7.0
Betriebssystemeinstellungen
echo always > /sys/kernel/mm/redhat_transparent_hugepage/enabled
Compiler
SPECint_base2006, SPECint2006:
Xeon E5-2623 v3, E5-2637 v3, E5-2640 v3, E5-2643 v3, E5-2650L v3, E5-2660 v3, E52667 v3, E5-2670 v3, E5-2680 v3, E5-2683 v3:
C/C++: Version 14.0.0.080 of Intel C++ Studio XE for Linux
Alle anderen: C/C++: Version 15.0.0.090 of Intel C++ Studio XE for Linux
SPECint_rate_base2006, SPECint_rate2006:
Xeon E5-2620 v3, E5-2630 v3, E5-2698 v3:
C/C++: Version 15.0.0.090 of Intel C++ Studio XE for Linux
Alle anderen: C/C++: Version 14.0.0.080 of Intel C++ Studio XE for Linux
SPECfp_base2006, SPECfp2006, SPECfp_rate_base2006, SPECfp_rate2006:
C/C++: Version 15.0.0.090 of Intel C++ Studio XE for Linux
Fortran: Version 15.0.0.090 of Intel Fortran Studio XE for Linux
Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar.
http://www.fujitsu.com/de/primergy
Seite 9 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Ergebnisse
56.4
59.3
1
209 (est.)
216 (est.)
2
410
424
Xeon E5-2637 v3
2
61.5
64.7
1
233 (est.)
240 (est.)
2
456
470
Xeon E5-2603 v3
2
28.9
30.1
1
135 (est.)
140 (est.)
2
265
274
Xeon E5-2609 v3
2
33.9
35.2
1
156 (est.)
162 (est.)
2
306
317
Xeon E5-2620 v3
2
54.1
56.2
1
258 (est.)
269 (est.)
2
506
528
Xeon E5-2643 v3
2
64.0
67.5
1
340 (est.)
351 (est.)
2
667
688
Xeon E5-2630L v3
2
51.3
53.6
1
285 (est.)
296 (est.)
2
559
580
Xeon E5-2630 v3
2
55.6
58.1
1
338 (est.)
352 (est.)
2
662
690
Xeon E5-2640 v3
2
58.4
62.2
1
359 (est.)
370 (est.)
2
703
726
Xeon E5-2667 v3
2
63.3
66.9
1
414 (est.)
428 (est.)
2
812
838
Xeon E5-2650 v3
2
53.8
56.2
1
421 (est.)
434 (est.)
2
825
850
Xeon E5-2660 v3
2
58.4
61.7
1
453 (est.)
468 (est.)
2
888
917
Xeon E5-2650L v3
2
46.4
48.7
1
414 (est.)
429 (est.)
2
812
841
Xeon E5-2670 v3
2
56.0
59.2
1
494 (est.)
510 (est.)
2
968
999
Xeon E5-2680 v3
2
59.7
62.9
1
531 (est.)
546 (est.)
2
1040
1070
Xeon E5-2690 v3
2
62.7
65.4
1
551 (est.)
566 (est.)
2
1080
1110
Xeon E5-2683 v3
2
53.7
56.5
1
541 (est.)
561 (est.)
2
1060
1100
Xeon E5-2695 v3
2
58.9
61.6
1
582 (est.)
602 (est.)
2
1140
1180
Xeon E5-2697 v3
2
63.6
66.1
1
617 (est.)
638 (est.)
2
1210
1250
Xeon E5-2698 v3
2
63.2
65.5
1
638 (est.)
658 (est.)
2
1250
1290
Xeon E5-2699 v3
2
63.9
66.0
1
699 (est.)
719 (est.)
2
1370
1410
SPECint_rate2006
Anzahl Prozessoren
SPECint_rate_base2006
SPECint2006
2
Seite 10 (62)
Anzahl Prozessoren
SPECint_base2006
Xeon E5-2623 v3
SPECint_rate2006
Prozessor
Anzahl Prozessoren
SPECint_rate_base2006
Das Benchmark-Ergebnis hängt prozessorseitig in erster Linie von der Größe des Prozessor-Caches, der
Unterstützung von Hyper-Threading, der Anzahl Prozessorkerne und der Prozessorfrequenz ab. Bei
Prozessoren mit Turbomodus bestimmt die Anzahl Cores, die durch den Benchmark belastet werden, die
maximal erreichbare Prozessorfrequenz. Bei den „singlethreaded“ Benchmarks, die überwiegend nur einen
Core belasten, ist die maximal erreichbare Prozessorfrequenz höher als bei den „multithreaded“
Benchmarks.
Mit „(est.)“ gekennzeichnete Ergebnisse sind Schätzwerte (estimated).
http://www.fujitsu.com/de/primergy
Anzahl Prozessoren
SPECfp_rate_base2006
SPECfp_rate2006
2
380
389
1
214 (est.)
222 (est.)
2
425
440
56.6
1
142 (est.)
145 (est.)
2
282
288
63.1
1
163 (est.)
167 (est.)
2
325
331
479
Xeon E5-2637 v3
2
Xeon E5-2603 v3
2
54.8
Xeon E5-2609 v3
2
61.0
Xeon E5-2620 v3
2
94.6
Xeon E5-2643 v3
2
Xeon E5-2630L v3
2
Xeon E5-2630 v3
2
102
108
Xeon E5-2640 v3
2
105
Xeon E5-2667 v3
2
Xeon E5-2650 v3
101
SPECfp2006
SPECfp_base2006
2
97.3
103
SPECfp_rate2006
196 (est.)
Xeon E5-2623 v3
Anzahl Prozessoren
191 (est.)
Anzahl Prozessoren
1
Prozessor
94.4
Version: 1.4  2015-07-02
SPECfp_rate_base2006
White Paper  Performance Report PRIMERGY RX2540 M1
100
1
235 (est.)
242 (est.)
2
468
116
1
286 (est.)
295 (est.)
2
569
585
1
251 (est.)
259 (est.)
2
499
512
1
283 (est.)
291 (est.)
2
563
577
109
1
293 (est.)
302 (est.)
2
583
598
115
119
1
330 (est.)
340 (est.)
2
656
673
2
102
106
1
343 (est.)
354 (est.)
2
682
700
Xeon E5-2660 v3
2
108
112
1
355 (est.)
367 (est.)
2
706
726
Xeon E5-2650L v3
2
1
336 (est.)
347 (est.)
2
668
687
Xeon E5-2670 v3
2
104
108
1
381 (est.)
393 (est.)
2
759
779
Xeon E5-2680 v3
2
110
114
1
392 (est.)
406 (est.)
2
781
804
Xeon E5-2690 v3
2
114
118
1
398 (est.)
412 (est.)
2
793
815
Xeon E5-2683 v3
2
102
1
404 (est.)
417 (est.)
2
804
826
Xeon E5-2695 v3
2
103
108
1
410 (est.)
424 (est.)
2
816
840
Xeon E5-2697 v3
2
110
113
1
427 (est.)
441 (est.)
2
849
874
Xeon E5-2698 v3
2
107
112
1
436 (est.)
451 (est.)
2
868
893
Xeon E5-2699 v3
2
109
115
1
461 (est.)
478 (est.)
2
917
946
112
88.5
87.5
98.3
93.6
91.4
Am 19. September 2014 belegte die PRIMERGY RX2540 M1 mit zwei Prozessoren







Xeon E5-2643 v3 den ersten Platz in der Kategorie der 2-Socket Systeme bei dem
Benchmark SPECint_base2006.
Xeon E5-2667 v3 den ersten Platz bei dem Benchmark SPECfp_base2006.
Xeon E5-2667 v3 den ersten Platz bei dem Benchmark SPECfp2006.
Xeon E5-2699 v3 den ersten Platz in der Kategorie der 2-Socket Systeme bei dem
Benchmark SPECint_rate_base2006.
Xeon E5-2699 v3 den ersten Platz in der Kategorie der 2-Socket Systeme bei dem
Benchmark SPECint_rate2006.
Xeon E5-2699 v3 den ersten Platz in der Kategorie der 2-Socket Systeme bei dem
Benchmark SPECfp_rate_base2006.
Xeon E5-2699 v3 den ersten Platz in der Kategorie der 2-Socket Systeme bei dem
Benchmark SPECfp_rate2006.
Die Ergebnisse sind zu finden unter
http://www.fujitsu.com/fts/products/computing/servers/primergy/benchmarks/rx2540m1/.
http://www.fujitsu.com/de/primergy
Seite 11 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Die folgenden vier Grafiken verdeutlichen den Durchsatz der PRIMERGY RX2540 M1 im Vergleich zu ihrem
Vorgänger, der PRIMERGY RX300 S8, in jeweils performantester Ausstattung.
SPECcpu2006: Integer-Performance
PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8
67.5
67.4
70
62.6
64.0
60
50
40
30
20
SPECint2006
10
SPECint_base2006
0
PRIMERGY RX300 S8 PRIMERGY RX2540 M1
2 x Xeon E5-2667 v2
2 x Xeon E5-2643 v3
SPECcpu2006: Integer-Performance
PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8
1410
1500
1370
962
1250
931
1000
750
500
SPECint_rate2006
250
SPECint_rate_base2006
0
PRIMERGY RX300 S8 PRIMERGY RX2540 M1
2 x Xeon E5-2697 v2 2 x Xeon E5-2699 v3
Seite 12 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
SPECcpu2006: Floating-Point-Performance
PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8
119
112
120
115
108
100
80
60
40
SPECfp2006
20
SPECfp_base2006
0
PRIMERGY RX300 S8 PRIMERGY RX2540 M1
2 x Xeon E5-2667 v2
2 x Xeon E5-2667 v3
SPECcpu2006: Floating-Point-Performance
PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8
946
1000
900
917
696
800
677
700
600
500
400
300
SPECfp_rate2006
200
100
SPECfp_rate_base2006
0
PRIMERGY RX300 S8 PRIMERGY RX2540 M1
2 x Xeon E5-2697 v2
2 x Xeon E5-2699 v3
http://www.fujitsu.com/de/primergy
Seite 13 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
SPECpower_ssj2008
Benchmark-Beschreibung
SPECpower_ssj2008 ist der erste Industriestandard-Benchmark von SPEC, der den Stromverbrauch eines
Servers im Verhältnis zu dessen Durchsatz beurteilt. Mit SPECpower_ssj2008 hat SPEC in ähnlicher Weise
wie auch für Durchsatzmessungen Standards auf dem Gebiet der elektrischen Leistungsmessung definiert.
Der Workload des Benchmarks basiert auf typischen serverseitigen Java Business Applikationen. Er ist skalierbar, multi-threaded, auf eine große Anzahl von Plattformen portierbar und leicht auszuführen. Der Benchmark testet CPUs, Caches, die Speicherhierarchie und die Skalierbarkeit von symmetrischen Multiprozessorsystemen (SMPs), wie auch die Implementationen der Java Virtual Machine (JVM), Just In Time
(JIT) Compiler, Garbage Collection, Threads und einige weitere Betriebssystemaspekte.
SPECpower_ssj2008 zeichnet den Stromverbrauch von
Servern bei unterschiedlichen Belastungsstufen — in
10%-Schritten von 100% bis „Active Idle“ — während
einer festgesetzten Zeitspanne auf. Der abgestufte
Workload ist der Tatsache geschuldet, dass Auslastung
und Stromverbrauch von Servern im Verlauf von Tagen
oder Wochen deutlich variieren. Zur Berechnung der
Power-Performance-Metrik über alle Stufen werden die
gemessenen Transaktionsdurchsätze jedes Messintervalls aufsummiert und dann durch die Summe der
während jedes Messintervalls durchschnittlich aufgenommenen elektrischen Leistung geteilt. Das Ergebnis
ist ein „overall ssj_ops/watt“ genannter Wert. Diese
Kennzahl gibt Aufschluss über die Energie-Effizienz des
gemessenen Servers. Der definierte Messstandard
ermöglicht es einem Kunden Vergleiche anzustellen
zwischen verschiedenen Konfigurationen und Servern,
die mit SPECpower_ssj2008 vermessen wurden. Das
nebenstehende Diagramm zeigt einen typischen Graphen eines SPECpower_ssj2008-Ergebnisses.
Der Benchmark läuft auf den unterschiedlichsten Betriebssystemen und HardwareArchitekturen und stellt dabei keine
besonderen Anforderungen an die Clientund Storage-Infrastruktur. Die Minimalausstattung für einen SPEC-konformen Test
besteht aus zwei vernetzten Computern,
sowie einem Strommessgerät und einem
Temperatursensor. Der eine Computer ist
das System Under Test (SUT), auf dem
eines der unterstützten Betriebssysteme und
die JVM installiert sind. Die JVM stellt die
Umgebung bereit, die für den Ablauf des in
Java implementierten SPECpower_ssj2008Workloads benötigt wird. Der zweite
Computer ist das sogenannte „Control &
Collection System“ (CCS), das die
Ausführung des Benchmarks kontrolliert und
die elektrische Leistungsaufnahme, sowie
die Durchsatzund
Temperaturwerte
aufnimmt
und
protokolliert.
Das
nebenstehende Diagramm gibt Ihnen einen
Überblick über die Grundstruktur der
Benchmark-Konfiguration mit den dazugehörigen Komponenten.
Seite 14 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Umgebung
System Under Test (SUT)
Hardware
Modell
PRIMERGY RX2540 M1
Modellvariante
PY RX2540 M1 4x 3.5' expandable
Prozessor
Xeon E5-2699 v3
Speicher
8 × 8GB (1x8GB) 2Rx8 DDR4-2133 R ECC
Netzwerk-Interface
1 × PLAN AP 1x1Gbit Cu Intel I210-T1 LP
Disk-Subsystem
Onboard HDD-Controller
1 × DOM SATA 6G 64GB Main N H-P
Netzteil
1 × Modular PSU 800W titanium hp
Software
BIOS
R1.6.0
BIOS-Einstellungen
Hardware Prefetcher = Disabled
Adjacent Cache Line Prefetch = Disabled
DCU Streamer Prefetcher = Disabled
Onboard USB Controllers = Disabled
Power Technology = Custom
QPI Link Frequency Select = 6.4 GT/s
Turbo Mode = Disabled
Intel Virtualization Technology = Disabled
ASPM Support = L1 Only
DMI Control = Gen1
COD Enable = Enabled
Early Snoop = Disabled
Firmware
7.60A
Betriebssystem
Microsoft Windows Server 2008 R2 Enterprise SP1
Betriebssystemeinstellungen
Using the local security settings console, “lock pages in memory” was enabled for the user
running the benchmark.
Power Management: Enabled (“Fujitsu Enhanced Power Settings” power plan)
Set “Turn off hard disk after = 1 Minute” in OS.
Benchmark was started via Windows Remote Desktop Connection.
Microsoft Hotfix KB2510206 has been installed due to known problems of the group
assignment algorithm which does not create a balanced group assignment. For more
information see: http://support.microsoft.com/kb/2510206
JVM
IBM J9 VM (build 2.6, JRE 1.7.0 Windows Server 2008 R2 amd64-64 20120322_106209 (JIT
enabled, AOT enabled)
JVM-Einstellungen
start /NODE [0,1,2,3] /AFFINITY [0x3,0xC,0x30,0xC0,0x300,0xC00,0x3000,0xC000,0x30000]
-Xmn825m -Xms975m -Xmx975m -Xaggressive -Xcompressedrefs -Xgcpolicy:gencon
-XlockReservation -Xnoloa -XtlhPrefetch -Xlp -Xconcurrentlevel0 -Xthr:minimizeusercpu
-Xgcthreads2 (-Xgcthreads1 for JVM5 and JVM23)
Weitere Software
IBM WebSphere Application Server V8.5.0.0, Microsoft Hotfix for Windows (KB2510206)
Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar.
http://www.fujitsu.com/de/primergy
Seite 15 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Ergebnisse
Die PRIMERGY RX2540 M1 erzielte folgendes Ergebnis:
SPECpower_ssj2008 = 10,654 overall ssj_ops/watt
Das nebenstehende Diagramm zeigt
das Ergebnis der oben beschriebenen Konfiguration. Die roten waagerechten Balken zeigen für die einzelnen Laststufen (an der y-Achse des
Diagramms abgebildet) das Verhältnis von Durchsatz zu Energieverbrauch (Performance to Power Ratio)
in ssj_ops/watt (x-Achse oben). Die
blaue Kurve stellt den durchschnittlichen Energieverbrauch dar (an der xAchse unten abgebildet); die Werte
für die einzelnen Laststufen sind jeweils mit einer kleinen Raute gekennzeichnet. Die schwarze senkrechte
Linie zeigt das Benchmark-Resultat
von 10,654 overall ssj_ops/watt für
die PRIMERGY RX2540 M1. Das ist
der Quotient aus der Summe der
Transaktionsdurchsätze der einzelnen Laststufen und der Summe der
an diesen Stufen jeweils durchschnittlich aufgenommenen elektrischen
Leistung.
Die folgende Tabelle zeigt die Benchmark-Ergebnisse bezüglich des Durchsatzes in ssj_ops, der
elektrischen Leistungsaufnahme in Watt und des daraus resultierenden Energieeffizienz-Werts für jede
einzelne Laststufe.
Performance
Power
Energy Efficiency
Target Load
ssj_ops
100%
3,257,627
271
12,001
90%
2,929,344
244
11,985
80%
2,599,922
216
12,063
70%
2,283,039
186
12,264
60%
1,957,744
161
12,181
50%
1,633,106
143
11,417
40%
1,303,216
128
10,187
30%
978,558
113
8,652
20%
652,175
98.2
6,642
10%
326,571
82.6
3,954
0
39.0
0
Active Idle
Average Power (W)
ssj_ops/watt
∑ssj_ops / ∑power = 10,654
Mit diesem Ergebnis erzielte die PRIMERGY RX2540 M1 einen neuen Weltrekord und übertraf
damit das beste Konkurrenz-Ergebnis um 4.1% (Stand: 18. März 2015). Damit beweist sich die
PRIMERGY RX2540 M1 als energieeffizientester Server weltweit. Die aktuellen
SPECpower_ssj2008-Ergebnisse sind zu finden unter
http://www.spec.org/power_ssj2008/results.
Seite 16 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
SPECpower_ssj2008: PRIMERGY RX2540 M1 vs. Wettbewerb
12,000
overall ssj_ops/watt
10,000
10,238
10,654
8,000
Version: 1.4  2015-07-02
Der Vergleich zur Konkurrenz macht den
Vorsprung der PRIMERGY RX2540 M1 im
Bereich Energieeffizienz deutlich. Mit 4.1%
höherer Energieeffizienz gegenüber dem
besten Konkurrenzergebnis, dem Quanta
QuantaGrid D51B-2U Server, setzt die
PRIMERGY RX2540 M1 neue Maßstäbe.
6,000
4,000
2,000
0
Quanta
QuantaGrid D51B-2U
Fujitsu Server
PRIMERGY RX2540 M1
Folgendes Diagramm zeigt für jede Laststufe den Stromverbrauch (auf der rechten Y-Achse) und den
Durchsatz (auf der linken Y-Achse) der PRIMERGY RX2540 M1 gegenüber dem Vorgängersystem, der
PRIMERGY RX300 S8.
SPECpower_ssj2008: PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8
http://www.fujitsu.com/de/primergy
Seite 17 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
SPECpower_ssj2008 overall ssj_ops/watt:
PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8
1,800
10,000
10,654
8,000
1,500
1,200
8,097
6,000
900
4,000
600
2,000
300
0
total power [watt]
12,000
overall ssj_ops/watt
Durch die neuen Haswell-Prozessoren hat
die PRIMERGY RX2540 M1 im Vergleich
zur PRIMERGY RX300 S8 einen deutlich
höheren Durchsatz. Trotz der höheren Leistungsaufnahme führt dies im Gesamtergebnis zu einer Steigerung der Energieeffizienz
der PRIMERGY RX2540 M1 um 32%.
Version: 1.4  2015-07-02
0
Fujitsu Server
Fujitsu Server
PRIMERGY RX300 S8 PRIMERGY RX2540 M1
Seite 18 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Disk-I/O: Performance von Speichermedien
Benchmark-Beschreibung
Performance-Messungen von Disk-Subsystemen bei PRIMERGY Servern dienen dazu, deren
Leistungsfähigkeit zu beurteilen und einen Vergleich der verschiedenen Storage-Anbindungen bei
PRIMERGY Servern zu ermöglichen. Standardmäßig werden diese Performance-Messungen mit einem
definierten Messverfahren durchgeführt, das die Zugriffe realer Anwendungsszenarien anhand von
Kenndaten modelliert.
Die wesentlichen Kenndaten sind:
 Anteil von wahlfreien Zugriffen / sequentiellen Zugriffen
 Anteil der Zugriffsarten Lesen / Schreiben
 Blockgröße (kB)
 Anzahl paralleler Zugriffe (# of Outstanding I/Os)
Eine gegebene Wertekombination dieser Kenndaten heißt „Lastprofil“. Die folgenden fünf Standardlastprofile
lassen sich typischen Anwendungsszenarien zuordnen:
Standardlastprofil
Zugriff
Zugriffsart
read
write
Blockgröße
[kB]
Anwendung
File copy
wahlfrei
50%
50%
64
Kopieren von Dateien
File server
wahlfrei
67%
33%
64
File-Server
Database
wahlfrei
67%
33%
8
Datenbank (Datentransfer)
Mail Server
Streaming
sequentiell
100%
0%
64
Datenbank (Log-File),
Datensicherung;
Video Streaming (teilweise)
Restore
sequentiell
0%
100%
64
Wiederherstellen von Dateien
Zur Modellierung parallel zugreifender Anwendungen mit unterschiedlicher Belastungsintensität wird die
„# of Outstanding I/Os“ mit 1, 3, 8 beginnend bis 512 gesteigert (ab 8 in Zweierpotenzschritten).
Die Messungen des vorliegenden Dokumentes beruhen auf diesen Standardlastprofilen.
Die wichtigsten Ergebnisse einer Messung sind:



Throughput [MB/s]
Transactions [IO/s]
Latency [ms]
Datendurchsatz in Megabytes pro Sekunde
Transaktionsrate in I/O-Operationen pro Sekunde
mittlere Antwortzeit in ms
Für sequentielle Lastprofile hat sich der Datendurchsatz als übliche Messgröße durchgesetzt, während bei
den wahlfreien Lastprofilen mit ihren kleinen Blockgrößen meist die Messgröße „Transaktionsrate“
verwendet wird. Datendurchsatz und Transaktionsrate sind direkt proportional zueinander und lassen sich
nach der Formel
Datendurchsatz [MB/s]
= Transaktionsrate [IO/s] × Blockgröße [MB]
Transaktionsrate [IO/s]
= Datendurchsatz [MB/s] / Blockgröße [MB]
ineinander überführen.
12
In diesem Kapitel sind Kapazitäten von Speichermedien durchgängig zur Basis 10 angegeben (1 TB = 10
Bytes), während alle anderen Kapazitäten, Dateigrößen, Blockgrößen und Durchsätze zur Basis 2
20
angegeben sind (1 MB/s = 2 Bytes/s).
Alle Details des Messverfahrens und Grundlagen zur Disk-I/O-Performance sind im White Paper
„Grundlagen Disk-I/O-Performance“ beschrieben.
http://www.fujitsu.com/de/primergy
Seite 19 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Umgebung
Alle in diesem Kapitel diskutierten Messergebnisse gelten für die im Folgenden aufgelisteten Hardware- und
Software-Komponenten:
System Under Test (SUT)
Hardware
Modell
PRIMERGY RX2540 M1
Controller
1 × RAID Ctrl SAS 6G 0/1 (D2607)
Speichermedien
SSD
HDD
Intel SSDSC2BA100G3C
Intel SSDSC2BA200G3C
Intel SSDSC2BA400G3C
Intel SSDSC2BA800G3C
HGST HUC156030CSS204
HGST HUC156045CSS204
HGST HUC156060CSS204
Seagate ST1000NM0023
Seagate ST1000NM0033
Seagate ST2000NM0023
Seagate ST2000NM0033
Seagate ST3000NM0023
Seagate ST3000NM0033
Seagate ST4000NM0023
Seagate ST4000NM0033
Western Digital WD1001FYYG
Western Digital WD1003FBYX
Western Digital WD2000FYYZ
Western Digital WD2001FYYG
Western Digital WD3000FYYZ
Western Digital WD3001FYYG
Western Digital WD4000FYYZ
Western Digital WD4001FYYG
Western Digital WD5003ABYX
Software
Betriebssystem
Microsoft Windows Server 2008 Enterprise x64 Edition SP2
Verwaltungssoftware
ServerView RAID Manager 5.7.2
Dateisystem
NTFS
Messwerkzeug
Iometer 2006.07.27
Messdaten
32 GB Messdatei
Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar.
Benchmark-Ergebnisse
Die hier vorgestellten Ergebnisse sollen dabei helfen, für die PRIMERGY RX2540 M1 passende
Speichermedien unter dem Gesichtspunkt der Disk-I/O-Performance auszuwählen. Hierzu wurde in der im
Unterkapitel Benchmark-Umgebung angegebenen Konfiguration jeweils ein einzelnes Speichmedium
gemessen. Bei den Messungen wurde der RAID-Controller RAID Ctrl SAS 6G 0/1 (D2607) verwendet. Die
folgende Tabelle fasst dessen wichtigste Eigenschaften zusammen.
Controller-Name
RAID Ctrl SAS 6G 0/1 (D2607)
Seite 20 (62)
Cache
-
Unterstützte Interfaces
SATA 3G/6G
SAS 3G/6G
PCIe 2.0 x8
RAID Levels
0, 1, 1E, 10
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Speichermedien
Durch die Auswahl des Speichermedientyps und deren Anzahl lässt sich eine Gewichtung in Richtung
Speicherkapazität, Performance, Sicherheit oder Preis vornehmen. In der PRIMERGY RX2540 M1 können
folgende Typen von Speichermedien verwendet werden:
Speichermedientyp
Schnittstelle
Formfaktor
HDD
SATA 6G
3.5"
HDD
SAS 12G
2.5" *
HDD
SAS 6G
3.5"
SSD
SATA 6G
2.5" *
)
)
*) teilweise auch mit 3.5"-Rahmen erhältlich
HDDs und SSDs werden über Host-Bus-Adapter, meist RAID-Controller, mit SATA- oder SAS-Schnittstelle
betrieben. Die Schnittstelle des RAID-Controllers zum Chipsatz des Systemboards ist typischerweise PCIe
oder, im Falle der integrierten Onboard-Controller, eine interne Busschnittstelle des Systemboards.
Von allen Speichermedientypen bieten SSDs die bei weitem die höchsten Transaktionsraten für wahlfreie
Lastprofile wie auch die kürzesten Zugriffszeiten. Dafür ist allerdings der Preis pro Gigabyte
Speicherkapazität erheblich höher.
Cache-Einstellungen
Der Cache von HDDs hat in den meisten Fällen einen großen Einfluss auf die Disk-I/O-Performance. Er wird
häufig als Sicherheitsproblem bei Stromausfall angesehen und daher abgeschaltet. Dennoch wurde er von
den Festplattenherstellern aus gutem Grund zur Steigerung der Schreib-Performance integriert. Aus
Performance-Gründen ist es daher empfehlenswert den Festplatten-Cache einzuschalten. Um
Datenverlusten bei Stromausfall vorzubeugen, empfiehlt es sich das System mit einer USV auszustatten.
Zwecks einfacher und sicherer Handhabung der Einstellungen von RAID-Controller und Festplatten
empfiehlt sich die für PRIMERGY Server mitgelieferte RAID-Manager-Software „ServerView RAID“.
Üblicherweise wird man – spezifisch für den Anwendungsfall – mittels der vordefinierten Modi „Performance“
oder „Data Protection“ die kompletten Cache-Einstellungen für Controller und Festplatten en bloc
vornehmen. Der Modus „Performance“ gewährleistet für die Mehrzahl der Anwendungsszenarien
Performance-optimale Einstellungen.
Performance-Werte
Die Performance-Werte der PRIMERGY RX2540 M1 werden im Folgenden tabellarisch zusammengestellt,
jeweils spezifisch für ein einzelnes Speichermedium bei verschiedenen Zugriffsarten und Blockgrößen.
Hierbei werden die etablierten Messgrößen, wie sie schon im Unterkapitel Benchmark-Beschreibung
erwähnt wurden, verwendet. Bei den wahlfreien Zugriffen wird also die Transaktionsrate angegeben, und bei
den sequentiellen Zugriffen der Datendurchsatz. Um Verwechslungen der Maßeinheiten zu vermeiden, sind
die Tabellen für die beiden Arten von Zugriffen getrennt.
In den Tabellenzellen sind die maximal erreichbaren Werte eingetragen. Das bedeutet: jeder Wert ist das
Maximum über den gesamten Bereich von Belastungsintensitäten (# of Outstanding I/Os). Zwecks
zusätzlicher Visualisierung der Zahlenwerte ist jede Tabellenzelle mit einem waagerechten Balken hinterlegt,
dessen Länge proportional zum Zahlenwert in der Tabellenzelle ist. Alle Balken, die im gleichen
Längenmaßstab dargestellt sind, haben die gleiche Farbe. Es können also nur die Tabellenzellen mit
gleichfarbigen Balken sinnvoll visuell miteinander verglichen werden. Da die waagerechten Balken in den
Tabellenzellen die maximal erreichbaren Performance-Werte veranschaulichen, sind sie als von links nach
rechts heller werdende Farbverläufe dargestellt. Der helle Farbton am rechten Balkenende drückt aus, dass
der Wert das Maximum ist und nur bei optimalen Voraussetzungen erreicht werden kann. Je dunkler dann
der Farbton nach links hin wird, umso häufiger wird der entsprechende Wert in der Praxis erreichbar sein.
http://www.fujitsu.com/de/primergy
Seite 21 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
SSDs im Vergleich zur leistungsstärksten HDD
Wahlfreie Zugriffe (maximale Performance-Werte in IO/s):
PRIMERGY RX2540 M1
Kapazität
Speichermedium
[GB]
800 Intel SSDSC2BA800G3C
Schnittstelle
SATA 6G
600
HGST HUC156060CSS204 (HDD) SAS 12G
400
Intel SSDSC2BA400G3C
200
100
Transaktionen [IO/s]
Database
Fileserver
35120
5554
Filecopy
5313
872
749
759
SATA 6G
36667
5453
5338
Intel SSDSC2BA200G3C
SATA 6G
35023
4903
4466
Intel SSDSC2BA100G3C
SATA 6G
28535
3371
3128
Sequentielle Zugriffe (maximale Performance-Werte in MB/s):
PRIMERGY RX2540 M1
Kapazität
Speichermedium
[GB]
800 Intel SSDSC2BA800G3C
Schnittstelle
SATA 6G
Durchsatz [MB/s]
Streaming
Restore
382
342
600
HGST HUC156060CSS204 (HDD) SAS 12G
236
236
400
Intel SSDSC2BA400G3C
SATA 6G
434
341
200
Intel SSDSC2BA200G3C
SATA 6G
410
330
100
Intel SSDSC2BA100G3C
SATA 6G
434
196
Seite 22 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
HDDs
Wahlfreie Zugriffe (maximale Performance-Werte in IO/s):
PRIMERGY RX2540 M1
Kapazität
Speichermedium
[GB]
4000 Seagate ST4000NM0033
4000 Seagate ST4000NM0023
4000 Western Digital WD4001FYYG
4000 Western Digital WD4000FYYZ
SATA 6G
SAS 6G
SAS 6G
SATA 6G
Transaktionen [IO/s]
Fileserver
413
363
410
354
331
294
324
285
Schnittstelle
Database
Filecopy
354
353
310
293
3000
3000
3000
3000
Seagate ST3000NM0033
Seagate ST3000NM0023
Western Digital WD3001FYYG
Western Digital WD3000FYYZ
SATA 6G
SAS 6G
SAS 6G
SATA 6G
391
370
343
254
345
321
305
234
341
323
316
230
2000
2000
2000
2000
Seagate ST2000NM0033
Seagate ST2000NM0023
Western Digital WD2001FYYG
Western Digital WD2000FYYZ
SATA 6G
SAS 6G
SAS 6G
SATA 6G
358
357
328
301
321
313
290
271
317
315
303
278
1000
1000
1000
1000
Seagate ST1000NM0033
Seagate ST1000NM0023
Western Digital WD1001FYYG
Western Digital WD1003FBYX
SATA 6G
SAS 6G
SAS 6G
SATA 6G
356
340
320
243
315
298
287
220
310
298
299
231
600
HGST HUC156060CSS204
SAS 12G
872
749
759
500
Western Digital WD5003ABYX
SATA 6G
242
219
228
450
HGST HUC156045CSS204
SAS 12G
864
766
789
300
HGST HUC156030CSS204
SAS 12G
783
663
678
Sequentielle Zugriffe (maximale Performance-Werte in MB/s):
PRIMERGY RX2540 M1
Kapazität
Speichermedium
[GB]
4000 Seagate ST4000NM0033
4000 Seagate ST4000NM0023
4000 Western Digital WD4001FYYG
4000 Western Digital WD4000FYYZ
Schnittstelle
SATA 6G
SAS 6G
SAS 6G
SATA 6G
Durchsatz [MB/s]
Streaming
Restore
174
186
173
165
173
185
173
164
3000
3000
3000
3000
Seagate ST3000NM0033
Seagate ST3000NM0023
Western Digital WD3001FYYG
Western Digital WD3000FYYZ
SATA 6G
SAS 6G
SAS 6G
SATA 6G
176
182
167
167
175
182
167
167
2000
2000
2000
2000
Seagate ST2000NM0033
Seagate ST2000NM0023
Western Digital WD2001FYYG
Western Digital WD2000FYYZ
SATA 6G
SAS 6G
SAS 6G
SATA 6G
179
176
160
157
177
175
160
157
1000
1000
1000
1000
Seagate ST1000NM0033
Seagate ST1000NM0023
Western Digital WD1001FYYG
Western Digital WD1003FBYX
SATA 6G
SAS 6G
SAS 6G
SATA 6G
162
167
159
130
162
166
159
129
600
HGST HUC156060CSS204
SAS 12G
236
236
500
Western Digital WD5003ABYX
SATA 6G
132
131
450
HGST HUC156045CSS204
SAS 12G
237
237
300
HGST HUC156030CSS204
SAS 12G
236
236
http://www.fujitsu.com/de/primergy
Seite 23 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Disk-I/O: Performance von RAID-Controllern
Benchmark-Beschreibung
Performance-Messungen von Disk-Subsystemen bei PRIMERGY Servern dienen dazu, deren
Leistungsfähigkeit zu beurteilen und einen Vergleich der verschiedenen Storage-Anbindungen bei
PRIMERGY Servern zu ermöglichen. Standardmäßig werden diese Performance-Messungen mit einem
definierten Messverfahren durchgeführt, das die Zugriffe realer Anwendungsszenarien anhand von
Kenndaten modelliert.
Die wesentlichen Kenndaten sind:
 Anteil von wahlfreien Zugriffen / sequentiellen Zugriffen
 Anteil der Zugriffsarten Lesen / Schreiben
 Blockgröße (kB)
 Anzahl paralleler Zugriffe (# of Outstanding I/Os)
Eine gegebene Wertekombination dieser Kenndaten heißt „Lastprofil“. Die folgenden fünf Standardlastprofile
lassen sich typischen Anwendungsszenarien zuordnen:
Standardlastprofil
Zugriff
Zugriffsart
read
write
Blockgröße
[kB]
Anwendung
File copy
wahlfrei
50%
50%
64
Kopieren von Dateien
File server
wahlfrei
67%
33%
64
File-Server
Database
wahlfrei
67%
33%
8
Datenbank (Datentransfer)
Mail Server
Streaming
sequentiell
100%
0%
64
Datenbank (Log-File),
Datensicherung;
Video Streaming (teilweise)
Restore
sequentiell
0%
100%
64
Wiederherstellen von Dateien
Zur Modellierung parallel zugreifender Anwendungen mit unterschiedlicher Belastungsintensität wird die
„# of Outstanding I/Os“ mit 1, 3, 8 beginnend bis 512 gesteigert (ab 8 in Zweierpotenzschritten).
Die Messungen des vorliegenden Dokumentes beruhen auf diesen Standardlastprofilen.
Die wichtigsten Ergebnisse einer Messung sind:



Throughput [MB/s]
Transactions [IO/s]
Latency [ms]
Datendurchsatz in Megabytes pro Sekunde
Transaktionsrate in I/O-Operationen pro Sekunde
mittlere Antwortzeit in ms
Für sequentielle Lastprofile hat sich der Datendurchsatz als übliche Messgröße durchgesetzt, während bei
den wahlfreien Lastprofilen mit ihren kleinen Blockgrößen meist die Messgröße „Transaktionsrate“
verwendet wird. Datendurchsatz und Transaktionsrate sind direkt proportional zueinander und lassen sich
nach der Formel
Datendurchsatz [MB/s]
= Transaktionsrate [IO/s] × Blockgröße [MB]
Transaktionsrate [IO/s]
= Datendurchsatz [MB/s] / Blockgröße [MB]
ineinander überführen.
12
In diesem Kapitel sind Kapazitäten von Speichermedien durchgängig zur Basis 10 angegeben (1 TB = 10
Bytes), während alle anderen Kapazitäten, Dateigrößen, Blockgrößen und Durchsätze zur Basis 2
20
angegeben sind (1 MB/s = 2 Bytes/s).
Alle Details des Messverfahrens und Grundlagen zur Disk-I/O-Performance sind im White Paper
„Grundlagen Disk-I/O-Performance“ beschrieben.
Seite 24 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Umgebung
Alle in diesem Kapitel diskutierten Messergebnisse wurden mit den im Folgenden aufgelisteten Hardwareund Software-Komponenten ermittelt:
System Under Test (SUT)
Hardware
Controller
1 × „LSI SW RAID on Intel C610 (Onboard SATA)“
1 × „PRAID CP400i“
1 × „PRAID EP400i“
1 × „PRAID EP420i“
Festplatte
4 × 3.5" SATA HDD Seagate ST3000NM0033
4 × 2.5" SATA HDD Seagate ST91000640NS
4 × 2.5" SATA SSD Intel SSDSC2BA400G3C
24 × 2.5" SAS SSD Toshiba PX02SMF040
24 × 2.5" SAS HDD HGST HUC156045CSS204
Software
BIOS-Einstellungen
Intel Virtualization Technology = Disabled
VT-d = Disabled
Energy Performance = Performance
Utilization Profile = Unbalanced
CPU C6 Report = Disabled
Betriebssystem
Microsoft Windows Server 2012 Standard
BetriebssystemEinstellungen
Choose or customize a power plan: High performance
Für die Disk-I/O-erzeugenden Prozesse: Setzen der AFFINITY auf den CPU-Node, an den
der PCIe-Slot des RAID-Controllers angeschlossen ist
Verwaltungssoftware
ServerView RAID Manager 5.7.2 / 6.1.4
Initialisierung von
RAID-Verbänden
RAID-Verbände werden vor der Messung mit einer elementaren Blockgröße von 64 kB
(„Stripe Size“) initialisiert
Dateisystem
NTFS
Messwerkzeug
Iometer 2006.07.27
Messdaten
Messdateien von 32 GB bei 1 – 8 Festplatten; 64 GB bei 9 – 16 Festplatten;
128 GB bei 17 oder mehr Festplatten
Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar.
http://www.fujitsu.com/de/primergy
Seite 25 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Ergebnisse
Die hier vorgestellten Ergebnisse sollen dabei helfen, aus den verschiedenen Konfigurationsmöglichkeiten
der PRIMERGY RX2540 M1 die passende Lösung unter dem Gesichtspunkt der Disk-I/O-Performance
auszuwählen. Im Folgenden sollen verschiedene Kombinationen von RAID-Controllern und Datenträgern
untersucht werden. Informationen zur Auswahl der Datenträger selbst finden sich im Kapitel „Disk-I/O:
Performance von Speichermedien“.
Festplatten
Die erste wesentliche Komponente sind die Festplatten. Wenn im Folgenden von „Festplatten“ die Rede ist,
so ist dies als Oberbegriff gemeint für HDDs („hard disk drives“, also konventionelle Festplatten) und SSDs
(„solid state drives“, also nichtflüchtige elektronische Speichermedien).
Mischkonfigurationen von SAS- und SATA-Festplatten in einem System sind zulässig, sofern sie nicht für
spezielle Festplattentypen im Konfigurator ausgeschlossen sind.
Durch die Verwendung von 2.5"-Festplatten anstelle von 3.5"-Festplatten sind mehr Festplatten pro System
möglich. Dadurch sinkt die Belastung, die jede einzelne Festplatte zu bewältigen hat, und die maximale
Gesamt-Performance des Systems steigt.
Detailliertere Performance-Aussagen zu den Festplattentypen sind im Kapitel „Disk-I/O: Performance von
Speichermedien“ im vorliegenden Performance Report zu finden.
Modellvarianten
Die maximale Anzahl von Festplatten im System hängt von der Systemkonfiguration ab. Die folgende
Tabelle stellt die wesentlichen Fälle zusammen. Für alle in diesem Kapitel behandelten Schnittstellen wird
nur deren höchste unterstützte Version genannt.
Formfaktor
Schnittstelle
Anzahl PCIeController
Maximalzahl
Festplatten
direkt
0
SATA 6G, SAS 12G
direkt
1
8
SATA 6G, SAS 12G
Expander
1
12
SATA 6G, SAS 12G
Expander
1
24
2.5", 3.5"
SATA 6G
2.5", 3.5"
3.5"
2.5"
Seite 26 (62)
Anschlusstyp
8
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
RAID-Controller
Neben den Festplatten ist der RAID-Controller die zweite Performance-bestimmende Schlüsselkomponente.
Bei diesen Controllern bietet das „Modular RAID“ Konzept der PRIMERGY Server eine Fülle von
Möglichkeiten, um den verschiedenen Anforderungen unterschiedlichster Anwendungsszenarien gerecht zu
werden.
Die folgende Tabelle fasst die wichtigsten Eigenschaften der verfügbaren RAID-Controller der PRIMERGY
RX2540 M1 zusammen. Pro Controller ist hierin ein kurzer Alias angegeben, der bei der anschließenden
Zusammenstellung der Performance-Werte verwendet wird.
Controller-Name
Alias
Cache
Unterstützte
Interfaces
Im System
Max. # Disks
pro Controller
BBU/
FBU
RAID Levels
LSI SW RAID on Intel
C610 (Onboard SATA)
Onboard C610
-
SATA 6G
-
4 × 2.5"
4 × 3.5"
0, 1, 10
-/-
PRAID CP400i
PRAID CP400i
-
SATA 6G
SAS 12G
PCIe 3.0
x8
8 × 2.5"
8 × 3.5"
0, 1, 1E, 5,
10, 50
-/-
PRAID EP400i
PRAID EP400i
1 GB
SATA 6G
SAS 12G
PCIe 3.0
x8
24 × 2.5"
12 × 3.5"
0, 1, 1E, 5, 6,
10, 50, 60
-/
PRAID EP420i
PRAID EP420i
2 GB
SATA 6G
SAS 12G
PCIe 3.0
x8
24 × 2.5"
12 × 3.5"
0, 1, 1E, 5, 6,
10, 50, 60
-/
Onboard RAID Controller sind im Chipset auf den Systemboards der Server realisiert und benutzen die CPU
des Servers für die RAID-Funktionalität. Diese einfache Lösung benötigt keinen PCIe-Steckplatz. Der
Chipset kommuniziert mit der CPU nicht über PCIe, sondern über das „Direct Media Interface“, kurz DMI. Die
PRIMERGY RX2540 M1 besitzt den Chipset Intel C610. Hierin sind zwei Onboard RAID Controller integriert.
Mit jedem dieser Controller können über das PRIMERGY RAID Management Verbände aus bis zu vier
Festplatten gebildet werden. In diesem Dokument wird mit dem Alias des Onboard-Controllers eine
Controller-Instanz im Chipset bezeichnet.
Systemspezifische Schnittstellen
Die Schnittstellen eines Controllers in Richtung CPU (DMI oder PCIe) und in Richtung Festplatten (SAS oder
SATA) haben jeweils spezifische Grenzen für den Datendurchsatz. Diese Grenzen sind in der folgenden
Tabelle zusammengestellt. Das Minimum dieser beiden Werte ist eine prinzipielle Grenze, die nicht
überschritten werden kann. Dieser Wert ist in der folgenden Tabelle mit Fettdruck hervorgehoben.
ControllerAlias
Effektiv in der Konfiguration
# Disk-seitige
Datenkanäle
1 × Onboard C610 1 × 4 × SATA 6G
Grenze für
Durchsatz
Disk-Interface
2060 MB/s
# CPU-seitige
Datenkanäle
Grenze für
Durchsatz
CPU-seitiges
Interface
4 × DMI 2.0
*)
Anschluss
über
Expander
1716 MB/s
-
1716 MB/s
-
2 × Onboard C610 2 × 4 × SATA 6G
4120 MB/s
4 × DMI 2.0
PRAID CP400i
8 × SAS 12G
8240 MB/s
8 × PCIe 3.0
6761 MB/s
PRAID EP400i
8 × SAS 12G
8240 MB/s
8 × PCIe 3.0
6761 MB/s
-/
PRAID EP420i
8 × SAS 12G
8240 MB/s
8 × PCIe 3.0
6761 MB/s
-/
*) Die zweite Controller-Instanz erhöht die CPU-seitige Durchsatzgrenze nicht.
Weitere Details zu den RAID-Controllern der PRIMERGY Systeme finden sich im White Paper „RAIDController-Performance“.
http://www.fujitsu.com/de/primergy
Seite 27 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Einstellungen
Der Cache von HDDs hat in den meisten Fällen einen großen Einfluss auf die Disk-I/O-Performance. Er wird
häufig als Sicherheitsproblem bei Stromausfall angesehen und daher abgeschaltet. Dennoch wurde er von
den Festplattenherstellern aus gutem Grund zur Steigerung der Schreib-Performance integriert. Aus
Performance-Gründen ist es daher empfehlenswert den Festplatten-Cache einzuschalten. Um
Datenverlusten bei Stromausfall vorzubeugen, empfiehlt es sich das System mit einer USV auszustatten.
Bei Controllern mit Cache gibt es mehrere einstellbare Parameter. Die jeweils optimalen Einstellungen
können vom RAID-Level, vom Anwendungsszenario und vom Datenträgertyp abhängen. Besonders bei den
RAID-Levels 5 und 6 (und den davon abgeleiteten komplexeren RAID-Levels 50 und 60) ist bei
Anwendungsszenarien mit Schreibanteil das Einschalten des Controller-Caches Pflicht. Bei aktiviertem
Controller-Cache sollten die darin temporär gespeicherten Daten gegen Verlust bei Stromausfall gesichert
werden. Hierfür ist geeignetes Zubehör verfügbar (beispielsweise eine BBU bzw. FBU).
Zwecks einfacher und sicherer Handhabung der Einstellungen von RAID-Controller und Festplatten
empfiehlt sich die für PRIMERGY Server mitgelieferte RAID-Manager-Software „ServerView RAID“.
Üblicherweise wird man – spezifisch für den Anwendungsfall – mittels der vordefinierten Modi „Performance“
oder „Data Protection“ die kompletten Cache-Einstellungen für Controller und Festplatten en bloc
vornehmen. Der Modus „Performance“ gewährleistet für die Mehrzahl der Anwendungsszenarien
Performance-optimale Einstellungen.
Nähere Informationen zu den Einstellungsmöglichkeiten beim Controller-Cache sind im White Paper „RAIDController-Performance“ zu finden.
Performance-Werte
Generell hängt die Disk-I/O-Performance eines RAID-Verbandes von Festplattentyp und –anzahl, vom
RAID-Level und vom RAID-Controller ab. Sofern die Limitierungen der systemspezifischen Schnittstellen
nicht überschritten werden, gelten also Aussagen zur Disk-I/O-Performance für alle PRIMERGY Systeme.
Daher gelten auch alle Performance-Aussagen des Dokumentes „RAID-Controller-Performance“ für die
PRIMERGY RX2540 M1, soweit die dort vermessenen Konfigurationen auch von diesem System unterstützt
werden.
Die Performance-Werte der PRIMERGY RX2540 M1 werden im Folgenden tabellarisch zusammengestellt,
jeweils spezifisch für verschiedene RAID-Level, Zugriffsarten und Blockgrößen. Wesentlich verschiedene
Konfigurationsvarianten werden getrennt behandelt. Hierbei werden die etablierten Messgrößen, wie sie
schon im Unterkapitel Benchmark-Beschreibung erwähnt wurden, verwendet. Bei den wahlfreien Zugriffen
wird also die Transaktionsrate angegeben, und bei den sequentiellen Zugriffen der Datendurchsatz. Um
Verwechslungen der Maßeinheiten zu vermeiden, sind die Tabellen für die beiden Arten von Zugriffen
getrennt.
In den Tabellenzellen sind die maximal erreichbaren Werte eingetragen. Das bedeutet dreierlei: Zum einen
wurden Festplatten mit optimaler Performance verwendet (die Komponenten sind im Unterkapitel
Benchmark-Umgebung näher beschrieben). Des Weiteren sind Cache-Einstellungen von Controllern und
Festplatten zugrunde gelegt, die für das jeweilige Zugriffsszenario und den RAID-Level optimal sind. Und
schließlich ist jeder Wert das Maximum über den gesamten Bereich von Belastungsintensitäten (# of
Outstanding I/Os).
Zwecks zusätzlicher Visualisierung der Zahlenwerte ist jede Tabellenzelle mit einem waagerechten Balken
hinterlegt, dessen Länge proportional zum Zahlenwert in der Tabellenzelle ist. Alle Balken, die im gleichen
Längenmaßstab dargestellt sind, haben die gleiche Farbe. Es können also nur die Tabellenzellen mit
gleichfarbigen Balken sinnvoll visuell miteinander verglichen werden.
Da die waagerechten Balken in den Tabellenzellen die maximal erreichbaren Performance-Werte
veranschaulichen, sind sie als von links nach rechts heller werdende Farbverläufe dargestellt. Der helle
Farbton am rechten Balkenende drückt aus, dass der Wert das Maximum ist und nur bei optimalen
Voraussetzungen erreicht werden kann. Je dunkler dann der Farbton nach links hin wird, umso häufiger wird
der entsprechende Wert in der Praxis erreichbar sein.
Seite 28 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
2.5" - Wahlfreie Zugriffe (maximale Performance-Werte in IO/s):
HUC156045CSS204 SAS HDD
PRAID CP400i
PX02SMF040 SAS SSD
PRAID EP400i
PRAID EP420i
HUC156045CSS204 SAS HDD
PX02SMF040 SAS SSD
HUC156045CSS204 SAS HDD
PX02SMF040 SAS SSD
http://www.fujitsu.com/de/primergy
SSDs wahlfrei
64 kB Blöcke
67% read
[IO/s]
SSDs wahlfrei
8 kB Blöcke
67% read
[IO/s]
HDDs wahlfrei
64 kB Blöcke
67% read
[IO/s]
ST91000640NS SATA HDD
SSDSC2BA400G3 SATA SSD
HDDs wahlfrei
8 kB Blöcke
67% read
[IO/s]
Festplattentyp
Onboard C610
# Disks
RAIDController
Konfigurationsvariante
RAID-Level
PRIMERGY RX2540 M1
Modellvariante PY RX2540 M1 8x 2.5' expandable
Modellvariante PY RX2540 M1 24x 2.5'
2
1
464
389
47337
7870
4
4
0
10
915
714
500
415
78887
63426
14951
12256
2
1
1290
1112
75925
12445
8
8
8
10
0
5
3948
5490
2827
2524
3466
1920
100776
137616
29911
55843
77081
19148
2
1
1630
883
78733
12318
8
8
8
10
0
5
6239
7828
2903
2818
3783
1779
113462
132049
54614
58778
81445
23046
16
24
24
10
0
5
10401
17737
9675
5104
9051
5375
110528
132349
54107
78017
99988
21825
2
1
1949
1085
80178
12460
8
8
8
10
0
5
6150
8065
3194
3034
3887
1766
105915
123219
54214
58569
79893
22894
16
24
24
10
0
5
13624
17713
9705
6827
9263
5330
110944
132539
54287
78403
100570
22398
Seite 29 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
2.5" - Sequentielle Zugriffe (maximale Performance-Werte in MB/s):
HUC156045CSS204 SAS HDD
PRAID CP400i
PX02SMF040 SAS SSD
PRAID EP400i
PRAID EP420i
Seite 30 (62)
HUC156045CSS204 SAS HDD
PX02SMF040 SAS SSD
HUC156045CSS204 SAS HDD
PX02SMF040 SAS SSD
SSDs sequentiell
64 kB Blöcke
100% write
[MB/s]
SSDs sequentiell
64 kB Blöcke
100% read
[MB/s]
HDDs sequentiell
64 kB Blöcke
100% write
[MB/s]
ST91000640NS SATA HDD
SSDSC2BA400G3 SATA SSD
HDDs sequentiell
64 kB Blöcke
100% read
[MB/s]
Festplattentyp
Onboard C610
# Disks
RAIDController
Konfigurationsvariante
RAID-Level
PRIMERGY RX2540 M1
Modellvariante PY RX2540 M1 8x 2.5' expandable
Modellvariante PY RX2540 M1 24x 2.5'
2
1
112
108
726
443
4
4
0
10
429
221
425
213
1264
1027
1190
605
2
1
394
235
1601
421
8
8
8
10
0
5
1006
1816
1577
913
1820
1583
5918
5838
5844
1652
3295
1868
2
1
411
235
1596
420
8
8
8
10
0
5
1001
1836
1600
926
1808
1591
5873
5818
5790
1653
3295
2651
16
24
24
10
0
5
1949
5320
4984
1838
5168
2764
5917
5914
5914
2917
6518
2907
2
1
441
274
1595
421
8
8
8
10
0
5
1027
1919
1636
958
1851
1605
5888
5848
5847
1650
3281
2611
16
24
24
10
0
5
1967
5272
5021
1805
5308
2682
5914
5912
5912
2898
6522
2857
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
3.5" - Wahlfreie Zugriffe (maximale Performance-Werte in IO/s):
Onboard C610
PRAID CP400i
PRAID EP400i
PRAID EP420i
ST3000NM0033 SATA HDD
SSDSC2BA200G3 SATA SSD
SSDs wahlfrei
64 kB Blöcke
67% read
[IO/s]
SSDs wahlfrei
8 kB Blöcke
67% read
[IO/s]
HDDs wahlfrei
64 kB Blöcke
67% read
[IO/s]
HDDs wahlfrei
8 kB Blöcke
67% read
[IO/s]
# Disks
Festplattentyp
RAIDController
Konfigurationsvariante
RAID-Level
PRIMERGY RX2540 M1
Modellvariante PY RX2540 M1 4x 3.5' expandable
Modellvariante PY RX2540 M1 12x 3.5'
2
1
487
435
47337
7870
4
4
0
10
1081
813
609
464
78887
63426
14951
12256
2
1
1290
1112
75925
12445
HUC156045CSS204 SAS HDD
8
10
3948
2524
100776
55843
PX02SMF040 SAS-SSD
8
8
0
5
5490
2827
3466
1920
137616
29911
77081
19148
2
1
1630
883
78733
12318
8
10
6239
2818
113462
58778
8
8
0
5
7828
2903
3783
1779
132049
54614
81445
23046
12
10
7795
3837
111727
74612
12
12
0
5
10185
4319
5113
2631
133129
54586
96384
22676
2
1
1949
1085
80178
12460
12
12
12
10
0
5
8104
10608
5284
3932
5255
2885
104772
123978
53800
72461
90934
22547
HUC156045CSS204 SAS HDD
PX02SMF040 SAS-SSD
HUC156045CSS204 SAS HDD
PX02SMF040 SAS-SSD
http://www.fujitsu.com/de/primergy
Seite 31 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
3.5" - Sequentielle Zugriffe (maximale Performance-Werte in MB/s):
Onboard C610
PRAID CP400i
PRAID EP400i
PRAID EP420i
ST3000NM0033 SATA HDD
SSDSC2BA200G3 SATA SSD
SSDs sequentiell
64 kB Blöcke
100% write
[MB/s]
SSDs sequentiell
64 kB Blöcke
100% read
[MB/s]
HDDs sequentiell
64 kB Blöcke
100% write
[MB/s]
HDDs sequentiell
64 kB Blöcke
100% read
[MB/s]
# Disks
Festplattentyp
RAIDController
Konfigurationsvariante
RAID-Level
PRIMERGY RX2540 M1
Modellvariante PY RX2540 M1 4x 3.5' expandable
Modellvariante PY RX2540 M1 12x 3.5'
2
1
178
173
726
443
4
4
0
10
667
350
672
336
1264
1027
1190
605
2
1
394
235
1601
421
HUC156045CSS204 SAS HDD
8
10
1006
913
5918
1652
PX02SMF040 SAS-SSD
8
8
0
5
1816
1577
1820
1583
5838
5844
3295
1868
2
1
411
235
1596
420
8
10
997
909
5873
1653
8
8
0
5
1818
1609
1571
1545
5818
5790
3295
2651
12
10
1479
1342
5900
2438
12
12
0
5
2697
2432
2694
2483
5898
5898
4824
2811
HUC156045CSS204 SAS HDD
PX02SMF040 SAS-SSD
HUC156045CSS204 SAS HDD
PX02SMF040 SAS-SSD
2
1
441
274
1595
421
12
12
12
10
0
5
1496
2715
2532
1359
2685
2437
5932
5919
5918
2410
4762
2762
Fazit
Die PRIMERGY RX2540 M1 erreicht im Vollausbau mit leistungsfähigen Festplatten einen Durchsatz von bis
zu 6522 MB/s bei sequentiellen Lastprofilen und eine Transaktionsrate von bis zu 137616 IO/s bei typischen
wahlfreien Anwendungsszenarien.
Für bestmögliche Performance empfiehlt sich einer der steckbaren PCIe-Controller. Bei mehr als acht
Festplatten ist ein Controller mit Cache erforderlich.
Zum Betrieb von SSDs im höchstmöglichen Performance-Bereich ist bei den einfacheren RAID-Levels 0, 1
und 10 bereits der PRAID CP400i geeignet, bei RAID 5 ist ein Controller mit Cache vorzuziehen.
Im Falle von HDDs bringt der Controller-Cache für wahlfreie Lastprofile mit signifikantem Schreibanteil bei
allen RAID-Levels Performance-Vorteile.
Seite 32 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
SAP SD
Benchmark-Beschreibung
Die SAP Anwendungssoftware besteht aus Modulen zum Management aller Standard-Geschäftsprozesse.
Es gibt u.a. Module für ERP (Enterprise Resource Planning) wie Assemble-to-Order (ATO), Financial
Accounting (FI), Human Resources (HR), Materials Management (MM), Production Planning (PP) und Sales
and Distribution (SD), aber auch für SCM (Supply Chain Management), Retail, Banking, Utilities, BI
(Business Intelligence), CRM (Customer Relation Management) oder PLM (Product Lifecycle Management).
Die Applikationssoftware setzt immer auf einer Datenbank auf, so dass eine SAP-Konfiguration neben der
Hardware aus den Software-Komponenten Betriebssystem, Datenbank und letztendlich der SAP-Software
selbst besteht.
Zur Verifikation der Performance, Stabilität und Skalierbarkeit eines SAP-Applikationssystems hat die SAP
AG die SAP Standard Application Benchmarks entwickelt. Die Benchmarks (der wichtigste und am meisten
verbreitete ist der SD Benchmark) analysieren die Performance des Gesamtsystems und liefern somit ein
Maß für die Qualität der Integration der Einzelkomponenten.
Bei dem Benchmark wird zwischen einer Two-Tier- und einer Three-Tier-Konfiguration unterschieden. Bei
der Two-Tier-Konfiguration sind die SAP-Applikation und die Datenbank auf einem Server installiert. Bei
einer Three-Tier-Konfiguration können die einzelnen Komponenten der SAP-Applikation über mehrere
Server verteilt sein und ein weiterer Server übernimmt die Datenbank.
Eine komplette Spezifikation des von der SAP AG, Walldorf – Deutschland entwickelten Benchmarks ist
unter http://www.sap.com/benchmark zu finden.
Benchmark-Umgebung
Der Messaufbau wird symbolisch durch folgende Grafik veranschaulicht:
2-Tier-Umgebung
Server
Disk-Subsystem
Netzwerk
BenchmarkTreiber
http://www.fujitsu.com/de/primergy
System Under Test (SUT)
Seite 33 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
System Under Test (SUT)
Hardware
Modell
PRIMERGY RX2540 M1
Prozessor
2 × Xeon E5-2699 v3
Speicher
16 × 16GB (1x16GB) 2Rx4 DDR4-2133 R ECC
Netzwerkinterface
1Gbit/s LAN
Disk-Subsystem
PRIMERGY RX2540 M1:
1 × SSD SATA 6G 400GB Main 3.5' H-P EP
1 × FC Ctrl 8Gb/s 2 Chan LPe12002 MMF LC
1 × FibreCAT CX4-480 Storage Unit
Netzteil
1 × Modular PSU 800W platinum hp
Software
BIOS-Einstellungen
DDR Performance = Performance Optimized
Betriebssystem
Microsoft Windows Server 2012 Datacenter
Datenbank
Microsoft SQL Server 2012 (64-bit)
SAP Business Suite
Software
SAP enhancement package 5 for SAP ERP 6.0
Benchmark-Treiber
Hardware
Modell
PRIMERGY RX300 S4
Prozessor
2 × Xeon X5460
Speicher
32 GB
Netzwerkinterface
1Gbit/s LAN
Software
Betriebssystem
SUSE Linux Enterprise Server 11 SP1
Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar.
Benchmark-Ergebnisse
Zertifikationsnummer 2014028
Number of SAP SD benchmark users
16,000
Average dialog response time
0.97 seconds
Throughput
Fully processed order line items/hour
Dialog steps/hour
SAPS
1,750,000
5,250,000
87,500
Average database request time (dialog/update)
0.014 sec / 0.026 sec
CPU utilization of central server
98%
Operating system, central server
Windows Server 2012 Datacenter Edition
RDBMS
SQL Server 2012
SAP Business Suite software
SAP enhancement package 5 for SAP ERP 6.0
Configuration
Central Server
Fujitsu PRIMERGY RX2540 M1
2 processors / 36 cores / 72 threads
Intel Xeon E5-2699 v3, 2.3GHz, 64KB L1 cache and 256KB L2
cache per core, 45 MB L3 cache per processor
256 GB main memory
Seite 34 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Die PRIMERGY RX2540 M1 erzielte das beste 2 Processor, Two-Tier SAP SD Standard
Application Benchmark Ergebnis mit Windows (Stand: 10. September 2014). Die aktuellen SAP
SD 2-Tier Ergebnisse sind zu finden unter
http://www.sap.com/solutions/benchmark/sd2tier.epx.
Two-Tier SAP SD results on Windows for 2 processor servers:
PRIMERGY RX2540 M1 vs. next best 2-socket servers
Fujitsu PRIMERGY RX2540 M1
2 x Xeon E5-2699 v3
2 processors/36 cores/72 threads
Windows Server 2012 / SQL Server 2012
SAP enhancement package 5 for SAP ERP 6.0
Certification number: 2014028
16000
IBM System x3650 M5
2 x Xeon E5-2699 v3
2 processors/36 cores/72 threads
Windows Server 2012 / DB2 10
SAP enhancement package 5 for SAP ERP 6.0
Certification number: 2014030
Cisco UCS B260 M4
2 x Xeon E7-4890 v2
2 processors/30 cores/60 threads
Windows Server 2012 / SQL Server 2012
SAP enhancement package 5 for SAP ERP 6.0
Certification number 2014018
16000
12280
0
5000
10000
15000
Number of Benchmark Users
Die folgende Grafik verdeutlicht den Durchsatz der PRIMERGY RX2540 M1 im Vergleich zu ihrem
Vorgänger, der PRIMERGY RX300 S8, in jeweils performantester Ausstattung.
Two-Tier SAP SD results: PRIMERGY RX2540 M1 vs. predecessor
Fujitsu PRIMERGY RX2540 M1
2 x Xeon E5-2699 v3
2 processors/36 cores/72 threads
256 GB main memory
Windows Server 2012 Datacenter Edition
SQL Server 2012
SAP enhancement package 5 for SAP ERP 6.0
Certification number: 2014028
16000
Fujitsu PRIMERGY RX300 S8
2 x Xeon E5-2697 v2
2 processors/24 cores/48 threads
256 GB main memory
Windows Server 2012 Standard Edition
SQL Server 2012
SAP enhancement package 5 for SAP ERP 6.0
Certification number: 2013024
10240
0
5000
10000
15000
Number of Benchmark Users
http://www.fujitsu.com/de/primergy
Seite 35 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
OLTP-2
Benchmark-Beschreibung
OLTP steht für Online Transaction Processing. Dem OLTP-2-Benchmark liegt das typische Anwendungsszenario einer Datenbanklösung zugrunde. Es werden bei OLTP-2 Zugriffe auf eine Datenbank simuliert und
die Anzahl erreichter Transaktionen pro Sekunde (tps) als Maß für die Leistungsfähigkeit des vermessenen
Systems ermittelt.
Im Gegensatz zu Benchmarks, wie beispielsweise SPECint und TPC-E, die von unabhängigen Gremien
standardisiert wurden und bei denen die Einhaltung des jeweiligen Reglements überwacht wird, ist OLTP-2
ein interner Benchmark von Fujitsu. OLTP-2 basiert auf dem bekannten Datenbank-Benchmark TPC-E.
OLTP-2 wurde so gestaltet, dass eine Vielzahl von Konfigurationen messbar sind, um die Skalierung eines
Systems hinsichtlich CPU- und Speicherausbau darstellen zu können.
Auch wenn die beiden Benchmarks OLTP-2 und TPC-E ähnliche Anwendungsszenarien simulieren und die
gleichen Lastprofile verwenden, so sind die Ergebnisse nicht vergleichbar oder gar gleichzusetzen, da die
beiden Benchmarks unterschiedliche Methoden zur Simulation der Benutzerlast verwenden. Typischerweise
sind OLTP-2-Werte TPC-E-Werten ähnlich. Ein direkter Vergleich oder gar die Bezeichnung des OLTP-2Ergebnisses als TPC-E-Ergebnis ist nicht zulässig, da insbesondere kein Preis-Leistungswert ermittelt wird.
Weitere Informationen können dem Dokument Benchmark-Überblick OLTP-2 entnommen werden.
Benchmark-Umgebung
Der Messaufbau wird symbolisch durch folgende Grafik veranschaulicht:
Driver
Tier A
Tier B
Netzwerk
Netzwerk
Applikations-Server
Clients
DiskSubsystem
Datenbank-Server
System Under Test (SUT)
Alle Ergebnisse wurden exemplarisch auf einer PRIMERGY RX2540 M1 ermittelt.
Seite 36 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Datenbank-Server (Tier B)
Hardware
Modell
PRIMERGY RX2540 M1
Prozessor
Intel Xeon Processor E5-2600 v3 Product Family
Speicher
1 Prozessor:
2 Prozessoren:
Netzwerk-Interface
2 × onboard LAN 10 Gb/s
Disk-Subsystem
RX2540 M1:
Onboard RAID Controller PRAID EP400i
2 × 300 GB 15k rpm SAS Drive, RAID1 (OS),
4 × 450 GB 15k rpm SAS Drive, RAID10 (LOG)
5 × LSI MegaRAID SAS 9286CV-8e oder 5 × PRAID EP420e
(gleiche Performance bei OLTP-2)
5 × JX40: Je 13 × 400 GB SSD Drive, RAID5 (Daten)
®
®
8 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC
16 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC
Software
BIOS
Version R1.0.0
Betriebssystem
Microsoft Windows Server 2012 R2 Standard
Datenbank
Microsoft SQL Server 2014 Enterprise
Applikations-Server (Tier A)
Hardware
Modell
1 × PRIMERGY RX200 S8
Prozessor
2 × Xeon E5-2667 v2
Speicher
64 GB, 1600 MHz registered ECC DDR3
Netzwerk-Interface
2 × onboard LAN 1 Gb/s
1 × Dual Port LAN 10 Gb/s
Disk-Subsystem
2 × 250 GB 7.2k rpm SATA Drive
Software
Betriebssystem
Microsoft Windows Server 2012 Standard
Client (Lastgenerator)
Hardware
Modell
2 × PRIMERGY RX200 S7
Prozessor
2 × Xeon E5-2670
Speicher
32 GB, 1600 MHz registered ECC DDR3
Netzwerk-Interface
2 × onboard LAN 1 Gb/s
1 × Dual Port LAN 1Gb/s
Disk-Subsystem
1 × 250 GB 7.2k rpm SATA Drive
Software
Betriebssystem
Microsoft Windows Server 2008 R2 Standard
Benchmark
OLTP-2 Software EGen version 1.13.0
Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar.
http://www.fujitsu.com/de/primergy
Seite 37 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Ergebnisse
Die Datenbank-Performance ist in hohem Maße abhängig von den Ausbaumöglichkeiten mit CPU, Speicher
und den Anschlussmöglichkeiten eines für die Datenbank angemessenen Disk-Subsystems. Bei den
folgenden Skalierungsbetrachtungen der Prozessoren gehen wir davon aus, dass sowohl der Speicher als
auch das Disk-Subsystem adäquat gewählt ist und keinen Engpass darstellt.
Als Richtlinie für die Auswahl von Arbeitsspeicher gilt im Datenbankumfeld, dass eine ausreichende Menge
wichtiger ist als die Geschwindigkeit der Speicherzugriffe. Daher wurde bei den Messungen mit zwei
Prozessoren eine Bestückung mit insgesamt 512 GB Speicher und bei den Messungen mit einem Prozessor
eine Bestückung mit insgesamt 256 GB Speicher betrachtet. Beide Speicherbestückungen haben einen
Memory-Zugriff von 2133 MHz. Weitere Informationen über Speicherperformance sind in dem White Paper
Speicher-Performance Xeon E5-2600 v3 (Haswell-EP) basierter Systeme zu finden.
®
Die nachfolgende Grafik zeigt die OLTP-2 Transaktionsraten, die mit einem und zwei Prozessoren der Intel
®
Xeon Processor E5-2600 v3 Product Family erreicht werden können.
OLTP-2 tps
E5-2699 v3 - 18C, HT
3768.70
2136.52
E5-2698 v3 - 16C, HT
3435.90
1915.90
E5-2697 v3 - 14C, HT
3235.78
1842.92
E5-2695 v3 - 14C, HT
2985.40
1689.76
E5-2683 v3 - 14C, HT
1606.03
E5-2690 v3 - 12C, HT
1586.30
E5-2680 v3 - 12C, HT
2889.68
2838.84
2765.09
1545.09
E5-2670 v3 - 12C, HT
2601.38
1454.37
E5-2650L v3 - 12C, HT
2188.13
1219.78
E5-2660 v3 - 10C, HT
2357.78
1310.06
E5-2650 v3 - 10C, HT
1240.39
E5-2667 v3 - 8C, HT
1224.02
E5-2640 v3 - 8C, HT
1068.08
E5-2630L v3 - 8C, HT
874.06
E5-2630 v3 - 8C, HT
1019.98
E5-2643 v3 - 6C, HT
979.99
E5-2620 v3 - 6C, HT
773.16
732.37
409.34
684.82
372.70
E5-2609 v3 - 6C
E5-2603 v3 - 6C
2232.40
2244.71
1996.46
1623.49
1906.56
1823.73
1449.64
2CPUs 512GB RAM
1CPU 256GB RAM
E5-2637 v3 - 4C, HT
667.62
E5-2623 v3 - 4C, HT
608.60
0
HT:
Seite 38 (62)
Hyper-Threading
500
1247.97
1128.35
1000
1500
2000
Fett:
Kursiv:
2500
3000
3500
4000
tps
gemessen
berechnet
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Es wird deutlich, dass durch die Vielzahl an freigegebenen Prozessoren eine große Leistungsbandbreite
abgedeckt wird. Vergleicht man den OLTP-2-Wert des leistungsschwächsten Prozessors Xeon E5-2603 v3
mit dem des leistungsstärksten Prozessors Xeon E5-2699 v3, so ergibt sich eine Leistungssteigerung um
den Faktor 5.2.
Die Eigenschaften der Prozessoren sind im Kapitel „Technische Daten“ zusammengestellt.
Die relativ großen Performance-Unterschiede zwischen den Prozessoren sind durch ihre Eigenschaften zu
erklären. Die Werte skalieren aufgrund der Anzahl der Cores, der Größe des L3-Caches und der CPUTaktfrequenz sowie durch die bei den meisten Prozessortypen vorhandenen Features Hyper-Threading und
Tubo-Modus. Darüber hinaus bestimmt auch die Datenübertragungsrate zwischen den Prozessoren („QPI
Speed“) die Performance.
Eine geringe Leistung zeigen die Xeon E5-2603 v3 und E5-2609 v3 Prozessoren, da sie ohne HyperThreading (HT) und Turbo-Mode (TM) auskommen müssen.
Innerhalb einer Gruppe von Prozessoren mit gleicher Core-Anzahl sieht man eine Skalierung über die CPUTaktfrequenz.
Vergleicht man die maximal erreichbaren OLTP-2 Werte der aktuellen Systemgeneration mit den Werten, die
auf den Vorgängersystemen erreicht wurden, so ergibt sich eine Steigerung von ca. 52%.
Maximum OLTP-2 tps
Vergleich der Systemgenerationen
tps
4500
+ ~52%
4000
3500
3000
2500
2000
1500
2 × E5-2697 v2
512 GB
2 × E5-2699 v3
512 GB
1000
SQL 2012
SQL 2014
500
0
Vorgängersystem
Aktuelles System
Vorgängersystem
Aktuelles System
TX2560 M1 RX2530 M1 RX2540 M1 RX2560 M1
TX300 S8
http://www.fujitsu.com/de/primergy
RX200 S8
RX300 S8
RX350 S8
Seite 39 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
TPC-E
Benchmark-Beschreibung
Der TPC-E-Benchmark misst die Performance online transaktionsverarbeitender Systeme (Online
Transaction Processing oder kurz OLTP genannt). Er basiert auf einer komplexen Datenbank und einer
Reihe unterschiedlicher Transaktionstypen, die auf ihr ausgeführt werden. TPC-E ist ein sowohl Hardwareals auch Software-unabhängiger Benchmark und kann damit auf jeder Testplattform – sei es eine proprietäre
oder offene – implementiert werden. Neben den Messergebnissen müssen auch sämtliche Details der
vermessenen Systeme und des Messvorgangs in einem Messreport (Full Disclosure Report oder kurz FDR)
erläutert werden. Dadurch wird überprüfbar, ob eine Messung allen Benchmark-Anforderungen entspricht
und nachvollziehbar ist. Durch TPC-E wird nicht ein einzelner Server, sondern eine recht umfangreiche
Systemkonfiguration vermessen. Performance-bestimmend ist hierbei die Systemleistung des
Datenbankservers mit Disk-I/O und Netzwerk-Kommunikation.
Die Performance-Metrik ist tpsE. tps steht dabei für transactions per second. tpsE ist die mittlere Anzahl an
Trade-Result-Transaktionen, die innerhalb einer Sekunde ausgeführt wurden. Gemäß dem TPC-E-Standard
besteht eine korrekte Angabe aus der tpsE-Rate, dem zugehörigen Preis/Leistungs-Wert und dem
Weitere Informationen über TPC-E können dem Übersichtsdokument Benchmark Overview TPC-E
entnommen werden.
Benchmark-Ergebnisse
Im Oktober 2014 veröffentlichte Fujitsu ein TPC-E Benchmark-Ergebnis für PRIMERGY RX2540 M1 mit dem
18-Core Prozessor Intel Xeon E5-2699 v3 und 512 GB Speicher.
Die Resultate zeigen eine enorme Leistungssteigerung gegenüber der PRIMERGY RX300 S8 bei
gleichzeitiger Reduzierung der Kosten.
Seite 40 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
TPC-E 1.13.0
TPC Pricing 1.7.0
FUJITSU Server
PRIMERGY RX2540 M1
TPC-E Throughput
3,772.08 tpsE
Price/Performance
$ 130.44 USD per tpsE
Report Date
October 6, 2014
Availability Date
December 1, 2014
Total System Cost
$ 492,023 USD
Database Server Configuration
Operating System
Microsoft Windows Server
2012 R2 Standard Edition
Database Manager
Microsoft SQL Server
2014 Enterprise Edition
SUT
Processors/Cores/Threads
2/36/72
Memory
512 GB
Tier A
PRIMERGY RX200 S8
2x Intel Xeon E5-2667 v2 3.30 GHz
64 GB Memory
2x 250 GB 7.2k rpm SATA Drive
2x onboard LAN 1 Gb/s
1x Dual Port LAN 10 Gb/s
Tier B
PRIMERGY RX2540 M1
2x Intel Xeon E5-2699 v3 2.30 GHz
512 GB Memory
2x 300 GB 15k rpm SAS Drives
4x 450 GB 15k rpm SAS Drives
2x onboard LAN 10 Gb/s
6x SAS RAID Controller
Storage
1x PRIMECENTER Rack
5x ETERNUS JX40
65x 400 GB SSD Drives
Initial Database Size
15,604 GB
Redundancy Level 1
RAID-5 data and RAID-10 log
Storage
65 x 400 GB SSD
4 x 450 GB 15k rpm HDD
Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar.
Weitere Informationen zu diesem TPC-E Ergebnis, speziell auch den Full Disclosure Report, findet man auf
der TPC-Webseite http://www.tpc.org/tpce/results/tpce_result_detail.asp?id=114100601.
http://www.fujitsu.com/de/primergy
Seite 41 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Im Oktober 2014 ist Fujitsu in der TPC-E Liste mit fünf Veröffentlichungen (ohne die historischen
Ergebnisse) vertreten:
Durchsatz
Preis /
Performance
Watts/
tpsE
PRIMERGY RX300 S7 mit 2 × Xeon E5-2690
1871.81 tpsE
$175.57 pro tpsE
0.69
17. August 2012
PRIMERGY RX500 S7 mit 4 × Xeon E5-4650
2651.27 tpsE
$161.95 pro tpsE
0.68
1. November 2012
PRIMERGY RX300 S8 mit 2 × Xeon E5-2697 v2
2472.58 tpsE
$135.14 pro tpsE
-
10. September 2013
PRIMEQUEST 2800E mit 2 × Xeon E7-8890 v2
8582.52 tpsE
$205.43 pro tpsE
-
1. Mai 2014
PRIMERGY RX2540 M1 mit 2 × Xeon E5-2699 v3
3772.08 tpsE
$130.44 pro tpsE
-
1. Dezember 2014
System und Prozessoren
Verfügbarkeitsdatum
Weitere Informationen sowie alle TPC-E Ergebnisse (inklusive der historischen Ergebnisse) können der
TPC-Webseite (http://www.tpc.org/tpce) entnommen werden.
Die folgende Grafik für 2-Sockel PRIMERGY Systeme mit den unterschiedlichen Prozessortypen zeigt die
gute Leistung des 2-Sockel-Systems PRIMERGY RX2540 M1.
tpsE
$/tpsE
4500
tpsE
$ per tpsE
4000
3,772.08
500
3500
400
3000
2,472.58
2500
2000
1500
300
1,871.81
200
$175.57
$130.44
$135.14
100
500
0
better
better
1000
0
PRIMERGY
RX300 S7
2 × E5-2690
512 GB
PRIMERGY
RX300 S8
2 × E5-2697 v2
512 GB
PRIMERGY
RX2540 M1
2 × E5-2699 v3
512 GB
Durchsatz
Preis /
Performance
Watts/
tpsE
PRIMERGY RX300 S7 mit 2 × Xeon E5-2690
1871.81 tpsE
$175.57 pro tpsE
0.69
PRIMERGY RX300 S8 mit 2 × Xeon E5-2697 v2
2472.58 tpsE
$135.14 pro tpsE
-
10. September 2013
PRIMERGY RX2540 M1 mit 2 × Xeon E5-2699 v3
3772.08 tpsE
$130.44 pro tpsE
-
1. Dezember 2014
System und Prozessoren
Verfügbarkeitsdatum
17. August 2012
Gegenüber der PRIMERGY RX300 S8 beträgt der Leistungsgewinn +53% und gegenüber der PRIMERGY
RX300 S7 +102%. Der Preis pro Performance ist $130.44/tpsE. Die Kosten reduzieren sich gegenüber der
PRIMERGY RX300 S8 auf 97% und gegenüber der PRIMERGY RX300 S7 auf 74%.
Seite 42 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Die folgende Übersicht, sortiert nach Preis/Performance, zeigt die besten TPC-E
Preis/Performance-Werte (Stand 6. Oktober 2014, ohne die historischen Ergebnisse) und die
zugehörigen TPC-E Durchsätze. Dabei erreicht die PRIMERGY RX2540 M1 mit einem
Preis/Performance-Wert von $130.44/tpsE das beste Preis-Leistungsverhältnis.
System
Fujitsu PRIMERGY RX2540 M1
Fujitsu
PRIMERGY RX300 S8
IBM
System x3650 M4
Fujitsu
PRIMERGY RX500 S7
HP
ProLiant DL380p Gen8
Fujitsu
PRIMERGY RX300 S7
HP
ProLiant DL385p Gen8
IBM
System x3850 X6
Fujitsu
PRIMEQUEST 2800E
IBM
System x3650 M4
Prozessortyp
Prozessoren/
Cores/Threads
2 × Intel Xeon
E5-2699 v3
2 × Intel Xeon
E5-2697 v2
2 × Intel Xeon
E5-2697 v2
4 × Intel Xeon
E5-4650
2 × Intel Xeon
E5-2690
2 × Intel Xeon
E5-2690
2 × AMD Opteron
6386SE
4 × Intel Xeon
E7-4890 v2
8 × Intel Xeon
E7-8890 v2
2 × Intel Xeon
E5-2690
tpsE
(höher ist
besser)
$/tpsE
(niedriger ist
besser)
Verfügbarkeitsdatum
3,772.08
130.44
2014-12-01
2,472.58
135.14
2013-09-10
2,590.93
150.00
2013-11-29
2,651.27
161.95
2012-11-21
1,881.76
173.00
2012-12-21
1,871.71
175.57
2012-08-17
1,416.37
183.00
2013-05-15
5,576.27
188.69
2014-04-15
8,582.52
205.43
2014-05-01
1,863.23
207.85
2012-05-31
Weitere Informationen sowie alle TPC-E Ergebnisse (inklusive der historischen Ergebnisse) können der
TPC-Webseite (http://www.tpc.org/tpce) entnommen werden.
http://www.fujitsu.com/de/primergy
Seite 43 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
vServCon
Benchmark-Beschreibung
vServCon ist ein bei Fujitsu verwendeter Benchmark zum Vergleich von Serverkonfigurationen mit
Hypervisor in Bezug auf ihre Eignung für Server-Konsolidierung. Hiermit ist sowohl der Vergleich von
Systemen, Prozessoren und I/O-Technologien möglich, wie auch der Vergleich von Hypervisor-en,
Virtualisierungsformen und zusätzlichen Treibern für virtuelle Maschinen.
Bei vServCon handelt es sich nicht um einen neuen Benchmark im eigentlichen Sinn. Es ist vielmehr ein
Framework, das bereits etablierte Benchmarks, ggf. auch in modifizierter Form, als Workloads
zusammenfasst, um die Last einer konsolidierten und virtualisierten Serverumgebung nachzubilden. Es
kommen drei bewährte Benchmarks zum Einsatz, die die Anwendungsszenarien Datenbank,
Applikationsserver und Web-Server abdecken.
Anwendungsszenario
Benchmark
Anzahl logischer CPU-Cores
Memory
Database
Sysbench (angepasst)
2
Java-Applikationsserver
SPECjbb (angepasst, mit 50% - 60% Last)
2
2 GB
Webserver
WebBench
1
1.5 GB
1.5 GB
Jedes der drei Anwendungsszenarien wird jeweils einer dedizierten virtuellen Maschine (VM) zugeordnet.
Hinzu kommt eine vierte, so genannte Idle-VM. Diese vier VMs bilden eine „Tile“ (engl. Kachel). Durch die
Leistungsfähigkeit der zugrunde liegenden Server-Hardware ist es meist notwendig, dass im Rahmen einer
Messung mehrere identische Tiles parallel gestartet werden müssen um eine maximale GesamtPerformance zu erreichen.
System under Test
Database
VM
Java
VM
Web
VM
…
Database
Java
VM
VM
Database
Java
VM
VM
Database
Java
VM
VM
Web
VM
Web
VM
Web
VM
Idle
VM
Tile n
…
Idle
VM
Idle
VM
Idle
VM
Tile 3
Tile 2
Tile 1
Jedes der drei vServCon-Anwendungsszenarien ergibt für die jeweilige VM ein spezifisches Ergebnis in
Form von applikationsspezifischen Transaktionsraten. Um hieraus eine normalisierte Bewertungszahl zu
bilden, werden die einzelnen Ergebnisse für eine Tile in Relation zu den jeweiligen Ergebnissen eines
Referenzsystems gesetzt. Die daraus resultierenden relativen Performance-Werte werden geeignet
gewichtet und über alle VMs und Tiles aufsummiert. Das Ergebnis ist eine Bewertungszahl, „Score“ genannt,
für diese Tile-Anzahl.
Diese Prozedur wird – in der Regel beginnend mit eins – für steigende Tile-Anzahlen durchgeführt, bis keine
signifikante Steigerung dieses vServCon-Scores mehr eintritt. Der finale vServCon-Score ist dann das
Maximum über die vServCon-Scores aller Tile-Anzahlen. Diese Bewertungszahl spiegelt somit den
maximalen Gesamtdurchsatz wider, den man durch den Betrieb des in vServCon definierten Mixes aus
vielen Anwendungs-VMs bis zur möglichst vollständigen Ausnutzung der CPU-Ressourcen erzielen kann.
Dabei ist die Messumgebung für vServCon so ausgelegt, dass nur die CPU der begrenzende Faktor ist und
keine Limitierungen durch andere Ressourcen eintreten.
Der Verlauf der vServCon-Scores über die Tile-Anzahlen liefert nützliche Informationen über das
Skalierungsverhalten des „System under Test“.
Eine ausführliche Beschreibung von vServCon ist zu finden im Übersichtsdokument: Benchmark-Überblick
vServCon.
Seite 44 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Umgebung
Der Messaufbau wird symbolisch durch folgende Grafik veranschaulicht:
FrameworkController
Server
Disk-Subsystem
Mehrere
1Gb oder 10Gb
Netzwerke
System Under Test (SUT)
Lastgeneratoren
Alle Ergebnisse wurden exemplarisch auf einer PRIMERGY RX2540 M1 ermittelt.
System Under Test (SUT)
Hardware
®
®
Prozessor
Intel Xeon Processor E5-2600 v3 Product Family
Speicher
1 Prozessor:
2 Prozessoren:
Netzwerk-Interface
1 × dual port 1GbE Adapter
1 × dual port 10GbE Server Adapter
Disk-Subsystem
1 × dual-channel FC-Controller Emulex LPe12002
ETERNUS DX80 Storage-Systeme:
Je Tile: 50 GB LUN
Je LUN: RAID 0 mit 2 × Seagate ST3300657SS-Disks (15 krpm)
8 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC
16 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC
Software
Betriebssystem
VMware ESXi 5.5.0 U2 Build 2068190
Lastgenerator (inkl. Framework-Controller)
Hardware (Shared)
Gehäuse
PRIMERGY BX900
Hardware
Modell
18 × PRIMERGY BX920 S1 Server-Blades (PRIMERGY BX900 Chassis)
Prozessor
2 × Xeon X5570
Speicher
12 GB
Netzwerk-Interface
3 × 1 Gbit/s LAN
Software
Betriebssystem
Microsoft Windows Server 2008 R2 Enterprise mit Hyper-V
http://www.fujitsu.com/de/primergy
Seite 45 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Lastgenerator-VM (pro Tile 3 Lastgenerator-VMs auf verschiedenen Server-Blades)
Hardware
Prozessor
1 × logische CPU
Speicher
512 MB
Netzwerk-Interface
2 × 1 Gbit/s LAN
Software
Betriebssystem
Microsoft Windows Server 2003 R2 Enterprise Edition
Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar.
Benchmark-Ergebnisse
Die hier behandelten PRIMERGY Zwei-Sockel-Rack- und Tower-Systeme basieren auf Prozessoren der
®
®
Intel Xeon Processor E5-2600 v3 Product Family. Die Eigenschaften der Prozessoren sind im Kapitel
„Technische Daten“ zusammengestellt.
Die verfügbaren Prozessoren dieser Systeme mit ihren Ergebnissen zeigt folgende Tabelle.
Score
#Tiles
4 Cores
Hyper-Threading, Turbo-Modus
E5-2623 v3
E5-2637 v3
7.71
8.65
4
4
6 Cores
E5-2603 v3
E5-2609 v3
5.13
5.83
5
5
6 Cores
Hyper-Threading, Turbo-Modus
E5-2620 v3
E5-2643 v3
10.1
13.1
6
6
8 Cores
Hyper-Threading, Turbo-Modus
E5-2630L v3
E5-2630 v3
E5-2640 v3
E5-2667 v3
11.4
13.6
14.1
15.9
8
8
8
8
10 Cores
Hyper-Threading, Turbo-Modus
E5-2650 v3
E5-2660 v3
16.6
17.8
10
10
12 Cores
Hyper-Threading, Turbo-Modus
E5-2650L v3
E5-2670 v3
E5-2680 v3
E5-2690 v3
16.2
20.0
21.4
22.4
11
12
12
13
14 Cores
Hyper-Threading, Turbo-Modus
E5-2683 v3
E5-2695 v3
E5-2697 v3
21.6
23.5
25.5
14
14
15
16 Cores
Hyper-Threading, Turbo-Modus
E5-2698 v3
27.3
16
18 Cores
Hyper-Threading, Turbo-Modus
E5-2699 v3
30.3
18
®
®
Intel Xeon Processor
E5 v3 Product Family
Prozessor
Diese PRIMERGY Zwei-Sockel-Rack- und Tower-Systeme sind durch weitere Fortschritte in der
Prozessortechnologie gut für die Virtualisierung von Anwendungen geeignet. Verglichen mit einem System
basierend auf der vorherigen Prozessorgeneration ist eine etwa 76% höhere Virtualisierungs-Performance
(gemessen in vServCon-Score in der jeweils größten Konfiguration) erreichbar.
Seite 46 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Die erste Grafik vergleicht die mit den hier betrachteten Prozessortypen erreichbaren Werte der
Virtualisierungs-Performance.
®
®
#Tiles
5
5
6
6
8
8
8
8
10
10
11
12
12
13
14
14
15
E5-2637 v3 - 4 Cores
E5-2603 v3 - 6 Cores
E5-2609 v3 - 6 Cores
E5-2620 v3 - 6 Cores
E5-2643 v3 - 6 Cores
E5-2630L v3 - 8 Cores
E5-2630 v3 - 8 Cores
E5-2640 v3 - 8 Cores
E5-2667 v3 - 8 Cores
E5-2650 v3 - 10 Cores
E5-2660 v3 - 10 Cores
E5-2650L v3 - 12 Cores
E5-2670 v3 - 12 Cores
E5-2680 v3 - 12 Cores
E5-2690 v3 - 12 Cores
E5-2683 v3 - 14 Cores
E5-2695 v3 - 14 Cores
E5-2697 v3 - 14 Cores
16
18
E5-2699 v3 - 18 Cores
4
E5-2698 v3 - 16 Cores
4
E5-2623 v3 - 4 Cores
Intel Xeon Processor E5-2600 v3 Product Family
30
Final vServCon Score
25
20
15
10
5
0
Die relativ großen Performance-Unterschiede zwischen den Prozessoren sind durch ihre Eigenschaften zu
erklären. Die Werte skalieren aufgrund der Anzahl der Cores, der Größe des L3-Caches und der CPUTaktfrequenz sowie durch die bei den meisten Prozessortypen vorhandenen Features Hyper-Threading und
Turbo-Modus. Darüber hinaus bestimmt auch die Datenübertragungsrate zwischen den Prozessoren („QPI
Speed“) die Performance.
Eine geringe Leistung zeigen die Xeon E5-2603 v3 und E5-2609 v3 Prozessoren, da sie ohne HyperThreading (HT) und Turbo-Modus (TM) auskommen müssen. Grundsätzlich sind diese schwächsten
Prozessoren für das Virtualisierungsumfeld nur bedingt geeignet.
Innerhalb einer Gruppe von Prozessoren mit gleicher Core-Anzahl sieht man eine Skalierung über die CPUTaktfrequenz.
Grundsätzlich hat auch die Speicherzugriffsgeschwindigkeit Auswirkungen auf die Leistung. Als Richtschnur
für die Auswahl von Arbeitsspeicher gilt im Virtualisierungsumfeld, dass eine ausreichende Menge wichtiger
ist als die Geschwindigkeit der Speicherzugriffe. Die hier vorgestellten vServCon-Skalierungsmessungen
wurden alle mit einer Speicherzugriffsgeschwindigkeit – abhängig vom Prozessortyp – von maximal
2133 MHz durchgeführt. Näheres zur Thematik „Speicher-Performance“ und zur QPI-Architektur ist zu finden
im White Paper Speicher-Performance Xeon E5-2600 v3 (Haswell-EP) basierter Systeme.
http://www.fujitsu.com/de/primergy
Seite 47 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Bisher wurde die Virtualisierungs-Performance eines voll
ausgebauten Systems betrachtet. Bei einem Server mit zwei
Sockeln stellt sich jedoch auch die Frage, wie gut die Performance
von einem auf zwei Prozessoren skaliert. Je besser die Skalierung,
desto geringer ist der Overhead, der durch die gemeinsame
Nutzung der Ressourcen innerhalb eines Servers üblicherweise
entsteht. Der Skalierungsfaktor hängt auch von der Anwendung
ab. Dient der Server als Virtualisierungsplattform für die ServerKonsolidierung, skaliert das System mit dem Faktor 1.97. Beim
Betrieb mit zwei Prozessoren erreicht das System also eine
deutlich höhere Leistung wie mit einem Prozessor, wie die
nebenstehende Grafik am Beispiel der Prozessorvariante Xeon
E5-2699 v3 verdeutlicht.
× 1.97
25
20
30.3@18 tiles
15
15.4@9 tiles
Final vServCon Score
35
30
1 x E5-2699 v3
2 x E5-2699 v3
10
5
Version: 1.4  2015-07-02
0
2.65
5.47
8.20
10.7
13.3
14.8
17.2
18.9
19.8
21.0
22.0
22.7
23.4
23.5
0
2.89
5.70
8.36
10.3
11.6
12.8
13.8
14.1
vServCon Score
Die nächste Grafik veranschaulicht die Virtualisierungs-Performance für wachsende VM-Anzahlen am
Beispiel der Prozessoren Xeon E5-2640 v3 (8-Core) und E5-2695 v3 (14-Core).
Neben der erhöhten Anzahl
E5-2640 v3
E5-2695 v3
physikalischer Cores ist das
Hyper-Threading, das fast
25
®
alle Prozessoren der Intel
®
Xeon Processor E5-2600 v3
Product Family unterstützen,
20
ein weiterer Grund für die
hohe Anzahl betreibbarer
VMs.
Hierdurch
wird
bekanntermaßen
ein
15
physikalischer Prozessorkern
in zwei logische Cores
unterteilt und damit die für
10
den Hypervisor verfügbare
Anzahl Cores verdoppelt.
Dieses
standardmäßig
5
eingestellte Feature steigert
daher im Allgemeinen die
Virtualisierungs-Performance
eines Systems.
1 2 3 4 5 6 7 8
1 2 3 4 5 6 7 8 9 10 11 12 13 14
#Tiles
Das vorige Bild hat den Aspekt der summierten Performance über alle Anwendungs-VMs eines Hosts
betrachtet. Genauso interessant ist aber auch die Performance aus Sicht einer einzelnen Anwendungs-VM.
Diese Information lässt sich ebenfalls aus dem vorigen Bild entnehmen. Im oben dargestellten Fall des Xeon
E5-2640 v3 beispielsweise wird bei 24 Anwendungs-VMs (acht Tiles, die Idle-VMs nicht mitgezählt) das
Gesamtoptimum erreicht; der Niedriglastfall wird durch drei Anwendungs-VMs (eine Tile, die Idle-VM nicht
mitgezählt) repräsentiert. Man rufe sich in Erinnerung: der vServCon-Score für eine Tile ist ein
Durchschnittswert über die drei Anwendungsszenarien in vServCon. Diese durchschnittliche Performance
einer einzelnen Tile sinkt beim Übergang vom Niedriglastfall zum Gesamtoptimum des vServCon-Scores
von 2.89 auf 14.1/8=1.76, also auf 61%. Dabei können die einzelnen Typen von Anwendungs-VMs im
Hochlastfall durchaus unterschiedlich reagieren. Hierdurch wird deutlich, dass man bezüglich der VMAnzahlen auf einem Virtualisierungs-Host im konkreten Fall die Performance-Anforderungen einer einzelnen
Anwendung gegen die Gesamtanforderungen abwägen muss.
Seite 48 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Die virtualisierungsrelevanten Fortschritte in der Prozessortechnologie seit dem Jahre 2008 wirken zum
einen auf eine einzelne VM und zum anderen auf die maximal mögliche Anzahl von VMs bis zur CPUSättigung. Die folgende Gegenüberstellung arbeitet die Anteile der beiden Arten von Verbesserungen
heraus.
Verglichen
werden
sechs
2008
2009
2011
2012
2013
2014/2015
Systeme mit ähnlicher GehäuseRX200 S4
RX200 S5 RX200 S6
RX200 S7 RX200 S8 RX2530 M1
form: ein System von 2008, ein
RX300 S4
RX300 S5 RX300 S6
RX300 S7 RX300 S8 RX2540 M1
System von 2009, ein System
TX300 S6
RX350 S7 RX350 S8 RX2560 M1
von 2011, ein System von 2012,
TX300
S4
TX300
S5
TX300
S6
TX300 S7 TX300 S8 TX2560 M1
ein System von 2013 und ein
aktuelles System mit den jeweils besten Prozessoren (siehe untenstehende Tabelle) für wenige VMs und für
höchste Gesamt-Performance.
2008
2009
2011
2012
2013
2014
Beste
vServCon
Beste
vServCon
Performance Score
GesamtScore
wenige VMs
1 Tile Performance
max.
X5460
1.91
X5460
2.94@2 tiles
X5570
2.45
X5570
6.08@ 6 tiles
X5690
2.63
X5690
9.61@ 9 tiles
E5-2643
2.73
E5-2690
13.5@ 8 tiles
E5-2667 v2
2.85
E5-2697 v2 17.1@11 tiles
E5-2643 v3
3.22
E5-2699 v3
30.3@18tiles
Die deutlichsten Performance-Fortschritte gab es von 2008 nach 2009 mit der Einführung der
1
Prozessorgeneration Xeon 5500 (z. B. durch das Feature „Extended Page Tables“, kurz EPT ). Hier zeigte
sich bei wenigen VMs (eine Tile) eine Steigerung des vServCon-Scores um den Faktor 1.28.
Virtualisierungsrelevante Fortschritte
10
Wenige VMs (1 Tile)
9
8
vServCon Score
7
6
5
× 1.13
× 1.04
× 1.04
4
× 1.07
× 1.28
3
2
1
1.91
2.45
2.63
2.73
2.85
3.22
2009
X5570
2.93 GHz
4C
2011
X5690
2.93 GHz
6C
2012
E5-2643
3.3 GHz
4C
2013
E5-2667 v2
3.3 GHz
8C
2014
E5-2643 v3
3.4 GHz
6C
0
2008
X5460
3.17 GHz
4C
Year
Y CPU
Freq.
#Cores
Bei Vollauslastung der Systeme mit VMs ergab sich eine Steigerung um den Faktor 2.07. Die eine Ursache
hierfür war die für eine einzelne VM realisierbare Performance-Steigerung (siehe Score für wenige VMs). Die
andere Ursache lag darin, dass beim Gesamtoptimum mehr VMs möglich waren (durch Hyper-Threading).
1
EPT beschleunigt die Virtualisierung von Memory durch eine Hardware-Unterstützung für die Umsetzung zwischen
Host- und Gast-Memory-Adressen.
http://www.fujitsu.com/de/primergy
Seite 49 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Es ist allerdings auch zu erkennen, dass das Optimum bei der dreifachen Anzahl von VMs erkauft wurde mit
einer verringerten Leistung der einzelnen VM.
Virtualisierungsrelevante Fortschritte
35
Score bei optimaler Tile-Anzahl
× 1.77
30
25
vServCon Score
× 1.27
20
× 1.40
15
30.3
× 1.58
× 2.07
10
17.1
13.5
5
0
9.61
2.94
2008
X5460
3.17 GHz
4C
6.08
2009
X5570
2.93 GHz
4C
2011
X5690
2.93 GHz
6C
2012
E5-2690
2.9 GHz
8C
2013
E5-2697 v2
2.7 GHz
12C
2014
E5-2699 v3
2.3 GHz
18C
Year
Y CPU
Freq.
#Cores
Worin liegen jetzt die Technologiefortschritte von 2009 nach 2014?
Die Performance für eine einzelne VM in Niedriglastsituationen hat sich für die hier verglichenen
Prozessoren mit maximaler Taktfrequenz pro Core nur leicht verbessert. Es sei daher ausdrücklich davor
gewarnt, die durch den Score bei optimaler Tile-Anzahl ausgedrückte gesteigerte VirtualisierungsPerformance komplett als Verbesserung für eine einzelne VM zu erhoffen.
Die entscheidenden Fortschritte liegen in der höheren Anzahl physikalischer Cores und – damit verbunden –
in den gesteigerten Werten der Gesamt-Performance (Faktor 1.58, 1.40, 1.27 und 1.77 in der Grafik).
Bis einschließlich 2011 hatte der beste Prozessortyp einer Prozessorgeneration sowohl die höchste
Taktfrequenz als auch die höchste Core-Anzahl. Ab 2012 gibt es unterschiedlich optimierte Prozessoren im
Angebot: Varianten mit hoher Taktfrequenz pro Core bei weniger Cores und Varianten mit hoher CoreAnzahl aber niedrigerer Taktfrequenz pro Core. Die Eigenschaften der Prozessoren sind im Kapitel
„Technische Daten“ zusammengestellt.
Performance-Steigerungen im Virtualisierungsumfeld werden seit 2009 also hauptsächlich durch
Steigerungen der VM-Anzahl aufgrund von mehr verfügbaren logischen oder physikalischen Cores erreicht.
Seit 2012 kann aber je nach Anwendungsszenario im Virtualisierungsumfeld auch eine CPU mit optimierter
Taktfrequenz ausgewählt werden, wenn wenige oder einzelne VMs eine maximale Rechenleistung
benötigen.
Seite 50 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
VMmark V2
Benchmark-Beschreibung
VMmark V2 ist ein von VMware entwickelter Benchmark zum Vergleich von Serverkonfigurationen mit
Hypervisor-Lösungen von VMware in Bezug auf ihre Eignung für Server-Konsolidierung. Neben der Software
zur Lastgenerierung besteht der Benchmark aus einem definierten Lastprofil und aus einem verbindlichen
Regelwerk. Die Benchmark-Ergebnisse können bei VMware eingereicht werden und werden nach einem
erfolgreich durchlaufenen Review-Prozess auf deren Internet-Seite veröffentlicht. Nachdem der bewährte
Benchmark „VMmark V1“ im Oktober 2010 eingestellt wurde, gibt es den Nachfolger „VMmark V2“, der ein
Cluster aus mindestens zwei Servern voraussetzt und Datacenter-Funktionen wie Cloning und Deployment
von virtuellen Maschinen (VMs), Load Balancing sowie die Verschiebung von VMs durch vMotion und auch
Storage vMotion mit abdeckt.
Neben dem „Performance Only“ Ergebnis kann ab Version 2.5 von VMmark auch wahlweise die elektrische
Leistungsaufnahme mit gemessen werden und als „Performance with Server Power“ (Leistungsaufnahme
nur der Server-Systeme) und/oder „Performance with Server and Storage Power“ Resultat
(Leistungsaufnahme der Server-Systeme und aller Storage-Komponenten) veröffentlicht werden.
Bei VMmark V2 handelt es sich nicht um einen neuen Anwendungsszenario Last-Tool
# VMs
Benchmark im eigentlichen Sinn. Es ist vielmehr ein
LoadGen
1
Framework, das bereits etablierte Benchmarks als Mail-Server
Web
2.0
Olio
client
2
Workloads zusammenfasst, um die Last einer
konsolidierten und virtualisierten Serverumgebung E-Commerce
DVD Store 2 client
4
nachzubilden. Drei bewährte Benchmarks, die die
Standby-Server
(IdleVMTest)
1
Anwendungsszenarien Mail-Server, Web 2.0 und
E-Commerce abdecken, wurden in VMmark V2 integriert.
Die drei Anwendungsszenarien werden jeweils insgesamt sieben dedizierten VMs zugeordnet. Hinzu kommt
eine achte VM, der so genannte Standby-Server. Diese acht VMs bilden eine „Tile“ (englisch für „Kachel“).
Durch die Leistungsfähigkeit der zugrunde liegenden Server-Hardware ist es meist notwendig, dass im
Rahmen einer Messung mehrere identische Tiles parallel gestartet werden müssen um eine maximale
Gesamt-Performance zu erreichen.
Neu bei VMmark V2 ist eine Infrastruktur-Komponente, die einmal je zwei Hosts vorhanden ist. Diese misst
Fähigkeiten der Datacenter-Konsolidierung durch VM Cloning und Deployment, vMotion und Storage
vMotion. Zusätzlich wird die Load Balancing Fähigkeit des Datacenters eingesetzt (DRS, Distributed
Resource Scheduler).
Das Ergebnis von VMmark V2 im Testtyp „Performance Only“ ist eine Zahl, „Score“ genannt, die Aufschluss
über die Leistungsfähigkeit der vermessenen Virtualisierungslösung gibt. Der Score spiegelt für eine ServerKonfiguration mit Hypervisor den maximalen summarischen Konsolidierungs-Nutzen über alle Hosts und
VMs wider und dient als Vergleichskriterium von verschiedenen Hardwareplattformen.
Dieser Score wird aus den Einzelergebnissen der VMs und einem Infrastruktur-Ergebnis ermittelt. Jede der
fünf VMmark V2 Anwendungs- bzw. Front End-VMs ergibt für jede VM ein spezifisches Ergebnis in Form von
anwendungsspezifischen Transaktionsraten. Um hieraus eine normalisierte Bewertungszahl zu bilden,
werden die einzelnen Ergebnisse für eine Tile in Relation zu den jeweiligen Ergebnissen eines
Referenzsystems gesetzt. Die daraus resultierenden dimensionslosen Performance-Werte werden dann für
diese Tile geometrisch gemittelt und als letztes über alle Tiles aufsummiert. Dieser Wert geht mit einer
Gewichtung von 80% in den Gesamt-Score ein. Der Infrastruktur-Workload ist im Benchmark nur einmal pro
zwei Hosts vorhanden; er bestimmt das Resultat zu 20%. Für die Infrastruktur-Workload-Komponenten
werden jeweils die Anzahl der Transaktionen pro Stunde und die durchschnittliche Dauer in Sekunden für
den Score ermittelt.
Neben dem eigentlichen Score wird bei jedem VMmark V2 Ergebnis die Anzahl Tiles mit angegeben. Das
ausgewiesene Resultat hat dann die Form „Score@Number of Tiles“, beispielsweise „4.20@5 Tiles“.
Bei den zwei Testtypen „Performance with Server Power“ und „Performance with Server and Storage Power“
wird ein sogenannter „Server PPKW Score“ bzw. „Server and Storage PPKW Score“ ermittelt, dies ist der
Performance Score dividiert durch die durchschnittliche Leistungsaufnahme in Kilowatt (PPKW =
Performance per Kilowatt (KW)).
Die Ergebnisse der drei Testtypen dürfen untereinander nicht verglichen werden.
Eine ausführliche Beschreibung von VMmark V2 ist im Übersichtsdokument Benchmark Overview VMmark
V2 zu finden.
http://www.fujitsu.com/de/primergy
Seite 51 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Umgebung
Der Messaufbau wird symbolisch durch folgende Grafik veranschaulicht:
Clients & Management
Server(s)
Storage-System
Mehrere
1Gb oder 10Gb
Netzwerke
Lastgeneratoren
inkl. Prime-Client und
Datacenter Management
Server
vMotion
Netzwerk
System under Test (SUT)
„Performance Only“ Messergebnis:
System Under Test (SUT)
Hardware
Anzahl Server
2
Modell
PRIMERGY RX2540 M1
Prozessor
2 × Xeon E5-2699 v3
Speicher
512 GB: 16 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC
Netzwerk-Interface
1 × Emulex OneConnect OCe14000 Dual Port Adapter mit PLAN EM 2x1Gb T interface
card
1 × Fujitsu Eth Ctrl 2x10Gbit PCIe x8 D2755 SFP+
Disk-Subsystem
1 × Dual port PFC EP LPe16002
2 × PRIMERGY RX300 S8 konfiguriert als Fibre Channel Target:
7/6 × SAS-SSD (400 GB)
®
2 × Fusion-io ioDrive 2 PCIe-SSD (1.2 TB)
RAID 0 mit mehreren LUNs
Gesamt: 8440 GB
Software
BIOS
Version V5.0.0.9 R1.1.0
BIOS-Einstellungen
Siehe Details
Betriebssystem
VMware ESXi 5.5.0 U2 Build 1964139
Betriebssystemeinstellungen
ESX-Einstellungen: siehe Details
Details
Siehe Disclosure
Seite 52 (62)
http://www.vmware.com/a/assets/vmmark/pdf/2014-09-08-Fujitsu-RX2540M1.pdf
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
„Performance with
Messergebnisse:
Server
Power“
und
Version: 1.4  2015-07-02
„Performance
with
Server
and
Storage
Power“
System Under Test (SUT)
Hardware
Anzahl Server
2
Modell
PRIMERGY RX2540 M1
Prozessor
2 × Xeon E5-2699 v3
Speicher
384 GB: 12 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC
Netzwerk-Interface
1 × Emulex OneConnect OCe14000 Dual Port Adapter mit PLAN EM 2x1Gb T interface
card
1 × Fujitsu Eth Ctrl 2x10Gbit PCIe x8 D2755 SFP+
Disk-Subsystem
1 × Dual port PFC EP LPe12002
1 × PRIMERGY RX300 S8 konfiguriert als Fibre Channel Target:
12 × SAS-SSD (400 GB)
®
2 × Fusion-io ioDrive 2 PCIe-SSD (1.2 TB)
RAID 0 mit mehreren LUNs
Gesamt: 6292 GB
Software
BIOS
Version V5.0.0.9 R1.3.0
BIOS-Einstellungen
Siehe Details
Betriebssystem
VMware ESXi 5.5.0 U2 Build 2068190
Betriebssystemeinstellungen
ESX-Einstellungen: siehe Details
Details
Siehe Disclosure
http://www.vmware.com/a/assets/vmmark/pdf/2014-09-30-Fujitsu-RX2540M1-serverptd.pdf
http://www.vmware.com/a/assets/vmmark/pdf/2014-09-30-Fujitsu-RX2540M1-allptd.pdf
Gemeinsam für alle Messergebnisse:
Datacenter Management Server (DMS)
Hardware (Shared)
Gehäuse
PRIMERGY BX600
Netzwerk-Switch
1 × PRIMERGY BX600 GbE Switch Blade 30/12
Hardware
Modell
1 × Server-Blade PRIMERGY BX620 S5
Prozessor
2 × Xeon X5570
Speicher
24 GB
Netzwerk-Interface
6 × 1 Gbit/s LAN
Software
Betriebssystem
VMware ESXi 5.1.0 Build 799733
Datacenter Management Server (DMS)-VM
Hardware
Prozessor
4 × logische CPU
Speicher
10 GB
Netzwerk-Interface
2 × 1 Gbit/s LAN
Software
Betriebssystem
Microsoft Windows Server 2008 R2 Enterprise x64 Edition
http://www.fujitsu.com/de/primergy
Seite 53 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Prime-Client
Hardware (Shared)
Gehäuse
PRIMERGY BX600
Netzwerk-Switch
1 × PRIMERGY BX600 GbE Switch Blade 30/12
Hardware
Modell
1 × Server-Blade PRIMERGY BX620 S5
Prozessor
2 × Xeon X5570
Speicher
12 GB
Netzwerk-Interface
6 × 1 Gbit/s LAN
Software
Betriebssystem
Microsoft Windows Server 2008 Enterprise x64 Edition SP2
Lastgenerator
Hardware
Modell
2 × PRIMERGY RX600 S6
Prozessor
4 × Xeon E7-4870
Speicher
512 GB
Netzwerk-Interface
5 × 1 Gbit/s LAN
Software
Betriebssystem
VMware ESX 4.1.0 U2 Build 502767
Lastgenerator-VMs (pro Tile 1 Lastgenerator-VM)
Hardware
Prozessor
4 × logische CPU
Speicher
4 GB
Netzwerk-Interface
1 × 1 Gbit/s LAN
Software
Betriebssystem
Microsoft Windows Server 2008 Enterprise x64 Edition SP2
Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar.
Seite 54 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Ergebnisse
„Performance Only“ Messergebnis (8. September 2014)
Am 8. September 2014 erzielte Fujitsu mit einer PRIMERGY RX2540 M1 mit Xeon E5-2699 v3
Prozessoren und VMware ESXi 5.5.0 U2 einen VMmark V2-Score von „26.48@22 tiles“ in einer
Systemkonfiguration mit insgesamt 2 × 36 Prozessorkernen beim Einsatz von zwei identischen
Servern im „System under Test“ (SUT). Mit diesem Ergebnis ist die PRIMERGY RX2540 M1 in
der offiziellen VMmark V2-„Performance Only“-Rangliste der leistungsstärkste 2-Sockel-Server in einer
„matched pair“ Konfiguration aus zwei identischen Hosts (zum Zeitpunkt der Veröffentlichung des
Benchmark-Ergebnisses).
Alle genannten Vergleichswerte zu Wettbewerbsprodukten geben den Stand vom 17. September 2014
wieder. Die aktuellen VMmark V2-„Performance Only“-Ergebnisse sowie die ausführlichen Resultate und
Konfigurationsdaten sind zu finden unter http://www.vmware.com/a/vmmark/.
Die Grafik zeigt das „Performance Only“-Ergebnis der PRIMERGY RX2540 M1 im Vergleich zum besten
®
®
System des Mitbewerbs mit 2 × 2 Prozessoren der Intel Xeon Processor E5-2600 Product Family
(v1/v2/v3).
PRIMERGY RX2540 M1 vs. HP ProLiant DL380p Gen8
30
+60%
20
10
5
16.54@14 tiles
15
26.48@22 tiles
VMmark V2 Score
25
2 × Fujitsu
PRIMERGY RX2540 M1
2 × 2 × Xeon
E5-2699 v3
2 × HP
ProLiant DL380p Gen8
2 × 2 × Xeon
E5-2697 v2
0
Wesentliche Voraussetzungen zur Erreichung des Ergebnisses der PRIMERGY RX2540 M1 waren die
verwendeten Prozessoren, die bei gut eingestelltem Hypervisor ihre Prozessor-Features inklusive HyperThreading optimal nutzen konnten. All dies wirkt sich speziell bei der Virtualisierung positiv aus.
Alle VMs, deren Anwendungsdaten, das Host-Betriebssystem sowie weitere erforderliche Daten befanden
sich auf einem leistungsfähigen Fibre-Channel Disk-Subsystem. Die Einrichtung des Disk-Subsystems
berücksichtigt möglichst die spezifischen Anforderungen des Benchmarks. Der Einsatz von FlashTechnologie in Form von SAS-SSDs und PCIe-SSDs in dem leistungsfähigen Fibre-Channel DiskSubsystem brachte weitere Vorteile bei den Antwortzeiten des eingesetzten Speichermediums.
Der Netzwerkanschluss an die Lastgeneratoren wurde über 10Gb LAN Ports realisiert. Die InfrastrukturWorkload-Verbindung zwischen den Hosts erfolgte per 1Gb LAN Ports.
Alle verwendeten Komponenten wurden dabei optimal aufeinander abgestimmt.
http://www.fujitsu.com/de/primergy
Seite 55 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
„Performance with Server Power“ Messergebnis (30. September 2014)
Am 30. September 2014 erzielte Fujitsu mit einer PRIMERGY RX2540 M1 mit Xeon E5-2699 v3
Prozessoren und VMware ESXi 5.5.0 U2 einen VMmark V2-„Server PPKW Score“ von
„25.2305@22 tiles“ in einer Systemkonfiguration mit insgesamt 2 × 36 Prozessorkernen beim
Einsatz von zwei identischen Servern im „System under Test“ (SUT). Mit diesem Ergebnis ist die
PRIMERGY RX2540 M1 in der offiziellen VMmark V2-„Performance with Server Power“-Rangliste der
energieeffizienteste Virtualisierungsserver weltweit (zum Zeitpunkt der Veröffentlichung des BenchmarkErgebnisses).
Alle genannten Vergleichswerte zu Wettbewerbsprodukten geben den Stand vom 30. September 2014
wieder. Die aktuellen VMmark V2-„Performance with Server Power“-Ergebnisse sowie die ausführlichen
Resultate und Konfigurationsdaten sind zu finden unter http://www.vmware.com/a/vmmark/2/.
Die Grafik zeigt das „Performance with Server Power“-Ergebnis der PRIMERGY RX2540 M1 im Vergleich
zum besten System des Mitbewerbs.
Performance with Server Power
+43%
25
20
10
5
17.6899@20 tiles
15
25.2305@22 tiles
VMmark V2 Server PPKW Score
30
2 × Fujitsu
PRIMERGY RX2540 M1
2 × 2 × Xeon
E5-2699 v3
2 × HP
ProLiant DL380 Gen9
2 × 2 × Xeon
E5-2699 v3
0
Seite 56 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
„Performance with Server and Storage Power“ Messergebnis (30. September 2014)
Am 30. September 2014 erzielte Fujitsu mit einer PRIMERGY RX2540 M1 mit Xeon E5-2699 v3
Prozessoren und VMware ESXi 5.5.0 U2 einen VMmark V2-„Server and Storage PPKW Score“
von „20.8067@22 tiles“ in einer Systemkonfiguration mit insgesamt 2 × 36 Prozessorkernen
beim Einsatz von zwei identischen Servern im „System under Test“ (SUT). Mit diesem Ergebnis
ist die PRIMERGY RX2540 M1 zusammen mit dem energieeffizienten Disk-Subsystem in der offiziellen
VMmark V2-„Performance with Server and Storage Power“-Rangliste die energieeffizienteste
Virtualisierungsplattform weltweit (zum Zeitpunkt der Veröffentlichung des Benchmark-Ergebnisses).
Alle genannten Vergleichswerte zu Wettbewerbsprodukten geben den Stand vom 30. September 2014
wieder. Die aktuellen VMmark V2-„Performance with Server and Storage Power“-Ergebnisse sowie die
ausführlichen Resultate und Konfigurationsdaten sind zu finden unter http://www.vmware.com/a/vmmark/3/.
Die Grafik zeigt das „Performance with Server and Storage Power“-Ergebnis der PRIMERGY RX2540 M1 im
Vergleich zum besten System des Mitbewerbs.
Performance with Server and Storage Power
VMmark V2 Server and Storage PPKW Score
25
+64%
20
5
12.7058@20 tiles
10
20.8067@22 tiles
15
2 × Fujitsu
PRIMERGY RX2540 M1
2 × 2 × Xeon
E5-2699 v3
2 × HP
ProLiant DL380 Gen9
2 × 2 × Xeon
E5-2699 v3
0
http://www.fujitsu.com/de/primergy
Seite 57 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
STREAM
Benchmark-Beschreibung
STREAM ist ein seit vielen Jahren eingesetzter synthetischer Benchmark zur Ermittlung des
Speicherdurchsatzes, der von John McCalpin während seiner Professur an der Universität in Delaware
entwickelt wurde. Heute wird STREAM an der Universität von Virginia betreut. Dort kann der Quellcode
wahlweise in Fortran oder C heruntergeladen werden. Besonders im HPC-Umfeld spielt STREAM nach wie
vor eine wichtige Rolle. So ist er z.B. Bestandteil der HPC Challenge Benchmark-Suite.
Der Benchmark ist so konzipiert, dass er sowohl auf PCs als auch auf Serversystemen eingesetzt werden
kann. Die Maßeinheit des Benchmarks ist GB/s, also die Anzahl Gigabytes, die pro Sekunde gelesen und
geschrieben werden kann.
STREAM misst den Speicherdurchsatz bei sequentiellen Zugriffen. Diese können generell effizienter
durchgeführt werden als Zugriffe, die zufällig auf den Speicher verteilt sind, da bei sequentiellem Zugriff die
Prozessor-Caches genutzt werden.
Vor der Ausführung wird der Quellcode der zu vermessenden Umgebung angepasst. So muss die Größe
des Datenbereiches mindestens 12mal höher sein als die Summe aller „last-level“ Prozessor-Caches, damit
diese einen möglichst geringen Einfluss auf das Ergebnis nehmen. Mit Hilfe der OpenMPProgrammbibliothek können ausgewählte Programmteile während der Laufzeit des Benchmarks parallel
ausgeführt werden, wodurch eine optimale Lastverteilung auf die verfügbaren Prozessorkerne erreicht wird.
Bei der Ausführung wird der definierte Datenbereich, bestehend aus 8-Byte-Elementen, nacheinander auf
vier Arten kopiert, wobei teilweise zusätzlich arithmetische Berechnungen durchgeführt werden.
Art
Ausführung
Bytes je Schritt
Gleitkommarechnung je Schritt
COPY
a(i) = b(i)
16
0
SCALE
a(i) = q × b(i)
16
1
SUM
a(i) = b(i) + c(i)
24
1
TRIAD
a(i) = b(i) + q × c(i)
24
2
Bei jeder Berechnungs-Art wird der Durchsatz in GB/s ausgegeben. Die Unterschiede der verschiedenen
Werte sind auf modernen Systemen in der Regel nur gering. Zum Vergleich wird im Allgemeinen nur noch
der ermittelte TRIAD-Wert verwendet.
Die Messergebnisse hängen in erster Linie von der Taktfrequenz der Speichermodule ab, die Prozessoren
beeinflussen die arithmetischen Berechnungen.
9
In diesem Kapitel sind Durchsätze durchgängig zur Basis 10 angegeben (1 GB/s = 10 Byte/s).
Seite 58 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Umgebung
System Under Test (SUT)
Hardware
Modell
PRIMERGY RX2540 M1
Prozessor
2 Prozessoren der Intel Xeon Processor E5-2600 v3 Product Family
Speicher
16 × 16GB (1x16GB) 2Rx4 DDR4-2133 R ECC
®
®
Software
BIOS-Einstellungen
EnergyPerformance = Performance
Xeon E5-2603 v3, E5-2609 v3, E5-2637 v3, E5-2698 v3, E5-2699 v3:
COD Enable = disabled, Early Snoop = disabled
Xeon E5-2630 v3, E5-2630L v3, E5-2640 v3:
COD Enable = disabled, Early Snoop = enabled
Alle anderen:
COD Enable = enabled, Early Snoop = disabled
Betriebssystem
Xeon E5-2699 v3: Red Hat Enterprise Linux Server release 6.5
Alle anderen:
Red Hat Enterprise Linux Server release 7.0
Betriebssystemeinstellungen
Transparent Huge Pages inactivated
Compiler
Intel C++ Composer XE 2013 SP1 for Linux Update 1
Benchmark
Stream.c Version 5.9
Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar.
http://www.fujitsu.com/de/primergy
Seite 59 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Benchmark-Ergebnisse
Prozessor
Speicherfrequenz
[MHz]
Max. Speicher- Cores
bandbreite
[GB/s]
Prozessorfrequenz
[Ghz]
Anzahl
Prozessoren
TRIAD
[GB/s]
Xeon E5-2603 v3
1600
51
6
1.60
2
47.9
Xeon E5-2609 v3
1600
51
6
1.90
2
58.1
Xeon E5-2623 v3
1866
59
4
3.00
2
73.3 (est.)
Xeon E5-2620 v3
1866
59
6
2.40
2
88.9 (est.)
Xeon E5-2630L v3
1866
59
8
1.80
2
86.2
Xeon E5-2630 v3
1866
59
8
2.40
2
89.9
Xeon E5-2640 v3
1866
59
8
2.60
2
89.6
Xeon E5-2637 v3
2133
68
4
3.50
2
89.8
Xeon E5-2643 v3
2133
68
6
3.40
2
90.3 (est.)
Xeon E5-2667 v3
2133
68
8
3.20
2
Xeon E5-2650 v3
2133
68
10
2.30
2
116 (est.)
Xeon E5-2660 v3
2133
68
10
2.60
2
115 (est.)
Xeon E5-2650L v3
2133
68
12
1.80
2
115
Xeon E5-2670 v3
2133
68
12
2.30
2
118 (est.)
Xeon E5-2680 v3
2133
68
12
2.50
2
118 (est.)
Xeon E5-2690 v3
2133
68
12
2.60
2
117
Xeon E5-2683 v3
2133
68
14
2.00
2
117 (est.)
Xeon E5-2695 v3
2133
68
14
2.30
2
118 (est.)
Xeon E5-2697 v3
2133
68
14
2.60
2
117 (est.)
Xeon E5-2698 v3
2133
68
16
2.30
2
117
Xeon E5-2699 v3
2133
68
18
2.30
2
116
90.3 (est.)
Mit „(est.)“ gekennzeichnete Ergebnisse sind Schätzwerte (estimated).
Seite 60 (62)
http://www.fujitsu.com/de/primergy
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
Literatur
PRIMERGY Server
http://primergy.de/
PRIMERGY RX2540 M1
Dieses White Paper:
http://docs.ts.fujitsu.com/dl.aspx?id=0cf6083d-23ab-4634-86e3-4d86ddf6e4f8
http://docs.ts.fujitsu.com/dl.aspx?id=884d7bdc-49ad-4550-b1a9-292d5770df9c
http://docs.ts.fujitsu.com/dl.aspx?id=4c793f74-a016-4bc7-8066-7775c8de5a1f
Datenblatt
http://docs.ts.fujitsu.com/dl.aspx?id=510df3c4-a4bc-4aae-8ddd-4d7ba65e8ce9
PRIMERGY Performance
http://www.fujitsu.com/de/x86-server-benchmarks
Performance von Server-Komponenten
http://www.fujitsu.com/de/products/computing/servers/mission-critical/benchmarks/x86components.html
BIOS-Optimierungen für Xeon E5-2600 v3 basierte Systeme
http://docs.ts.fujitsu.com/dl.aspx?id=b0877217-e9ef-4c7b-943d-299c0a4c4637
Speicher-Performance Xeon E5-2600 v3 (Haswell-EP) basierter Systeme
http://docs.ts.fujitsu.com/dl.aspx?id=571dd497-136c-4699-90d2-adff5d33a74c
RAID-Controller-Performance
http://docs.ts.fujitsu.com/dl.aspx?id=71fac54b-7ec3-4b3f-b13d-f80fbb42d583
Disk-I/O: Performance von Speichermedien und RAID-Controllern
Grundlagen Disk-I/O-Performance
http://docs.ts.fujitsu.com/dl.aspx?id=3d4fbad8-2a7e-465f-b9ee-d43b711f636d
Informationen über Iometer
http://www.iometer.org
OLTP-2
Benchmark-Überblick OLTP-2
http://docs.ts.fujitsu.com/dl.aspx?id=743d7d46-56e8-41d2-9d50-9ab29ccf4d18
SAP SD
http://www.sap.com/benchmark
Benchmark Überblick SAP SD
http://docs.ts.fujitsu.com/dl.aspx?id=ae039b1d-73d8-4946-ae60-08dcef54cfa8
SPECcpu2006
http://www.spec.org/osg/cpu2006
Benchmark Überblick SPECcpu2006
http://docs.ts.fujitsu.com/dl.aspx?id=04351fd2-8a69-42a3-ba1c-4342dcc89b89
SPECpower_ssj2008
http://www.spec.org/power_ssj2008
Benchmark-Überblick SPECpower_ssj2008
http://docs.ts.fujitsu.com/dl.aspx?id=66467935-98dc-4374-80b2-3ddae4c73491
STREAM
http://www.cs.virginia.edu/stream/
http://www.fujitsu.com/de/primergy
Seite 61 (62)
White Paper  Performance Report PRIMERGY RX2540 M1
Version: 1.4  2015-07-02
TPC-E
http://www.tpc.org/tpce
Benchmark Overview TPC-E (DE)
http://docs.ts.fujitsu.com/dl.aspx?id=08c95eef-5f18-4453-bed6-cbf9363f4e2f
VMmark V2
Benchmark-Überblick VMmark V2
http://docs.ts.fujitsu.com/dl.aspx?id=ea18bef0-c1ff-46ae-81b3-c47811f866de
VMmark V2
http://www.vmmark.com
vServCon
Benchmark-Überblick vServCon
http://docs.ts.fujitsu.com/dl.aspx?id=214ee9dc-9239-4985-86e4-f0f9ac78ea25
Kontakt
FUJITSU
Website: http://www.fujitsu.com/de/
PRIMERGY Product Marketing
mailto:Primergy-PM@ts.fujitsu.com
PRIMERGY Performance und Benchmarks
mailto:primergy.benchmark@ts.fujitsu.com
© Copyright 2014-2015 Fujitsu Technology Solutions. Fujitsu und das Fujitsu Logo sind Handelsnamen und/oder eingetragene Warenzeichen von Fujitsu
Ltd. in Japan und anderen Ländern. Andere Firmen-, Produkt- und Servicebezeichnungen können Marken oder eingetragene Marken der jeweiligen
Eigentümer sein. Änderung von technischen Daten sowie Lieferbarkeit vorbehalten. Haftung oder Garantie für Vollständigkeit, Aktualität und Richtigkeit der
angegebenen Daten und Abbildungen ausgeschlossen. Wiedergegebene Bezeichnungen können Marken und/oder Urheberrechte sein, deren Benutzung
durch Dritte für eigene Zwecke die Rechte der Inhaber verletzen kann.
Weitere Einzelheiten unter http://www.fujitsu.com/de/resources/navigation/terms-of-use.html
2015-07-02 WW DE
Seite 62 (62)
http://www.fujitsu.com/de/primergy