Performance Report PRIMERGY RX2540 M1
Transcription
Performance Report PRIMERGY RX2540 M1
White Paper Performance Report PRIMERGY RX2540 M1 White Paper FUJITSU Server PRIMERGY Performance Report PRIMERGY RX2540 M1 In diesem Dokument sind alle Benchmarks zusammengefasst, die für den FUJITSU Server PRIMERGY RX2540 M1 durchgeführt wurden. Ferner werden die Leistungsdaten der PRIMERGY RX2540 M1 mit denen anderer PRIMERGY Modelle verglichen und diskutiert. Neben den Benchmark-Ergebnissen als solchen wird jeder Benchmark und die Umgebung, in der der Benchmark durchgeführt wurde, kurz erläutert. Version 1.4 2015-07-02 http://www.fujitsu.com/de/primergy Seite 1 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Inhalt Dokumenthistorie ................................................................................................................................................ 3 Technische Daten ............................................................................................................................................... 5 SPECcpu2006 .................................................................................................................................................... 8 SPECpower_ssj2008 ........................................................................................................................................ 14 Disk-I/O: Performance von Speichermedien .................................................................................................... 19 Disk-I/O: Performance von RAID-Controllern ................................................................................................... 24 SAP SD ............................................................................................................................................................. 33 OLTP-2 ............................................................................................................................................................. 36 TPC-E ............................................................................................................................................................... 40 vServCon .......................................................................................................................................................... 44 VMmark V2 ....................................................................................................................................................... 51 STREAM ........................................................................................................................................................... 58 Literatur ............................................................................................................................................................. 61 Kontakt .............................................................................................................................................................. 62 Seite 2 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Dokumenthistorie Version 1.0 Neu: Technische Daten SPECcpu2006 ® ® Messungen mit Intel Xeon Processor E5-2600 v3 Product Family Disk-I/O: Performance von Speichermedien Ergebnisse für 3.5"-Speichermedien SAP SD Zertifikationsnummer 2014028 OLTP-2 ® ® Ergebnisse für Intel Xeon Processor E5-2600 v3 Product Family VMmark V2 Messung mit Xeon E5-2699 v3 Version 1.1 Neu: SPECpower_ssj2008 Messung mit Xeon E5-2699 v3 Disk-I/O: Performance von RAID-Controllern Messungen mit „LSI SW RAID on Intel C610 (Onboard SATA)“ und „PRAID EP400i“ Controllern TPC-E Messung mit Xeon E5-2699 v3 vServCon ® ® Ergebnisse für Intel Xeon Processor E5-2600 v3 Product Family Aktualisiert: SPECcpu2006 ® ® Weitere Messungen mit Intel Xeon Processor E5-2600 v3 Product Family OLTP-2 ® ® Neue Ergebnisse für Intel Xeon Processor E5-2600 v3 Product Family VMmark V2 „Performance with Server Power“ Messung mit Xeon E5-2699 v3 „Performance with Server and Storage Power“ Messung mit Xeon E5-2699 v3 Version 1.2 Aktualisiert: Technische Daten Modellvariante PY RX2540 M1 12x 3.5" hinzugefügt Modular PSU 450W platinum hp hinzugefügt Modular PSU 1200W platinum hp hinzugefügt SPECcpu2006 ® ® Weitere Messungen mit Intel Xeon Processor E5-2600 v3 Product Family http://www.fujitsu.com/de/primergy Seite 3 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Version 1.3 Aktualisiert: Technische Daten Modellvariante PY RX2540 M1 8x 2.5" expandable hinzugefügt Modellvariante PY RX2540 M1 24x 2.5" hinzugefügt Speichermodul 32GB (1x32GB) 2Rx4 DDR4-2133 R ECC hinzugefügt Max. Anzahl interner Festplatten durch Option für 4x REAR 2.5" SAS/SATA HDD/SSD erhöht SPECcpu2006 Schätzwerte für 1-Sockel-Konfigurationen eingefügt SPECpower_ssj2008 Wettbewerbsvergleich eingefügt OLTP-2 Neue PRIMERGY Systeme hinzugefügt Kleinere Korrekturen vServCon Neue PRIMERGY Systeme hinzugefügt Kleinere Korrekturen VMmark V2 Neue Bezeichnungen „Server PPKW Score“ und „Server and Storage PPKW Score“ Kleinere Korrekturen Version 1.4 Neu: STREAM ® ® Messungen mit Intel Xeon Processor E5-2600 v3 Product Family Aktualisiert: Technische Daten Speichermodul 64GB (1x64GB) 4Rx4 DDR4-2133 LR ECC hinzugefügt Disk-I/O: Performance von RAID-Controllern Modellvariante PY RX2540 M1 12x 3.5" hinzugefügt Modellvariante PY RX2540 M1 8x 2.5" expandable hinzugefügt Modellvariante PY RX2540 M1 24x 2.5" hinzugefügt Zweite Controller-Instanz in „LSI SW RAID on Intel C610 (Onboard SATA)“ hinzugefügt „PRAID CP400i“ und „PRAID EP420i“ Controller hinzugefügt Kleinere Korrekturen Seite 4 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Technische Daten PRIMERGY RX2540 M1 In diesem White Paper werden bei Maßeinheiten Dezimalpräfixe nach SI-Standard verwendet (z.B. 1 GB = 9 10 Byte). Abweichend hiervon sind bei Kapazitäten von Caches und Speichermodulen diese Präfixe als 30 Binärpräfixe (z.B. 1 GB = 2 Byte) zu interpretieren. Im Falle weiterer Ausnahmen wird an entsprechender Stelle gesondert darauf hingewiesen. Modell PRIMERGY RX2540 M1 Modellvarianten PY RX2540 M1 4x 3.5' expandable PY RX2540 M1 12x 3.5" PY RX2540 M1 8x 2.5" expandable PY RX2540 M1 24x 2.5" Formfaktor Rack Server Chipsatz Intel C610 Anzahl Sockel 2 Anzahl bestellbarer Prozessoren 1 oder 2 Prozessortyp Intel Xeon Processor E5-2600 v3 Product Family Anzahl Speichersteckplätze 24 (12 pro Prozessor) Maximaler Speicherausbau 1536 GB Onboard HDD-Controller PCI-Steckplätze Max. Anzahl interner Festplatten http://www.fujitsu.com/de/primergy ® ® ® PY RX2540 M1 4x 3.5' expandable, PY RX2540 M1 12x 3.5": Controller mit RAID 0, RAID 1 oder RAID 10 für bis zu 4 × 3.5" SATA HDDs PY RX2540 M1 8x 2.5" expandable, PY RX2540 M1 24x 2.5": Controller mit RAID 0, RAID 1 oder RAID 10 für bis zu 8 × 2.5" SATA HDDs 5 × PCI-Express 3.0 x8 2 × PCI-Express 3.0 x16 PY RX2540 M1 4x 3.5' expandable: 8 × 3.5" + 4 × 2.5" PY RX2540 M1 12x 3.5": 12 × 3.5" + 4 × 2.5" PY RX2540 M1 8x 2.5" expandable: 28 × 2.5" PY RX2540 M1 24x 2.5": 28 × 2.5" Seite 5 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Cache Xeon E5-2623 v3 4 8 10 8.00 3.00 3.50 1866 105 Xeon E5-2637 v3 4 8 15 9.60 3.50 3.70 2133 135 Xeon E5-2603 v3 6 6 15 6.40 1.60 entf. 1600 85 Xeon E5-2609 v3 6 6 15 6.40 1.90 entf. 1600 85 Xeon E5-2620 v3 6 12 15 8.00 2.40 3.20 1866 85 Xeon E5-2643 v3 6 12 20 9.60 3.40 3.70 2133 135 Xeon E5-2630L v3 8 16 20 8.00 1.80 2.90 1866 55 Xeon E5-2630 v3 8 16 20 8.00 2.40 3.20 1866 85 Xeon E5-2640 v3 8 16 20 8.00 2.60 3.40 1866 90 Xeon E5-2667 v3 8 16 20 9.60 3.20 3.60 2133 135 Xeon E5-2650 v3 10 20 25 9.60 2.30 3.00 2133 105 Xeon E5-2660 v3 10 20 25 9.60 2.60 3.3 2133 105 Xeon E5-2650L v3 12 24 30 9.60 1.80 2.50 2133 65 Xeon E5-2670 v3 12 24 30 9.60 2.30 3.10 2133 120 Xeon E5-2680 v3 12 24 30 9.60 2.50 3.30 2133 120 Xeon E5-2690 v3 12 24 30 9.60 2.60 3.50 2133 135 Xeon E5-2683 v3 14 28 35 9.60 2.00 3.00 2133 120 Xeon E5-2695 v3 14 28 35 9.60 2.30 3.30 2133 120 Xeon E5-2697 v3 14 28 35 9.60 2.60 3.60 2133 145 Xeon E5-2698 v3 16 32 40 9.60 2.30 3.60 2133 135 Xeon E5-2699 v3 18 36 45 9.60 2.30 3.60 2133 145 Prozessor Cores Threads Prozessoren (seit System-Release) QPISpeed Nominalfrequenz [Ghz] Max. Turbofrequenz [Ghz] Max. Speicherfrequenz [MHz] [MB] [GT/s] TDP [Watt] Alle mit der PRIMERGY RX2540 M1 bestellbaren Prozessoren außer Xeon E5-2603 v3 und Xeon E5-2609 ® v3 unterstützen Intel Turbo Boost Technology 2.0. Diese Technologie ermöglicht den Betrieb des Prozessors mit höheren Frequenzen als der Nominalfrequenz. In der Prozessortabelle steht „Max. Turbofrequenz“ für das theoretische Frequenzmaximum bei nur einem aktiven Core pro Prozessor. Die tatsächlich erreichbare Maximalfrequenz ist abhängig von der Anzahl aktiver Cores, dem Stromverbrauch, der elektrischen Leistungsaufnahme und der Temperatur des Prozessors. Das Erreichen der maximalen Turbofrequenz wird von Intel grundsätzlich nicht garantiert. Dies hängt mit Fertigungstoleranzen zusammen, aus denen eine Varianz bezüglich der Performance verschiedener Exemplare eines Prozessormodells folgt. Das Spektrum der Varianz überdeckt den gesamten Bereich zwischen der Nominalfrequenz und der maximalen Turbofrequenz. Die Turbo-Funktionalität ist per BIOS-Option einstellbar. Grundsätzlich empfiehlt Fujitsu die „Turbo Mode“Option auf der Standardeinstellung „Enabled“ zu belassen, denn durch die höheren Frequenzen wird die Performance deutlich gesteigert. Da die höheren Frequenzen jedoch abhängig von Randbedingungen und nicht immer garantiert sind, kann es für Anwendungsszenarien mit intensiver Verwendung von AVXInstruktionen und hoher Anzahl Instruktionen pro Takteinheit, aber auch solchen, in denen eine konstante Performance oder eine niedrige elektrische Leistungsaufnahme gefordert ist, von Vorteil sein die „Turbo Mode“-Option auszuschalten. Seite 6 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Registered ECC 4 2133 Load reduced 1 Low voltage 8 Bitbreite der Speicherchips Ranks 8GB (1x8GB) 1Rx4 DDR4-2133 R ECC Kapazität [GB] Speichermodul Frequenz [MHz] Speichermodule (seit System-Release) 8 2 8 2133 16GB (1x16GB) 2Rx4 DDR4-2133 R ECC 16 2 4 2133 32GB (1x32GB) 2Rx4 DDR4-2133 R ECC 32 2 4 2133 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC 32 4 4 2133 64GB (1x64GB) 4Rx4 DDR4-2133 LR ECC 64 4 4 2133 8GB (1x8GB) 2Rx8 DDR4-2133 R ECC Netzteile (seit System-Release) max. Anzahl Modular PSU 450W platinum hp 2 Modular PSU 800W platinum hp 2 Modular PSU 800W titanium hp 2 Modular PSU 1200W platinum hp 2 Einige Komponenten sind möglicherweise nicht in allen Ländern/Vertriebsregionen verfügbar. Detaillierte technische Informationen finden Sie im Datenblatt PRIMERGY RX2540 M1. http://www.fujitsu.com/de/primergy Seite 7 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 SPECcpu2006 Benchmark-Beschreibung SPECcpu2006 ist ein Benchmark, der die Systemeffizienz bei Integer- und Fließkomma-Operationen misst. Er besteht aus einer Integer-Testsuite (SPECint2006), die 12 Applikationen enthält, und einer FließkommaTestsuite (SPECfp2006), die 17 Applikationen enthält. Beide Testsuiten sind extrem rechenintensiv und konzentrieren sich auf die CPU und den Speicher. Andere Komponenten, wie Disk-I/O und Netzwerk, werden von diesem Benchmark nicht vermessen. SPECcpu2006 ist nicht an ein spezielles Betriebssystem gebunden. Der Benchmark ist als Source-Code verfügbar und wird vor der eigentlichen Messung kompiliert. Daher beeinflussen auch die verwendete Compiler-Version und deren Optimierungseinstellungen das Messergebnis. SPECcpu2006 beinhaltet zwei verschiedene Methoden der Performance-Messung: Die erste Methode (SPECint2006 bzw. SPECfp2006) ermittelt die Zeit, die für die Bearbeitung einer einzelnen Aufgabe benötigt wird. Die zweite Methode (SPECint_rate2006 bzw. SPECfp_rate2006) ermittelt den Durchsatz, d.h. wie viele Aufgaben parallel erledigt werden können. Beide Methoden werden zusätzlich noch in zwei Messläufe unterteilt, „base“ und „peak“, die sich in der Verwendung der Compiler-Optimierung unterscheiden. Bei der Publikation von Ergebnissen werden immer „base“-Werte verwendet, „peak“-Werte sind optional. Benchmark Arithmetik Typ CompilerOptimierung SPECint2006 Integer peak aggressiv SPECint_base2006 Integer base konservativ SPECint_rate2006 Integer peak aggressiv SPECint_rate_base2006 Integer base konservativ SPECfp2006 Fließkomma peak aggressiv SPECfp_base2006 Fließkomma base konservativ SPECfp_rate2006 Fließkomma peak aggressiv SPECfp_rate_base2006 Fließkomma base konservativ Messergebnis Anwendung Geschwindigkeit Singlethreaded Durchsatz Multithreaded Geschwindigkeit Singlethreaded Durchsatz Multithreaded Bei den Messergebnissen handelt es sich um das geometrische Mittel aus normalisierten Verhältniswerten, die für die Einzel-Benchmarks ermittelt wurden. Das geometrische Mittel führt gegenüber dem arithmetischen Mittel dazu, dass bei unterschiedlich hohen Einzelergebnissen eine Gewichtung zugunsten der niedrigeren Einzelergebnisse erfolgt. Normalisiert heißt, dass gemessen wird, wie schnell das Testsystem verglichen mit einem Referenzsystem ist. Der Wert „1“ wurde für die SPECint_base2006-, SPECint_rate_base2006, SPECfp_base2006 und SPECfp_rate_base2006-Ergebnisse des Referenzsystems festgelegt. So bedeutet beispielsweise ein SPECint_base2006-Wert von 2, dass das Messsystem diesen Benchmark etwa doppelt so schnell wie das Referenzsystem bewältigt hat. Ein SPECfp_rate_base2006-Wert von 4 bedeutet, dass das Messsystem diesen Benchmark etwa 4/[# base copies] mal so schnell wie das Referenzsystem bewältigt hat. „# base copies“ gibt hierbei an, wie viele parallele Instanzen des Benchmarks ausgeführt worden sind. Nicht alle SPECcpu2006-Messungen werden von uns zur Veröffentlichung bei SPEC eingereicht. Daher erscheinen auch nicht alle Ergebnisse auf den Web-Seiten von SPEC. Da wir für alle Messungen die Protokolldateien archivieren, können wir jederzeit den Nachweis für die korrekte Durchführung der Messungen erbringen. Seite 8 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Umgebung System Under Test (SUT) Hardware Modell PRIMERGY RX2540 M1 Prozessor 2 Prozessoren der Intel Xeon Processor E5-2600 v3 Product Family Speicher 16 × 16GB (1x16GB) 2Rx4 DDR4-2133 R ECC ® ® Software Betriebssystem SPECint_base2006, SPECint2006: Xeon E5-2603 v3, E5-2609 v3, E5-2620 v3, E5-2630 v3, E5-2630L v3, E5-2650 v3, E52690 v3, E5-2695 v3, E5-2697 v3, E5-2698 v3: Red Hat Enterprise Linux Server release 7.0 Alle anderen: Red Hat Enterprise Linux Server release 6.5 SPECint_rate_base2006, SPECint_rate2006: Xeon E5-2620 v3, E5-2630 v3, E5-2698 v3: Red Hat Enterprise Linux Server release 7.0 Alle anderen: Red Hat Enterprise Linux Server release 6.5 SPECfp_base2006, SPECfp2006, SPECfp_rate_base2006, SPECfp_rate2006: Xeon E5-2699 v3: Red Hat Enterprise Linux Server release 6.5 Alle anderen: Red Hat Enterprise Linux Server release 7.0 Betriebssystemeinstellungen echo always > /sys/kernel/mm/redhat_transparent_hugepage/enabled Compiler SPECint_base2006, SPECint2006: Xeon E5-2623 v3, E5-2637 v3, E5-2640 v3, E5-2643 v3, E5-2650L v3, E5-2660 v3, E52667 v3, E5-2670 v3, E5-2680 v3, E5-2683 v3: C/C++: Version 14.0.0.080 of Intel C++ Studio XE for Linux Alle anderen: C/C++: Version 15.0.0.090 of Intel C++ Studio XE for Linux SPECint_rate_base2006, SPECint_rate2006: Xeon E5-2620 v3, E5-2630 v3, E5-2698 v3: C/C++: Version 15.0.0.090 of Intel C++ Studio XE for Linux Alle anderen: C/C++: Version 14.0.0.080 of Intel C++ Studio XE for Linux SPECfp_base2006, SPECfp2006, SPECfp_rate_base2006, SPECfp_rate2006: C/C++: Version 15.0.0.090 of Intel C++ Studio XE for Linux Fortran: Version 15.0.0.090 of Intel Fortran Studio XE for Linux Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. http://www.fujitsu.com/de/primergy Seite 9 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Ergebnisse 56.4 59.3 1 209 (est.) 216 (est.) 2 410 424 Xeon E5-2637 v3 2 61.5 64.7 1 233 (est.) 240 (est.) 2 456 470 Xeon E5-2603 v3 2 28.9 30.1 1 135 (est.) 140 (est.) 2 265 274 Xeon E5-2609 v3 2 33.9 35.2 1 156 (est.) 162 (est.) 2 306 317 Xeon E5-2620 v3 2 54.1 56.2 1 258 (est.) 269 (est.) 2 506 528 Xeon E5-2643 v3 2 64.0 67.5 1 340 (est.) 351 (est.) 2 667 688 Xeon E5-2630L v3 2 51.3 53.6 1 285 (est.) 296 (est.) 2 559 580 Xeon E5-2630 v3 2 55.6 58.1 1 338 (est.) 352 (est.) 2 662 690 Xeon E5-2640 v3 2 58.4 62.2 1 359 (est.) 370 (est.) 2 703 726 Xeon E5-2667 v3 2 63.3 66.9 1 414 (est.) 428 (est.) 2 812 838 Xeon E5-2650 v3 2 53.8 56.2 1 421 (est.) 434 (est.) 2 825 850 Xeon E5-2660 v3 2 58.4 61.7 1 453 (est.) 468 (est.) 2 888 917 Xeon E5-2650L v3 2 46.4 48.7 1 414 (est.) 429 (est.) 2 812 841 Xeon E5-2670 v3 2 56.0 59.2 1 494 (est.) 510 (est.) 2 968 999 Xeon E5-2680 v3 2 59.7 62.9 1 531 (est.) 546 (est.) 2 1040 1070 Xeon E5-2690 v3 2 62.7 65.4 1 551 (est.) 566 (est.) 2 1080 1110 Xeon E5-2683 v3 2 53.7 56.5 1 541 (est.) 561 (est.) 2 1060 1100 Xeon E5-2695 v3 2 58.9 61.6 1 582 (est.) 602 (est.) 2 1140 1180 Xeon E5-2697 v3 2 63.6 66.1 1 617 (est.) 638 (est.) 2 1210 1250 Xeon E5-2698 v3 2 63.2 65.5 1 638 (est.) 658 (est.) 2 1250 1290 Xeon E5-2699 v3 2 63.9 66.0 1 699 (est.) 719 (est.) 2 1370 1410 SPECint_rate2006 Anzahl Prozessoren SPECint_rate_base2006 SPECint2006 2 Seite 10 (62) Anzahl Prozessoren SPECint_base2006 Xeon E5-2623 v3 SPECint_rate2006 Prozessor Anzahl Prozessoren SPECint_rate_base2006 Das Benchmark-Ergebnis hängt prozessorseitig in erster Linie von der Größe des Prozessor-Caches, der Unterstützung von Hyper-Threading, der Anzahl Prozessorkerne und der Prozessorfrequenz ab. Bei Prozessoren mit Turbomodus bestimmt die Anzahl Cores, die durch den Benchmark belastet werden, die maximal erreichbare Prozessorfrequenz. Bei den „singlethreaded“ Benchmarks, die überwiegend nur einen Core belasten, ist die maximal erreichbare Prozessorfrequenz höher als bei den „multithreaded“ Benchmarks. Mit „(est.)“ gekennzeichnete Ergebnisse sind Schätzwerte (estimated). http://www.fujitsu.com/de/primergy Anzahl Prozessoren SPECfp_rate_base2006 SPECfp_rate2006 2 380 389 1 214 (est.) 222 (est.) 2 425 440 56.6 1 142 (est.) 145 (est.) 2 282 288 63.1 1 163 (est.) 167 (est.) 2 325 331 479 Xeon E5-2637 v3 2 Xeon E5-2603 v3 2 54.8 Xeon E5-2609 v3 2 61.0 Xeon E5-2620 v3 2 94.6 Xeon E5-2643 v3 2 Xeon E5-2630L v3 2 Xeon E5-2630 v3 2 102 108 Xeon E5-2640 v3 2 105 Xeon E5-2667 v3 2 Xeon E5-2650 v3 101 SPECfp2006 SPECfp_base2006 2 97.3 103 SPECfp_rate2006 196 (est.) Xeon E5-2623 v3 Anzahl Prozessoren 191 (est.) Anzahl Prozessoren 1 Prozessor 94.4 Version: 1.4 2015-07-02 SPECfp_rate_base2006 White Paper Performance Report PRIMERGY RX2540 M1 100 1 235 (est.) 242 (est.) 2 468 116 1 286 (est.) 295 (est.) 2 569 585 1 251 (est.) 259 (est.) 2 499 512 1 283 (est.) 291 (est.) 2 563 577 109 1 293 (est.) 302 (est.) 2 583 598 115 119 1 330 (est.) 340 (est.) 2 656 673 2 102 106 1 343 (est.) 354 (est.) 2 682 700 Xeon E5-2660 v3 2 108 112 1 355 (est.) 367 (est.) 2 706 726 Xeon E5-2650L v3 2 1 336 (est.) 347 (est.) 2 668 687 Xeon E5-2670 v3 2 104 108 1 381 (est.) 393 (est.) 2 759 779 Xeon E5-2680 v3 2 110 114 1 392 (est.) 406 (est.) 2 781 804 Xeon E5-2690 v3 2 114 118 1 398 (est.) 412 (est.) 2 793 815 Xeon E5-2683 v3 2 102 1 404 (est.) 417 (est.) 2 804 826 Xeon E5-2695 v3 2 103 108 1 410 (est.) 424 (est.) 2 816 840 Xeon E5-2697 v3 2 110 113 1 427 (est.) 441 (est.) 2 849 874 Xeon E5-2698 v3 2 107 112 1 436 (est.) 451 (est.) 2 868 893 Xeon E5-2699 v3 2 109 115 1 461 (est.) 478 (est.) 2 917 946 112 88.5 87.5 98.3 93.6 91.4 Am 19. September 2014 belegte die PRIMERGY RX2540 M1 mit zwei Prozessoren Xeon E5-2643 v3 den ersten Platz in der Kategorie der 2-Socket Systeme bei dem Benchmark SPECint_base2006. Xeon E5-2667 v3 den ersten Platz bei dem Benchmark SPECfp_base2006. Xeon E5-2667 v3 den ersten Platz bei dem Benchmark SPECfp2006. Xeon E5-2699 v3 den ersten Platz in der Kategorie der 2-Socket Systeme bei dem Benchmark SPECint_rate_base2006. Xeon E5-2699 v3 den ersten Platz in der Kategorie der 2-Socket Systeme bei dem Benchmark SPECint_rate2006. Xeon E5-2699 v3 den ersten Platz in der Kategorie der 2-Socket Systeme bei dem Benchmark SPECfp_rate_base2006. Xeon E5-2699 v3 den ersten Platz in der Kategorie der 2-Socket Systeme bei dem Benchmark SPECfp_rate2006. Die Ergebnisse sind zu finden unter http://www.fujitsu.com/fts/products/computing/servers/primergy/benchmarks/rx2540m1/. http://www.fujitsu.com/de/primergy Seite 11 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Die folgenden vier Grafiken verdeutlichen den Durchsatz der PRIMERGY RX2540 M1 im Vergleich zu ihrem Vorgänger, der PRIMERGY RX300 S8, in jeweils performantester Ausstattung. SPECcpu2006: Integer-Performance PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8 67.5 67.4 70 62.6 64.0 60 50 40 30 20 SPECint2006 10 SPECint_base2006 0 PRIMERGY RX300 S8 PRIMERGY RX2540 M1 2 x Xeon E5-2667 v2 2 x Xeon E5-2643 v3 SPECcpu2006: Integer-Performance PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8 1410 1500 1370 962 1250 931 1000 750 500 SPECint_rate2006 250 SPECint_rate_base2006 0 PRIMERGY RX300 S8 PRIMERGY RX2540 M1 2 x Xeon E5-2697 v2 2 x Xeon E5-2699 v3 Seite 12 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 SPECcpu2006: Floating-Point-Performance PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8 119 112 120 115 108 100 80 60 40 SPECfp2006 20 SPECfp_base2006 0 PRIMERGY RX300 S8 PRIMERGY RX2540 M1 2 x Xeon E5-2667 v2 2 x Xeon E5-2667 v3 SPECcpu2006: Floating-Point-Performance PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8 946 1000 900 917 696 800 677 700 600 500 400 300 SPECfp_rate2006 200 100 SPECfp_rate_base2006 0 PRIMERGY RX300 S8 PRIMERGY RX2540 M1 2 x Xeon E5-2697 v2 2 x Xeon E5-2699 v3 http://www.fujitsu.com/de/primergy Seite 13 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 SPECpower_ssj2008 Benchmark-Beschreibung SPECpower_ssj2008 ist der erste Industriestandard-Benchmark von SPEC, der den Stromverbrauch eines Servers im Verhältnis zu dessen Durchsatz beurteilt. Mit SPECpower_ssj2008 hat SPEC in ähnlicher Weise wie auch für Durchsatzmessungen Standards auf dem Gebiet der elektrischen Leistungsmessung definiert. Der Workload des Benchmarks basiert auf typischen serverseitigen Java Business Applikationen. Er ist skalierbar, multi-threaded, auf eine große Anzahl von Plattformen portierbar und leicht auszuführen. Der Benchmark testet CPUs, Caches, die Speicherhierarchie und die Skalierbarkeit von symmetrischen Multiprozessorsystemen (SMPs), wie auch die Implementationen der Java Virtual Machine (JVM), Just In Time (JIT) Compiler, Garbage Collection, Threads und einige weitere Betriebssystemaspekte. SPECpower_ssj2008 zeichnet den Stromverbrauch von Servern bei unterschiedlichen Belastungsstufen — in 10%-Schritten von 100% bis „Active Idle“ — während einer festgesetzten Zeitspanne auf. Der abgestufte Workload ist der Tatsache geschuldet, dass Auslastung und Stromverbrauch von Servern im Verlauf von Tagen oder Wochen deutlich variieren. Zur Berechnung der Power-Performance-Metrik über alle Stufen werden die gemessenen Transaktionsdurchsätze jedes Messintervalls aufsummiert und dann durch die Summe der während jedes Messintervalls durchschnittlich aufgenommenen elektrischen Leistung geteilt. Das Ergebnis ist ein „overall ssj_ops/watt“ genannter Wert. Diese Kennzahl gibt Aufschluss über die Energie-Effizienz des gemessenen Servers. Der definierte Messstandard ermöglicht es einem Kunden Vergleiche anzustellen zwischen verschiedenen Konfigurationen und Servern, die mit SPECpower_ssj2008 vermessen wurden. Das nebenstehende Diagramm zeigt einen typischen Graphen eines SPECpower_ssj2008-Ergebnisses. Der Benchmark läuft auf den unterschiedlichsten Betriebssystemen und HardwareArchitekturen und stellt dabei keine besonderen Anforderungen an die Clientund Storage-Infrastruktur. Die Minimalausstattung für einen SPEC-konformen Test besteht aus zwei vernetzten Computern, sowie einem Strommessgerät und einem Temperatursensor. Der eine Computer ist das System Under Test (SUT), auf dem eines der unterstützten Betriebssysteme und die JVM installiert sind. Die JVM stellt die Umgebung bereit, die für den Ablauf des in Java implementierten SPECpower_ssj2008Workloads benötigt wird. Der zweite Computer ist das sogenannte „Control & Collection System“ (CCS), das die Ausführung des Benchmarks kontrolliert und die elektrische Leistungsaufnahme, sowie die Durchsatzund Temperaturwerte aufnimmt und protokolliert. Das nebenstehende Diagramm gibt Ihnen einen Überblick über die Grundstruktur der Benchmark-Konfiguration mit den dazugehörigen Komponenten. Seite 14 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Umgebung System Under Test (SUT) Hardware Modell PRIMERGY RX2540 M1 Modellvariante PY RX2540 M1 4x 3.5' expandable Prozessor Xeon E5-2699 v3 Speicher 8 × 8GB (1x8GB) 2Rx8 DDR4-2133 R ECC Netzwerk-Interface 1 × PLAN AP 1x1Gbit Cu Intel I210-T1 LP Disk-Subsystem Onboard HDD-Controller 1 × DOM SATA 6G 64GB Main N H-P Netzteil 1 × Modular PSU 800W titanium hp Software BIOS R1.6.0 BIOS-Einstellungen Hardware Prefetcher = Disabled Adjacent Cache Line Prefetch = Disabled DCU Streamer Prefetcher = Disabled Onboard USB Controllers = Disabled Power Technology = Custom QPI Link Frequency Select = 6.4 GT/s Turbo Mode = Disabled Intel Virtualization Technology = Disabled ASPM Support = L1 Only DMI Control = Gen1 COD Enable = Enabled Early Snoop = Disabled Firmware 7.60A Betriebssystem Microsoft Windows Server 2008 R2 Enterprise SP1 Betriebssystemeinstellungen Using the local security settings console, “lock pages in memory” was enabled for the user running the benchmark. Power Management: Enabled (“Fujitsu Enhanced Power Settings” power plan) Set “Turn off hard disk after = 1 Minute” in OS. Benchmark was started via Windows Remote Desktop Connection. Microsoft Hotfix KB2510206 has been installed due to known problems of the group assignment algorithm which does not create a balanced group assignment. For more information see: http://support.microsoft.com/kb/2510206 JVM IBM J9 VM (build 2.6, JRE 1.7.0 Windows Server 2008 R2 amd64-64 20120322_106209 (JIT enabled, AOT enabled) JVM-Einstellungen start /NODE [0,1,2,3] /AFFINITY [0x3,0xC,0x30,0xC0,0x300,0xC00,0x3000,0xC000,0x30000] -Xmn825m -Xms975m -Xmx975m -Xaggressive -Xcompressedrefs -Xgcpolicy:gencon -XlockReservation -Xnoloa -XtlhPrefetch -Xlp -Xconcurrentlevel0 -Xthr:minimizeusercpu -Xgcthreads2 (-Xgcthreads1 for JVM5 and JVM23) Weitere Software IBM WebSphere Application Server V8.5.0.0, Microsoft Hotfix for Windows (KB2510206) Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. http://www.fujitsu.com/de/primergy Seite 15 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Ergebnisse Die PRIMERGY RX2540 M1 erzielte folgendes Ergebnis: SPECpower_ssj2008 = 10,654 overall ssj_ops/watt Das nebenstehende Diagramm zeigt das Ergebnis der oben beschriebenen Konfiguration. Die roten waagerechten Balken zeigen für die einzelnen Laststufen (an der y-Achse des Diagramms abgebildet) das Verhältnis von Durchsatz zu Energieverbrauch (Performance to Power Ratio) in ssj_ops/watt (x-Achse oben). Die blaue Kurve stellt den durchschnittlichen Energieverbrauch dar (an der xAchse unten abgebildet); die Werte für die einzelnen Laststufen sind jeweils mit einer kleinen Raute gekennzeichnet. Die schwarze senkrechte Linie zeigt das Benchmark-Resultat von 10,654 overall ssj_ops/watt für die PRIMERGY RX2540 M1. Das ist der Quotient aus der Summe der Transaktionsdurchsätze der einzelnen Laststufen und der Summe der an diesen Stufen jeweils durchschnittlich aufgenommenen elektrischen Leistung. Die folgende Tabelle zeigt die Benchmark-Ergebnisse bezüglich des Durchsatzes in ssj_ops, der elektrischen Leistungsaufnahme in Watt und des daraus resultierenden Energieeffizienz-Werts für jede einzelne Laststufe. Performance Power Energy Efficiency Target Load ssj_ops 100% 3,257,627 271 12,001 90% 2,929,344 244 11,985 80% 2,599,922 216 12,063 70% 2,283,039 186 12,264 60% 1,957,744 161 12,181 50% 1,633,106 143 11,417 40% 1,303,216 128 10,187 30% 978,558 113 8,652 20% 652,175 98.2 6,642 10% 326,571 82.6 3,954 0 39.0 0 Active Idle Average Power (W) ssj_ops/watt ∑ssj_ops / ∑power = 10,654 Mit diesem Ergebnis erzielte die PRIMERGY RX2540 M1 einen neuen Weltrekord und übertraf damit das beste Konkurrenz-Ergebnis um 4.1% (Stand: 18. März 2015). Damit beweist sich die PRIMERGY RX2540 M1 als energieeffizientester Server weltweit. Die aktuellen SPECpower_ssj2008-Ergebnisse sind zu finden unter http://www.spec.org/power_ssj2008/results. Seite 16 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 SPECpower_ssj2008: PRIMERGY RX2540 M1 vs. Wettbewerb 12,000 overall ssj_ops/watt 10,000 10,238 10,654 8,000 Version: 1.4 2015-07-02 Der Vergleich zur Konkurrenz macht den Vorsprung der PRIMERGY RX2540 M1 im Bereich Energieeffizienz deutlich. Mit 4.1% höherer Energieeffizienz gegenüber dem besten Konkurrenzergebnis, dem Quanta QuantaGrid D51B-2U Server, setzt die PRIMERGY RX2540 M1 neue Maßstäbe. 6,000 4,000 2,000 0 Quanta QuantaGrid D51B-2U Fujitsu Server PRIMERGY RX2540 M1 Folgendes Diagramm zeigt für jede Laststufe den Stromverbrauch (auf der rechten Y-Achse) und den Durchsatz (auf der linken Y-Achse) der PRIMERGY RX2540 M1 gegenüber dem Vorgängersystem, der PRIMERGY RX300 S8. SPECpower_ssj2008: PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8 http://www.fujitsu.com/de/primergy Seite 17 (62) White Paper Performance Report PRIMERGY RX2540 M1 SPECpower_ssj2008 overall ssj_ops/watt: PRIMERGY RX2540 M1 vs. PRIMERGY RX300 S8 1,800 10,000 10,654 8,000 1,500 1,200 8,097 6,000 900 4,000 600 2,000 300 0 total power [watt] 12,000 overall ssj_ops/watt Durch die neuen Haswell-Prozessoren hat die PRIMERGY RX2540 M1 im Vergleich zur PRIMERGY RX300 S8 einen deutlich höheren Durchsatz. Trotz der höheren Leistungsaufnahme führt dies im Gesamtergebnis zu einer Steigerung der Energieeffizienz der PRIMERGY RX2540 M1 um 32%. Version: 1.4 2015-07-02 0 Fujitsu Server Fujitsu Server PRIMERGY RX300 S8 PRIMERGY RX2540 M1 Seite 18 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Disk-I/O: Performance von Speichermedien Benchmark-Beschreibung Performance-Messungen von Disk-Subsystemen bei PRIMERGY Servern dienen dazu, deren Leistungsfähigkeit zu beurteilen und einen Vergleich der verschiedenen Storage-Anbindungen bei PRIMERGY Servern zu ermöglichen. Standardmäßig werden diese Performance-Messungen mit einem definierten Messverfahren durchgeführt, das die Zugriffe realer Anwendungsszenarien anhand von Kenndaten modelliert. Die wesentlichen Kenndaten sind: Anteil von wahlfreien Zugriffen / sequentiellen Zugriffen Anteil der Zugriffsarten Lesen / Schreiben Blockgröße (kB) Anzahl paralleler Zugriffe (# of Outstanding I/Os) Eine gegebene Wertekombination dieser Kenndaten heißt „Lastprofil“. Die folgenden fünf Standardlastprofile lassen sich typischen Anwendungsszenarien zuordnen: Standardlastprofil Zugriff Zugriffsart read write Blockgröße [kB] Anwendung File copy wahlfrei 50% 50% 64 Kopieren von Dateien File server wahlfrei 67% 33% 64 File-Server Database wahlfrei 67% 33% 8 Datenbank (Datentransfer) Mail Server Streaming sequentiell 100% 0% 64 Datenbank (Log-File), Datensicherung; Video Streaming (teilweise) Restore sequentiell 0% 100% 64 Wiederherstellen von Dateien Zur Modellierung parallel zugreifender Anwendungen mit unterschiedlicher Belastungsintensität wird die „# of Outstanding I/Os“ mit 1, 3, 8 beginnend bis 512 gesteigert (ab 8 in Zweierpotenzschritten). Die Messungen des vorliegenden Dokumentes beruhen auf diesen Standardlastprofilen. Die wichtigsten Ergebnisse einer Messung sind: Throughput [MB/s] Transactions [IO/s] Latency [ms] Datendurchsatz in Megabytes pro Sekunde Transaktionsrate in I/O-Operationen pro Sekunde mittlere Antwortzeit in ms Für sequentielle Lastprofile hat sich der Datendurchsatz als übliche Messgröße durchgesetzt, während bei den wahlfreien Lastprofilen mit ihren kleinen Blockgrößen meist die Messgröße „Transaktionsrate“ verwendet wird. Datendurchsatz und Transaktionsrate sind direkt proportional zueinander und lassen sich nach der Formel Datendurchsatz [MB/s] = Transaktionsrate [IO/s] × Blockgröße [MB] Transaktionsrate [IO/s] = Datendurchsatz [MB/s] / Blockgröße [MB] ineinander überführen. 12 In diesem Kapitel sind Kapazitäten von Speichermedien durchgängig zur Basis 10 angegeben (1 TB = 10 Bytes), während alle anderen Kapazitäten, Dateigrößen, Blockgrößen und Durchsätze zur Basis 2 20 angegeben sind (1 MB/s = 2 Bytes/s). Alle Details des Messverfahrens und Grundlagen zur Disk-I/O-Performance sind im White Paper „Grundlagen Disk-I/O-Performance“ beschrieben. http://www.fujitsu.com/de/primergy Seite 19 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Umgebung Alle in diesem Kapitel diskutierten Messergebnisse gelten für die im Folgenden aufgelisteten Hardware- und Software-Komponenten: System Under Test (SUT) Hardware Modell PRIMERGY RX2540 M1 Controller 1 × RAID Ctrl SAS 6G 0/1 (D2607) Speichermedien SSD HDD Intel SSDSC2BA100G3C Intel SSDSC2BA200G3C Intel SSDSC2BA400G3C Intel SSDSC2BA800G3C HGST HUC156030CSS204 HGST HUC156045CSS204 HGST HUC156060CSS204 Seagate ST1000NM0023 Seagate ST1000NM0033 Seagate ST2000NM0023 Seagate ST2000NM0033 Seagate ST3000NM0023 Seagate ST3000NM0033 Seagate ST4000NM0023 Seagate ST4000NM0033 Western Digital WD1001FYYG Western Digital WD1003FBYX Western Digital WD2000FYYZ Western Digital WD2001FYYG Western Digital WD3000FYYZ Western Digital WD3001FYYG Western Digital WD4000FYYZ Western Digital WD4001FYYG Western Digital WD5003ABYX Software Betriebssystem Microsoft Windows Server 2008 Enterprise x64 Edition SP2 Verwaltungssoftware ServerView RAID Manager 5.7.2 Dateisystem NTFS Messwerkzeug Iometer 2006.07.27 Messdaten 32 GB Messdatei Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Benchmark-Ergebnisse Die hier vorgestellten Ergebnisse sollen dabei helfen, für die PRIMERGY RX2540 M1 passende Speichermedien unter dem Gesichtspunkt der Disk-I/O-Performance auszuwählen. Hierzu wurde in der im Unterkapitel Benchmark-Umgebung angegebenen Konfiguration jeweils ein einzelnes Speichmedium gemessen. Bei den Messungen wurde der RAID-Controller RAID Ctrl SAS 6G 0/1 (D2607) verwendet. Die folgende Tabelle fasst dessen wichtigste Eigenschaften zusammen. Controller-Name RAID Ctrl SAS 6G 0/1 (D2607) Seite 20 (62) Cache - Unterstützte Interfaces SATA 3G/6G SAS 3G/6G PCIe 2.0 x8 RAID Levels 0, 1, 1E, 10 http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Speichermedien Durch die Auswahl des Speichermedientyps und deren Anzahl lässt sich eine Gewichtung in Richtung Speicherkapazität, Performance, Sicherheit oder Preis vornehmen. In der PRIMERGY RX2540 M1 können folgende Typen von Speichermedien verwendet werden: Speichermedientyp Schnittstelle Formfaktor HDD SATA 6G 3.5" HDD SAS 12G 2.5" * HDD SAS 6G 3.5" SSD SATA 6G 2.5" * ) ) *) teilweise auch mit 3.5"-Rahmen erhältlich HDDs und SSDs werden über Host-Bus-Adapter, meist RAID-Controller, mit SATA- oder SAS-Schnittstelle betrieben. Die Schnittstelle des RAID-Controllers zum Chipsatz des Systemboards ist typischerweise PCIe oder, im Falle der integrierten Onboard-Controller, eine interne Busschnittstelle des Systemboards. Von allen Speichermedientypen bieten SSDs die bei weitem die höchsten Transaktionsraten für wahlfreie Lastprofile wie auch die kürzesten Zugriffszeiten. Dafür ist allerdings der Preis pro Gigabyte Speicherkapazität erheblich höher. Cache-Einstellungen Der Cache von HDDs hat in den meisten Fällen einen großen Einfluss auf die Disk-I/O-Performance. Er wird häufig als Sicherheitsproblem bei Stromausfall angesehen und daher abgeschaltet. Dennoch wurde er von den Festplattenherstellern aus gutem Grund zur Steigerung der Schreib-Performance integriert. Aus Performance-Gründen ist es daher empfehlenswert den Festplatten-Cache einzuschalten. Um Datenverlusten bei Stromausfall vorzubeugen, empfiehlt es sich das System mit einer USV auszustatten. Zwecks einfacher und sicherer Handhabung der Einstellungen von RAID-Controller und Festplatten empfiehlt sich die für PRIMERGY Server mitgelieferte RAID-Manager-Software „ServerView RAID“. Üblicherweise wird man – spezifisch für den Anwendungsfall – mittels der vordefinierten Modi „Performance“ oder „Data Protection“ die kompletten Cache-Einstellungen für Controller und Festplatten en bloc vornehmen. Der Modus „Performance“ gewährleistet für die Mehrzahl der Anwendungsszenarien Performance-optimale Einstellungen. Performance-Werte Die Performance-Werte der PRIMERGY RX2540 M1 werden im Folgenden tabellarisch zusammengestellt, jeweils spezifisch für ein einzelnes Speichermedium bei verschiedenen Zugriffsarten und Blockgrößen. Hierbei werden die etablierten Messgrößen, wie sie schon im Unterkapitel Benchmark-Beschreibung erwähnt wurden, verwendet. Bei den wahlfreien Zugriffen wird also die Transaktionsrate angegeben, und bei den sequentiellen Zugriffen der Datendurchsatz. Um Verwechslungen der Maßeinheiten zu vermeiden, sind die Tabellen für die beiden Arten von Zugriffen getrennt. In den Tabellenzellen sind die maximal erreichbaren Werte eingetragen. Das bedeutet: jeder Wert ist das Maximum über den gesamten Bereich von Belastungsintensitäten (# of Outstanding I/Os). Zwecks zusätzlicher Visualisierung der Zahlenwerte ist jede Tabellenzelle mit einem waagerechten Balken hinterlegt, dessen Länge proportional zum Zahlenwert in der Tabellenzelle ist. Alle Balken, die im gleichen Längenmaßstab dargestellt sind, haben die gleiche Farbe. Es können also nur die Tabellenzellen mit gleichfarbigen Balken sinnvoll visuell miteinander verglichen werden. Da die waagerechten Balken in den Tabellenzellen die maximal erreichbaren Performance-Werte veranschaulichen, sind sie als von links nach rechts heller werdende Farbverläufe dargestellt. Der helle Farbton am rechten Balkenende drückt aus, dass der Wert das Maximum ist und nur bei optimalen Voraussetzungen erreicht werden kann. Je dunkler dann der Farbton nach links hin wird, umso häufiger wird der entsprechende Wert in der Praxis erreichbar sein. http://www.fujitsu.com/de/primergy Seite 21 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 SSDs im Vergleich zur leistungsstärksten HDD Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): PRIMERGY RX2540 M1 Kapazität Speichermedium [GB] 800 Intel SSDSC2BA800G3C Schnittstelle SATA 6G 600 HGST HUC156060CSS204 (HDD) SAS 12G 400 Intel SSDSC2BA400G3C 200 100 Transaktionen [IO/s] Database Fileserver 35120 5554 Filecopy 5313 872 749 759 SATA 6G 36667 5453 5338 Intel SSDSC2BA200G3C SATA 6G 35023 4903 4466 Intel SSDSC2BA100G3C SATA 6G 28535 3371 3128 Sequentielle Zugriffe (maximale Performance-Werte in MB/s): PRIMERGY RX2540 M1 Kapazität Speichermedium [GB] 800 Intel SSDSC2BA800G3C Schnittstelle SATA 6G Durchsatz [MB/s] Streaming Restore 382 342 600 HGST HUC156060CSS204 (HDD) SAS 12G 236 236 400 Intel SSDSC2BA400G3C SATA 6G 434 341 200 Intel SSDSC2BA200G3C SATA 6G 410 330 100 Intel SSDSC2BA100G3C SATA 6G 434 196 Seite 22 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 HDDs Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): PRIMERGY RX2540 M1 Kapazität Speichermedium [GB] 4000 Seagate ST4000NM0033 4000 Seagate ST4000NM0023 4000 Western Digital WD4001FYYG 4000 Western Digital WD4000FYYZ SATA 6G SAS 6G SAS 6G SATA 6G Transaktionen [IO/s] Fileserver 413 363 410 354 331 294 324 285 Schnittstelle Database Filecopy 354 353 310 293 3000 3000 3000 3000 Seagate ST3000NM0033 Seagate ST3000NM0023 Western Digital WD3001FYYG Western Digital WD3000FYYZ SATA 6G SAS 6G SAS 6G SATA 6G 391 370 343 254 345 321 305 234 341 323 316 230 2000 2000 2000 2000 Seagate ST2000NM0033 Seagate ST2000NM0023 Western Digital WD2001FYYG Western Digital WD2000FYYZ SATA 6G SAS 6G SAS 6G SATA 6G 358 357 328 301 321 313 290 271 317 315 303 278 1000 1000 1000 1000 Seagate ST1000NM0033 Seagate ST1000NM0023 Western Digital WD1001FYYG Western Digital WD1003FBYX SATA 6G SAS 6G SAS 6G SATA 6G 356 340 320 243 315 298 287 220 310 298 299 231 600 HGST HUC156060CSS204 SAS 12G 872 749 759 500 Western Digital WD5003ABYX SATA 6G 242 219 228 450 HGST HUC156045CSS204 SAS 12G 864 766 789 300 HGST HUC156030CSS204 SAS 12G 783 663 678 Sequentielle Zugriffe (maximale Performance-Werte in MB/s): PRIMERGY RX2540 M1 Kapazität Speichermedium [GB] 4000 Seagate ST4000NM0033 4000 Seagate ST4000NM0023 4000 Western Digital WD4001FYYG 4000 Western Digital WD4000FYYZ Schnittstelle SATA 6G SAS 6G SAS 6G SATA 6G Durchsatz [MB/s] Streaming Restore 174 186 173 165 173 185 173 164 3000 3000 3000 3000 Seagate ST3000NM0033 Seagate ST3000NM0023 Western Digital WD3001FYYG Western Digital WD3000FYYZ SATA 6G SAS 6G SAS 6G SATA 6G 176 182 167 167 175 182 167 167 2000 2000 2000 2000 Seagate ST2000NM0033 Seagate ST2000NM0023 Western Digital WD2001FYYG Western Digital WD2000FYYZ SATA 6G SAS 6G SAS 6G SATA 6G 179 176 160 157 177 175 160 157 1000 1000 1000 1000 Seagate ST1000NM0033 Seagate ST1000NM0023 Western Digital WD1001FYYG Western Digital WD1003FBYX SATA 6G SAS 6G SAS 6G SATA 6G 162 167 159 130 162 166 159 129 600 HGST HUC156060CSS204 SAS 12G 236 236 500 Western Digital WD5003ABYX SATA 6G 132 131 450 HGST HUC156045CSS204 SAS 12G 237 237 300 HGST HUC156030CSS204 SAS 12G 236 236 http://www.fujitsu.com/de/primergy Seite 23 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Disk-I/O: Performance von RAID-Controllern Benchmark-Beschreibung Performance-Messungen von Disk-Subsystemen bei PRIMERGY Servern dienen dazu, deren Leistungsfähigkeit zu beurteilen und einen Vergleich der verschiedenen Storage-Anbindungen bei PRIMERGY Servern zu ermöglichen. Standardmäßig werden diese Performance-Messungen mit einem definierten Messverfahren durchgeführt, das die Zugriffe realer Anwendungsszenarien anhand von Kenndaten modelliert. Die wesentlichen Kenndaten sind: Anteil von wahlfreien Zugriffen / sequentiellen Zugriffen Anteil der Zugriffsarten Lesen / Schreiben Blockgröße (kB) Anzahl paralleler Zugriffe (# of Outstanding I/Os) Eine gegebene Wertekombination dieser Kenndaten heißt „Lastprofil“. Die folgenden fünf Standardlastprofile lassen sich typischen Anwendungsszenarien zuordnen: Standardlastprofil Zugriff Zugriffsart read write Blockgröße [kB] Anwendung File copy wahlfrei 50% 50% 64 Kopieren von Dateien File server wahlfrei 67% 33% 64 File-Server Database wahlfrei 67% 33% 8 Datenbank (Datentransfer) Mail Server Streaming sequentiell 100% 0% 64 Datenbank (Log-File), Datensicherung; Video Streaming (teilweise) Restore sequentiell 0% 100% 64 Wiederherstellen von Dateien Zur Modellierung parallel zugreifender Anwendungen mit unterschiedlicher Belastungsintensität wird die „# of Outstanding I/Os“ mit 1, 3, 8 beginnend bis 512 gesteigert (ab 8 in Zweierpotenzschritten). Die Messungen des vorliegenden Dokumentes beruhen auf diesen Standardlastprofilen. Die wichtigsten Ergebnisse einer Messung sind: Throughput [MB/s] Transactions [IO/s] Latency [ms] Datendurchsatz in Megabytes pro Sekunde Transaktionsrate in I/O-Operationen pro Sekunde mittlere Antwortzeit in ms Für sequentielle Lastprofile hat sich der Datendurchsatz als übliche Messgröße durchgesetzt, während bei den wahlfreien Lastprofilen mit ihren kleinen Blockgrößen meist die Messgröße „Transaktionsrate“ verwendet wird. Datendurchsatz und Transaktionsrate sind direkt proportional zueinander und lassen sich nach der Formel Datendurchsatz [MB/s] = Transaktionsrate [IO/s] × Blockgröße [MB] Transaktionsrate [IO/s] = Datendurchsatz [MB/s] / Blockgröße [MB] ineinander überführen. 12 In diesem Kapitel sind Kapazitäten von Speichermedien durchgängig zur Basis 10 angegeben (1 TB = 10 Bytes), während alle anderen Kapazitäten, Dateigrößen, Blockgrößen und Durchsätze zur Basis 2 20 angegeben sind (1 MB/s = 2 Bytes/s). Alle Details des Messverfahrens und Grundlagen zur Disk-I/O-Performance sind im White Paper „Grundlagen Disk-I/O-Performance“ beschrieben. Seite 24 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Umgebung Alle in diesem Kapitel diskutierten Messergebnisse wurden mit den im Folgenden aufgelisteten Hardwareund Software-Komponenten ermittelt: System Under Test (SUT) Hardware Controller 1 × „LSI SW RAID on Intel C610 (Onboard SATA)“ 1 × „PRAID CP400i“ 1 × „PRAID EP400i“ 1 × „PRAID EP420i“ Festplatte 4 × 3.5" SATA HDD Seagate ST3000NM0033 4 × 2.5" SATA HDD Seagate ST91000640NS 4 × 2.5" SATA SSD Intel SSDSC2BA400G3C 24 × 2.5" SAS SSD Toshiba PX02SMF040 24 × 2.5" SAS HDD HGST HUC156045CSS204 Software BIOS-Einstellungen Intel Virtualization Technology = Disabled VT-d = Disabled Energy Performance = Performance Utilization Profile = Unbalanced CPU C6 Report = Disabled Betriebssystem Microsoft Windows Server 2012 Standard BetriebssystemEinstellungen Choose or customize a power plan: High performance Für die Disk-I/O-erzeugenden Prozesse: Setzen der AFFINITY auf den CPU-Node, an den der PCIe-Slot des RAID-Controllers angeschlossen ist Verwaltungssoftware ServerView RAID Manager 5.7.2 / 6.1.4 Initialisierung von RAID-Verbänden RAID-Verbände werden vor der Messung mit einer elementaren Blockgröße von 64 kB („Stripe Size“) initialisiert Dateisystem NTFS Messwerkzeug Iometer 2006.07.27 Messdaten Messdateien von 32 GB bei 1 – 8 Festplatten; 64 GB bei 9 – 16 Festplatten; 128 GB bei 17 oder mehr Festplatten Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. http://www.fujitsu.com/de/primergy Seite 25 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Ergebnisse Die hier vorgestellten Ergebnisse sollen dabei helfen, aus den verschiedenen Konfigurationsmöglichkeiten der PRIMERGY RX2540 M1 die passende Lösung unter dem Gesichtspunkt der Disk-I/O-Performance auszuwählen. Im Folgenden sollen verschiedene Kombinationen von RAID-Controllern und Datenträgern untersucht werden. Informationen zur Auswahl der Datenträger selbst finden sich im Kapitel „Disk-I/O: Performance von Speichermedien“. Festplatten Die erste wesentliche Komponente sind die Festplatten. Wenn im Folgenden von „Festplatten“ die Rede ist, so ist dies als Oberbegriff gemeint für HDDs („hard disk drives“, also konventionelle Festplatten) und SSDs („solid state drives“, also nichtflüchtige elektronische Speichermedien). Mischkonfigurationen von SAS- und SATA-Festplatten in einem System sind zulässig, sofern sie nicht für spezielle Festplattentypen im Konfigurator ausgeschlossen sind. Durch die Verwendung von 2.5"-Festplatten anstelle von 3.5"-Festplatten sind mehr Festplatten pro System möglich. Dadurch sinkt die Belastung, die jede einzelne Festplatte zu bewältigen hat, und die maximale Gesamt-Performance des Systems steigt. Detailliertere Performance-Aussagen zu den Festplattentypen sind im Kapitel „Disk-I/O: Performance von Speichermedien“ im vorliegenden Performance Report zu finden. Modellvarianten Die maximale Anzahl von Festplatten im System hängt von der Systemkonfiguration ab. Die folgende Tabelle stellt die wesentlichen Fälle zusammen. Für alle in diesem Kapitel behandelten Schnittstellen wird nur deren höchste unterstützte Version genannt. Formfaktor Schnittstelle Anzahl PCIeController Maximalzahl Festplatten direkt 0 SATA 6G, SAS 12G direkt 1 8 SATA 6G, SAS 12G Expander 1 12 SATA 6G, SAS 12G Expander 1 24 2.5", 3.5" SATA 6G 2.5", 3.5" 3.5" 2.5" Seite 26 (62) Anschlusstyp 8 http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 RAID-Controller Neben den Festplatten ist der RAID-Controller die zweite Performance-bestimmende Schlüsselkomponente. Bei diesen Controllern bietet das „Modular RAID“ Konzept der PRIMERGY Server eine Fülle von Möglichkeiten, um den verschiedenen Anforderungen unterschiedlichster Anwendungsszenarien gerecht zu werden. Die folgende Tabelle fasst die wichtigsten Eigenschaften der verfügbaren RAID-Controller der PRIMERGY RX2540 M1 zusammen. Pro Controller ist hierin ein kurzer Alias angegeben, der bei der anschließenden Zusammenstellung der Performance-Werte verwendet wird. Controller-Name Alias Cache Unterstützte Interfaces Im System Max. # Disks pro Controller BBU/ FBU RAID Levels LSI SW RAID on Intel C610 (Onboard SATA) Onboard C610 - SATA 6G - 4 × 2.5" 4 × 3.5" 0, 1, 10 -/- PRAID CP400i PRAID CP400i - SATA 6G SAS 12G PCIe 3.0 x8 8 × 2.5" 8 × 3.5" 0, 1, 1E, 5, 10, 50 -/- PRAID EP400i PRAID EP400i 1 GB SATA 6G SAS 12G PCIe 3.0 x8 24 × 2.5" 12 × 3.5" 0, 1, 1E, 5, 6, 10, 50, 60 -/ PRAID EP420i PRAID EP420i 2 GB SATA 6G SAS 12G PCIe 3.0 x8 24 × 2.5" 12 × 3.5" 0, 1, 1E, 5, 6, 10, 50, 60 -/ Onboard RAID Controller sind im Chipset auf den Systemboards der Server realisiert und benutzen die CPU des Servers für die RAID-Funktionalität. Diese einfache Lösung benötigt keinen PCIe-Steckplatz. Der Chipset kommuniziert mit der CPU nicht über PCIe, sondern über das „Direct Media Interface“, kurz DMI. Die PRIMERGY RX2540 M1 besitzt den Chipset Intel C610. Hierin sind zwei Onboard RAID Controller integriert. Mit jedem dieser Controller können über das PRIMERGY RAID Management Verbände aus bis zu vier Festplatten gebildet werden. In diesem Dokument wird mit dem Alias des Onboard-Controllers eine Controller-Instanz im Chipset bezeichnet. Systemspezifische Schnittstellen Die Schnittstellen eines Controllers in Richtung CPU (DMI oder PCIe) und in Richtung Festplatten (SAS oder SATA) haben jeweils spezifische Grenzen für den Datendurchsatz. Diese Grenzen sind in der folgenden Tabelle zusammengestellt. Das Minimum dieser beiden Werte ist eine prinzipielle Grenze, die nicht überschritten werden kann. Dieser Wert ist in der folgenden Tabelle mit Fettdruck hervorgehoben. ControllerAlias Effektiv in der Konfiguration # Disk-seitige Datenkanäle 1 × Onboard C610 1 × 4 × SATA 6G Grenze für Durchsatz Disk-Interface 2060 MB/s # CPU-seitige Datenkanäle Grenze für Durchsatz CPU-seitiges Interface 4 × DMI 2.0 *) Anschluss über Expander 1716 MB/s - 1716 MB/s - 2 × Onboard C610 2 × 4 × SATA 6G 4120 MB/s 4 × DMI 2.0 PRAID CP400i 8 × SAS 12G 8240 MB/s 8 × PCIe 3.0 6761 MB/s PRAID EP400i 8 × SAS 12G 8240 MB/s 8 × PCIe 3.0 6761 MB/s -/ PRAID EP420i 8 × SAS 12G 8240 MB/s 8 × PCIe 3.0 6761 MB/s -/ *) Die zweite Controller-Instanz erhöht die CPU-seitige Durchsatzgrenze nicht. Weitere Details zu den RAID-Controllern der PRIMERGY Systeme finden sich im White Paper „RAIDController-Performance“. http://www.fujitsu.com/de/primergy Seite 27 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Einstellungen Der Cache von HDDs hat in den meisten Fällen einen großen Einfluss auf die Disk-I/O-Performance. Er wird häufig als Sicherheitsproblem bei Stromausfall angesehen und daher abgeschaltet. Dennoch wurde er von den Festplattenherstellern aus gutem Grund zur Steigerung der Schreib-Performance integriert. Aus Performance-Gründen ist es daher empfehlenswert den Festplatten-Cache einzuschalten. Um Datenverlusten bei Stromausfall vorzubeugen, empfiehlt es sich das System mit einer USV auszustatten. Bei Controllern mit Cache gibt es mehrere einstellbare Parameter. Die jeweils optimalen Einstellungen können vom RAID-Level, vom Anwendungsszenario und vom Datenträgertyp abhängen. Besonders bei den RAID-Levels 5 und 6 (und den davon abgeleiteten komplexeren RAID-Levels 50 und 60) ist bei Anwendungsszenarien mit Schreibanteil das Einschalten des Controller-Caches Pflicht. Bei aktiviertem Controller-Cache sollten die darin temporär gespeicherten Daten gegen Verlust bei Stromausfall gesichert werden. Hierfür ist geeignetes Zubehör verfügbar (beispielsweise eine BBU bzw. FBU). Zwecks einfacher und sicherer Handhabung der Einstellungen von RAID-Controller und Festplatten empfiehlt sich die für PRIMERGY Server mitgelieferte RAID-Manager-Software „ServerView RAID“. Üblicherweise wird man – spezifisch für den Anwendungsfall – mittels der vordefinierten Modi „Performance“ oder „Data Protection“ die kompletten Cache-Einstellungen für Controller und Festplatten en bloc vornehmen. Der Modus „Performance“ gewährleistet für die Mehrzahl der Anwendungsszenarien Performance-optimale Einstellungen. Nähere Informationen zu den Einstellungsmöglichkeiten beim Controller-Cache sind im White Paper „RAIDController-Performance“ zu finden. Performance-Werte Generell hängt die Disk-I/O-Performance eines RAID-Verbandes von Festplattentyp und –anzahl, vom RAID-Level und vom RAID-Controller ab. Sofern die Limitierungen der systemspezifischen Schnittstellen nicht überschritten werden, gelten also Aussagen zur Disk-I/O-Performance für alle PRIMERGY Systeme. Daher gelten auch alle Performance-Aussagen des Dokumentes „RAID-Controller-Performance“ für die PRIMERGY RX2540 M1, soweit die dort vermessenen Konfigurationen auch von diesem System unterstützt werden. Die Performance-Werte der PRIMERGY RX2540 M1 werden im Folgenden tabellarisch zusammengestellt, jeweils spezifisch für verschiedene RAID-Level, Zugriffsarten und Blockgrößen. Wesentlich verschiedene Konfigurationsvarianten werden getrennt behandelt. Hierbei werden die etablierten Messgrößen, wie sie schon im Unterkapitel Benchmark-Beschreibung erwähnt wurden, verwendet. Bei den wahlfreien Zugriffen wird also die Transaktionsrate angegeben, und bei den sequentiellen Zugriffen der Datendurchsatz. Um Verwechslungen der Maßeinheiten zu vermeiden, sind die Tabellen für die beiden Arten von Zugriffen getrennt. In den Tabellenzellen sind die maximal erreichbaren Werte eingetragen. Das bedeutet dreierlei: Zum einen wurden Festplatten mit optimaler Performance verwendet (die Komponenten sind im Unterkapitel Benchmark-Umgebung näher beschrieben). Des Weiteren sind Cache-Einstellungen von Controllern und Festplatten zugrunde gelegt, die für das jeweilige Zugriffsszenario und den RAID-Level optimal sind. Und schließlich ist jeder Wert das Maximum über den gesamten Bereich von Belastungsintensitäten (# of Outstanding I/Os). Zwecks zusätzlicher Visualisierung der Zahlenwerte ist jede Tabellenzelle mit einem waagerechten Balken hinterlegt, dessen Länge proportional zum Zahlenwert in der Tabellenzelle ist. Alle Balken, die im gleichen Längenmaßstab dargestellt sind, haben die gleiche Farbe. Es können also nur die Tabellenzellen mit gleichfarbigen Balken sinnvoll visuell miteinander verglichen werden. Da die waagerechten Balken in den Tabellenzellen die maximal erreichbaren Performance-Werte veranschaulichen, sind sie als von links nach rechts heller werdende Farbverläufe dargestellt. Der helle Farbton am rechten Balkenende drückt aus, dass der Wert das Maximum ist und nur bei optimalen Voraussetzungen erreicht werden kann. Je dunkler dann der Farbton nach links hin wird, umso häufiger wird der entsprechende Wert in der Praxis erreichbar sein. Seite 28 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 2.5" - Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): HUC156045CSS204 SAS HDD PRAID CP400i PX02SMF040 SAS SSD PRAID EP400i PRAID EP420i HUC156045CSS204 SAS HDD PX02SMF040 SAS SSD HUC156045CSS204 SAS HDD PX02SMF040 SAS SSD http://www.fujitsu.com/de/primergy SSDs wahlfrei 64 kB Blöcke 67% read [IO/s] SSDs wahlfrei 8 kB Blöcke 67% read [IO/s] HDDs wahlfrei 64 kB Blöcke 67% read [IO/s] ST91000640NS SATA HDD SSDSC2BA400G3 SATA SSD HDDs wahlfrei 8 kB Blöcke 67% read [IO/s] Festplattentyp Onboard C610 # Disks RAIDController Konfigurationsvariante RAID-Level PRIMERGY RX2540 M1 Modellvariante PY RX2540 M1 8x 2.5' expandable Modellvariante PY RX2540 M1 24x 2.5' 2 1 464 389 47337 7870 4 4 0 10 915 714 500 415 78887 63426 14951 12256 2 1 1290 1112 75925 12445 8 8 8 10 0 5 3948 5490 2827 2524 3466 1920 100776 137616 29911 55843 77081 19148 2 1 1630 883 78733 12318 8 8 8 10 0 5 6239 7828 2903 2818 3783 1779 113462 132049 54614 58778 81445 23046 16 24 24 10 0 5 10401 17737 9675 5104 9051 5375 110528 132349 54107 78017 99988 21825 2 1 1949 1085 80178 12460 8 8 8 10 0 5 6150 8065 3194 3034 3887 1766 105915 123219 54214 58569 79893 22894 16 24 24 10 0 5 13624 17713 9705 6827 9263 5330 110944 132539 54287 78403 100570 22398 Seite 29 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 2.5" - Sequentielle Zugriffe (maximale Performance-Werte in MB/s): HUC156045CSS204 SAS HDD PRAID CP400i PX02SMF040 SAS SSD PRAID EP400i PRAID EP420i Seite 30 (62) HUC156045CSS204 SAS HDD PX02SMF040 SAS SSD HUC156045CSS204 SAS HDD PX02SMF040 SAS SSD SSDs sequentiell 64 kB Blöcke 100% write [MB/s] SSDs sequentiell 64 kB Blöcke 100% read [MB/s] HDDs sequentiell 64 kB Blöcke 100% write [MB/s] ST91000640NS SATA HDD SSDSC2BA400G3 SATA SSD HDDs sequentiell 64 kB Blöcke 100% read [MB/s] Festplattentyp Onboard C610 # Disks RAIDController Konfigurationsvariante RAID-Level PRIMERGY RX2540 M1 Modellvariante PY RX2540 M1 8x 2.5' expandable Modellvariante PY RX2540 M1 24x 2.5' 2 1 112 108 726 443 4 4 0 10 429 221 425 213 1264 1027 1190 605 2 1 394 235 1601 421 8 8 8 10 0 5 1006 1816 1577 913 1820 1583 5918 5838 5844 1652 3295 1868 2 1 411 235 1596 420 8 8 8 10 0 5 1001 1836 1600 926 1808 1591 5873 5818 5790 1653 3295 2651 16 24 24 10 0 5 1949 5320 4984 1838 5168 2764 5917 5914 5914 2917 6518 2907 2 1 441 274 1595 421 8 8 8 10 0 5 1027 1919 1636 958 1851 1605 5888 5848 5847 1650 3281 2611 16 24 24 10 0 5 1967 5272 5021 1805 5308 2682 5914 5912 5912 2898 6522 2857 http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 3.5" - Wahlfreie Zugriffe (maximale Performance-Werte in IO/s): Onboard C610 PRAID CP400i PRAID EP400i PRAID EP420i ST3000NM0033 SATA HDD SSDSC2BA200G3 SATA SSD SSDs wahlfrei 64 kB Blöcke 67% read [IO/s] SSDs wahlfrei 8 kB Blöcke 67% read [IO/s] HDDs wahlfrei 64 kB Blöcke 67% read [IO/s] HDDs wahlfrei 8 kB Blöcke 67% read [IO/s] # Disks Festplattentyp RAIDController Konfigurationsvariante RAID-Level PRIMERGY RX2540 M1 Modellvariante PY RX2540 M1 4x 3.5' expandable Modellvariante PY RX2540 M1 12x 3.5' 2 1 487 435 47337 7870 4 4 0 10 1081 813 609 464 78887 63426 14951 12256 2 1 1290 1112 75925 12445 HUC156045CSS204 SAS HDD 8 10 3948 2524 100776 55843 PX02SMF040 SAS-SSD 8 8 0 5 5490 2827 3466 1920 137616 29911 77081 19148 2 1 1630 883 78733 12318 8 10 6239 2818 113462 58778 8 8 0 5 7828 2903 3783 1779 132049 54614 81445 23046 12 10 7795 3837 111727 74612 12 12 0 5 10185 4319 5113 2631 133129 54586 96384 22676 2 1 1949 1085 80178 12460 12 12 12 10 0 5 8104 10608 5284 3932 5255 2885 104772 123978 53800 72461 90934 22547 HUC156045CSS204 SAS HDD PX02SMF040 SAS-SSD HUC156045CSS204 SAS HDD PX02SMF040 SAS-SSD http://www.fujitsu.com/de/primergy Seite 31 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 3.5" - Sequentielle Zugriffe (maximale Performance-Werte in MB/s): Onboard C610 PRAID CP400i PRAID EP400i PRAID EP420i ST3000NM0033 SATA HDD SSDSC2BA200G3 SATA SSD SSDs sequentiell 64 kB Blöcke 100% write [MB/s] SSDs sequentiell 64 kB Blöcke 100% read [MB/s] HDDs sequentiell 64 kB Blöcke 100% write [MB/s] HDDs sequentiell 64 kB Blöcke 100% read [MB/s] # Disks Festplattentyp RAIDController Konfigurationsvariante RAID-Level PRIMERGY RX2540 M1 Modellvariante PY RX2540 M1 4x 3.5' expandable Modellvariante PY RX2540 M1 12x 3.5' 2 1 178 173 726 443 4 4 0 10 667 350 672 336 1264 1027 1190 605 2 1 394 235 1601 421 HUC156045CSS204 SAS HDD 8 10 1006 913 5918 1652 PX02SMF040 SAS-SSD 8 8 0 5 1816 1577 1820 1583 5838 5844 3295 1868 2 1 411 235 1596 420 8 10 997 909 5873 1653 8 8 0 5 1818 1609 1571 1545 5818 5790 3295 2651 12 10 1479 1342 5900 2438 12 12 0 5 2697 2432 2694 2483 5898 5898 4824 2811 HUC156045CSS204 SAS HDD PX02SMF040 SAS-SSD HUC156045CSS204 SAS HDD PX02SMF040 SAS-SSD 2 1 441 274 1595 421 12 12 12 10 0 5 1496 2715 2532 1359 2685 2437 5932 5919 5918 2410 4762 2762 Fazit Die PRIMERGY RX2540 M1 erreicht im Vollausbau mit leistungsfähigen Festplatten einen Durchsatz von bis zu 6522 MB/s bei sequentiellen Lastprofilen und eine Transaktionsrate von bis zu 137616 IO/s bei typischen wahlfreien Anwendungsszenarien. Für bestmögliche Performance empfiehlt sich einer der steckbaren PCIe-Controller. Bei mehr als acht Festplatten ist ein Controller mit Cache erforderlich. Zum Betrieb von SSDs im höchstmöglichen Performance-Bereich ist bei den einfacheren RAID-Levels 0, 1 und 10 bereits der PRAID CP400i geeignet, bei RAID 5 ist ein Controller mit Cache vorzuziehen. Im Falle von HDDs bringt der Controller-Cache für wahlfreie Lastprofile mit signifikantem Schreibanteil bei allen RAID-Levels Performance-Vorteile. Seite 32 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 SAP SD Benchmark-Beschreibung Die SAP Anwendungssoftware besteht aus Modulen zum Management aller Standard-Geschäftsprozesse. Es gibt u.a. Module für ERP (Enterprise Resource Planning) wie Assemble-to-Order (ATO), Financial Accounting (FI), Human Resources (HR), Materials Management (MM), Production Planning (PP) und Sales and Distribution (SD), aber auch für SCM (Supply Chain Management), Retail, Banking, Utilities, BI (Business Intelligence), CRM (Customer Relation Management) oder PLM (Product Lifecycle Management). Die Applikationssoftware setzt immer auf einer Datenbank auf, so dass eine SAP-Konfiguration neben der Hardware aus den Software-Komponenten Betriebssystem, Datenbank und letztendlich der SAP-Software selbst besteht. Zur Verifikation der Performance, Stabilität und Skalierbarkeit eines SAP-Applikationssystems hat die SAP AG die SAP Standard Application Benchmarks entwickelt. Die Benchmarks (der wichtigste und am meisten verbreitete ist der SD Benchmark) analysieren die Performance des Gesamtsystems und liefern somit ein Maß für die Qualität der Integration der Einzelkomponenten. Bei dem Benchmark wird zwischen einer Two-Tier- und einer Three-Tier-Konfiguration unterschieden. Bei der Two-Tier-Konfiguration sind die SAP-Applikation und die Datenbank auf einem Server installiert. Bei einer Three-Tier-Konfiguration können die einzelnen Komponenten der SAP-Applikation über mehrere Server verteilt sein und ein weiterer Server übernimmt die Datenbank. Eine komplette Spezifikation des von der SAP AG, Walldorf – Deutschland entwickelten Benchmarks ist unter http://www.sap.com/benchmark zu finden. Benchmark-Umgebung Der Messaufbau wird symbolisch durch folgende Grafik veranschaulicht: 2-Tier-Umgebung Server Disk-Subsystem Netzwerk BenchmarkTreiber http://www.fujitsu.com/de/primergy System Under Test (SUT) Seite 33 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 System Under Test (SUT) Hardware Modell PRIMERGY RX2540 M1 Prozessor 2 × Xeon E5-2699 v3 Speicher 16 × 16GB (1x16GB) 2Rx4 DDR4-2133 R ECC Netzwerkinterface 1Gbit/s LAN Disk-Subsystem PRIMERGY RX2540 M1: 1 × SSD SATA 6G 400GB Main 3.5' H-P EP 1 × FC Ctrl 8Gb/s 2 Chan LPe12002 MMF LC 1 × FibreCAT CX4-480 Storage Unit Netzteil 1 × Modular PSU 800W platinum hp Software BIOS-Einstellungen DDR Performance = Performance Optimized Betriebssystem Microsoft Windows Server 2012 Datacenter Datenbank Microsoft SQL Server 2012 (64-bit) SAP Business Suite Software SAP enhancement package 5 for SAP ERP 6.0 Benchmark-Treiber Hardware Modell PRIMERGY RX300 S4 Prozessor 2 × Xeon X5460 Speicher 32 GB Netzwerkinterface 1Gbit/s LAN Software Betriebssystem SUSE Linux Enterprise Server 11 SP1 Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Benchmark-Ergebnisse Zertifikationsnummer 2014028 Number of SAP SD benchmark users 16,000 Average dialog response time 0.97 seconds Throughput Fully processed order line items/hour Dialog steps/hour SAPS 1,750,000 5,250,000 87,500 Average database request time (dialog/update) 0.014 sec / 0.026 sec CPU utilization of central server 98% Operating system, central server Windows Server 2012 Datacenter Edition RDBMS SQL Server 2012 SAP Business Suite software SAP enhancement package 5 for SAP ERP 6.0 Configuration Central Server Fujitsu PRIMERGY RX2540 M1 2 processors / 36 cores / 72 threads Intel Xeon E5-2699 v3, 2.3GHz, 64KB L1 cache and 256KB L2 cache per core, 45 MB L3 cache per processor 256 GB main memory Seite 34 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Die PRIMERGY RX2540 M1 erzielte das beste 2 Processor, Two-Tier SAP SD Standard Application Benchmark Ergebnis mit Windows (Stand: 10. September 2014). Die aktuellen SAP SD 2-Tier Ergebnisse sind zu finden unter http://www.sap.com/solutions/benchmark/sd2tier.epx. Two-Tier SAP SD results on Windows for 2 processor servers: PRIMERGY RX2540 M1 vs. next best 2-socket servers Fujitsu PRIMERGY RX2540 M1 2 x Xeon E5-2699 v3 2 processors/36 cores/72 threads Windows Server 2012 / SQL Server 2012 SAP enhancement package 5 for SAP ERP 6.0 Certification number: 2014028 16000 IBM System x3650 M5 2 x Xeon E5-2699 v3 2 processors/36 cores/72 threads Windows Server 2012 / DB2 10 SAP enhancement package 5 for SAP ERP 6.0 Certification number: 2014030 Cisco UCS B260 M4 2 x Xeon E7-4890 v2 2 processors/30 cores/60 threads Windows Server 2012 / SQL Server 2012 SAP enhancement package 5 for SAP ERP 6.0 Certification number 2014018 16000 12280 0 5000 10000 15000 Number of Benchmark Users Die folgende Grafik verdeutlicht den Durchsatz der PRIMERGY RX2540 M1 im Vergleich zu ihrem Vorgänger, der PRIMERGY RX300 S8, in jeweils performantester Ausstattung. Two-Tier SAP SD results: PRIMERGY RX2540 M1 vs. predecessor Fujitsu PRIMERGY RX2540 M1 2 x Xeon E5-2699 v3 2 processors/36 cores/72 threads 256 GB main memory Windows Server 2012 Datacenter Edition SQL Server 2012 SAP enhancement package 5 for SAP ERP 6.0 Certification number: 2014028 16000 Fujitsu PRIMERGY RX300 S8 2 x Xeon E5-2697 v2 2 processors/24 cores/48 threads 256 GB main memory Windows Server 2012 Standard Edition SQL Server 2012 SAP enhancement package 5 for SAP ERP 6.0 Certification number: 2013024 10240 0 5000 10000 15000 Number of Benchmark Users http://www.fujitsu.com/de/primergy Seite 35 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 OLTP-2 Benchmark-Beschreibung OLTP steht für Online Transaction Processing. Dem OLTP-2-Benchmark liegt das typische Anwendungsszenario einer Datenbanklösung zugrunde. Es werden bei OLTP-2 Zugriffe auf eine Datenbank simuliert und die Anzahl erreichter Transaktionen pro Sekunde (tps) als Maß für die Leistungsfähigkeit des vermessenen Systems ermittelt. Im Gegensatz zu Benchmarks, wie beispielsweise SPECint und TPC-E, die von unabhängigen Gremien standardisiert wurden und bei denen die Einhaltung des jeweiligen Reglements überwacht wird, ist OLTP-2 ein interner Benchmark von Fujitsu. OLTP-2 basiert auf dem bekannten Datenbank-Benchmark TPC-E. OLTP-2 wurde so gestaltet, dass eine Vielzahl von Konfigurationen messbar sind, um die Skalierung eines Systems hinsichtlich CPU- und Speicherausbau darstellen zu können. Auch wenn die beiden Benchmarks OLTP-2 und TPC-E ähnliche Anwendungsszenarien simulieren und die gleichen Lastprofile verwenden, so sind die Ergebnisse nicht vergleichbar oder gar gleichzusetzen, da die beiden Benchmarks unterschiedliche Methoden zur Simulation der Benutzerlast verwenden. Typischerweise sind OLTP-2-Werte TPC-E-Werten ähnlich. Ein direkter Vergleich oder gar die Bezeichnung des OLTP-2Ergebnisses als TPC-E-Ergebnis ist nicht zulässig, da insbesondere kein Preis-Leistungswert ermittelt wird. Weitere Informationen können dem Dokument Benchmark-Überblick OLTP-2 entnommen werden. Benchmark-Umgebung Der Messaufbau wird symbolisch durch folgende Grafik veranschaulicht: Driver Tier A Tier B Netzwerk Netzwerk Applikations-Server Clients DiskSubsystem Datenbank-Server System Under Test (SUT) Alle Ergebnisse wurden exemplarisch auf einer PRIMERGY RX2540 M1 ermittelt. Seite 36 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Datenbank-Server (Tier B) Hardware Modell PRIMERGY RX2540 M1 Prozessor Intel Xeon Processor E5-2600 v3 Product Family Speicher 1 Prozessor: 2 Prozessoren: Netzwerk-Interface 2 × onboard LAN 10 Gb/s Disk-Subsystem RX2540 M1: Onboard RAID Controller PRAID EP400i 2 × 300 GB 15k rpm SAS Drive, RAID1 (OS), 4 × 450 GB 15k rpm SAS Drive, RAID10 (LOG) 5 × LSI MegaRAID SAS 9286CV-8e oder 5 × PRAID EP420e (gleiche Performance bei OLTP-2) 5 × JX40: Je 13 × 400 GB SSD Drive, RAID5 (Daten) ® ® 8 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC 16 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC Software BIOS Version R1.0.0 Betriebssystem Microsoft Windows Server 2012 R2 Standard Datenbank Microsoft SQL Server 2014 Enterprise Applikations-Server (Tier A) Hardware Modell 1 × PRIMERGY RX200 S8 Prozessor 2 × Xeon E5-2667 v2 Speicher 64 GB, 1600 MHz registered ECC DDR3 Netzwerk-Interface 2 × onboard LAN 1 Gb/s 1 × Dual Port LAN 10 Gb/s Disk-Subsystem 2 × 250 GB 7.2k rpm SATA Drive Software Betriebssystem Microsoft Windows Server 2012 Standard Client (Lastgenerator) Hardware Modell 2 × PRIMERGY RX200 S7 Prozessor 2 × Xeon E5-2670 Speicher 32 GB, 1600 MHz registered ECC DDR3 Netzwerk-Interface 2 × onboard LAN 1 Gb/s 1 × Dual Port LAN 1Gb/s Disk-Subsystem 1 × 250 GB 7.2k rpm SATA Drive Software Betriebssystem Microsoft Windows Server 2008 R2 Standard Benchmark OLTP-2 Software EGen version 1.13.0 Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. http://www.fujitsu.com/de/primergy Seite 37 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Ergebnisse Die Datenbank-Performance ist in hohem Maße abhängig von den Ausbaumöglichkeiten mit CPU, Speicher und den Anschlussmöglichkeiten eines für die Datenbank angemessenen Disk-Subsystems. Bei den folgenden Skalierungsbetrachtungen der Prozessoren gehen wir davon aus, dass sowohl der Speicher als auch das Disk-Subsystem adäquat gewählt ist und keinen Engpass darstellt. Als Richtlinie für die Auswahl von Arbeitsspeicher gilt im Datenbankumfeld, dass eine ausreichende Menge wichtiger ist als die Geschwindigkeit der Speicherzugriffe. Daher wurde bei den Messungen mit zwei Prozessoren eine Bestückung mit insgesamt 512 GB Speicher und bei den Messungen mit einem Prozessor eine Bestückung mit insgesamt 256 GB Speicher betrachtet. Beide Speicherbestückungen haben einen Memory-Zugriff von 2133 MHz. Weitere Informationen über Speicherperformance sind in dem White Paper Speicher-Performance Xeon E5-2600 v3 (Haswell-EP) basierter Systeme zu finden. ® Die nachfolgende Grafik zeigt die OLTP-2 Transaktionsraten, die mit einem und zwei Prozessoren der Intel ® Xeon Processor E5-2600 v3 Product Family erreicht werden können. OLTP-2 tps E5-2699 v3 - 18C, HT 3768.70 2136.52 E5-2698 v3 - 16C, HT 3435.90 1915.90 E5-2697 v3 - 14C, HT 3235.78 1842.92 E5-2695 v3 - 14C, HT 2985.40 1689.76 E5-2683 v3 - 14C, HT 1606.03 E5-2690 v3 - 12C, HT 1586.30 E5-2680 v3 - 12C, HT 2889.68 2838.84 2765.09 1545.09 E5-2670 v3 - 12C, HT 2601.38 1454.37 E5-2650L v3 - 12C, HT 2188.13 1219.78 E5-2660 v3 - 10C, HT 2357.78 1310.06 E5-2650 v3 - 10C, HT 1240.39 E5-2667 v3 - 8C, HT 1224.02 E5-2640 v3 - 8C, HT 1068.08 E5-2630L v3 - 8C, HT 874.06 E5-2630 v3 - 8C, HT 1019.98 E5-2643 v3 - 6C, HT 979.99 E5-2620 v3 - 6C, HT 773.16 732.37 409.34 684.82 372.70 E5-2609 v3 - 6C E5-2603 v3 - 6C 2232.40 2244.71 1996.46 1623.49 1906.56 1823.73 1449.64 2CPUs 512GB RAM 1CPU 256GB RAM E5-2637 v3 - 4C, HT 667.62 E5-2623 v3 - 4C, HT 608.60 0 HT: Seite 38 (62) Hyper-Threading 500 1247.97 1128.35 1000 1500 2000 Fett: Kursiv: 2500 3000 3500 4000 tps gemessen berechnet http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Es wird deutlich, dass durch die Vielzahl an freigegebenen Prozessoren eine große Leistungsbandbreite abgedeckt wird. Vergleicht man den OLTP-2-Wert des leistungsschwächsten Prozessors Xeon E5-2603 v3 mit dem des leistungsstärksten Prozessors Xeon E5-2699 v3, so ergibt sich eine Leistungssteigerung um den Faktor 5.2. Die Eigenschaften der Prozessoren sind im Kapitel „Technische Daten“ zusammengestellt. Die relativ großen Performance-Unterschiede zwischen den Prozessoren sind durch ihre Eigenschaften zu erklären. Die Werte skalieren aufgrund der Anzahl der Cores, der Größe des L3-Caches und der CPUTaktfrequenz sowie durch die bei den meisten Prozessortypen vorhandenen Features Hyper-Threading und Tubo-Modus. Darüber hinaus bestimmt auch die Datenübertragungsrate zwischen den Prozessoren („QPI Speed“) die Performance. Eine geringe Leistung zeigen die Xeon E5-2603 v3 und E5-2609 v3 Prozessoren, da sie ohne HyperThreading (HT) und Turbo-Mode (TM) auskommen müssen. Innerhalb einer Gruppe von Prozessoren mit gleicher Core-Anzahl sieht man eine Skalierung über die CPUTaktfrequenz. Vergleicht man die maximal erreichbaren OLTP-2 Werte der aktuellen Systemgeneration mit den Werten, die auf den Vorgängersystemen erreicht wurden, so ergibt sich eine Steigerung von ca. 52%. Maximum OLTP-2 tps Vergleich der Systemgenerationen tps 4500 + ~52% 4000 3500 3000 2500 2000 1500 2 × E5-2697 v2 512 GB 2 × E5-2699 v3 512 GB 1000 SQL 2012 SQL 2014 500 0 Vorgängersystem Aktuelles System Vorgängersystem Aktuelles System TX2560 M1 RX2530 M1 RX2540 M1 RX2560 M1 TX300 S8 http://www.fujitsu.com/de/primergy RX200 S8 RX300 S8 RX350 S8 Seite 39 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 TPC-E Benchmark-Beschreibung Der TPC-E-Benchmark misst die Performance online transaktionsverarbeitender Systeme (Online Transaction Processing oder kurz OLTP genannt). Er basiert auf einer komplexen Datenbank und einer Reihe unterschiedlicher Transaktionstypen, die auf ihr ausgeführt werden. TPC-E ist ein sowohl Hardwareals auch Software-unabhängiger Benchmark und kann damit auf jeder Testplattform – sei es eine proprietäre oder offene – implementiert werden. Neben den Messergebnissen müssen auch sämtliche Details der vermessenen Systeme und des Messvorgangs in einem Messreport (Full Disclosure Report oder kurz FDR) erläutert werden. Dadurch wird überprüfbar, ob eine Messung allen Benchmark-Anforderungen entspricht und nachvollziehbar ist. Durch TPC-E wird nicht ein einzelner Server, sondern eine recht umfangreiche Systemkonfiguration vermessen. Performance-bestimmend ist hierbei die Systemleistung des Datenbankservers mit Disk-I/O und Netzwerk-Kommunikation. Die Performance-Metrik ist tpsE. tps steht dabei für transactions per second. tpsE ist die mittlere Anzahl an Trade-Result-Transaktionen, die innerhalb einer Sekunde ausgeführt wurden. Gemäß dem TPC-E-Standard besteht eine korrekte Angabe aus der tpsE-Rate, dem zugehörigen Preis/Leistungs-Wert und dem Weitere Informationen über TPC-E können dem Übersichtsdokument Benchmark Overview TPC-E entnommen werden. Benchmark-Ergebnisse Im Oktober 2014 veröffentlichte Fujitsu ein TPC-E Benchmark-Ergebnis für PRIMERGY RX2540 M1 mit dem 18-Core Prozessor Intel Xeon E5-2699 v3 und 512 GB Speicher. Die Resultate zeigen eine enorme Leistungssteigerung gegenüber der PRIMERGY RX300 S8 bei gleichzeitiger Reduzierung der Kosten. Seite 40 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 TPC-E 1.13.0 TPC Pricing 1.7.0 FUJITSU Server PRIMERGY RX2540 M1 TPC-E Throughput 3,772.08 tpsE Price/Performance $ 130.44 USD per tpsE Report Date October 6, 2014 Availability Date December 1, 2014 Total System Cost $ 492,023 USD Database Server Configuration Operating System Microsoft Windows Server 2012 R2 Standard Edition Database Manager Microsoft SQL Server 2014 Enterprise Edition SUT Processors/Cores/Threads 2/36/72 Memory 512 GB Tier A PRIMERGY RX200 S8 2x Intel Xeon E5-2667 v2 3.30 GHz 64 GB Memory 2x 250 GB 7.2k rpm SATA Drive 2x onboard LAN 1 Gb/s 1x Dual Port LAN 10 Gb/s Tier B PRIMERGY RX2540 M1 2x Intel Xeon E5-2699 v3 2.30 GHz 512 GB Memory 2x 300 GB 15k rpm SAS Drives 4x 450 GB 15k rpm SAS Drives 2x onboard LAN 10 Gb/s 6x SAS RAID Controller Storage 1x PRIMECENTER Rack 5x ETERNUS JX40 65x 400 GB SSD Drives Initial Database Size 15,604 GB Redundancy Level 1 RAID-5 data and RAID-10 log Storage 65 x 400 GB SSD 4 x 450 GB 15k rpm HDD Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Weitere Informationen zu diesem TPC-E Ergebnis, speziell auch den Full Disclosure Report, findet man auf der TPC-Webseite http://www.tpc.org/tpce/results/tpce_result_detail.asp?id=114100601. http://www.fujitsu.com/de/primergy Seite 41 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Im Oktober 2014 ist Fujitsu in der TPC-E Liste mit fünf Veröffentlichungen (ohne die historischen Ergebnisse) vertreten: Durchsatz Preis / Performance Watts/ tpsE PRIMERGY RX300 S7 mit 2 × Xeon E5-2690 1871.81 tpsE $175.57 pro tpsE 0.69 17. August 2012 PRIMERGY RX500 S7 mit 4 × Xeon E5-4650 2651.27 tpsE $161.95 pro tpsE 0.68 1. November 2012 PRIMERGY RX300 S8 mit 2 × Xeon E5-2697 v2 2472.58 tpsE $135.14 pro tpsE - 10. September 2013 PRIMEQUEST 2800E mit 2 × Xeon E7-8890 v2 8582.52 tpsE $205.43 pro tpsE - 1. Mai 2014 PRIMERGY RX2540 M1 mit 2 × Xeon E5-2699 v3 3772.08 tpsE $130.44 pro tpsE - 1. Dezember 2014 System und Prozessoren Verfügbarkeitsdatum Weitere Informationen sowie alle TPC-E Ergebnisse (inklusive der historischen Ergebnisse) können der TPC-Webseite (http://www.tpc.org/tpce) entnommen werden. Die folgende Grafik für 2-Sockel PRIMERGY Systeme mit den unterschiedlichen Prozessortypen zeigt die gute Leistung des 2-Sockel-Systems PRIMERGY RX2540 M1. tpsE $/tpsE 4500 tpsE $ per tpsE 4000 3,772.08 500 3500 400 3000 2,472.58 2500 2000 1500 300 1,871.81 200 $175.57 $130.44 $135.14 100 500 0 better better 1000 0 PRIMERGY RX300 S7 2 × E5-2690 512 GB PRIMERGY RX300 S8 2 × E5-2697 v2 512 GB PRIMERGY RX2540 M1 2 × E5-2699 v3 512 GB Durchsatz Preis / Performance Watts/ tpsE PRIMERGY RX300 S7 mit 2 × Xeon E5-2690 1871.81 tpsE $175.57 pro tpsE 0.69 PRIMERGY RX300 S8 mit 2 × Xeon E5-2697 v2 2472.58 tpsE $135.14 pro tpsE - 10. September 2013 PRIMERGY RX2540 M1 mit 2 × Xeon E5-2699 v3 3772.08 tpsE $130.44 pro tpsE - 1. Dezember 2014 System und Prozessoren Verfügbarkeitsdatum 17. August 2012 Gegenüber der PRIMERGY RX300 S8 beträgt der Leistungsgewinn +53% und gegenüber der PRIMERGY RX300 S7 +102%. Der Preis pro Performance ist $130.44/tpsE. Die Kosten reduzieren sich gegenüber der PRIMERGY RX300 S8 auf 97% und gegenüber der PRIMERGY RX300 S7 auf 74%. Seite 42 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Die folgende Übersicht, sortiert nach Preis/Performance, zeigt die besten TPC-E Preis/Performance-Werte (Stand 6. Oktober 2014, ohne die historischen Ergebnisse) und die zugehörigen TPC-E Durchsätze. Dabei erreicht die PRIMERGY RX2540 M1 mit einem Preis/Performance-Wert von $130.44/tpsE das beste Preis-Leistungsverhältnis. System Fujitsu PRIMERGY RX2540 M1 Fujitsu PRIMERGY RX300 S8 IBM System x3650 M4 Fujitsu PRIMERGY RX500 S7 HP ProLiant DL380p Gen8 Fujitsu PRIMERGY RX300 S7 HP ProLiant DL385p Gen8 IBM System x3850 X6 Fujitsu PRIMEQUEST 2800E IBM System x3650 M4 Prozessortyp Prozessoren/ Cores/Threads 2 × Intel Xeon E5-2699 v3 2 × Intel Xeon E5-2697 v2 2 × Intel Xeon E5-2697 v2 4 × Intel Xeon E5-4650 2 × Intel Xeon E5-2690 2 × Intel Xeon E5-2690 2 × AMD Opteron 6386SE 4 × Intel Xeon E7-4890 v2 8 × Intel Xeon E7-8890 v2 2 × Intel Xeon E5-2690 tpsE (höher ist besser) $/tpsE (niedriger ist besser) Verfügbarkeitsdatum 3,772.08 130.44 2014-12-01 2,472.58 135.14 2013-09-10 2,590.93 150.00 2013-11-29 2,651.27 161.95 2012-11-21 1,881.76 173.00 2012-12-21 1,871.71 175.57 2012-08-17 1,416.37 183.00 2013-05-15 5,576.27 188.69 2014-04-15 8,582.52 205.43 2014-05-01 1,863.23 207.85 2012-05-31 Weitere Informationen sowie alle TPC-E Ergebnisse (inklusive der historischen Ergebnisse) können der TPC-Webseite (http://www.tpc.org/tpce) entnommen werden. http://www.fujitsu.com/de/primergy Seite 43 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 vServCon Benchmark-Beschreibung vServCon ist ein bei Fujitsu verwendeter Benchmark zum Vergleich von Serverkonfigurationen mit Hypervisor in Bezug auf ihre Eignung für Server-Konsolidierung. Hiermit ist sowohl der Vergleich von Systemen, Prozessoren und I/O-Technologien möglich, wie auch der Vergleich von Hypervisor-en, Virtualisierungsformen und zusätzlichen Treibern für virtuelle Maschinen. Bei vServCon handelt es sich nicht um einen neuen Benchmark im eigentlichen Sinn. Es ist vielmehr ein Framework, das bereits etablierte Benchmarks, ggf. auch in modifizierter Form, als Workloads zusammenfasst, um die Last einer konsolidierten und virtualisierten Serverumgebung nachzubilden. Es kommen drei bewährte Benchmarks zum Einsatz, die die Anwendungsszenarien Datenbank, Applikationsserver und Web-Server abdecken. Anwendungsszenario Benchmark Anzahl logischer CPU-Cores Memory Database Sysbench (angepasst) 2 Java-Applikationsserver SPECjbb (angepasst, mit 50% - 60% Last) 2 2 GB Webserver WebBench 1 1.5 GB 1.5 GB Jedes der drei Anwendungsszenarien wird jeweils einer dedizierten virtuellen Maschine (VM) zugeordnet. Hinzu kommt eine vierte, so genannte Idle-VM. Diese vier VMs bilden eine „Tile“ (engl. Kachel). Durch die Leistungsfähigkeit der zugrunde liegenden Server-Hardware ist es meist notwendig, dass im Rahmen einer Messung mehrere identische Tiles parallel gestartet werden müssen um eine maximale GesamtPerformance zu erreichen. System under Test Database VM Java VM Web VM … Database Java VM VM Database Java VM VM Database Java VM VM Web VM Web VM Web VM Idle VM Tile n … Idle VM Idle VM Idle VM Tile 3 Tile 2 Tile 1 Jedes der drei vServCon-Anwendungsszenarien ergibt für die jeweilige VM ein spezifisches Ergebnis in Form von applikationsspezifischen Transaktionsraten. Um hieraus eine normalisierte Bewertungszahl zu bilden, werden die einzelnen Ergebnisse für eine Tile in Relation zu den jeweiligen Ergebnissen eines Referenzsystems gesetzt. Die daraus resultierenden relativen Performance-Werte werden geeignet gewichtet und über alle VMs und Tiles aufsummiert. Das Ergebnis ist eine Bewertungszahl, „Score“ genannt, für diese Tile-Anzahl. Diese Prozedur wird – in der Regel beginnend mit eins – für steigende Tile-Anzahlen durchgeführt, bis keine signifikante Steigerung dieses vServCon-Scores mehr eintritt. Der finale vServCon-Score ist dann das Maximum über die vServCon-Scores aller Tile-Anzahlen. Diese Bewertungszahl spiegelt somit den maximalen Gesamtdurchsatz wider, den man durch den Betrieb des in vServCon definierten Mixes aus vielen Anwendungs-VMs bis zur möglichst vollständigen Ausnutzung der CPU-Ressourcen erzielen kann. Dabei ist die Messumgebung für vServCon so ausgelegt, dass nur die CPU der begrenzende Faktor ist und keine Limitierungen durch andere Ressourcen eintreten. Der Verlauf der vServCon-Scores über die Tile-Anzahlen liefert nützliche Informationen über das Skalierungsverhalten des „System under Test“. Eine ausführliche Beschreibung von vServCon ist zu finden im Übersichtsdokument: Benchmark-Überblick vServCon. Seite 44 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Umgebung Der Messaufbau wird symbolisch durch folgende Grafik veranschaulicht: FrameworkController Server Disk-Subsystem Mehrere 1Gb oder 10Gb Netzwerke System Under Test (SUT) Lastgeneratoren Alle Ergebnisse wurden exemplarisch auf einer PRIMERGY RX2540 M1 ermittelt. System Under Test (SUT) Hardware ® ® Prozessor Intel Xeon Processor E5-2600 v3 Product Family Speicher 1 Prozessor: 2 Prozessoren: Netzwerk-Interface 1 × dual port 1GbE Adapter 1 × dual port 10GbE Server Adapter Disk-Subsystem 1 × dual-channel FC-Controller Emulex LPe12002 ETERNUS DX80 Storage-Systeme: Je Tile: 50 GB LUN Je LUN: RAID 0 mit 2 × Seagate ST3300657SS-Disks (15 krpm) 8 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC 16 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC Software Betriebssystem VMware ESXi 5.5.0 U2 Build 2068190 Lastgenerator (inkl. Framework-Controller) Hardware (Shared) Gehäuse PRIMERGY BX900 Hardware Modell 18 × PRIMERGY BX920 S1 Server-Blades (PRIMERGY BX900 Chassis) Prozessor 2 × Xeon X5570 Speicher 12 GB Netzwerk-Interface 3 × 1 Gbit/s LAN Software Betriebssystem Microsoft Windows Server 2008 R2 Enterprise mit Hyper-V http://www.fujitsu.com/de/primergy Seite 45 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Lastgenerator-VM (pro Tile 3 Lastgenerator-VMs auf verschiedenen Server-Blades) Hardware Prozessor 1 × logische CPU Speicher 512 MB Netzwerk-Interface 2 × 1 Gbit/s LAN Software Betriebssystem Microsoft Windows Server 2003 R2 Enterprise Edition Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Benchmark-Ergebnisse Die hier behandelten PRIMERGY Zwei-Sockel-Rack- und Tower-Systeme basieren auf Prozessoren der ® ® Intel Xeon Processor E5-2600 v3 Product Family. Die Eigenschaften der Prozessoren sind im Kapitel „Technische Daten“ zusammengestellt. Die verfügbaren Prozessoren dieser Systeme mit ihren Ergebnissen zeigt folgende Tabelle. Score #Tiles 4 Cores Hyper-Threading, Turbo-Modus E5-2623 v3 E5-2637 v3 7.71 8.65 4 4 6 Cores E5-2603 v3 E5-2609 v3 5.13 5.83 5 5 6 Cores Hyper-Threading, Turbo-Modus E5-2620 v3 E5-2643 v3 10.1 13.1 6 6 8 Cores Hyper-Threading, Turbo-Modus E5-2630L v3 E5-2630 v3 E5-2640 v3 E5-2667 v3 11.4 13.6 14.1 15.9 8 8 8 8 10 Cores Hyper-Threading, Turbo-Modus E5-2650 v3 E5-2660 v3 16.6 17.8 10 10 12 Cores Hyper-Threading, Turbo-Modus E5-2650L v3 E5-2670 v3 E5-2680 v3 E5-2690 v3 16.2 20.0 21.4 22.4 11 12 12 13 14 Cores Hyper-Threading, Turbo-Modus E5-2683 v3 E5-2695 v3 E5-2697 v3 21.6 23.5 25.5 14 14 15 16 Cores Hyper-Threading, Turbo-Modus E5-2698 v3 27.3 16 18 Cores Hyper-Threading, Turbo-Modus E5-2699 v3 30.3 18 ® ® Intel Xeon Processor E5 v3 Product Family Prozessor Diese PRIMERGY Zwei-Sockel-Rack- und Tower-Systeme sind durch weitere Fortschritte in der Prozessortechnologie gut für die Virtualisierung von Anwendungen geeignet. Verglichen mit einem System basierend auf der vorherigen Prozessorgeneration ist eine etwa 76% höhere Virtualisierungs-Performance (gemessen in vServCon-Score in der jeweils größten Konfiguration) erreichbar. Seite 46 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Die erste Grafik vergleicht die mit den hier betrachteten Prozessortypen erreichbaren Werte der Virtualisierungs-Performance. ® ® #Tiles 5 5 6 6 8 8 8 8 10 10 11 12 12 13 14 14 15 E5-2637 v3 - 4 Cores E5-2603 v3 - 6 Cores E5-2609 v3 - 6 Cores E5-2620 v3 - 6 Cores E5-2643 v3 - 6 Cores E5-2630L v3 - 8 Cores E5-2630 v3 - 8 Cores E5-2640 v3 - 8 Cores E5-2667 v3 - 8 Cores E5-2650 v3 - 10 Cores E5-2660 v3 - 10 Cores E5-2650L v3 - 12 Cores E5-2670 v3 - 12 Cores E5-2680 v3 - 12 Cores E5-2690 v3 - 12 Cores E5-2683 v3 - 14 Cores E5-2695 v3 - 14 Cores E5-2697 v3 - 14 Cores 16 18 E5-2699 v3 - 18 Cores 4 E5-2698 v3 - 16 Cores 4 E5-2623 v3 - 4 Cores Intel Xeon Processor E5-2600 v3 Product Family 30 Final vServCon Score 25 20 15 10 5 0 Die relativ großen Performance-Unterschiede zwischen den Prozessoren sind durch ihre Eigenschaften zu erklären. Die Werte skalieren aufgrund der Anzahl der Cores, der Größe des L3-Caches und der CPUTaktfrequenz sowie durch die bei den meisten Prozessortypen vorhandenen Features Hyper-Threading und Turbo-Modus. Darüber hinaus bestimmt auch die Datenübertragungsrate zwischen den Prozessoren („QPI Speed“) die Performance. Eine geringe Leistung zeigen die Xeon E5-2603 v3 und E5-2609 v3 Prozessoren, da sie ohne HyperThreading (HT) und Turbo-Modus (TM) auskommen müssen. Grundsätzlich sind diese schwächsten Prozessoren für das Virtualisierungsumfeld nur bedingt geeignet. Innerhalb einer Gruppe von Prozessoren mit gleicher Core-Anzahl sieht man eine Skalierung über die CPUTaktfrequenz. Grundsätzlich hat auch die Speicherzugriffsgeschwindigkeit Auswirkungen auf die Leistung. Als Richtschnur für die Auswahl von Arbeitsspeicher gilt im Virtualisierungsumfeld, dass eine ausreichende Menge wichtiger ist als die Geschwindigkeit der Speicherzugriffe. Die hier vorgestellten vServCon-Skalierungsmessungen wurden alle mit einer Speicherzugriffsgeschwindigkeit – abhängig vom Prozessortyp – von maximal 2133 MHz durchgeführt. Näheres zur Thematik „Speicher-Performance“ und zur QPI-Architektur ist zu finden im White Paper Speicher-Performance Xeon E5-2600 v3 (Haswell-EP) basierter Systeme. http://www.fujitsu.com/de/primergy Seite 47 (62) White Paper Performance Report PRIMERGY RX2540 M1 Bisher wurde die Virtualisierungs-Performance eines voll ausgebauten Systems betrachtet. Bei einem Server mit zwei Sockeln stellt sich jedoch auch die Frage, wie gut die Performance von einem auf zwei Prozessoren skaliert. Je besser die Skalierung, desto geringer ist der Overhead, der durch die gemeinsame Nutzung der Ressourcen innerhalb eines Servers üblicherweise entsteht. Der Skalierungsfaktor hängt auch von der Anwendung ab. Dient der Server als Virtualisierungsplattform für die ServerKonsolidierung, skaliert das System mit dem Faktor 1.97. Beim Betrieb mit zwei Prozessoren erreicht das System also eine deutlich höhere Leistung wie mit einem Prozessor, wie die nebenstehende Grafik am Beispiel der Prozessorvariante Xeon E5-2699 v3 verdeutlicht. × 1.97 25 20 30.3@18 tiles 15 15.4@9 tiles Final vServCon Score 35 30 1 x E5-2699 v3 2 x E5-2699 v3 10 5 Version: 1.4 2015-07-02 0 2.65 5.47 8.20 10.7 13.3 14.8 17.2 18.9 19.8 21.0 22.0 22.7 23.4 23.5 0 2.89 5.70 8.36 10.3 11.6 12.8 13.8 14.1 vServCon Score Die nächste Grafik veranschaulicht die Virtualisierungs-Performance für wachsende VM-Anzahlen am Beispiel der Prozessoren Xeon E5-2640 v3 (8-Core) und E5-2695 v3 (14-Core). Neben der erhöhten Anzahl E5-2640 v3 E5-2695 v3 physikalischer Cores ist das Hyper-Threading, das fast 25 ® alle Prozessoren der Intel ® Xeon Processor E5-2600 v3 Product Family unterstützen, 20 ein weiterer Grund für die hohe Anzahl betreibbarer VMs. Hierdurch wird bekanntermaßen ein 15 physikalischer Prozessorkern in zwei logische Cores unterteilt und damit die für 10 den Hypervisor verfügbare Anzahl Cores verdoppelt. Dieses standardmäßig 5 eingestellte Feature steigert daher im Allgemeinen die Virtualisierungs-Performance eines Systems. 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9 10 11 12 13 14 #Tiles Das vorige Bild hat den Aspekt der summierten Performance über alle Anwendungs-VMs eines Hosts betrachtet. Genauso interessant ist aber auch die Performance aus Sicht einer einzelnen Anwendungs-VM. Diese Information lässt sich ebenfalls aus dem vorigen Bild entnehmen. Im oben dargestellten Fall des Xeon E5-2640 v3 beispielsweise wird bei 24 Anwendungs-VMs (acht Tiles, die Idle-VMs nicht mitgezählt) das Gesamtoptimum erreicht; der Niedriglastfall wird durch drei Anwendungs-VMs (eine Tile, die Idle-VM nicht mitgezählt) repräsentiert. Man rufe sich in Erinnerung: der vServCon-Score für eine Tile ist ein Durchschnittswert über die drei Anwendungsszenarien in vServCon. Diese durchschnittliche Performance einer einzelnen Tile sinkt beim Übergang vom Niedriglastfall zum Gesamtoptimum des vServCon-Scores von 2.89 auf 14.1/8=1.76, also auf 61%. Dabei können die einzelnen Typen von Anwendungs-VMs im Hochlastfall durchaus unterschiedlich reagieren. Hierdurch wird deutlich, dass man bezüglich der VMAnzahlen auf einem Virtualisierungs-Host im konkreten Fall die Performance-Anforderungen einer einzelnen Anwendung gegen die Gesamtanforderungen abwägen muss. Seite 48 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Die virtualisierungsrelevanten Fortschritte in der Prozessortechnologie seit dem Jahre 2008 wirken zum einen auf eine einzelne VM und zum anderen auf die maximal mögliche Anzahl von VMs bis zur CPUSättigung. Die folgende Gegenüberstellung arbeitet die Anteile der beiden Arten von Verbesserungen heraus. Verglichen werden sechs 2008 2009 2011 2012 2013 2014/2015 Systeme mit ähnlicher GehäuseRX200 S4 RX200 S5 RX200 S6 RX200 S7 RX200 S8 RX2530 M1 form: ein System von 2008, ein RX300 S4 RX300 S5 RX300 S6 RX300 S7 RX300 S8 RX2540 M1 System von 2009, ein System TX300 S6 RX350 S7 RX350 S8 RX2560 M1 von 2011, ein System von 2012, TX300 S4 TX300 S5 TX300 S6 TX300 S7 TX300 S8 TX2560 M1 ein System von 2013 und ein aktuelles System mit den jeweils besten Prozessoren (siehe untenstehende Tabelle) für wenige VMs und für höchste Gesamt-Performance. 2008 2009 2011 2012 2013 2014 Beste vServCon Beste vServCon Performance Score GesamtScore wenige VMs 1 Tile Performance max. X5460 1.91 X5460 2.94@2 tiles X5570 2.45 X5570 6.08@ 6 tiles X5690 2.63 X5690 9.61@ 9 tiles E5-2643 2.73 E5-2690 13.5@ 8 tiles E5-2667 v2 2.85 E5-2697 v2 17.1@11 tiles E5-2643 v3 3.22 E5-2699 v3 30.3@18tiles Die deutlichsten Performance-Fortschritte gab es von 2008 nach 2009 mit der Einführung der 1 Prozessorgeneration Xeon 5500 (z. B. durch das Feature „Extended Page Tables“, kurz EPT ). Hier zeigte sich bei wenigen VMs (eine Tile) eine Steigerung des vServCon-Scores um den Faktor 1.28. Virtualisierungsrelevante Fortschritte 10 Wenige VMs (1 Tile) 9 8 vServCon Score 7 6 5 × 1.13 × 1.04 × 1.04 4 × 1.07 × 1.28 3 2 1 1.91 2.45 2.63 2.73 2.85 3.22 2009 X5570 2.93 GHz 4C 2011 X5690 2.93 GHz 6C 2012 E5-2643 3.3 GHz 4C 2013 E5-2667 v2 3.3 GHz 8C 2014 E5-2643 v3 3.4 GHz 6C 0 2008 X5460 3.17 GHz 4C Year Y CPU Freq. #Cores Bei Vollauslastung der Systeme mit VMs ergab sich eine Steigerung um den Faktor 2.07. Die eine Ursache hierfür war die für eine einzelne VM realisierbare Performance-Steigerung (siehe Score für wenige VMs). Die andere Ursache lag darin, dass beim Gesamtoptimum mehr VMs möglich waren (durch Hyper-Threading). 1 EPT beschleunigt die Virtualisierung von Memory durch eine Hardware-Unterstützung für die Umsetzung zwischen Host- und Gast-Memory-Adressen. http://www.fujitsu.com/de/primergy Seite 49 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Es ist allerdings auch zu erkennen, dass das Optimum bei der dreifachen Anzahl von VMs erkauft wurde mit einer verringerten Leistung der einzelnen VM. Virtualisierungsrelevante Fortschritte 35 Score bei optimaler Tile-Anzahl × 1.77 30 25 vServCon Score × 1.27 20 × 1.40 15 30.3 × 1.58 × 2.07 10 17.1 13.5 5 0 9.61 2.94 2008 X5460 3.17 GHz 4C 6.08 2009 X5570 2.93 GHz 4C 2011 X5690 2.93 GHz 6C 2012 E5-2690 2.9 GHz 8C 2013 E5-2697 v2 2.7 GHz 12C 2014 E5-2699 v3 2.3 GHz 18C Year Y CPU Freq. #Cores Worin liegen jetzt die Technologiefortschritte von 2009 nach 2014? Die Performance für eine einzelne VM in Niedriglastsituationen hat sich für die hier verglichenen Prozessoren mit maximaler Taktfrequenz pro Core nur leicht verbessert. Es sei daher ausdrücklich davor gewarnt, die durch den Score bei optimaler Tile-Anzahl ausgedrückte gesteigerte VirtualisierungsPerformance komplett als Verbesserung für eine einzelne VM zu erhoffen. Die entscheidenden Fortschritte liegen in der höheren Anzahl physikalischer Cores und – damit verbunden – in den gesteigerten Werten der Gesamt-Performance (Faktor 1.58, 1.40, 1.27 und 1.77 in der Grafik). Bis einschließlich 2011 hatte der beste Prozessortyp einer Prozessorgeneration sowohl die höchste Taktfrequenz als auch die höchste Core-Anzahl. Ab 2012 gibt es unterschiedlich optimierte Prozessoren im Angebot: Varianten mit hoher Taktfrequenz pro Core bei weniger Cores und Varianten mit hoher CoreAnzahl aber niedrigerer Taktfrequenz pro Core. Die Eigenschaften der Prozessoren sind im Kapitel „Technische Daten“ zusammengestellt. Performance-Steigerungen im Virtualisierungsumfeld werden seit 2009 also hauptsächlich durch Steigerungen der VM-Anzahl aufgrund von mehr verfügbaren logischen oder physikalischen Cores erreicht. Seit 2012 kann aber je nach Anwendungsszenario im Virtualisierungsumfeld auch eine CPU mit optimierter Taktfrequenz ausgewählt werden, wenn wenige oder einzelne VMs eine maximale Rechenleistung benötigen. Seite 50 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 VMmark V2 Benchmark-Beschreibung VMmark V2 ist ein von VMware entwickelter Benchmark zum Vergleich von Serverkonfigurationen mit Hypervisor-Lösungen von VMware in Bezug auf ihre Eignung für Server-Konsolidierung. Neben der Software zur Lastgenerierung besteht der Benchmark aus einem definierten Lastprofil und aus einem verbindlichen Regelwerk. Die Benchmark-Ergebnisse können bei VMware eingereicht werden und werden nach einem erfolgreich durchlaufenen Review-Prozess auf deren Internet-Seite veröffentlicht. Nachdem der bewährte Benchmark „VMmark V1“ im Oktober 2010 eingestellt wurde, gibt es den Nachfolger „VMmark V2“, der ein Cluster aus mindestens zwei Servern voraussetzt und Datacenter-Funktionen wie Cloning und Deployment von virtuellen Maschinen (VMs), Load Balancing sowie die Verschiebung von VMs durch vMotion und auch Storage vMotion mit abdeckt. Neben dem „Performance Only“ Ergebnis kann ab Version 2.5 von VMmark auch wahlweise die elektrische Leistungsaufnahme mit gemessen werden und als „Performance with Server Power“ (Leistungsaufnahme nur der Server-Systeme) und/oder „Performance with Server and Storage Power“ Resultat (Leistungsaufnahme der Server-Systeme und aller Storage-Komponenten) veröffentlicht werden. Bei VMmark V2 handelt es sich nicht um einen neuen Anwendungsszenario Last-Tool # VMs Benchmark im eigentlichen Sinn. Es ist vielmehr ein LoadGen 1 Framework, das bereits etablierte Benchmarks als Mail-Server Web 2.0 Olio client 2 Workloads zusammenfasst, um die Last einer konsolidierten und virtualisierten Serverumgebung E-Commerce DVD Store 2 client 4 nachzubilden. Drei bewährte Benchmarks, die die Standby-Server (IdleVMTest) 1 Anwendungsszenarien Mail-Server, Web 2.0 und E-Commerce abdecken, wurden in VMmark V2 integriert. Die drei Anwendungsszenarien werden jeweils insgesamt sieben dedizierten VMs zugeordnet. Hinzu kommt eine achte VM, der so genannte Standby-Server. Diese acht VMs bilden eine „Tile“ (englisch für „Kachel“). Durch die Leistungsfähigkeit der zugrunde liegenden Server-Hardware ist es meist notwendig, dass im Rahmen einer Messung mehrere identische Tiles parallel gestartet werden müssen um eine maximale Gesamt-Performance zu erreichen. Neu bei VMmark V2 ist eine Infrastruktur-Komponente, die einmal je zwei Hosts vorhanden ist. Diese misst Fähigkeiten der Datacenter-Konsolidierung durch VM Cloning und Deployment, vMotion und Storage vMotion. Zusätzlich wird die Load Balancing Fähigkeit des Datacenters eingesetzt (DRS, Distributed Resource Scheduler). Das Ergebnis von VMmark V2 im Testtyp „Performance Only“ ist eine Zahl, „Score“ genannt, die Aufschluss über die Leistungsfähigkeit der vermessenen Virtualisierungslösung gibt. Der Score spiegelt für eine ServerKonfiguration mit Hypervisor den maximalen summarischen Konsolidierungs-Nutzen über alle Hosts und VMs wider und dient als Vergleichskriterium von verschiedenen Hardwareplattformen. Dieser Score wird aus den Einzelergebnissen der VMs und einem Infrastruktur-Ergebnis ermittelt. Jede der fünf VMmark V2 Anwendungs- bzw. Front End-VMs ergibt für jede VM ein spezifisches Ergebnis in Form von anwendungsspezifischen Transaktionsraten. Um hieraus eine normalisierte Bewertungszahl zu bilden, werden die einzelnen Ergebnisse für eine Tile in Relation zu den jeweiligen Ergebnissen eines Referenzsystems gesetzt. Die daraus resultierenden dimensionslosen Performance-Werte werden dann für diese Tile geometrisch gemittelt und als letztes über alle Tiles aufsummiert. Dieser Wert geht mit einer Gewichtung von 80% in den Gesamt-Score ein. Der Infrastruktur-Workload ist im Benchmark nur einmal pro zwei Hosts vorhanden; er bestimmt das Resultat zu 20%. Für die Infrastruktur-Workload-Komponenten werden jeweils die Anzahl der Transaktionen pro Stunde und die durchschnittliche Dauer in Sekunden für den Score ermittelt. Neben dem eigentlichen Score wird bei jedem VMmark V2 Ergebnis die Anzahl Tiles mit angegeben. Das ausgewiesene Resultat hat dann die Form „Score@Number of Tiles“, beispielsweise „4.20@5 Tiles“. Bei den zwei Testtypen „Performance with Server Power“ und „Performance with Server and Storage Power“ wird ein sogenannter „Server PPKW Score“ bzw. „Server and Storage PPKW Score“ ermittelt, dies ist der Performance Score dividiert durch die durchschnittliche Leistungsaufnahme in Kilowatt (PPKW = Performance per Kilowatt (KW)). Die Ergebnisse der drei Testtypen dürfen untereinander nicht verglichen werden. Eine ausführliche Beschreibung von VMmark V2 ist im Übersichtsdokument Benchmark Overview VMmark V2 zu finden. http://www.fujitsu.com/de/primergy Seite 51 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Umgebung Der Messaufbau wird symbolisch durch folgende Grafik veranschaulicht: Clients & Management Server(s) Storage-System Mehrere 1Gb oder 10Gb Netzwerke Lastgeneratoren inkl. Prime-Client und Datacenter Management Server vMotion Netzwerk System under Test (SUT) „Performance Only“ Messergebnis: System Under Test (SUT) Hardware Anzahl Server 2 Modell PRIMERGY RX2540 M1 Prozessor 2 × Xeon E5-2699 v3 Speicher 512 GB: 16 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC Netzwerk-Interface 1 × Emulex OneConnect OCe14000 Dual Port Adapter mit PLAN EM 2x1Gb T interface card 1 × Fujitsu Eth Ctrl 2x10Gbit PCIe x8 D2755 SFP+ Disk-Subsystem 1 × Dual port PFC EP LPe16002 2 × PRIMERGY RX300 S8 konfiguriert als Fibre Channel Target: 7/6 × SAS-SSD (400 GB) ® 2 × Fusion-io ioDrive 2 PCIe-SSD (1.2 TB) RAID 0 mit mehreren LUNs Gesamt: 8440 GB Software BIOS Version V5.0.0.9 R1.1.0 BIOS-Einstellungen Siehe Details Betriebssystem VMware ESXi 5.5.0 U2 Build 1964139 Betriebssystemeinstellungen ESX-Einstellungen: siehe Details Details Siehe Disclosure Seite 52 (62) http://www.vmware.com/a/assets/vmmark/pdf/2014-09-08-Fujitsu-RX2540M1.pdf http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 „Performance with Messergebnisse: Server Power“ und Version: 1.4 2015-07-02 „Performance with Server and Storage Power“ System Under Test (SUT) Hardware Anzahl Server 2 Modell PRIMERGY RX2540 M1 Prozessor 2 × Xeon E5-2699 v3 Speicher 384 GB: 12 × 32GB (1x32GB) 4Rx4 DDR4-2133 LR ECC Netzwerk-Interface 1 × Emulex OneConnect OCe14000 Dual Port Adapter mit PLAN EM 2x1Gb T interface card 1 × Fujitsu Eth Ctrl 2x10Gbit PCIe x8 D2755 SFP+ Disk-Subsystem 1 × Dual port PFC EP LPe12002 1 × PRIMERGY RX300 S8 konfiguriert als Fibre Channel Target: 12 × SAS-SSD (400 GB) ® 2 × Fusion-io ioDrive 2 PCIe-SSD (1.2 TB) RAID 0 mit mehreren LUNs Gesamt: 6292 GB Software BIOS Version V5.0.0.9 R1.3.0 BIOS-Einstellungen Siehe Details Betriebssystem VMware ESXi 5.5.0 U2 Build 2068190 Betriebssystemeinstellungen ESX-Einstellungen: siehe Details Details Siehe Disclosure http://www.vmware.com/a/assets/vmmark/pdf/2014-09-30-Fujitsu-RX2540M1-serverptd.pdf http://www.vmware.com/a/assets/vmmark/pdf/2014-09-30-Fujitsu-RX2540M1-allptd.pdf Gemeinsam für alle Messergebnisse: Datacenter Management Server (DMS) Hardware (Shared) Gehäuse PRIMERGY BX600 Netzwerk-Switch 1 × PRIMERGY BX600 GbE Switch Blade 30/12 Hardware Modell 1 × Server-Blade PRIMERGY BX620 S5 Prozessor 2 × Xeon X5570 Speicher 24 GB Netzwerk-Interface 6 × 1 Gbit/s LAN Software Betriebssystem VMware ESXi 5.1.0 Build 799733 Datacenter Management Server (DMS)-VM Hardware Prozessor 4 × logische CPU Speicher 10 GB Netzwerk-Interface 2 × 1 Gbit/s LAN Software Betriebssystem Microsoft Windows Server 2008 R2 Enterprise x64 Edition http://www.fujitsu.com/de/primergy Seite 53 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Prime-Client Hardware (Shared) Gehäuse PRIMERGY BX600 Netzwerk-Switch 1 × PRIMERGY BX600 GbE Switch Blade 30/12 Hardware Modell 1 × Server-Blade PRIMERGY BX620 S5 Prozessor 2 × Xeon X5570 Speicher 12 GB Netzwerk-Interface 6 × 1 Gbit/s LAN Software Betriebssystem Microsoft Windows Server 2008 Enterprise x64 Edition SP2 Lastgenerator Hardware Modell 2 × PRIMERGY RX600 S6 Prozessor 4 × Xeon E7-4870 Speicher 512 GB Netzwerk-Interface 5 × 1 Gbit/s LAN Software Betriebssystem VMware ESX 4.1.0 U2 Build 502767 Lastgenerator-VMs (pro Tile 1 Lastgenerator-VM) Hardware Prozessor 4 × logische CPU Speicher 4 GB Netzwerk-Interface 1 × 1 Gbit/s LAN Software Betriebssystem Microsoft Windows Server 2008 Enterprise x64 Edition SP2 Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. Seite 54 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Ergebnisse „Performance Only“ Messergebnis (8. September 2014) Am 8. September 2014 erzielte Fujitsu mit einer PRIMERGY RX2540 M1 mit Xeon E5-2699 v3 Prozessoren und VMware ESXi 5.5.0 U2 einen VMmark V2-Score von „26.48@22 tiles“ in einer Systemkonfiguration mit insgesamt 2 × 36 Prozessorkernen beim Einsatz von zwei identischen Servern im „System under Test“ (SUT). Mit diesem Ergebnis ist die PRIMERGY RX2540 M1 in der offiziellen VMmark V2-„Performance Only“-Rangliste der leistungsstärkste 2-Sockel-Server in einer „matched pair“ Konfiguration aus zwei identischen Hosts (zum Zeitpunkt der Veröffentlichung des Benchmark-Ergebnisses). Alle genannten Vergleichswerte zu Wettbewerbsprodukten geben den Stand vom 17. September 2014 wieder. Die aktuellen VMmark V2-„Performance Only“-Ergebnisse sowie die ausführlichen Resultate und Konfigurationsdaten sind zu finden unter http://www.vmware.com/a/vmmark/. Die Grafik zeigt das „Performance Only“-Ergebnis der PRIMERGY RX2540 M1 im Vergleich zum besten ® ® System des Mitbewerbs mit 2 × 2 Prozessoren der Intel Xeon Processor E5-2600 Product Family (v1/v2/v3). PRIMERGY RX2540 M1 vs. HP ProLiant DL380p Gen8 30 +60% 20 10 5 16.54@14 tiles 15 26.48@22 tiles VMmark V2 Score 25 2 × Fujitsu PRIMERGY RX2540 M1 2 × 2 × Xeon E5-2699 v3 2 × HP ProLiant DL380p Gen8 2 × 2 × Xeon E5-2697 v2 0 Wesentliche Voraussetzungen zur Erreichung des Ergebnisses der PRIMERGY RX2540 M1 waren die verwendeten Prozessoren, die bei gut eingestelltem Hypervisor ihre Prozessor-Features inklusive HyperThreading optimal nutzen konnten. All dies wirkt sich speziell bei der Virtualisierung positiv aus. Alle VMs, deren Anwendungsdaten, das Host-Betriebssystem sowie weitere erforderliche Daten befanden sich auf einem leistungsfähigen Fibre-Channel Disk-Subsystem. Die Einrichtung des Disk-Subsystems berücksichtigt möglichst die spezifischen Anforderungen des Benchmarks. Der Einsatz von FlashTechnologie in Form von SAS-SSDs und PCIe-SSDs in dem leistungsfähigen Fibre-Channel DiskSubsystem brachte weitere Vorteile bei den Antwortzeiten des eingesetzten Speichermediums. Der Netzwerkanschluss an die Lastgeneratoren wurde über 10Gb LAN Ports realisiert. Die InfrastrukturWorkload-Verbindung zwischen den Hosts erfolgte per 1Gb LAN Ports. Alle verwendeten Komponenten wurden dabei optimal aufeinander abgestimmt. http://www.fujitsu.com/de/primergy Seite 55 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 „Performance with Server Power“ Messergebnis (30. September 2014) Am 30. September 2014 erzielte Fujitsu mit einer PRIMERGY RX2540 M1 mit Xeon E5-2699 v3 Prozessoren und VMware ESXi 5.5.0 U2 einen VMmark V2-„Server PPKW Score“ von „25.2305@22 tiles“ in einer Systemkonfiguration mit insgesamt 2 × 36 Prozessorkernen beim Einsatz von zwei identischen Servern im „System under Test“ (SUT). Mit diesem Ergebnis ist die PRIMERGY RX2540 M1 in der offiziellen VMmark V2-„Performance with Server Power“-Rangliste der energieeffizienteste Virtualisierungsserver weltweit (zum Zeitpunkt der Veröffentlichung des BenchmarkErgebnisses). Alle genannten Vergleichswerte zu Wettbewerbsprodukten geben den Stand vom 30. September 2014 wieder. Die aktuellen VMmark V2-„Performance with Server Power“-Ergebnisse sowie die ausführlichen Resultate und Konfigurationsdaten sind zu finden unter http://www.vmware.com/a/vmmark/2/. Die Grafik zeigt das „Performance with Server Power“-Ergebnis der PRIMERGY RX2540 M1 im Vergleich zum besten System des Mitbewerbs. Performance with Server Power +43% 25 20 10 5 17.6899@20 tiles 15 25.2305@22 tiles VMmark V2 Server PPKW Score 30 2 × Fujitsu PRIMERGY RX2540 M1 2 × 2 × Xeon E5-2699 v3 2 × HP ProLiant DL380 Gen9 2 × 2 × Xeon E5-2699 v3 0 Seite 56 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 „Performance with Server and Storage Power“ Messergebnis (30. September 2014) Am 30. September 2014 erzielte Fujitsu mit einer PRIMERGY RX2540 M1 mit Xeon E5-2699 v3 Prozessoren und VMware ESXi 5.5.0 U2 einen VMmark V2-„Server and Storage PPKW Score“ von „20.8067@22 tiles“ in einer Systemkonfiguration mit insgesamt 2 × 36 Prozessorkernen beim Einsatz von zwei identischen Servern im „System under Test“ (SUT). Mit diesem Ergebnis ist die PRIMERGY RX2540 M1 zusammen mit dem energieeffizienten Disk-Subsystem in der offiziellen VMmark V2-„Performance with Server and Storage Power“-Rangliste die energieeffizienteste Virtualisierungsplattform weltweit (zum Zeitpunkt der Veröffentlichung des Benchmark-Ergebnisses). Alle genannten Vergleichswerte zu Wettbewerbsprodukten geben den Stand vom 30. September 2014 wieder. Die aktuellen VMmark V2-„Performance with Server and Storage Power“-Ergebnisse sowie die ausführlichen Resultate und Konfigurationsdaten sind zu finden unter http://www.vmware.com/a/vmmark/3/. Die Grafik zeigt das „Performance with Server and Storage Power“-Ergebnis der PRIMERGY RX2540 M1 im Vergleich zum besten System des Mitbewerbs. Performance with Server and Storage Power VMmark V2 Server and Storage PPKW Score 25 +64% 20 5 12.7058@20 tiles 10 20.8067@22 tiles 15 2 × Fujitsu PRIMERGY RX2540 M1 2 × 2 × Xeon E5-2699 v3 2 × HP ProLiant DL380 Gen9 2 × 2 × Xeon E5-2699 v3 0 http://www.fujitsu.com/de/primergy Seite 57 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 STREAM Benchmark-Beschreibung STREAM ist ein seit vielen Jahren eingesetzter synthetischer Benchmark zur Ermittlung des Speicherdurchsatzes, der von John McCalpin während seiner Professur an der Universität in Delaware entwickelt wurde. Heute wird STREAM an der Universität von Virginia betreut. Dort kann der Quellcode wahlweise in Fortran oder C heruntergeladen werden. Besonders im HPC-Umfeld spielt STREAM nach wie vor eine wichtige Rolle. So ist er z.B. Bestandteil der HPC Challenge Benchmark-Suite. Der Benchmark ist so konzipiert, dass er sowohl auf PCs als auch auf Serversystemen eingesetzt werden kann. Die Maßeinheit des Benchmarks ist GB/s, also die Anzahl Gigabytes, die pro Sekunde gelesen und geschrieben werden kann. STREAM misst den Speicherdurchsatz bei sequentiellen Zugriffen. Diese können generell effizienter durchgeführt werden als Zugriffe, die zufällig auf den Speicher verteilt sind, da bei sequentiellem Zugriff die Prozessor-Caches genutzt werden. Vor der Ausführung wird der Quellcode der zu vermessenden Umgebung angepasst. So muss die Größe des Datenbereiches mindestens 12mal höher sein als die Summe aller „last-level“ Prozessor-Caches, damit diese einen möglichst geringen Einfluss auf das Ergebnis nehmen. Mit Hilfe der OpenMPProgrammbibliothek können ausgewählte Programmteile während der Laufzeit des Benchmarks parallel ausgeführt werden, wodurch eine optimale Lastverteilung auf die verfügbaren Prozessorkerne erreicht wird. Bei der Ausführung wird der definierte Datenbereich, bestehend aus 8-Byte-Elementen, nacheinander auf vier Arten kopiert, wobei teilweise zusätzlich arithmetische Berechnungen durchgeführt werden. Art Ausführung Bytes je Schritt Gleitkommarechnung je Schritt COPY a(i) = b(i) 16 0 SCALE a(i) = q × b(i) 16 1 SUM a(i) = b(i) + c(i) 24 1 TRIAD a(i) = b(i) + q × c(i) 24 2 Bei jeder Berechnungs-Art wird der Durchsatz in GB/s ausgegeben. Die Unterschiede der verschiedenen Werte sind auf modernen Systemen in der Regel nur gering. Zum Vergleich wird im Allgemeinen nur noch der ermittelte TRIAD-Wert verwendet. Die Messergebnisse hängen in erster Linie von der Taktfrequenz der Speichermodule ab, die Prozessoren beeinflussen die arithmetischen Berechnungen. 9 In diesem Kapitel sind Durchsätze durchgängig zur Basis 10 angegeben (1 GB/s = 10 Byte/s). Seite 58 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Umgebung System Under Test (SUT) Hardware Modell PRIMERGY RX2540 M1 Prozessor 2 Prozessoren der Intel Xeon Processor E5-2600 v3 Product Family Speicher 16 × 16GB (1x16GB) 2Rx4 DDR4-2133 R ECC ® ® Software BIOS-Einstellungen EnergyPerformance = Performance Xeon E5-2603 v3, E5-2609 v3, E5-2637 v3, E5-2698 v3, E5-2699 v3: COD Enable = disabled, Early Snoop = disabled Xeon E5-2630 v3, E5-2630L v3, E5-2640 v3: COD Enable = disabled, Early Snoop = enabled Alle anderen: COD Enable = enabled, Early Snoop = disabled Betriebssystem Xeon E5-2699 v3: Red Hat Enterprise Linux Server release 6.5 Alle anderen: Red Hat Enterprise Linux Server release 7.0 Betriebssystemeinstellungen Transparent Huge Pages inactivated Compiler Intel C++ Composer XE 2013 SP1 for Linux Update 1 Benchmark Stream.c Version 5.9 Einige Komponenten sind möglicherweise nicht in allen Ländern / Vertriebsregionen verfügbar. http://www.fujitsu.com/de/primergy Seite 59 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Benchmark-Ergebnisse Prozessor Speicherfrequenz [MHz] Max. Speicher- Cores bandbreite [GB/s] Prozessorfrequenz [Ghz] Anzahl Prozessoren TRIAD [GB/s] Xeon E5-2603 v3 1600 51 6 1.60 2 47.9 Xeon E5-2609 v3 1600 51 6 1.90 2 58.1 Xeon E5-2623 v3 1866 59 4 3.00 2 73.3 (est.) Xeon E5-2620 v3 1866 59 6 2.40 2 88.9 (est.) Xeon E5-2630L v3 1866 59 8 1.80 2 86.2 Xeon E5-2630 v3 1866 59 8 2.40 2 89.9 Xeon E5-2640 v3 1866 59 8 2.60 2 89.6 Xeon E5-2637 v3 2133 68 4 3.50 2 89.8 Xeon E5-2643 v3 2133 68 6 3.40 2 90.3 (est.) Xeon E5-2667 v3 2133 68 8 3.20 2 Xeon E5-2650 v3 2133 68 10 2.30 2 116 (est.) Xeon E5-2660 v3 2133 68 10 2.60 2 115 (est.) Xeon E5-2650L v3 2133 68 12 1.80 2 115 Xeon E5-2670 v3 2133 68 12 2.30 2 118 (est.) Xeon E5-2680 v3 2133 68 12 2.50 2 118 (est.) Xeon E5-2690 v3 2133 68 12 2.60 2 117 Xeon E5-2683 v3 2133 68 14 2.00 2 117 (est.) Xeon E5-2695 v3 2133 68 14 2.30 2 118 (est.) Xeon E5-2697 v3 2133 68 14 2.60 2 117 (est.) Xeon E5-2698 v3 2133 68 16 2.30 2 117 Xeon E5-2699 v3 2133 68 18 2.30 2 116 90.3 (est.) Mit „(est.)“ gekennzeichnete Ergebnisse sind Schätzwerte (estimated). Seite 60 (62) http://www.fujitsu.com/de/primergy White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 Literatur PRIMERGY Server http://primergy.de/ PRIMERGY RX2540 M1 Dieses White Paper: http://docs.ts.fujitsu.com/dl.aspx?id=0cf6083d-23ab-4634-86e3-4d86ddf6e4f8 http://docs.ts.fujitsu.com/dl.aspx?id=884d7bdc-49ad-4550-b1a9-292d5770df9c http://docs.ts.fujitsu.com/dl.aspx?id=4c793f74-a016-4bc7-8066-7775c8de5a1f Datenblatt http://docs.ts.fujitsu.com/dl.aspx?id=510df3c4-a4bc-4aae-8ddd-4d7ba65e8ce9 PRIMERGY Performance http://www.fujitsu.com/de/x86-server-benchmarks Performance von Server-Komponenten http://www.fujitsu.com/de/products/computing/servers/mission-critical/benchmarks/x86components.html BIOS-Optimierungen für Xeon E5-2600 v3 basierte Systeme http://docs.ts.fujitsu.com/dl.aspx?id=b0877217-e9ef-4c7b-943d-299c0a4c4637 Speicher-Performance Xeon E5-2600 v3 (Haswell-EP) basierter Systeme http://docs.ts.fujitsu.com/dl.aspx?id=571dd497-136c-4699-90d2-adff5d33a74c RAID-Controller-Performance http://docs.ts.fujitsu.com/dl.aspx?id=71fac54b-7ec3-4b3f-b13d-f80fbb42d583 Disk-I/O: Performance von Speichermedien und RAID-Controllern Grundlagen Disk-I/O-Performance http://docs.ts.fujitsu.com/dl.aspx?id=3d4fbad8-2a7e-465f-b9ee-d43b711f636d Informationen über Iometer http://www.iometer.org OLTP-2 Benchmark-Überblick OLTP-2 http://docs.ts.fujitsu.com/dl.aspx?id=743d7d46-56e8-41d2-9d50-9ab29ccf4d18 SAP SD http://www.sap.com/benchmark Benchmark Überblick SAP SD http://docs.ts.fujitsu.com/dl.aspx?id=ae039b1d-73d8-4946-ae60-08dcef54cfa8 SPECcpu2006 http://www.spec.org/osg/cpu2006 Benchmark Überblick SPECcpu2006 http://docs.ts.fujitsu.com/dl.aspx?id=04351fd2-8a69-42a3-ba1c-4342dcc89b89 SPECpower_ssj2008 http://www.spec.org/power_ssj2008 Benchmark-Überblick SPECpower_ssj2008 http://docs.ts.fujitsu.com/dl.aspx?id=66467935-98dc-4374-80b2-3ddae4c73491 STREAM http://www.cs.virginia.edu/stream/ http://www.fujitsu.com/de/primergy Seite 61 (62) White Paper Performance Report PRIMERGY RX2540 M1 Version: 1.4 2015-07-02 TPC-E http://www.tpc.org/tpce Benchmark Overview TPC-E (DE) http://docs.ts.fujitsu.com/dl.aspx?id=08c95eef-5f18-4453-bed6-cbf9363f4e2f VMmark V2 Benchmark-Überblick VMmark V2 http://docs.ts.fujitsu.com/dl.aspx?id=ea18bef0-c1ff-46ae-81b3-c47811f866de VMmark V2 http://www.vmmark.com vServCon Benchmark-Überblick vServCon http://docs.ts.fujitsu.com/dl.aspx?id=214ee9dc-9239-4985-86e4-f0f9ac78ea25 Kontakt FUJITSU Website: http://www.fujitsu.com/de/ PRIMERGY Product Marketing mailto:Primergy-PM@ts.fujitsu.com PRIMERGY Performance und Benchmarks mailto:primergy.benchmark@ts.fujitsu.com © Copyright 2014-2015 Fujitsu Technology Solutions. Fujitsu und das Fujitsu Logo sind Handelsnamen und/oder eingetragene Warenzeichen von Fujitsu Ltd. in Japan und anderen Ländern. Andere Firmen-, Produkt- und Servicebezeichnungen können Marken oder eingetragene Marken der jeweiligen Eigentümer sein. Änderung von technischen Daten sowie Lieferbarkeit vorbehalten. Haftung oder Garantie für Vollständigkeit, Aktualität und Richtigkeit der angegebenen Daten und Abbildungen ausgeschlossen. Wiedergegebene Bezeichnungen können Marken und/oder Urheberrechte sein, deren Benutzung durch Dritte für eigene Zwecke die Rechte der Inhaber verletzen kann. Weitere Einzelheiten unter http://www.fujitsu.com/de/resources/navigation/terms-of-use.html 2015-07-02 WW DE Seite 62 (62) http://www.fujitsu.com/de/primergy