Aktuelle Storagetrends im Aktuelle
Transcription
Aktuelle Storagetrends im Aktuelle
Aktuelle Storagetrends im Rechenzentrum Eine technologische Standortbestimmung norbert e. deuschle d deuschle hl b business i consulting lti (Dipl.Wi.Ing., Senior Berater, Analyst) www.storagewelt.de www.storageconsortium.de t ti d Agenda - Einführung Trend 1: I/O-Performance, HDD‘s, SSDs, Alternativen 640 KBytes (Arbeitsspeicher) ist alles, was irgendeine Applikationpjemals benötigen sollte - Bill Gates, 1981 Trend 2: Kapazitätsoptimierung, p g COS Trend 3: Virtualisierung & Energieeffizienz Fazit Das Datenwachstum weltweit ... 1 MB = 1 Esslöffel Sand 1 ZB = 1 Strand ... 30 m breit, 30cm tief, entlang Europa) 161 EB Æ 1.0 ZB ... Wachstum x6 Quelle: IDC, 2007 Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Datenwachstum im Unternehmen Unstrukturiertes Datenwachstum Name Space Verwaltung Plan: 55% Wachstum p.a. Jedoch oft > 100% Non-Shared NAS Distributed (Clustered-) FS GNS NuView (Brocade) O S Pantera ONStor Exanet NetApp GX (Spinnaker) I ili Isilion EMC (Rainfinity) HP (PolyServ) Microsoft (DFSR2) IBM Panasas etc.. Network File Management Services - File Virtualization - File Mgmt Mgmt..Services NeoPath Attune NetApp Acopia (F5) Bridgehead ................... Brocade EMC 2008 Wide Area File Services (WAFS) - File Services - Network Optimization - Application Acceleration Cisco Brocade Packeteer Quantum HP2010 Riverbed Juniper Nortel File Content Cl Classification ifi ti DeDuplication Kazeon StoredIQ Abrevity R k t Software Rocket S ft (Arkivio) Njini IBM / FileNet DataGlobal Pandoratio Scentric FAST Blackball usw. 2/3 / an unstrukturierten Daten auf Enterprise p Arrays... y 1/3 / im (nearline-) ( ) Archiv Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Konsequenzen für Storageprozesse … • Weniger “aktive Daten” auf HD (50x pro Jahrzehnt) • Disk scan benötigt immer länger (10x pro Dekade) Quasi unbegrenzte Kapazität – 1990 disk ~ 1GB = 5 Min. scan – 2008 disk ~1000GB = 6.5 hour scan • Problem: Backup-/Restore Zeiten … • In 2009: – 75TB / Storage Admin (managed storage, Automation) • Problem: – 5TB = 10 Preiseinheiten heute – 5TB = 1 Preiseinheit in wenigen Jahren … Begrenzte Bandbreite Storage Management Kosten Æ höheren Storagekosten Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Automatisierte Speicherverwaltung virtualisierter Ressourcen • Nur ca. 60% haben formale Storage Policies* und Verantwortlichkeiten eingeführt. • Disziplin: Automated Storage Resource Management Management, (A)SRM * Policies: SLA basierende Definitionen von Storage Services, Services priorisiert nach Benutzerklassen und geschäftlichen Anforderungen €/GB/Month • Mit automatisierten Storage g Prozessen wird die Effizienz pro FTE verdoppelt – 60.0+ TB/Admin. in 2008 Personalkosten Ohne Storage Mgmt. mit automatisiertem Storage Management Speicherkosten (RAID Subsysteme) 1995 2000 2001: 2002: 2003: 1.25 TB/FTE 3.80 3 80 TB/FTE 6.50 TB/FTE 2005 2009: 75.00 TB/FTE Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Quellen: SNIA XAM, DMTF 2010 File ManagementManagement Virtualisierung Name Space Verwaltung Non-Shared NAS DistributedShared FS, GNS Brocade (NuView) O S Pantera ONStor Exanet, Panasas NetApp GX (Spinnaker) I il Isilon EMC (Rainfinity) HP (PolyServ) Microsoft (DFSR2) IBM (GPFS), (GPFS) SoFS S FS SUN ZFS etc.. Quelle: N.Deuschle, 12/2008 Network File Management Services Wide Area File Services WAFS File Classification File Virtualization - File Mgmt.Services - File Services - Network Optimization - Application Acceleration File Content Classification NeoPath (Cisco) Attune NetApp Acopia (F5) Bridgehead Brocade EMC C HP IBM etc.. Cisco Brocade Packeteer Quantum HP Riverbed Juniper Nortel SilverPeak etc.. Trend: Clustered Storage + Filevirtualisierung + Integration von DeDup & Backup (virtual tape) Kazeon StoredIQ Abre it Abrevity DataGlobal Arkivio Njini IBM / FileNet Pandoratio Scentric FAST Blackball Zantaz etc.. Deuschle Storage Business Consulting, München 2008 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Quelle: IEEE Computer Society / Google, Luiz André Barroso, Urs Hölzle Dez. 2007 Server-/Storagearchitekturen /Storagearchitekturen Virtualisierung = pot. pot I/O - Engpass Klassische Server wurden vor dem Internet entwickelt... Web W b 2.0 2 0 verlangt l t nach h stärkerer tä k D t Datenund nicht CPU-Zentrierung (s.a. Datenwachstum vs. Moore‘s Law) Î Mehr I/O-, Storage-RAM-Kapazitäten als CPU-Servercapacity sinnvoll (Memory-Scale-Up-Architekturen ...) Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Intro: Server-/Storage High DensityE t i kl Entwicklung bi bis 2011/12 - 10x to 100x Leistungsverbesserung i b • 10TB HD • 512GB+ NAND Solid State Disks (T0) • 1TB Hauptspeicher • 16+ cores cpu 16 cores 16 cores 16 cores 16 cores 1TB DDR3 System Crossbar PCIe Gen 3 16x 10TB HDD PCIe Gen 3 - Wachstum exponentiell: • Kapazität • Bandwidth • Latency 60% p.a. (100x) 40% p.a. (10x) 15% p.a. - Kapazität >> Bandbreite >> Latency -ENERGIEEFFIZIENZ - Data Center IT Utilization (DCIU) - Data Center Performance per Watt (DCPpW) 16Gb/s FC 10Gb/s FCoE SSD Geschwindigkeit (t) - CPU’s CPU’ Memory Diskkapazitäten Netzbandbreite Änderungen (t) - IT P Prozesse Memory X-Rate Storage latency Fabric Architekturen Quelle: Stuart Berman, CTO Emulex Corp. Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Storage und Energieeffizienz • Verbraucher (%) im RZ vor Virtualisierung: – Server 60-70%, Netze 10-20%, – Storage ca. 20% • Mit Server-Virtualisierung + HD-Architekturen: – Server: 10%-20% (Konsolidierungsraten von 1:10 - 1:30 typisch..) typisch ) Server Storage jetzt im Fokus Verbraucher nach Virtualisierung Netze 4 0 % 50% Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Speicher High-Density Architekturen • Herausforderung HighDensity, HD-Architekturen Server Storage ... Server, Quelle: RZ, Finanzdienstleister 2008 Cooling on Demand Î 1 Grad Absenkung = kostet 5% mehr Energie ! Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern E Energieeffizienz i ffi i iim R Rechenzentrum h t Rechenzentrums – Performance-Effizienz (DCPE): - DCE = (1/PUE) PUE (Power Usage Effectiveness) - PUE = (total Facility Power / IT Equipment Power) www.thegreengrid.org Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern TREND 1: Halbleiterspeicher schnell & energieeffizient ... HDD-Entwicklungstrends 2008 - 2015 The Hard Disk Is Dead: Long Live Solid State Patterned Media (>2010) Bylund 1.0 -By 3.0Anders Tb/sq.in. Thermally Assisted Recording, TAR* TAR (>2015..?) (>2015 ?) 2.0 - 15.0 Tb/sq.in. October 7, 2008 Perpendicular R. Quelle: US Nasdaq TechTicker, 07. Okt. 2008 500 - 800 Gb/sq.in. Gb/sq in >2006 „Der Test zeigt es geht in Richtung SSD.. einzig der Preis und die Speicherkapazität lässt zu wünschen übrig. Aber wie wir wissen geht die Entwicklung rasend schnell. Das Ende der Festplatte naht...“ PC Welt, Sept. 2008 Sometimes, it takes an established industry giant to bring out the best in a brilliant new technology. Intel (Nasdaq: INTC) wasn't kidding this summer when it promised to put a new face on solid-state drives. The chip giant's first serious foray into the $35 billion storage drive market hits the street this week, and the early buzz is phenomenal. Longitudinal R. < 130 Gb/sq.in. Intels new X25-M ... still not cheap enough to blow traditional disk makers like Western Digital (NYSE: WDC) and <2015 Seagate Technology (NYSE: STX) to pieces yet yet, but it's it s just a question of time time. ... STEC (Nasdaq: STEC) and SMART Modular Technologies (Nasdaq: SMOD) make business-class flash drives to power massive data banks like video-on-demand libraries. Motorola (NYSE: MOT) builds entire media servers around the extreme performance and reliability of solid-state storage. *Bto keep10 *Bsp.: Tb/ i = auf 2.5“ 2 5“ oder d TB auff from 3.5“ 3 5“that disk diangle, k too. IT managers love theirTb/sq.in. data centers cool12 and TB quiet, sof memory chips 50 are desirable Quelle: HITACHI GST Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Halbleiterspeicher - Kurzübersicht • • SRAM (Flip-Flop, (Fli Fl CPU Cache) C h ) – Sehr schnell (x100 als DRAM = < 0,1 ns), hoher Energieverbrauch, teuer, geringe Kapazität, volatil ... DRAM/SDRAM (Main Memory) – Schnell (20 bis 7 ns), klein, Kapazitäten teuer, Refresh nötig, volatil ... • PRAM (Phase Change M. ) NOR-/NAND-Flash) /NAND Flash) – Möglicher Ersatz für DRAM und NOR – Schnell (x30 zu Flash, klein, nicht-flüchtig, langlebig (x10 zu Flash), preiswert in der Herstellung, (Intel, AMD, Samsung, NEC, IBM) – Möglicher Ersatz für Flash bei USB Sticks ... • MRAM (Magneto-resistive) (Magneto resistive) – Schnell wie SRAM, Packungsdichte wie DRAM, kein Refresh, nicht-flüchtig, langlebig wie SDRAM (ca. 1 Billion write-/read-cycles), Technikpotential heute noch nicht ausgenutzt, Preiswerte Herstellung, Ersatz für SDRAM möglich (Philips, Freescale, Infineon, IBM ...) EEPROM / FLASH Memory (NOR, NAND, ORNAND™) – ohne einzelne Speicherelement-Löschung, langsamer als RAM, kompliziertes Write-/Read Î Controller mit ECC nötig, teurer als HDD, non-volatile, geringer Energieverbrauch, klein, hohe Datendichte schnell gegenüber HDD‘s (Reads) ... Datendichte, Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Z Zugriffszeiten iff it vs. T Technologie h l i Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Energieeffizienz- Metrik P Power Density, D it TB pro (K)W (K)Watt, tt Storage St Density, D it TB pro Stellfläche St llflä h TAPE + DeDup p TB/Watt Tape** MAID + DeDuplizierung MAID* Tape CAS SATA Arrays FC / SAS Enterprise Arrays 500 – 7,0 , kW Rack 1,5 , - 3.0 kW Rack TB/Stellfläche *MAID, Massive Arrays of Idle Disks for Storage Archives, D. Colarelli and D. Grunwald, 2002 ACM/IEEE conference on Supercomputing, November 2002, 2002 Baltimore, Baltimore US US. Anbieter: Copan Copan, nexsan ** Kapazitätsabhängig Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern E Energieeffiziente i ffi i t SSD SSDs: IOPS / Durchsatz pro Watt • • • • Storage (Sub-)system Bandbreite, Storage Density, Power Density, IOPS / (K)Watt MB/s / (K)Watt TB / Stellfläche TB / (K)Watt – Bsp.: Solid State Disk Technologie: = 200 IOPS/Watt – Bsp.: RAID-6 HDD Array = 10 IOPS/Watt Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern SSD- Technik: zu HDD (Arrays) ? • • • Festplatten: noch 10 - 15 Jahre am Markt ... Formfaktor: Übergang zu 2.5“ Drives in 2009 Zunehmend FLASH für 15k HDDs (2009/10) • Neue Optionen = Solid State + SLC NAND (Flash) g p Arrays: y 320 GB,, 2.5“,, 0,5ms , seek – Highspeed – Kombination von SSD mit RAID-Flash • Einstiegspreise deutlich reduziert (NAND-Preise minus 30-50% p.a. in 2007/08) ⇒ HDD latency: bis 1:700 gegenüber SDRAM ⇒ NAND latency: bis 1: 80 gegenüber SDRAM ⇒ Kombination aus DRAM plus SLC-NAND – Vorteile: > hohe E/A-Leistung > Energieeffizient (IOPS / Watt) > Anbieterbsp.: Texas Memory Systems, TMS Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern NAND Flash als HDD-Ersatz HDD Ersatz sinnvoll ? • Zuverlässigkeit, Einsatzmöglichkeiten: + MTBF auf HDD–Level (>1.5 Mio Std.) + SLC NAND: >100.000 Write Write-cycles cycles + Random, Sequential - I/O Performance hoch - IOPS bei Random-Write plus Verschleiß ¾ Für jede Löschoperation eine Blockkopie ¾ Verlagern oft genutzter Blöcke verringert vorschnelle Alterung ¾ Controller-Intelligenz nötig ¾ Preis P i ($30 ($30-120 120 pro GB) Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern NAND Flash vs. HDD Arrays • • • • 60 HDDs 18 000 IOPS 18.000 6.0 GB/s 4.4 TB – Pro HDD: • 100MB/s • 300 IOPS O S – 12W (active) * Angaben basierend auf INTEL Specs, 11/2008 Energiekosten g -Faktor 5 Read d IOPS O S -Faktor >110 X-Rate -Faktor 3 (active) 60 SSDs* 2 1 Mio. 2.1 Mio IOPS 18 GB/s 1.9 TB - Pro SSD: - 250MB/s read - 170MB/s 0 / write - 35K IOPS 2 4W - 2.4W Wh When servers wait it on storage, t users wait it on servers. Thi This iis I/O wait it ti time... Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Applikationsprofile, pp at o sp o e, SS SSD – Einsatz sat in 2009 009 Enterprise DDRAM-/Flash SSD Virtual Machines ... zu 3-4Hit* x mehr VMs pro Serverinstanz lauffähig •-Bis Cache – HardDisk Array: ms -Keine Interrupts wegenca. I/O0.3 Engpäßen ca 0 0.015 015 ms (15.0 (15 D 0 microsec.) microsec -Metadaten M–t SSD: d t – Management Mca. t (VTL, (VTL DeDup D ...)) ) • Cache Miss (Read) – HardDisk Array: ca. 5.0 Transaktionsverarbeitung ... ms – SSD: ca. 0.2 ms (<2 ms write cache miss) -Datenbanken • IOPS (random read) -OLTP Apps (< 100x schnellere Responsezeiten; Transaktionen pro – HD Array: 6 6.000 000 versus SSD: 100.000 100 000 Sekunde bis Faktor 10 erhöht) – Stromverbrauch: HD-Array vs. SSD: Faktor 3x-10x • Kosten: Content Streaming ... pro GB – HD Array: $ 15.0 bis zu 300 x schneller -Rich Media Apps (< 10/ xGB mehr Streams/t) – SSD: $150 bis zu 10 x teurer Realtime Editing von HD-Mediastreams HD Mediastreams etc. -Realtime *Quelle: Hersteller Texas Memory Systems,TMS Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern NAND Flash Alternativen – Future S lid St Solid State t St Storage ... NonVolatile RAM Magnetic RAM Ferroelectric RAM RAM MRAM 10 ns 2 ns Phase-Change RAM M Memory-to-Memory M SAN Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Active Archive NAND Flash Alternativen – Future S lid St Solid State t St Storage (2) NonVolatile RAM Magnetic RAM Ferroelectric RAM Phase-Change RAM RAM 10 GbE, IB NVRAM SAN,, NAS heute ... Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern NOR/NAND und DRAM: SRAM DRAM RAMDISK ORNAND™ SSD NAND, NOR HDD Q ll SSpansion, Quelle: i 11/2008 Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern NAND Flash Alternativen F t Future Storage, St Ausblick A bli k ... ¾ NAND Flash ist Übergangstechnologie ¾ MRAM, MRAM PRAM als (FC-HDD) (FC HDD) Nachfolger (Intel, AMD, IBM, Samsung, NEC u.a.) Basis für Cloud Computing- Storage Zukünftig: 2015+ NANO Speicher: MEMRISTOR RACETRACK (HP MEMRISTOR, (HP, IBM IBM, TKD u u.a.) a) RaceTrack StorageArray*: "Großer" Schreib/Lese-Kopf, "kleine" Spin-Datenfelder auf ferroelektrischem Nanodraht* Nanostrukturen Lichtspeicher Spintronics Quelle Abbildungen: IBM Watson Research Center, USA und Dr. A. Köster, IBM Deutschland. Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Trend 2: Kapazitätsoptimierung, p p g, COS • Kapazität und Kosten limitieren die Verwendung von Disk-Systemen Di k S fü für B Backupk und dR Restore: – Daten müssen nach wenigen Tagen gelöscht oder verschoben e sc obe werden. e de – Einer der Hauptvorteile von D2D-Backups, die hohe Recovery-Geschwindigkeit, bleibt vielfach ungenutzt. ungenutzt • Effektives Disaster-Recovery kaum realisierbar – Disk-Backup-Systeme sind isolierte Systeme – Replikation ist bei verteilten Standorten aufgrund des Datenvolumens vielfach nicht praxistauglich (Kosten, Leistung, Netzbandbreite). Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Daten De Duplizierung Daten-De-Duplizierung Î Definition: D fi iti Deduplizieren („single-instance“) ist das Entfernen von redundanten Dateien, Bytes oder Datenblöcken. Diese (redundanten Daten) werden durch Verweise (pointer) ersetzt. Î Data Repository zur Identifikation von „unique“ Data Î Technik: Pattern Pattern-Matching Matching (delta based) based)* or Hashing-based Hashing based - Algorithms DeDup – Implementierungen: •Pattern Matching ist eine Technik, mit der ein String, bestehend aus Text oder binären Daten, nach einer Zeichenfolge durchsucht wird. Die Zeichenfolge wird dabei in Form eines speziellen Suchmusters angegeben angegeben. http://www.perlboard.de/perlguide/Kap09.html 1.File (Object-) Level: nur eine Kopie pro Datei wird geschrieben y oder Blocklevel: 2.Byte- Deuschle Storage Business Consulting, München 2008 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern DeDuplizierung, cont.(1) Wo wird DeDupliziert ? 1 Target: z.B. 1.Target: z B Storage Subsystem: + keine CPU-Belastung keine Host-Agents und SW-Updates, OPEX zentrales t l M Mgmt./ t/T Transparentt zu S Server / A Apps. - Keine LAN-/WAN – Entlastung durch DeDup 2. Source: z.B. Host / VMs + Netzbandbreiten ... Entlastung LAN/WAN - Hostbelastung, Hostbelastung verteilte Systeme - Installations- / Admin. Aufwand, OPEX Deuschle Storage Business Consulting, München 2008 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern De-Duplizierung, De Duplizierung, cont.(2) Wie wird DeDupliziert ? 1 R l Time: 1.Real Ti Deduplizierung g findet beim Speichervorgang g g statt. + Sofortige Platzeinsparung - Performance Impact (z.B. FC HDDs nötig) 2. Post Processing: + - Deduplizierung D d li i zu d definierten fi i Z Zeiten, i d d.h. h planbar l b Zusätzliche Diskkapazität muss vorgehalten werden Deuschle Storage Business Consulting, München 2008 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Beispiel: Backup-/DR mit DeDuplikation Weekly Backup: 5 TB Änderungen pro Woche: 1.25 1 25 TB Daily Backup: 1 TB - Verfügbare Sicherungszeit pro Woche: 8 Std. Total Backups, primary site: 130 TB Total Backups, DR site: 130 TB DeDup Faktor = 17 : 1 RZ: -DeDup: 7.4 TB - VTL: 130 TB - Tape: 1.040 Tapes DR-Site: - DeDup: - VTL: - Tape: 7.4 TB bei b i 4.0 0 Mb/s. b/ 130 TB bei 72.0 Mb/s. 1.040 Tapes, KFZ, Archivraum Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern DeDu-Faktor DeDu Faktor (Effizienz) vs. vs p p g Kapazitätseinsparung Dedup Ratio Quelle: Quantum Corporation, 2008 Disk Savings 1:1 0% 2:1 50% 3:1 67% 4:1 75% 5:1 80% 6:1 83% 7:1 86% 8:1 87% 9:1 89% 10:1 90% 50:1 98% 100:1 99.0% 500:1 99.8% Normal: Raten zwischen 10:1 - 30:1 Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Einsatzkriterien - DeDuplication • Beeinflusst DeDup die Backup-Performance? (Konfigurationen, in-line, postprocessing..) • Datenstrukturen k respektive k Anwendungen! d – Effizienzfaktor, Encryption, Compression … • Index-Katalog (Data Repository): Aufbau, Sicherheit, Grösse, Verfügbarkeit, RAM oder Disk... • Skalierbarkeit Sk li b k it (A (Architekturprinzipien) hit kt i i i ) • Erweiterbarkeit (n-nodes) • Kostenaspekte K k (OPEX)* *Einkaufsführer DeDup - N.Deuschle - www.storageconsortium.de /Downloads Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Trend: DeDuplikation & Virtual Tape - Kaum K Geräteengpässe, G ät ä stabile t bil Pl Planung möglich ö li h - Deutlich kürzere Sicherungszeiten mit virtualisierten Bändern - Einheitliches Mgmt. Mgmt der logischen Volumes und weniger Ausfälle - Für Systemadministration ein vorhersehbarer Prozess - Entlastung der Backup Backup-Server Server und des Speichernetzwerks - Unabhängigkeit von Bandtechnologien - Flexibilität und Leistung beim Restore - Betriebskosten können gesenkt werden - Backupkosten 10%-30% geringer - Backup-Prozesse fehlertoleranter. Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Data De De-Duplication Duplication und Datenintegrität Data pattern „1234123412341234“ Compression: „4 1234“ (4-fache Kompression von 16 digits) De-Duplication: Data pattern 1234123412341234 (16 digits) ===> 1234 (4 digits) D t i t Datenintegrität ität (BER) von Hash-basierenden H h b i d D DeDup D - Verfahren V f h • Bei 95EB an Daten existiert eine statistische BER von: 0 00000000000001110223024625156540423631668090820313% einen 0.00000000000001110223024625156540423631668090820313%, Datenblock durch Hash-Collision zu verlieren •U Undetected d t t d Bit E Error R Rate: t – Jeder Schreibvorgang auf ein LTO tape drive bedeutet statistisch eine BER von 0.000000000000000000000000100000% = 1 in 10^(27) HASH COLLISION ist mit SHA-1 (noch) nicht praxisrelevant Trend 3: Virtualisierung g im RZ,, Storage und Energieeffizienz • Server Virtualisierung als Katalysator für SANs und Speichervirtualisierung – Parameter: Skalierbarkeit, I/O ... Bildquelle: ESG ESG, 10/07 Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Entwicklung – Virtualisierung im RZ Europa 2007: 8%-10% aller Server virtualisiert • V1 (2001 - 2006) – Konsolidierung, SW-Entwicklung-/Tests (ca. 80%) – Verfügbarkeit (ca. (ca 15%) – Virt. Clients (ca. 3%) Î Ressourcen-Sharing, heterogene Plattformen • V2 (2007 - 2011) ca. 50% planen Beschaffung für 2008 – Konsolidierung, SW-Entwicklung-/Tests (ca. 30%) – Verfügbarkeitsaspekte (ca. (ca 50%) – Virt. Clients (15%), SOA Î Ressource-sharing + Migration + Workload Management ÎUnplanned Downtime, Downtime Energieeffizienz, Energieeffizienz Performance • V3 (2012+) – Policy Policy-based based Automation Automation, SOA V2 Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Energiekosten und virtuelle Ressourcen im Data Center • SANs und Storage Virtualisierung nach Servervirtualisierung sinnvoll, sinnvoll jedoch: – Konsolidierung impliziert nicht nur Energieeinsparung ☹ • 2003 - 2008: typ. Rack im RZ = 2.0kW bis 3.0kW • Wärmeabgabe ca. 25% der Energiekosten – 2009: 20.0kW • Wärmeabgabe 5 - 10 KW (bis 50% Kosten Wärmeabfuhr) – Kühlung: 0,5 bis 0,7 Watt pro 1 Watt Server - Power* • Kühlung Î 60% des Energieverbrauchs im RZ ⇒ High-Density – Architekturen Î 5-10 x Energieverbrauchs von konventionellen Systemen ⇒ Konventionell: bis zu 30kW pro Storage Rack 2012+ 2010: Energiekosten zweitgrößter Kostenblock im RZ *Quellen: Flometrics, IBM, Gartner Group, Forrester Research, 2007 Typisches RZ: 800.000.000 kWh p.a. = 380.000.000 kg CO2* Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Storage Virtualisierung VirtualisierungEnergieeffizienz KWh/Jahr Beispiel: Energiebedarf für 50TB (Stromverbrauch + Kühlung) nach h Disktyp Di kt (Energieverbrauch (E i b h variiert ii t jje nach hH Hersteller t ll und d Disk-Arraymodell; Angaben sind als Anhaltspunkt zu sehen). Storage Virtualisierung FC FC, SAS, SATA SATA TAPE, MAID HSM, Disk-Tape Quellen: Seagate, Bull, 2007 Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Fazit - Kapazitätsoptimierung - Virtualisierung g & Performance - Energieeffizienz Anforderungen an InfrastrukturElemente steigen ! Zusammenfassung- Fazit Zusammenfassung iSCSI FCoE Flash SSD Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Vielen Dank für f Ihre Aufmerksamkeit ! www.storageconsortium.de norbert deuschle@storageconsortium de norbert.deuschle@storageconsortium.de Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Literaturempfehlung: Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern Literaturempfehlung: Quelle: FCIA, fibre channel industry association, 2008 Deuschle Storage Business Consulting, München 2009 - Reprint-Reproduction Forbidden Without Permission - Alle Rechte bei den genannten Unternehmen-/Eigentümern