Interpretation digitaler Daten

Transcription

Interpretation digitaler Daten
Datengau in meinem Bildarchiv?
Nein danke!
Sichere Langzeitarchivierung digitaler Fotografien
Workshop TU Wien – Wirtschaftskammer Wien
Wolfgang Krautzer
Andreas Rauber
Studio Laxenburg
Johannesplatz 4
2361 Laxenburg
Inst. f. Softwaretechnik und
Interaktive Systeme
TU Wien
Favoritenstr. 9-11/188
http://www.ifs.tuwien.ac.at/~andi
http://studio-laxenburg.at
.................................................
Fotoarchive und Werte
ƒ Meist übersteigt der Wert eines Archivs deutlich die Kosten der
Archivierung.
ƒ Erst der Verlust aller Daten macht den Wert verständlich
ƒ Die Hochwasserkatastrophe als privater (analoger) Datengau
ƒ Die subjektive Bewertung ist unabdingbar!
ƒ Erst durch deutliche Formulierung der Bewertung kann ich
Entscheidungen treffen.
.................................................
Einleitung
ƒ Digitale Fotografie bietet unzählige Vorteile
ƒ Elektronische/Digitale Speicherung von Information
generell hat zahlreiche Vorteile
-> Digitalisierungsprojekte
aber:
ƒ Diese Information ist ungleich anfälliger
- Datenträger
- Dateiformate
- Metadaten
ƒ Erfordert neue Lösungen um langfristige Bewahrung
der Daten sicherzustellen
-> Digitale Langzeitarchivieurng (DLZA / DP)
.................................................
Einleitung
ƒ Problemstellung “DigitaleLangzeitarchivierung”
ƒ 2 Ebenen der Bedrohung digitaler Daten
- Physische Ebene: Speicherung:
- Probleme und Lösungsansätze
- Praxiserfahrungen
- Empfehlungen, best practice
- Logische Ebene: Formate
- Probleme & Lösungsansätze
- Praxiserfahrungen, Probleme bei Standard-Konvertierung
- Empfehlungen
ƒ Ausblick: Trainings & Service-Modell Entwicklung
.................................................
Speicherung digitaler Daten
.................................................
Speicherung digitaler Daten
ƒ Datenträger haben nur beschränkte Haltbarkeit
- Errechnet vs. Laborbedingungen vs. real
- Vorhersagbarkeit
ƒ Datenträger sind anfällig auf unterschiedliche “Störungen”
- magnetisch, mechanisch, Licht
ƒ Datenträger erfordern regelmäßiges Handling
- Umspulen, HDD in Betrieb, DVDs senkrechte Lagerung
ƒ Datenträger sind für unterschiedliche Datenmengen
geeignet
- CD/DVD wenige GB, ext. HDD bis zu 1TB, RAID Systeme,
Bandsysteme
ƒ Datenträger erfordern spezifische HW
- Laufwerke, Treiber
.................................................
Speicherung digitaler Daten
CD/DVD, hoch kompatibel aber sehr unpraktisch
ƒ Haltbarkeit DVD, Qualitätsunterschiede
ƒ Handling: Suchen und Finden
ƒ Kopieren von großer Anzahl von DVDs
ƒ Redundanz
.................................................
Speicherung digitaler Daten
ƒ RAID Systeme, gebunden an Server oder als freie
Netzwerkspeicher (NAS) sind das Gebot der Stunde
.................................................
Speicherung digitaler Daten
Best Practice
ƒ Redundante Speicherung
ƒ An physisch getrennten Orten
ƒ Unterschiedliche Technologien od. DatenträgerMarken/Serien
ƒ Regelmäßige Verifikation
ƒ RAID-5 Speicherung
ƒ DVDs:
- nur bei kleinen Datenmengen praktikabel
- qualitativ hochwertige Rohlinge
- qualitativ hochwertiger Brenner
ƒ Externe Festplatten
- Qualitativ hochwertige Platten
- Regelmäßig in Betrieb nehmen und prüfen
.................................................
Interpretation digitaler Daten
.................................................
Interpretation digitaler Daten
ƒ Objekte müssen von Datenträger gelesen werden
- Verfügbarkeit von Lesegeräten
- Haltbarkeit der Datenträger
ƒ Digitale Objekte brauchen eine definierte Umgebung um
zugreifbar zu sein:
- Dateien brauchen bestimmte Programme
- Programme brauchen bestimmte Betriebssysteme (-versionen)
- Betriebssysteme brauchen bestimmte Hardware-Komponenten
ƒ SW/HW Umgebung ist nicht stabil:
-
Dateien können nicht geöffnet werden
Metadaten können nicht interpretiert werden
eingebettet Objekte sind nicht zugreifbar
Programme laufen nicht
Information in digitaler Form ist verloren
.................................................
Interpretation digitaler Daten
ƒ Verschiedene Ansätze zur Langzeitbewahrung
ƒ Investment Strategien:
- Standardisierung, Datenextraktion, Encapsulation,
Formatbeschränkung
ƒ Kurzfristige Ansätze:
- Museum, Rückwärtskompatibilität, Versionsmigration,
Reengineering
ƒ Mittel-/langfristig Ansätze:
- Migration, Viewer, Emulation, (UVC)
ƒ Alternative Ansätze:
- Nicht-digitale Ansätze, Daten-Archäologie
ƒ Keine optimale Lösung für alle Objekte
.................................................
Interpretation digitaler Daten
Migration:
ƒ Transformation in anderes Format, kontinuierlich oder
on-demand (Viewer)
+ Verbreitet im Einsatz
+ Vergleich mit un-migriertem Objekt zum Zeitpunkt der
Migration
+ Jederzeit zugreifbar
- Unerwünschte Änderungen unmittelbar oder über mehrere
Migrationsschritte
- Nicht für alle Objekte anwendbar
- Kontinuierliche Migration erforderlich
.................................................
Interpretation digitaler Daten
Emulation:
ƒ Emulation von Hardware oder Software
+ Prinzipien weit verbreitet
+ Zahlreiche Emulatoren verfügbar
+ Potentiell vollständige Funktionalitätsbewahrung
+ Objekt wird unverändert nutzbar gemacht
- Objekt wird unverändert nutzbar gemacht
- Komplexe Technologie, Forschungsaufwand
- Erfordert in Zukunft Erfahrung im Umgang mit derzeitigen
Systemen
- Emulatoren müssen ebenfalls migriert/emuliert werden
- Emulatoren bei komplexen Systemen potentiell fehlerhaft
.................................................
Interpretation digitaler Daten
Kodak DCR Format als Beispiel
.................................................
Interpretation in Photoshop
.................................................
Interpretation im Vergleich
.................................................
Interpretation digitaler Daten
ƒ Jeder RAW Konverter (und jede in der Kamera
eingebaute JPG Interpretation) liefert andere
Ergebnisse
ƒ Software zur Interpretation wird nicht zwingend
fortgesetzt
ƒ Die bestmögliche Interpretation erfordert durchwegs
Expertenwissen
.................................................
Interpretation digitaler Daten
Best Practice
ƒ Aufheben des Originals (RAW) für eventuelle
Verbesserungen in der Interpretation und als “Original”
ƒ Umwandlung in ein stabiles Standardformat:
- TIFF (mit LZW Komprimierung)
- JPEG nur low-quality Surrogat
ƒ Einbinden in eine Datenbank die alle (auch RAW
Formate) interpretieren kann
.................................................
Ausblick: Servicemöglichkeiten
im Bereich der Dig. Fotografie
ƒ Entwicklung eines LZA-Service-Systems
ƒ Anbieten von Services ähnlich Antiviren-SW / Firewall
ƒ Datensicherheit (Bit-level Preservation)
- Datenträger-Migration, sichere Speicherung und Verwaltung
ƒ Bewahrung der Information
-
Migration auf geeignete aktuelle Dateiformate
Bewahrung der Metadaten, Speicherplatz, Bildqualität,...
Qualitätssicherung der zum Einsatz kommenden Werkzeuge
Experten erstellen Migrationsregeln & Parameter
ƒ Vertrauenswürdiges Digitales Langzeit-Archiv
- Aufbau eines DLZA Systems
- Zertifizierung
ƒ DME: Digital Memory Engineering
.................................................
http://www.ifs.tuwien.ac.at/dp
.................................................