ARCHIVTAUGLICHE DATEIFORMATE
Transcription
ARCHIVTAUGLICHE DATEIFORMATE
CC DALA Kompetenzzentrum (digitales) Aktenmanagement und Langzeitarchivierung Aktenmanagement und Langzeitarchivierung: ARCHIVTAUGLICHE DATEIFORMATE Standards für die Archivierung digitaler Unterlagen Stand: November 2009 Nur eine kleine Auswahl der vielen verschiedenen Dateiformate ist für die Archivierung tauglich. Diese Übersicht basiert auf dem Katalog archivischer Dateiformate der KOST1, den Standards des Schweizerischen Bundesarchivs2 sowie den Empfehlungen des Florida Center for Library Automation3. Für weiterführende Informationen über archivtaugliche Dateiformate wird an die genannten Dokumente verwiesen. Die Dateiformate lassen sich in sieben für Archive relevante Formatkategorien einteilen. Für jede dieser Kategorien gibt es bestimmte geeignete Dateiformate, welche auf Grund verschiedener Kriterien zum momentanen Zeitpunkt für die Archivierung tauglich sind. Kriterien sind unter anderem Funktionalität, Offenheit, Format-Spezifikation, Lizenzfreiheit, Verbreitung, Akzeptanz, Implementation oder Entwicklungspotential. 1 KOST: Katalog archivischer Dateiformate. Version 1.0, Bern, 19. Dezember 2007. Vgl. ULR: http://www.kost-ceco.ch/wiki/whelp/KaD/ [Stand: 8. Mai 2008]. 2 Schweizerisches Bundesarchiv: Archivtaugliche Dateiformate. Standards für die Archivierung digitaler Unterlagen. Bern, Juli 2007. Vgl. URL: http://www.bar.admin.ch/dienstleistungen/00516/00517/index.html?lang=de&download=M3wBPgDB/8ull6Du36WenojQ1NTTjaXZnqWfVpzLhmfhnapmmc7Zi6rZnqCkkIN0gn2EbKbXrZ6lhuDZ z8mMps2gpKfo [Stand: 8. Mai 2008]. 3 http://www.fcla.edu/digitalArchive/pdfs/recFormats.pdf [Stand:21.Januar 2009] Freigabe DIP Informatikhandbuch 23030020 Aktenmanagement Langzeitarchivierung Dateiformate.docx Datum 31.03.1999 Dienst für Informatikplanung des Kantons St.Gallen Version 2.0 IHB 2 – 3.3 Seite 1 von 3 Formatkategorien Text (unstrukturiert) Allgemeine Bemerkungen "Nur text" ("plain Text") Dateiformate Textdatei 'Office' Dokumente Textformate (Doc, PDF, Nur-Text etc.) alle in PDF/A konvertieren; PDF/A4 Bilddaten Rastergrafiken Verlustfreie Kompression; Konvertierung in TIFF oder JPEG2000; TIFF6 JPEG20007 Bilddaten Vektorgrafiken Audiodaten SVG-Format verwenden oder Konvertierung in TIFF oder JPEG2000; Keine oder verlustfreie Kompression; Videodaten Der Entscheid für unkomprimierte oder verlustfrei komprimierte Speicherung hängt vom Datenumfang ab. Möglichst lange Migrationszyklen anstreben, um häufige Migrationen zu vermeiden; Migration in MJPEG2000; SVG8 WAVE9; Auflösung: 24bit; Abtastrate: 96kHz; MJPEG200010 Begründung Als Archivformat verbreitet, da sehr lange erhaltbar; seit langem im Einsatz; Einbettung aller Inhalte (Formatierung, Layout, Multimedia etc.);5 Offener Standard, weit verbreitet, geeignet für Migration; Verlustfreie Komprimierung, bedeutende Entwicklung absehbar; Für Vektorgrafiken sehr geeignet; Dateiendungen .txt (UTF-8, UTF-16) Weit verbreitet, verlustfreie Speicherung, dafür grosse Dateien Verlustfreie Kompression, geeignet für Migration; .wav .pdfa .tif, .tiff .jp2, .jpg2 u.a. .svg u.a. .mj2, .mjp2 4 Portable Document Format/Archive (ISO 19005-1) 5 Eine für die Zukunft mögliche Alternative wäre Open Document Format ODF. ODF beruht auf OpenOffice.org, ist jedoch nur mit OpenOffice.org applikabel und bisher noch wenig verbreitet. 6 Tagged Image File Format(unkromprimiert) 7 Join Photographic Experts Group 2000 8 Scalable Vector Graphics 9 Waveform audio format 10 Moving Join Picture Experts Group 2000 Freigabe DIP Informatikhandbuch 23030020 Aktenmanagement Langzeitarchivierung Dateiformate.docx Datum 31.03.1999 Dienst für Informatikplanung des Kantons St.Gallen Version 2.0 IHB 2 – 3.3 Seite 2 von 3 Formatkategorien Strukturierte Daten: Tabellenkalkulation * Allgemeine Bemerkungen Die Wahl des Dateiformates hängt davon ab, ob die Funktionalität der Tabellenkalkulation oder nur die optische Erscheinung nötig ist. Dateiformate XLS11 PDF/A Strukturierte Daten: Datenbanken Vorübergehende Abhängigkeit von bisherigem, funktional etwas überholtem Dateiformat; Hoffnungsvolles Dateiformat für die Zukunft absehbar; CSV12 SQLX13 Begründung Funktionalität der Tabellenkalkulation bleibt erhalten; Migration in aktuelle Version des Dateiformates nötig; Geeignet, wenn nur optische Erscheinung notwendig ist; Weit verbreitet und bewährt, jedoch funktional etwas überholt; Noch nicht ausgereift und verbreitet, hat aber viel Potential; Dateiendungen .xls .pdfa .csv .sqlx * Bei diesem Dateityp bietet das Staatsarchiv gerne weitere Unterstützung an, da zum heutigen Zeitpunkt noch keine definitiven Empfehlungen vorhanden sind. Allgemeiner Hinweis: Die Liste der akzeptierten Formate ist klein. Geringe Mengen an Dateien müssen in eines dieser Formate umgewandelt werden. Oft sind jedoch grössere Mengen an Dateien bereits in anderen Formaten vorhanden, z.B. PDF, JPEG oder MP3. Das Staatsarchiv bietet in diesen Fällen gerne Beratung zum weiteren Vorgehen an. 11 Excel Spreadsheet 12 Comma/Colon/Character-Separated-Values 13 Verbindung von SQL Structured Query Language und XML Extended Markup Language Freigabe DIP Informatikhandbuch 23030020 Aktenmanagement Langzeitarchivierung Dateiformate.docx Datum 31.03.1999 Dienst für Informatikplanung des Kantons St.Gallen Version 2.0 IHB 2 – 3.3 Seite 3 von 3