Dr. Andrea Hänger, Dr. Sina Westphal
Transcription
Dr. Andrea Hänger, Dr. Sina Westphal
Das Digitale Archiv des Bundesarchivs Aktueller Stand Dr. Andrea Hänger • Dr. Sina Westphal Informationsforum Bundesarchiv Berlin 14. Januar 2014 14.01.2014 Das Digitale Archiv des Bundesarchivs Aktueller Stand Gliederung - Allgemeiner Überblick - Digitale Objekttypen - Aussonderungsbeispiel - PreIngest Toolset (Pit) Pit) - Bestandserhaltungstool (BET) Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 2 1 Das Digitale Archiv des Bundesarchivs Aktueller Stand Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 3 Das Digitale Archiv des Bundesarchivs Aktueller Stand Erste Erfahrungen – Sonderfälle für Spezialisten Daten aus 180 Fachverfahren von Stellen des Bundes und der DDR, ca. 300.000 Dateien Inhalte: – Verwaltung von personenbezogenen Daten (z. B. Kaderdatenspeicher, Häftlingsdaten) – statistische Auswertungen (v. a. Staatliche Zentralverwaltung für Statistik, Bundesanstalt für Arbeit) – Planung und Lenkung (z. B. Studienbewerber, Eingabenprojekte) Laufzeit: 1970-2000 Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 4 2 Das Digitale Archiv des Bundesarchivs Aktueller Stand Das Kerngeschäft wird digital … Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 5 Das Digitale Archiv des Bundesarchivs Aktueller Stand Ausgangssituation 2006 Bundesverwaltung Keine Schnittstellen, Schnittstellen, heterogene Metadaten Verschiedene DMS/VBSProjekte ? DOMEA Documentum SER VISkompakt Fabasoft Favorit [...] 6 Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 6 3 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digitales Archiv Seit 2008 DMS/VBS-Systeme Aussonderungsmodule SIP Mapping XBARCH AIP Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 7 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digitales Archiv Seit 2008 DMS/VBS-Systeme Aussonderungsmodule SIP Mapping XBARCH AIP SIP (Mapping XBARCH) AIP PreIngestPreIngest-Toolset PIT File-Systeme Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 8 4 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digitales Archiv Seit 2008 DMS/VBS-Systeme Aussonderungsmodule SIP Mapping XBARCH AIP SIP (Mapping XBARCH) AIP SIP (Mapping XBARCH) AIP PreIngestPreIngest-Toolset PIT File-Systeme Seit 2011 PreIngestPreIngest-Toolset PIT Datenbanken SIARD BET – Bestandserhaltungstool (Preservation Planning) Dr. Andrea Hänger • Dr. Sina Westphal 9 14.01.2014 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digitales Archiv Seit 2008 DMS/VBS-Systeme Aussonderungsmodule SIP Mapping XBARCH AIP TR-ESOR 03125 PreIngestPreIngest-Toolset PIT File-Systeme Seit 2011 SIP (Mapping XBARCH) AIP SIP (Mapping XBARCH) AIP Zugangssystem BASYS – 2 INVENIO PreIngestPreIngest-Toolset PIT Datenbanken SIARD VSGeheimarchiv BET – Bestandserhaltungstool (Preservation Planning) Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 10 5 Das Digitale Archiv des Bundesarchivs Aktueller Stand Archivfähige Digitale Objekttypen - Daten aus File-Systemen - Klassische Office-Ablage - Mediendateien (Filme, Bilder, Tö Töne) - Daten aus E-Akten - Dokumentenmanagement-Systeme - Vorgangsbearbeitungs-Systeme - Produktbeispiele: Domea, Domea, Favorit, Fabasoft - Daten aus Datenbanken - Relationale Datenbanken Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 11 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digitale Objekttypen: Archivierung Aussonderung Anbietung der elektronischen Unterlagen an das zustä zuständige Archiv Bewertung der Unterlagen durch das Archiv Vernichtung nicht archivwürdiger Unterlagen Quelle: Organisationskonzept elektronische Verwaltungsarbeit – E-Akte, S. 45. http://www cln_339/ _339/nn nn_2062562/ _2062562/SharedDocs SharedDocs/Publikationen/Organisation/e__ /Publikationen/Organisation/e__akte akte..html?__ nnn= =true http://www..verwaltung-innovativ.de/ verwaltung-innovativ.de/cln html?__nnn Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 12 6 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digitale Objekttypen: File-Systeme jpg tiff zip mpg mov wmv tiff db Unstrukturierte Daten Teilweise Hybridakten Vielzahl an Formaten Teilweise nicht mehr verkehrsfä verkehrsfähig Wichtig! Sind dem zustä zuständigen Archiv anzubieten soweit sie aktenrelevante Inhalte enthalten! Unstrukturierte Dateiablage Daten aus File-Systemen ... Vorerst Abgabe auf Datenträ Datenträgern Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 13 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digitale Objekttypen: E-Akten Definition E-Akten sind aus DMS oder VBS hervorgegangene elektronische Unterlagen, die zunehmend an die Stelle der herkö herkömmlichen Papierakte treten. In der Regel weisen auch E-Akten die Struktur Akte – Vorgang – Dokument auf (Produktbeispiele: Domea, Domea, Fabasoft). Fabasoft). Dokumentenmanagement-Systeme (DMS) Vorgangsbearbeitungs-Systeme (VBS) Teilstrukturierte Prozesse Strukturierte Prozesse häufig Sachakten häufig Fallakten Neu! Wichtig! Gesetz zur Fö Förderung der elektronischen Verwaltung (25. Juli 2013) Bei der Einfü Einführung der E-Akte in Rü Rücksprache mit dem Bundesarchiv Schnittstelle fü für die spä spätere Aussonderung einplanen Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 14 7 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digitale Objekttypen: Relationale Datenbanken Datenbanken sind die tragende Sä Säule der modernen Informationsgesellschaft und dienen der Verwaltung und Bereitstellung groß großer Datenmengen. Sie sind daher potentiell archivwü archivwürdig. Die SIARD Suite dient dazu, Datenbankinhalte langfristig zu archivieren und basiert auf dem offenen SIARD-Standard (Software-Independent Archival of Relational Databases) Databases) Konvertierung relationaler Datenbanken in ein SIARD-Format, das auf internationalen Standards basiert – etwa den ISO-Normen Unicode, Unicode, XML, SQL1999 und dem Industriestandard ZIP Erfassung der Daten (Metadaten und Primä Primärdaten), die eine „Relationale Datenbank“ Datenbank“ umschreiben (u.a. Schema, Tabellen-, Felddefinitionen, PK, FK, Views) Views) Dr. Andrea Hänger • Dr. Sina Westphal 15 14.01.2014 Das Digitale Archiv des Bundesarchivs Aktueller Stand Formathäufigkeit in einem exemplarischen SIP (File) F Name / Typ MB F Name / Typ MB ppt Power Point File (1997-2003) 12.623 shs Shell scrap object 124 doc Microsoft Word (1997-2003) 3.774 pptx Power Point (ab 2007) 101 Rich Text Format 94 mpg Videoformat 2.943 rtf pdf Textformat 1.877 tmp Temporary file 82 xls Microsoft Excel (1997-2003) 1.649 xps XML Paper Specification 44 mdb Datenbankformat 1.604 bmp Bitmap Graphik file 43 zip Containerformat 1.037 docx Microsoft Word (ab 2007) 36 jpg Bildformat 960 z0+ Gesplittete Zip-Datei 28 mov Videoformat 584 xlk Microsoft Excel / Backup 20 wmv Videoformat 283 ber Numbers-Dokument 10 Weitere Formate: pps, pps, png, png, xlsm, xlsm, pot, pot, wbk, wbk, xlsx, xlsx, gif, gif, dat, dat, tif, tif, msg, msg, ink, ink, vers, vers, docm, docm, txt, svg Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 16 8 Das Digitale Archiv des Bundesarchivs Aktueller Stand Formathäufigkeit in einem exemplarischen SIP (File) mdb zip jpg ppt doc mpg pdf xls mdb zip jpg mov wmv shs pptx rtf tmp xps bmp docx z0+ mov xls ppt pdf mpg doc xlk ber Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 17 Das Digitale Archiv des Bundesarchivs Aktueller Stand Formathäufigkeit in einem exemplarischen SIP (File) Bearbeitungsschritte vor der Strukturierung der Daten im PIT Kopieren der Daten auf die Festplatte des Clients (mö (möglichst in das Verzeichnis C) auf dem die spä spätere Bearbeitung mit dem PIT erfolgt Fehlerkontrolle des Kopiervorgangs Laden der Daten in den PIT Formatanalyse Strukturierung der Daten Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 18 9 Das Digitale Archiv des Bundesarchivs Aktueller Stand PreIngest Toolset (PIT): Funktionen Tool des Bundesarchivs zur Strukturierung von Daten (PreIngest) vor dem Import in das Digitale Archiv des Bundesarchivs - Automatische Protokollierung aller Aktionen - Sortier- und Löschfunktionen - Erweiterte Eingabemöglichkeiten für Metadaten und Vererbungsfunktionen - Möglichkeiten zur Definition von Bildungsregeln - Formatprüfung und – validierung Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 19 Das Digitale Archiv des Bundesarchivs Aktueller Stand PreIngest Toolset (PIT): Formaterkennung Formaterkennung und Validierung: Validierung: Mit Unterstü Unterstützung der Tools Pronom und Jhove, Jhove, inklusive Dublettenprü Dublettenprüfung Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 20 10 Das Digitale Archiv des Bundesarchivs Aktueller Stand PreIngest Toolset (PIT): Strukturierung Strukturierung nach festen Regeln – z.B.: - Ein Datenpaket pro Datei - Ein Datenpaket fü für alle Dateien eines Verzeichnisses - Ein Datenpaket fü für alle Bilddateien Bildung neuer Einheiten / Ordner Freies Umsortieren Protokolliertes Kassieren von Dateien mö möglich Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 21 Das Digitale Archiv des Bundesarchivs Aktueller Stand PreIngest Toolset (PIT): Lieferung Datenpakete der Lieferung zuweisen: - in Einzelpaketen - als Gesamtpaket Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 22 11 Das Digitale Archiv des Bundesarchivs Aktueller Stand PreIngest Toolset (PIT): Praxisbeispiele & Ausblick Daten der Gesundheitsministerkonferenz Kontinuierliche Weiterentwicklung des Tools mit Kooperationspartnern Wechselnder Vorsitz, Daten in Ordnerstrukturen abgelegt (File) und können mit dem PIT in strukturierter Form übernommen werden Zukünftig weitere Funktionen möglich z.B. Bereitstellung des PITs zur Nutzung in Behörden Daten der Bundeswehr (teilweise im Einsatz entstanden, FileAblage) Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 23 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digital Preservation Management (DPM): Ziele Steuerung von Wissens- und Prozessmanagement als Bausteine der Digitalen Bestandserhaltung Bestandserhalterische Maß Maßnahmen sind angesichts der vielfä vielfältigen Gefä Gefährdungen durch innere und äußere Faktoren zur dauerhaften Erhaltung von analogem und digitalem Archivgut unerlä unerlässlich Während die „traditionelle“ traditionelle“ Bestandserhaltung auf einen groß großen Erfahrungsschatz und bewä bewährte Methoden zurü zurückgreifen kann, ist die Bestandserhaltung digitaler Daten aufgrund des geringeren Erfahrungsschatzes, aber vor allem aufgrund der sich regelmäß ig regelmäßig wandelnden technischen Grundlagen in bestä beständiger Anpassung begriffen Vor diesem Hintergrund steigt die Bedeutung der Pflege relevanter Informationen sowie der systematischen Überwachung aller Prozesse im Digitalen Archiv. Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 24 12 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digital Preservation Management (DPM): Maßnahmen Kontinuierliche Bestandserhaltung - Zusammenfü Zusammenführung dezentral vorgehaltener Informationen zur Datenerhaltung - Nachhaltige Überwachung aller wesentlichen Aspekte der digitalen Bestandserhaltung - Erhaltung definierter Eigenschaften bzw. Charakteristika der originalen Objekte in ihrer ursprü ursprünglichen Form - z.B. archivwü archivwürdige Inhalte, Lesbarkeit, Formatierung, Strukturierung Effizientes Informations- / Bestandserhaltungsmanagement Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 25 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digital Preservation Management (DPM): Technik In Entwicklung seit Ende 2011 Browser basiertes Tool Client: Java-Runtime Java-Runtime--Environment (JRE) Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 26 13 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digital Preservation Management (DPM): Überblick Bestandserhaltungskreislauf i2 in i1 Sta tus Q uo Besta ndserha ltung Themen Update, Log • Eigenschaften Umsetzung M onitoring Plan Alarm Pla nung Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 27 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digital Preservation Management (DPM): HauptTabs Status Quo: Festlegung der grundlegenden Erhaltungsstrategien und Standards Monitoring: Monitoring: Prü Prüfung, ob die getroffenen Festlegungen weiterhin Bestand haben, Nutzung unterschiedlicher Informationsquellen (i1, i2...), laufen (im Status quo festgelegte) Fristen ab, wird ein Alarm ausgelö ausgelöst (z.B. neue Formatversionen) Planung: Analyse und Bewertung der Alarme, Erstellung eines Plans Umsetzung Historie Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 28 14 Das Digitale Archiv des Bundesarchivs Aktueller Stand Digital Preservation Management (DPM): Ausblick Kontinuierliche Weiterentwicklung des Tools mit Kooperationspartnern Zukünftig weitere Funktionen z.B. Steuerung der Migration Quellen im Monitoring, ggf. Verlinkung mit google alerts, Pronom usw. Dashboard Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 29 Das Digitale Archiv des Bundesarchivs Aktueller Stand Zusammenfassung Sowohl das PreIngest Toolset als auch das Digital Preservation Management werden zwar bereits in der täglichen Arbeit des Digitalen Archivs eingesetzt, sind aber zugleich noch in der Entwicklung begriffen Wir befinden uns damit in einem Stadium, in dem wir ganz besonders von Anregungen und kritischen Fragen profitieren Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 30 15 Das Digitale Archiv des Bundesarchivs Aktueller Stand Vielen Dank für Ihre Aufmerksamkeit ! Haben Sie noch Fragen? Kontakt: a.haenger@bundesarchiv.de s.westphal@bundesarchiv.de Dr. Andrea Hänger • Dr. Sina Westphal 14.01.2014 31 16