Dr. Andrea Hänger, Dr. Sina Westphal

Transcription

Dr. Andrea Hänger, Dr. Sina Westphal
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Dr. Andrea Hänger • Dr. Sina Westphal
Informationsforum Bundesarchiv Berlin
14. Januar 2014
14.01.2014
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Gliederung
-
Allgemeiner Überblick
-
Digitale Objekttypen
-
Aussonderungsbeispiel
-
PreIngest Toolset (Pit)
Pit)
-
Bestandserhaltungstool (BET)
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
2
1
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
3
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Erste Erfahrungen – Sonderfälle für
Spezialisten
Daten aus 180 Fachverfahren von Stellen des Bundes und der DDR,
ca. 300.000 Dateien
Inhalte:
– Verwaltung von personenbezogenen Daten (z. B.
Kaderdatenspeicher, Häftlingsdaten)
– statistische Auswertungen (v. a. Staatliche Zentralverwaltung für
Statistik, Bundesanstalt für Arbeit)
– Planung und Lenkung (z. B. Studienbewerber,
Eingabenprojekte)
Laufzeit: 1970-2000
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
4
2
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Das Kerngeschäft wird digital …
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
5
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Ausgangssituation
2006
Bundesverwaltung
Keine Schnittstellen,
Schnittstellen, heterogene
Metadaten
Verschiedene DMS/VBSProjekte
?
DOMEA
Documentum
SER
VISkompakt
Fabasoft
Favorit
[...]
6
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
6
3
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digitales Archiv
Seit 2008
DMS/VBS-Systeme
Aussonderungsmodule
SIP
Mapping XBARCH
AIP
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
7
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digitales Archiv
Seit 2008
DMS/VBS-Systeme
Aussonderungsmodule
SIP
Mapping XBARCH
AIP
SIP
(Mapping XBARCH)
AIP
PreIngestPreIngest-Toolset PIT
File-Systeme
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
8
4
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digitales Archiv
Seit 2008
DMS/VBS-Systeme
Aussonderungsmodule
SIP
Mapping XBARCH
AIP
SIP
(Mapping XBARCH)
AIP
SIP
(Mapping XBARCH)
AIP
PreIngestPreIngest-Toolset PIT
File-Systeme
Seit 2011
PreIngestPreIngest-Toolset PIT
Datenbanken
SIARD
BET – Bestandserhaltungstool (Preservation Planning)
Dr. Andrea Hänger • Dr. Sina Westphal
9
14.01.2014
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digitales Archiv
Seit 2008
DMS/VBS-Systeme
Aussonderungsmodule
SIP
Mapping XBARCH
AIP
TR-ESOR 03125
PreIngestPreIngest-Toolset PIT
File-Systeme
Seit 2011
SIP
(Mapping XBARCH)
AIP
SIP
(Mapping XBARCH)
AIP
Zugangssystem
BASYS – 2
INVENIO
PreIngestPreIngest-Toolset PIT
Datenbanken
SIARD
VSGeheimarchiv
BET – Bestandserhaltungstool (Preservation Planning)
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
10
5
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Archivfähige Digitale Objekttypen
-
Daten aus File-Systemen
- Klassische Office-Ablage
- Mediendateien (Filme, Bilder, Tö
Töne)
- Daten aus E-Akten
- Dokumentenmanagement-Systeme
- Vorgangsbearbeitungs-Systeme
- Produktbeispiele: Domea,
Domea, Favorit, Fabasoft
- Daten aus Datenbanken
- Relationale Datenbanken
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
11
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digitale Objekttypen: Archivierung
Aussonderung
 Anbietung der
elektronischen
Unterlagen an das
zustä
zuständige Archiv
 Bewertung der
Unterlagen durch
das Archiv
 Vernichtung
nicht archivwürdiger
Unterlagen
Quelle: Organisationskonzept elektronische Verwaltungsarbeit – E-Akte, S. 45.
http://www
cln_339/
_339/nn
nn_2062562/
_2062562/SharedDocs
SharedDocs/Publikationen/Organisation/e__
/Publikationen/Organisation/e__akte
akte..html?__
nnn=
=true
http://www..verwaltung-innovativ.de/
verwaltung-innovativ.de/cln
html?__nnn
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
12
6
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digitale Objekttypen: File-Systeme
jpg tiff zip mpg
mov wmv tiff db
 Unstrukturierte Daten
 Teilweise Hybridakten
 Vielzahl an Formaten
 Teilweise nicht mehr
verkehrsfä
verkehrsfähig
Wichtig!
 Sind dem zustä
zuständigen Archiv
anzubieten soweit sie aktenrelevante
Inhalte enthalten!
Unstrukturierte Dateiablage
Daten aus File-Systemen
...
 Vorerst Abgabe auf Datenträ
Datenträgern
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
13
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digitale Objekttypen: E-Akten
Definition
E-Akten sind aus DMS oder VBS hervorgegangene elektronische Unterlagen, die
zunehmend an die Stelle der herkö
herkömmlichen Papierakte treten. In der Regel weisen
auch E-Akten die Struktur Akte – Vorgang – Dokument auf (Produktbeispiele:
Domea,
Domea, Fabasoft).
Fabasoft).
Dokumentenmanagement-Systeme (DMS) Vorgangsbearbeitungs-Systeme (VBS)
 Teilstrukturierte Prozesse
 Strukturierte Prozesse
 häufig Sachakten
 häufig Fallakten
Neu!
Wichtig!
Gesetz zur Fö
Förderung der
elektronischen Verwaltung (25. Juli
2013)
Bei der Einfü
Einführung der E-Akte in Rü
Rücksprache
mit dem Bundesarchiv Schnittstelle fü
für die
spä
spätere Aussonderung einplanen
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
14
7
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digitale Objekttypen: Relationale Datenbanken
 Datenbanken sind die tragende Sä
Säule der modernen
Informationsgesellschaft und dienen der Verwaltung und
Bereitstellung groß
großer Datenmengen. Sie sind daher potentiell
archivwü
archivwürdig.
 Die SIARD Suite dient dazu, Datenbankinhalte langfristig zu archivieren und
basiert auf dem offenen SIARD-Standard (Software-Independent Archival of
Relational Databases)
Databases)
 Konvertierung relationaler Datenbanken in ein SIARD-Format, das auf
internationalen Standards basiert – etwa den ISO-Normen Unicode,
Unicode, XML,
SQL1999 und dem Industriestandard ZIP
 Erfassung der Daten (Metadaten und Primä
Primärdaten), die eine „Relationale
Datenbank“
Datenbank“ umschreiben (u.a. Schema, Tabellen-, Felddefinitionen, PK,
FK, Views)
Views)
Dr. Andrea Hänger • Dr. Sina Westphal
15
14.01.2014
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Formathäufigkeit in einem exemplarischen SIP (File)
F
Name / Typ
MB
F
Name / Typ
MB
ppt
Power Point File (1997-2003)
12.623
shs
Shell scrap object
124
doc
Microsoft Word (1997-2003)
3.774
pptx
Power Point (ab 2007)
101
Rich Text Format
94
mpg
Videoformat
2.943
rtf
pdf
Textformat
1.877
tmp
Temporary file
82
xls
Microsoft Excel (1997-2003)
1.649
xps
XML Paper Specification
44
mdb
Datenbankformat
1.604
bmp
Bitmap Graphik file
43
zip
Containerformat
1.037
docx
Microsoft Word (ab 2007)
36
jpg
Bildformat
960
z0+
Gesplittete Zip-Datei
28
mov
Videoformat
584
xlk
Microsoft Excel / Backup
20
wmv
Videoformat
283
ber
Numbers-Dokument
10
Weitere Formate: pps,
pps, png,
png, xlsm,
xlsm, pot,
pot, wbk,
wbk, xlsx,
xlsx, gif,
gif, dat,
dat, tif,
tif, msg,
msg, ink,
ink, vers,
vers, docm,
docm, txt, svg
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
16
8
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Formathäufigkeit in einem exemplarischen SIP (File)
mdb
zip
jpg
ppt
doc
mpg
pdf
xls
mdb
zip
jpg
mov
wmv
shs
pptx
rtf
tmp
xps
bmp
docx
z0+
mov
xls
ppt
pdf
mpg
doc
xlk
ber
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
17
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Formathäufigkeit in einem exemplarischen SIP (File)
Bearbeitungsschritte vor der Strukturierung der Daten im PIT
 Kopieren der Daten auf die Festplatte des Clients (mö
(möglichst in das Verzeichnis C)
auf dem die spä
spätere Bearbeitung mit dem PIT erfolgt
 Fehlerkontrolle des Kopiervorgangs
 Laden der Daten in den PIT
 Formatanalyse
 Strukturierung der Daten
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
18
9
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
PreIngest Toolset (PIT): Funktionen
 Tool des Bundesarchivs zur Strukturierung
von Daten (PreIngest) vor dem Import in
das Digitale Archiv des Bundesarchivs
- Automatische Protokollierung aller
Aktionen
- Sortier- und Löschfunktionen
- Erweiterte Eingabemöglichkeiten für
Metadaten und Vererbungsfunktionen
- Möglichkeiten zur Definition von
Bildungsregeln
- Formatprüfung und – validierung
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
19
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
PreIngest Toolset (PIT): Formaterkennung
 Formaterkennung und Validierung:
Validierung: Mit Unterstü
Unterstützung der Tools Pronom
und Jhove,
Jhove, inklusive Dublettenprü
Dublettenprüfung
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
20
10
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
PreIngest Toolset (PIT): Strukturierung
 Strukturierung nach festen
Regeln – z.B.:
- Ein Datenpaket pro Datei
- Ein Datenpaket fü
für alle Dateien
eines Verzeichnisses
- Ein Datenpaket fü
für alle
Bilddateien
 Bildung neuer Einheiten / Ordner
 Freies Umsortieren
 Protokolliertes Kassieren von
Dateien mö
möglich
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
21
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
PreIngest Toolset (PIT): Lieferung
Datenpakete der
Lieferung
zuweisen:
- in Einzelpaketen
- als Gesamtpaket
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
22
11
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
PreIngest Toolset (PIT): Praxisbeispiele & Ausblick
 Daten der
Gesundheitsministerkonferenz
 Kontinuierliche Weiterentwicklung
des Tools mit Kooperationspartnern
 Wechselnder Vorsitz, Daten in
Ordnerstrukturen abgelegt (File)
und können mit dem PIT in
strukturierter Form übernommen
werden
 Zukünftig weitere Funktionen
möglich
 z.B. Bereitstellung des PITs zur
Nutzung in Behörden
 Daten der Bundeswehr (teilweise
im Einsatz entstanden, FileAblage)
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
23
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digital Preservation Management (DPM): Ziele
 Steuerung von Wissens- und Prozessmanagement als Bausteine der
Digitalen Bestandserhaltung
 Bestandserhalterische Maß
Maßnahmen sind angesichts der vielfä
vielfältigen
Gefä
Gefährdungen durch innere und äußere Faktoren zur dauerhaften
Erhaltung von analogem und digitalem Archivgut unerlä
unerlässlich
 Während die „traditionelle“
traditionelle“ Bestandserhaltung auf einen groß
großen
Erfahrungsschatz und bewä
bewährte Methoden zurü
zurückgreifen kann, ist die
Bestandserhaltung digitaler Daten aufgrund des geringeren
Erfahrungsschatzes, aber vor allem aufgrund der sich regelmäß
ig
regelmäßig
wandelnden technischen Grundlagen in bestä
beständiger Anpassung begriffen
 Vor diesem Hintergrund steigt die Bedeutung der Pflege relevanter
Informationen sowie der systematischen Überwachung aller Prozesse im
Digitalen Archiv.
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
24
12
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digital Preservation Management (DPM): Maßnahmen
 Kontinuierliche Bestandserhaltung
- Zusammenfü
Zusammenführung dezentral vorgehaltener Informationen zur
Datenerhaltung
- Nachhaltige Überwachung aller wesentlichen Aspekte der digitalen
Bestandserhaltung
- Erhaltung definierter Eigenschaften bzw. Charakteristika der originalen
Objekte in ihrer ursprü
ursprünglichen Form
- z.B. archivwü
archivwürdige Inhalte, Lesbarkeit, Formatierung, Strukturierung
 Effizientes Informations- / Bestandserhaltungsmanagement
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
25
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digital Preservation Management (DPM): Technik
 In Entwicklung seit Ende 2011
 Browser basiertes Tool
 Client: Java-Runtime
Java-Runtime--Environment (JRE)
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
26
13
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digital Preservation Management (DPM): Überblick
Bestandserhaltungskreislauf
i2
in
i1
Sta tus Q uo
Besta ndserha ltung
Themen
Update, Log
• Eigenschaften
Umsetzung
M onitoring
Plan
Alarm
Pla nung
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
27
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digital Preservation Management (DPM): HauptTabs
 Status Quo: Festlegung der grundlegenden Erhaltungsstrategien und
Standards
 Monitoring:
Monitoring: Prü
Prüfung, ob die getroffenen Festlegungen weiterhin Bestand haben,
Nutzung unterschiedlicher Informationsquellen (i1, i2...), laufen (im Status quo
festgelegte) Fristen ab, wird ein Alarm ausgelö
ausgelöst (z.B. neue Formatversionen)
 Planung: Analyse und Bewertung der Alarme, Erstellung eines Plans
 Umsetzung
 Historie
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
28
14
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Digital Preservation Management (DPM): Ausblick
 Kontinuierliche Weiterentwicklung
des Tools mit Kooperationspartnern
 Zukünftig weitere Funktionen
 z.B. Steuerung der Migration
 Quellen im Monitoring, ggf.
Verlinkung mit google alerts,
Pronom usw.
 Dashboard
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
29
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Zusammenfassung
 Sowohl das PreIngest Toolset als auch das Digital Preservation
Management werden zwar bereits in der täglichen Arbeit des
Digitalen Archivs eingesetzt, sind aber zugleich noch in der
Entwicklung begriffen
 Wir befinden uns damit in einem Stadium, in dem wir ganz
besonders von Anregungen und kritischen Fragen profitieren
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
30
15
Das Digitale Archiv des Bundesarchivs
Aktueller Stand
Vielen Dank für
Ihre Aufmerksamkeit !
Haben Sie noch Fragen?
Kontakt:
a.haenger@bundesarchiv.de
s.westphal@bundesarchiv.de
Dr. Andrea Hänger • Dr. Sina Westphal
14.01.2014
31
16