Die Zahl der publizierten Informationen und Medien steigt unaufhörlich. Was kann und sollte archiviert werden?
Die rechtliche Grundlage der Tätigkeit der Archive in Bund, Ländern und Kommunen sind die vom jeweiligen Gesetzgeber verabschiedeten Archivgesetze. Andere Archivträger, etwa öffentlich-rechtliche Glaubensgemeinschaften, Anstalten des öffentlichen Rechts, juristische Personen des Privatrechts, auch Unternehmen regeln diese Tätigkeit in eigener Zuständigkeit. Entscheidend ist, dass Archivierung bei den Informationen bzw. ihrer Zusammenfassung in digitalen Akten, Datenbanken, Fachverfahren, Grafikdateien, Film- und Audiofiles etc. ansetzt. Die Medien im Sinne der gewählten Speichermedien spielen dabei insofern eine sekundäre Rolle. Sie verändern sich bereits während der Aufbewahrungsfrist digitaler Unterlagen.
Nehmen wir das Beispiel der Geburtsregister der Standesämter. Sie müssen 110 Jahre bei den Standesämter im jeweiligen Produktivsystem vorgehalten werden. Wie dies im Einzelfall geschieht – heute mittels moderner Systeme in Rechenzentren, früher durch Magnetsicherungsbänder für die Datensicherung – unterliegt dem technischen Fortschritt und damit einem ständigen Veränderungsprozess. Entscheidend sind die Daten, nicht die Speichermedien, die einem raschen Wechsel unterworfen sind. Dies ist ein wesentliches Kriterium im Unterschied zu einer Pergamenturkunde, bei der Text und Beschreibstoff und damit Daten und Datenträger wesentlich zusammengehören. Bei digitalen Unterlagen geht es um eine „Entmaterialisierung" der Information verbunden mit ihrer allgegenwärtigen Verfügbarkeit.
Sie sprechen mit Ihrer Frage auch das Thema einer Bewertung an. Es sind auch heute die Archivarinnen und Archivare, die anhand eingeführter Methoden zur Bewertung und vor dem Hintergrund ihres gesetzlichen oder vom Archivträger festgelegten Auftrages darüber entscheiden, was in die Zukunft überliefert und was vernichtet werden kann.
Die Unterlagen werden bei ihren Produzenten aus rechtlichen und wirtschaftlichen Gründen zeitlich befristet aufbewahrt. Nach Ablauf der Fristen werden diese Unterlagen im positiven Falle den Archiven angeboten und von den Archiven bewertet. Im Rahmen dieser archivarischen Bewertung werden die Informationen gefiltert in solche, die vernichtet werden können und solche, die als archivwürdig im gesetzlichen Sinne befunden werden. Als archivwürdig gelten dabei Unterlagen, die für die wissenschaftliche Forschung, zur Sicherung berechtigter Belange Betroffener oder Dritter oder für Zwecke der Gesetzgebung, Rechtsprechung oder Verwaltung von bleibendem Wert sind. Die juristische Funktion für den Archivträger zur Sicherung seiner eigenen Ansprüche sowie derjenigen der Bürgerinnen und Bürger und dann auch die kulturell-wissenschaftliche Bedeutung der Unterlagen sind also wesentliche Kriterien, die die Auswahl der Informationen aus der Gesamtmenge der angebotenen Unterlagen beeinflussen. Bei digital entstehenden Unterlagen ist es darüber hinaus generell nötig, bereits bei der Entstehung der Unterlagen und während der Zeit der Aufbewahrung dafür zu sorgen, dass sie authentisch und integer bleiben – und nicht zuletzt verkehrsfähig. Das heißt, dass sie weiterhin das Dokument bleiben, das zu sein sie vorgeben, dass sie nicht widerrechtlich und inhaltsentstellend verändert wurden und dass sie weiterhin über aktuelle Soft- und Hardware erreichbar sind.
JETZT HERUNTERLADEN
DIE DOKUMENTATION DIESER FACHDEBATTE
DIE DOKUMENTATION ENTHÄLT
Übersicht aller aktiven Debattenteilnehmer
Summary für Ihr Top-Management
Wie lässt sich ein effizientes Auffinden des gespeicherten Materials sicherstellen?
Hier kommt es darauf an, den gesamten Lebenszyklus einer Unterlage vom Beginn an zu denken. Bereits beim Produzenten der Informationen muss schon aus wirtschaftlichen Überlegungen ein effizientes Retrieval der Informationen gewährleistet sein. Die oft zu Unrecht gepriesene Volltextrecherche nach dem Google-Prinzip fördert unstrukturierte und zahlenmäßig große Treffermengen, deren Auswertung nicht effizient sein kann. Das liegt auch an der nicht normierten Vergabe oft mehrerer Schlagwörter zum gleichen Phänomen, z. B. Krankenhaus, Klinik, Klinikum, Hospital etc. Ein normiert sachsystematischer Thesaurus in der Gestalt eines Aktenplans hilft, die unterschiedlichen Teile von Akten gleichsam sachlogisch miteinander zu verknüpfen und unterschiedliche Informationseinheiten zu einem Vorgang oder einer Akte zu verbinden, die dann auch nach normierten Deskriptoren recherchiert werden können.
In den Archiven werden die Bestände nach Produzenten provenienzmäßig gebildet und heute mithilfe elektronischer Archivinformationssystemen verzeichnet. Diese Systeme sollten im Idealfall sowohl die wenig effiziente Volltextrecherche wie auch eine sachsystematische Recherche ermöglichen. Entscheidend ist dabei die Verbindung des digitalen Primärmaterials, z. B. der digitalen Fotos, mit Beschreibungsdaten (Metadaten), die von den SachbearbeiterInnen des Informationsproduzenten und / oder von den Archiven in das Archivinformationssystem eingegeben werden können. Das bedeutet etwa, bei der Volltextsuche linguistische, semantische und statistische Methoden einzubinden sowie den Suchraum durch eigene und fremde Kontexte zu erweitern – und zwar sowohl für die Ermittlung von Treffern als auch für deren Ranking.
Welchen Ansprüchen müssen Datenformate für eine langfristige Abrufbarkeit von digitalen Medien genügen?
Datenformate sollten austauschbar und auf möglichst vielen Plattformen mit einfachen und üblichen Tools lesbar sein. Bei der Übernahme etwa eines Fotonachlasses sind die üblichen Grafikformate tif oder jpg, die Beschreibungsdaten (Metadaten) in der Regel auf der Basis von xml (Extended Markup Language), das für Browser (Internet Explorer, Edge, Opera, Safari, Firefox) ohne Probleme lesbar und darstellbar ist.
Texte etwa sind im weltweiten Austauschstandard des PDF-Formats lesbar, wenn ein entsprechender Reader installiert ist. Bilder werden als jpg oder tif, Video- und Audiodateien in entsprechenden Quasi-Standards produziert und gelesen. Standardisierung und damit maximale Verfügbarkeit möglichst unabhängig von Betriebssystem oder einer einzigen Anwender-Software sind wesentliche Anzeichen für eine langfristige Verfügbarkeit. Aber auch hier ist nichts konstanter als der Wandel. Der Standard von Texten im DOS-Zeitalter war das Format .txt, das rasch – und die Veränderungsintervalle sind im Bereich der IT sehr kurzfristig – verändert wurde. Ein proprietäres Dateiformat würde erhebliche Probleme bei der Lauffähigkeit unter verschiedenen Betriebssystemen verursachen oder den User auf ein einziges monopolartiges System zwingen. Offenheit und Migrierbarkeit müssen aus meiner Sicht jedoch gegeben sein, wenn etwa digitale Dokumente zum Zeitpunkt ihrer heutigen Repräsentation nach Veränderungen eines Formatstandards nach Ablauf mehrerer Jahrzehnte in einer zweiten, dritten, vierten etc. Repräsentation verfügbar und von der Software von morgen und übermorgen gelesen werden soll.
Was hat – insofern welche vorliegen - mit den analogen Vorlagen für Langzeitdigitalisate zu geschehen?
Das Archiv bewahrt das Original! Von diesem Grundsatz weichen wir zunächst nicht ab. Niemand würde ein Gemälde im Original vernichten für eine noch so hochwertige digitale Reproduktion. Demgegenüber kann eine VHS-Videoproduktion sicher nach einer Digitalisierung vernichtet werden, wenn es etwa kaum mehr Wiedergabegeräte für diese Formate gibt. Insofern müssen Kriterien gegeben sein, wie sie etwa die Bundeskonferenz Kommunalarchive in ihrem BKK-Papier zum ersetzenden Scannen behandelt.
Archive haben im Rahmen ihrer Aufgaben bei der Überlieferungsbildung sicherzustellen, dass diejenige Erscheinungsform übernommen wird, die am ehesten Archivfähigkeit (technischer, organisatorischer und rechtlicher Art) besitzen könnte und den Zielen der Überlieferungsbildung entspricht. Grundsätzlich kann aus archivischer Sicht erst dann von einem ersetzenden Scannen gesprochen werden, wenn verschiedene Vorbedingungen erfüllt sind. Dazu zählen die technischen, organisatorischen und rechtlichen Rahmenbedingungen des Scanvorgangs selbst, sowie der Qualitätskontrolle, Speicherung und Weiterverarbeitung der Digitalisate. Dazu gibt es etwa Richtlinien des Bundesamtes für Sicherheit in der Informationsverarbeitung, flankiert durch den Baustein Scanprozess des Organisationskonzepts Elektronische Verwaltungsarbeit (EVA), das das ältere DOMEA-Konzept ablöst. Für die archivische Überlieferungsbildung sind vordringlich Authentizität, Nachvollziehbarkeit, Transparenz sowie inhaltliche Vollständigkeit von Bedeutung. Sollten die sich daraus ergebenden Kriterien und Rahmenbedingungen nicht erfüllt sein, können Digitalisate die Originale grundsätzlich nicht ersetzen. In diesen Fällen stützt sich die Überlieferungsbildung ausschließlich auf die analogen Unterlagen. Als Beispiel für die Erfüllung dieser Kriterien stellen sich z. B. die Fragen, ob (scheinbar) leere Rückseiten mit eingescannt wurden, oder ob eine farbige Vorlage schwarzweiß gescannt wird. Die Archivgesetze schreiben die Anbietung der Papierakten wie auch der digitalen Reproduktionen vor. Daher dürfen die Papieroriginale erst nach einer Entscheidung des Archivs vernichtet werden. Einige Archivgesetze legen sogar explizit die Anbietung in der Entstehungsform fest.
Zentral ist aber die Frage der Metadaten, die die Digitalisate begleiten und damit erläutern. Die besten Digitalisate von Archivgut werden ihren Nutzen erheblich einbüßen, wenn die Beschreibungsdaten die Auskunft über die Objekte geben, nicht mit überliefert werden.
Physische Schrift-Dokumente sind teilweise seit Jahrtausenden erhalten. Welche Chancen haben digitale Archivdaten, auf eine derartige Nachhaltigkeit?
Die Chancen sind grundsätzlich die gleichen. Im Rahmen der Konservierung und Bestandserhaltung achten wir in unseren Magazinen bei unseren analogen Unterlagen auf eine dem Informationsträger angemessene Aufbewahrung hinsichtlich des Raumklimas mit Temperatur und Luftfeuchtigkeit, um die Repräsentation dieses Materials zu erhalten. In ähnlicher Weise gilt dies auch für digitale Unterlagen. Auch hier müssen in den Rechenzentren klimatische Werte, erweitert um Parameter wie Stromversorgung, Vermeidung von Spannungsschwankungen und andere technische Werte bestimmte Forderungen erfüllen. Hinzu kommen technische Verfahren, die die Bestandserhaltung der elektronischen Dokumente und ihre Authentizität überprüfen, ob also die Zeichenketten aus den zahlreichen 0- und 1-Werten immer so bleiben, wie sie übernommen wurden. Formatwechsel bei bisherigen Standardformaten führen zu mehreren Repräsentationen einmal übernommener elektronischer Datenpakete. Diese digitale Bestandserhaltung und die Veränderungen von Format und Repräsentationen mitzumachen und damit rechtsrelevante oder kulturell-wissenschaftlich wichtige digitale Informationen langfristig zu erhalten, ist ein wesentliches Element der Archivierung. Dazu wird Know how, Software und Hardware in Rechenzentren, dazu werden aber insbesondere Haushaltsmittel verfügbar sein müssen, um heutige elektronische Datenvolumina bei den Informationsproduzenten zu erfassen, zu übernehmen, auf Dauer zu verwahren und zu sichern, zu erhalten, zu erschließen, nutzbar zu machen und auszuwerten und damit die Dienstleistung Archivierung als gesellschaftlichen Auftrag in vollem Umfang erfüllen zu können.
Die Archivierung digitaler Daten wird, eben weil die Erhaltung vermutlich vor allem durch Migration erfolgt, zu dauerhaft anfallenden Kosten führen. Die Chance zum Erhalt der digital vorliegenden Information liegt in der beständigen Anpassung ihrer Träger an die technisch aktuelle Umgebung.