Was ist Archivierung?
Mit der Archivierung werden nicht mehr aktiv verwendete Daten/Dokumente in ein separates Speichersystem ausgelagert und dort langfristig aufbewahrt. Die archivierten Daten können entweder in der Zukunft noch wichtig sein oder müssen aus Compliance-Gründen revisionssicher aufbewahrt werden. Die Datenarchive sind mit einer Suchfunktion versehen, um einen schnellen Zugriff auf die gesuchten Daten zu ermöglichen (vgl. „Datenarchivierung“ o. D.)
Einordnung in das AIIM-Modell
Elektronische Dokumentenarchivierung wird im angloamerikanischen Sprachgebrauch in die Komponenten „Records Management“, „Storage“ und „Preservation“ unterteilt (vgl. „Software Blog“ o. D.). Diese drei Komponenten werden im Folgenden näher erläutert. Die folgende Abbildung zeigt die Einordnung der 3 Themengebiete im AIIM Modell.
Records Management
Unter Records Management versteht man die Verwaltung von aufbewahrungspflichtigen Informationen, deren Grundsätze in der ISO-Norm DIN 15489 (Teil 1) definiert sind: (vgl. Kampffmeyer 2010)
„Als Führungsaufgabe wahrzunehmende effiziente und systematische Kontrolle und Durchführung der Erstellung, Entgegennahme, Aufbewahrung, Nutzung und Aussonderung von Schriftgut, einschließlich der Vorgänge zur Erfassung und Aufbewahrung von Nachweisen und Informationen über Geschäftsabläufe und Transaktionen in Form von Akten.“
Preserve
Die Preservation-Komponente dient der langzeitig, stabilen, statischen und unveränderbaren Aufbewahrung und Sicherung von Informationen. Dazu werden u. a. WORM, CAS, NAS und SAN als Speichertechniken eingesetzt (vgl. „IT Archivierung o. D.).
Storage
Die Storage-Komponente entspricht dem Store-Objekt in dem ECM-Modell von AIIM. Hier geht es um die temporäre Speicherung von nicht archivierungspflichtigen Informationen. In AIIM werden dieser Komponente „Repositories“ als Speicherorte, „Library Services“ als Verwaltungskomponente für die Speicherorte, und „Technologies“ als unterschiedliche Speichertechnologien zugeordnet (vgl. Kampffmeyer 2014).
Begriffsdefinitionen
Im Folgenden werden die wichtigsten Begriffe zur Archivierung erläutert.
Archivierung
Archivierung bezeichnet die „langzeitige, sichere, unveränderbare, vollständige, nachvollziehbare, authentische, integere, beweisfähige und jederzeit verfügbare Erhaltung von Unterlagen bezeichnet die systematische, kontrollierte, langfristige Aufbewahrung von Informationen.“ (vgl. „Archivierung“ o. D.).
Elektronische Archivierung
Unter elektronischer Archivierung wird „die datenbankgestützte, langzeitige, sichere und unveränderbare Aufbewahrung von jederzeit wieder reproduzierbaren elektronischen Informationsobjekten“ („Archivierung“ o. D.) verstanden.
Revisionssicherheit
Bei einem revisionssicheren Archiv werden die Inhalte unverändert (originär) sowie fälschungssicher gespeichert und sind über eine Suche auffindbar. Darüber hinaus werden alle Aktionen im Archiv protokolliert, um die Nachvollziehbarkeit sicherzustellen (vgl. Pfund o. D.).
Sicherungskopie (Backup)
Das Kopieren von Daten oder Programmen als Sicherungskopie wird als Backup bezeichnet. Bei Datenbeschädigung oder -verlust können aus einem Backup die Originaldaten wiederhergestellt werden (vgl. „Sicherungskopie“ o. D.).
Dokumentenmanagement umfasst alle oben genannten Begriffe.
Anforderungen
Die folgenden Anforderungen sollte ein Archivierungssystem erfüllen:
Umsetzung gesetzlicher Vorgaben
- Handelsgesetzbuch (HGB) und Abgabenordnung (AO),
- Grundsätze zur ordnungsmäßigen Führung und Aufbewahrung von Büchern, Aufzeichnungen und Unterlagen in elektronischer Form sowie zum Datenzugriff (GoBD),
- Sarbanes-Oxley-Act (SOX),
- EU-Richtlinie (Euro-SOX),
- Signatur Gesetz (SigG),
- Bundesdatenschutz Gesetz (BDSG) und
- weitere branchenspezifische Anforderungen (z. B. Luftfahrtgeräte, Futtermittel und Gefahrengut).
Funktionale Anforderungen
- Revisionssichere Ablage,
- Zugriffsmöglichkeit für den Steuerprüfer,
- Digitalisierung von Papierdokumenten,
- Es muss nachgewiesen werden, dass das Dokument nicht geändert wurde (z. B. über Erstellungszeitstempel, Archivierung über Barcode ist heutzutage eine verbreitete Praxis),
- Erhaltung des Dateiformats (gesetzliche Vorschrift),
- Erhaltung von Merkmalen wie z. B. Wasserzeichen,
- Mögliche Speicherung in verschiedenen Formaten, Dateiformat muss nach Aufbewahrungsfrist noch lesbar sein, Verbreitet ist beispielsweise .pdf/a (ISO-zertifizierte Form von pdf zur Langzeitarchivierung) und
- Migration erforderlich (Wechsel des Mediums im Lebenszyklus eines Dokuments auf Grund der unterschiedlichen Zugriffsarten).
Archivierungsverfahren
Folgende Darstellung zeigt den Ablauf der elektronischen Archivierung:
Wie in der oben aufgeführten Grafik werden zunächst die zu archivierenden, operativen Daten eines Unternehmens aufbereitet. Anschließend erfolgt der elektronische Import. Dabei werden Papierdokumente mit Hilfe von Scannern digitalisiert. Um die Dokumente später über eine Volltextsuche finden zu können, erfolgt eine OCR-Erkennung sowie eine Indexierung (z. B. mit Barcode).
Quelle: (WCM – Hemling 1997)
Dabei werden die Dokumente ggf. signiert, um die Authentizität später nachweisen zu können. Die Attribute des Dokuments werden in einer separaten Datenbank gesichert, bevor das digitale Dokument im DMS/Archiv (unveränderbares Repository) gespeichert wird (siehe auch Beitrag „Dokumentenmanagement„). Abschließend können die originalen Dokumente, die gescannt wurden, vernichtet werden und den Anwendern bzw. Kunden eine Zugriffsmöglichkeit auf das Archiv eingerichtet werden. Bei der Bereitstellung des Archivs für Kunden ist eine sichere Übertragung (z. B. verschlüsselt) aus Informationssicherheitsgründen zu bevorzugen.
Open Archival Information System (OAIS)
Der am weitesten verbreitete Standard für die elektronische Archivierung ist das „Reference Model for an Open Archive Information System“. Das Referenzmodell OAIS beschreibt die notwendigen Funktionen und Komponenten für eine elektronische Archivierung. Die Weltraumbehörden entwickelte das OAIS und 2003 wurde es zu dem ISO Standard 14721. Die Version 2 von OAIS, das sogenannte „Magenta Book“ wurde im August 2012 als ISO Norm 14721:2012 übernommen (vgl. Nestor 2013).
Speichermedien
Für die Archivierung sollten folgende Anforderungen an die Speichermedien erfüllt sein: (vgl. Reder 2014)
- Häufige Zugriffe möglich
- Kurze Zugriffszeiten
- Unterstützt verschiedene Archivierungsdauer
- Auslagerungsmöglichkeit
- keine nachträgliche Manipulation möglich
Bei den Speichermedien wird grundsätzlich zwischen optischen (z. B. CD, DVD, Blu-ray), magnetischen (z. B. Band, HDD) und Flash- (USB-Stick, SSD) Medien unterschieden. Für die Archivierung eignen sich optische Speichermedien nur bedingt, da die langfristige Haltbarkeit durch Temperaturen, Licht, Kratzern, Aufklebern und Fingerabdrücken beeinträchtigt wird. Bei magnetischen Medien muss auch stark auf die richtige Lagerung geachtet werden, sie bieten sich jedoch eher als Archivierungsmedium an, als optische Medien. Flash-Speicher ist lediglich vom Verschleiß bedroht, daher bietet sich dieser vor allem an, wenn er ausschließlich als Langzeitspeicher mit wenigen Zugriffen und Schreibzyklen verwendet wird. Bei den magnetischen Medien und den Flash-Speichern ist die Unveränderbarkeit der Daten grundsätzlich nicht gegeben (vgl. Schasche 2018).
Damit die Anforderungen an die Archivierung umgesetzt werden können (z. B. Revisionssicherheit) bieten sich z. B. WORM-Medien (Write Once, Read Multiple Times) an, die zu den optischen Speichermedien zählen. Diese werden häufig in sogenannten Jukeboxen (Plattenwechselautomaten) verwendet. Über eine Software, die in das Archivsystem integriert ist wird der Zugriff auf die entsprechenden WORM-Medien gesteuert (vgl. Gerling o. D.)
Revisionssicherheit schließt sichere Abläufe, die Organisation des Anwenderunternehmens, die ordnungsgemäße Nutzung, den sicheren Betrieb und den Nachweis in einer Verfahrensdokumentation ein. Wesentliches Merkmal revisionssicherer Archivsysteme ist, dass die Informationen wieder auffindbar, nachvollziehbar, unveränderbar und verfäl-schungssicher archiviert sind.
Zugriffsarten
Die Speichermedien unterscheiden sich stark in der Zugriffszeit. In diesem Zusammenhang wird zwischen folgenden Zugriffsarten unterschieden: (vgl. „Storage Technologien“ o. D.).
- Online-Archivierung (z. B. SSD, HDD) eignet sich für Daten und Dokumente, die im direkten Zugriff sind, da die Zugriffszeit sehr gering ist.
- Nearline-Archivierung (z. B. Tapes, Jukeboxen) wird für Daten und Dokumente verwendet, die auf einem Wechselmedium liegen, dessen Zugriff über eine Software gesteuert wird. Hier sind die Zugriffszeiten etwas langsamer als bei der Online-Archivierung, da die Zeit des Wechselprozesses berücksichtigt werden muss.
- Bei der Offline-Archivierung (CD, DVD usw.) befinden sich die Daten und Dokumente auf einem Medium, das ausgelagert wurde und auf das nicht direkt zugegriffen werden kann. Die Zugriffszeit ist dementsprechend lang.
Zusammenfassung
Für die Sicherstellung von reibungslosen Abläufen innerhalb der Unternehmen ist eine organisierte Aufbewahrung notwendig, denn mit dem stetigen Anstieg von elektronischen Daten müssen Daten digitalisiert und geeignete Archivierungssysteme zur Erfassung und Speicherung eingesetzt werden.
Elektronische Archivierungssysteme unterstützen bei der Langzeitaufbewahrung, ermöglichen einen schnellen Zugriff und eine optimale Recherche unter Berücksichtigung der gesetzlichen Aufbewahrungsfristen. Die Systeme sollten jedoch auf die spezifischen Anforderungen des Unternehmens abgestimmt sein.