SIARD Suite 2.2 - Konzept

Das Schweizerische Bundesarchiv ist verpflichtet, Unterlagen der eidgenössischen Behörden unabhängig vom Informationsträger zu archivieren. Das Problem der Langzeitarchivierung relationaler Datenbanken muss deshalb behandelt werden.

Seit 2007 dient das SIARD Format dem Schweizerischen Bundesarchiv - und vielen anderen Archiven weltweit - als Normalisierungsformat für die Langzeiterhaltung relationaler Datenbanken.

Um die Verfügbarkeit über lange Zeiträume zu gewährleisten, werden Datenbanken im SIARD Format 2.2 werden Datenbanken SQL:2008-konform getspeichert. Die Dateninhalte werden in einer Kollektion von XML-Dateien gespeichert. Weil das resultierende Archivformat für Datenbanken auf diesen beiden ISO-Standards beruht, wird ihm eine länger dauernde Verstehbarkeit zugetraut.

Eine wesentliche inhaltliche Anforderung an im SIARD-Format archivierte Daten ist, dass der Datenbank-Inhalt „Unterlagen-Charakter“ hat. Das heisst, dass die Inhalte der archivierten Tabellen Geschäftsdaten der Institution enthalten, welche die Datenbank betreibt, die unabhängig von Frontend-Anwendungen verstehbar sind. Mit der SIARD Suite werden weder ausführbarer Programmcode noch Objekte archiviert, sondern nur die Geschäftsdaten in Datenbanktabellen. Dieser Ansatz ist von Hartwig Thomas ausführlicher beschrieben im Dokument "Long-term Preservation of Relational Databases, What needs to be preserved how?".

Im SIARD-Format ist die Schemadefinition einer archivierten Datenbank in SQL:2008-konformen XML-Dateien abgespeichert, während die inhaltliche Dokumentation der Tabellen und Felder sowie die eigentlichen Daten in XML-Dateien abgelegt sind. Damit diese nicht übermässig aufgebläht werden, sind BLOB- und CLOB-Daten (Binary Large OBjects und Character Large OBjects) in separaten (binären) Dateien gespeichert, die in den XML-Dateien referenziert sind.

Hier wird auf die Struktur des SIARD-Formats nicht weiter eingegangen, da diese in einem separaten Dokument beschrieben ist, welches zusammen mit der SIARD Suite ausgeliefert wird. 2013 wurde das SIARD format als eCH-Standard anerkannt. Seit 2018 ist die Version 2.1 des SIARD-Formats als Standard verfügbar eCH-0165.