Kleines Rätsel: Wen beschreiben wir hier? Kann nichts wegwerfen, weil er/sie nicht weiß, ob man es vielleicht doch noch gebrauchen kann. Also wird ohne Ordnung zugemüllt, bis die Füllgrenze erreicht ist. Die richtige Antwort ist …. die meisten PC-Anwender! Aufgewachsen mit der verlässlichen Vorhersage, dass Speicher schneller billiger wird als wir ihn zumüllen können. Und weil Ordnung lästig ist, füllen wir die Speicher ohne Ordnung, ohne Regeln und ohne Rücksicht auf die Belange der Abteilung oder des Unternehmens. Dabei entstehen massive Probleme:
- Mangelnde Ordnung kostet Geld: Wenn ein Mitarbeiter Unterlagen nicht da findet, wo er sie vermuten darf, hat die Abteilung oder die Firma ein Kostenproblem, weil nun eine kostenintensive Suche losgeht.
- Kein gleichzeitiger Mehrfachzugriff. Das Dateisystem kennt kein Aus- oder Einchecken, wie es jedes bessere DMS zur Verfügung stellt, um das redundante Kopieren in einer Mehrbenutzerumgebung zu vermeiden. Also werden Mehrfachkopien erstellt, die inhaltlich immer weiter voneinander abweichen.
- Durch individuelle Versionierungen („Angebot_ letzte_Version_03b_11.11.2011.doc“) wird das Problem vergrößert, weil diese Versionsbezeichnungen häufig falsch, von Dritten nicht verstanden und daher irreführend sind. Aber die Mitarbeiter ohne DMS wissen es halt nicht besser, niemand hat ihnen beigebracht, wie man „richtig“ versioniert. Man hat ihnen zwar die Papier-Aktenordner weggenommen, aber nichts Vergleichbares als Ausgleich gegeben. Die Unterlagen sind jetzt digital, werden aber ohne sinnvolle – d.h. auch von den Kollegen verstandener, akzeptierter und angewandter Ordnung aufbewahrt. Der gültige Versionsstand ist nicht mehr bestimmbar. Mangels verlässlicher Versionierung ist unklar, welche Datei denn nun die Grundlage einer getroffenen Entscheidung war. Ist es „Angebot_aktuell“? Oder die Datei mit dem jüngsten Änderungsdatum? Oder gibt es gar nicht mehr die EINE Datei, weil – siehe oben – drei verschiedene Abteilungen in unterschiedlichen „persönlichen“ Versionen Änderungen vorgenommen haben?
- Ein File-System kennt bis auf Ordner- und Dateinamen nur technische, keine fachlichen Attribute. Also wird es verbogen, indem Unterordnern fachliche Attribute zugewiesen werden (Kundenakte X/Rechnungen). Manche Anwender haben tiefgestaffelte Baumstrukturen, die von Nicht-Eingeweihten kaum noch verstanden werden. Zusammen mit Abteilungsabkürzungen und anderen Kategorisierungen, die ebenfalls in den File-Strukturen abgebildet werden, sind die Dokumente somit über den Ablageort adressiert – eine Sünde, die auch die früheren Versionen des SharePoint belastet haben. Wehe, wenn sich Abteilungsbezeichnungen ändern. Und wehe, wenn diese Pfadangaben in nachgelagerten Systemen als Zugriffsadresse hinterlegt sind, die Datei aber – zum Beispiel um eine Fehlablage zu korrigieren – an eine andere Stelle verschoben wird. Eine Mehrfachattribuierung – d.h. die Zuordnung von Unterlagen zu mehreren fachlichen Ordnungsbegriffen ist in solchen 1-dimensionalen Ablagehierarchien unmöglich. Genau wie beim Papierordner muss man Mehrfachkopien und -ablagen in Kauf nehmen. Wenn dann an die fachlichen Baumstrukturen des File-Systems auch noch differenzierte Benutzerrechte gehängt werden, ist das Ablage- und Rechte-Chaos vorhersehbar.
- Das Dateisystem besitzt keine DMS-Funktionen wie Löschfristenverwaltung, das Sichern der Unveränderbarkeit, das Zuweisen von Rechten an fachliche Attribute, das Bilden von abteilungs- oder projektspezifischen Aktenstrukturen, um nur einige wenige Kernfunktionen moderner DMS-Lösungen zu nennen.
- Die beliebte Volltextsuche ist vollkommen ungeeignet, um das EINE zu einem bestimmten Geschäftsvorgang gehörende Dokument anzuzeigen. Die Suche nach „Angebot_aktuell“ kann Tausende von Treffern haben. Welches führte aber zum Auftrag X des Kunden Y? Welches ist die Buchungsgrundlage? Der Prüfer möchte keine Google-ähnliche nach semantischen Wahrscheinlichkeiten sortierte Trefferliste mit 500 Einträgen sehen. Er will DAS EINE Dokument über Kriterien auffinden , die eine eindeutige Verbindung zur Buchung herstellen. Das ist mit Eindeutigkeit des Index gemeint (siehe GOBS von 1995).
- Altlasten: Viele Ordner und Dateien werden wahrscheinlich nicht mehr benötigt, belasten aber die IT-Infrastruktur, weil man weder die Zeit für manuelles Löschen noch die Regelwerke für automatisches Löschen hat. Also wird weiter gesammelt.
- Probleme mit den Backup-Systemen: Die klassischen File-basierten Backup-Systeme benötigen immer länger für die Scan- und Sicherungsläufe.
Als Lösung für all diese Probleme wird immer wieder die so genannte Regel-basierte File-System-Archivierung diskutiert. Hierbei wird das Dateisystem automatisch „abgesaugt“; zurück bleiben so genannte Stubs, das sind Referenzen auf die nun im Archiv liegenden Dateien. Für den Endanwender hat sich auf den ersten Blick nichts geändert, er sieht seine vertrauten Verzeichnisstrukturen. Aber die Filesystem-Speicher werden entschlackt, das Backup-Laufzeitenproblem damit (vermeintlich) gelöst und wenn das (Archiv-)Speichersystem die Manipulation verhindert, dann hat man auch gleichzeitig das Problem der mangelnden Ordnungsmäßigkeit im File-System erledigt. Richtig? Ganz falsch!! Diese Form der automatischen File-System-Archivierung ist eigentlich ein Relikt aus den 80ern, als man die damals teuren Magnetplatten durch die (damals) preiswerten optischen Jukeboxen ergänzen wollte. Aus dem Host-Umfeld war bereits das Prinzip der Hierarchischen Storage Manager bekannt: Man verlagert nach bestimmten Regeln (Alter, Zugriffsfrequenz etc.) Dateien von einem schnellen aber teuren auf einen langsameren, aber preiswerten Speicher. Was damals aus Kostengründen sinnvoll gewesen sein mag, ist heute aber nicht mehr sinnvoll. Die wichtigsten Gründe gegen eine automatische File-System-Archivierung sind:
- Das Absaugen beseitigt nicht das Chaos im File-System. Wenn man Pech hat, wird das Chaos jetzt auch noch „unveränderbar“. Die Ordnung, nach der abgelegt und zugriffen wird, ist ja die mehr oder weniger unzureichende Ablagestruktur im File-System. Kein Regelwerk kann beim Absaugen des File-Systems aus dem Dateiinhalt einer PC-Datei ohne Benutzereingriff verlässlich auf die richtigen Attribute schließen, die ein Anwender bei einer von einer relationalen Datenbank unterstützten DMS-Ablage für dieses Dokument vergeben hätte. Mit anderen Worten: hat man vorher nichts gefunden, findet man danach auch nichts. Ein Hilfsmittel wäre die Volltextsuche, aber diese ist ungenau und kein Argument pro File-System-Archivierung, weil sie auch im File-System und mit wesentlich weniger Aufwand eingerichtet werden kann. Volltextsuche ist aber für eine genau Suche ungeeignet, weil sie auf die Dokumenteninhalte beschränkt ist und nicht nach Attributen suchen kann, die sich nicht im Dokument befinden (also der fachlichen Zuordnung zum Beispiel zu einem Vorgangsstatus, einem Dokumenttyp oder einem im Dokument nicht vorkommenden Ordnungswert, der sich erst aus der fachlichen Zuordnung ergibt).Daher wichtiger Merksatz zur Aufbewahrung: Ordnungsgemäße Aufbewahrung (vulgo revisionssichere Archivierung) bedeutet die Sicherstellung der Reproduktionsfähigkeit bildlich oder inhaltlich unveränderter Unterlagen für die Dauer der Aufbewahrungsfrist. Man muss also auch wieder rankommen an den Beleg, der die Grundlage für die Verbuchung war. Wenn das Chaos im File-System die Recherche des Beleges verhindert, dann ist die Tatsache, dass das Chaos jetzt unveränderbar ist, wahrscheinlich kein überzeugendes Argument für den Prüfer. Ordnungsmäßigkeit sieht anders aus.
- Das Argument des schlankeren Speichers ist in Frage zu stellen. Da die Dateisysteme beim Absaugen selten um Altlasten bereinigt werden (Grund: manueller Aufwand ist zu groß) ist der Speicherbedarf nachher genauso groß wie vorher. Und es ist schon lange nicht mehr so, dass ein Archiv einen preiswerteren Speicher als das normale File-Server-Speichersystem verwendet. In der Regel ist es doch eher so, dass ein Archivspeicher TEURER ist als der „normale“ Speicher – von High-End-SAN-Speichern mal abgesehen ? weil der Archivspeicher weitere Funktionen wie Unveränderbarkeit und manchmal noch eine Datenbank-basierte Objekt-ID Verwaltung mit Löschfristenmanagement beherrschen soll. Das Argument des Preisvorteils archivischer Speicher ist also schon seit vielen Jahren kein belastbares Argument mehr.
An dieser Stelle wird häufig eingewendet, dass manche File-System-Archivsysteme über Funktionen zur De-Duplizierung auf Dateiebene verfügen, der verfügbare Speicher also effizienter verwaltet wird, weil Binärdubletten erkannt und durch Referenzen ersetzt werden. Das stimmt (für manche Systeme, nicht alle), aber dann sollte man auch bedenken, dass die Fähigkeit der De-Duplizierung mitnichten eine exklusive Fähigkeit von Archivspeichern ist, sondern auch anderen Speicheranwendungen zur Verfügung steht. Und dort ggf. sogar in der sehr effizienten Variante der so genannten Block-Level-Deduplizierung. - Risiken bei automatischer Unveränderbarkeit. Die Regelwerke zur automatischen Auslagerung decken die Vielfalt der Anforderungen der Praxis nicht ab. Wenn eine Regel nach dem Alter der Objekte (im Bsp. hier 3 Monate) eine Migration initiiert: dann wird ein Dokument (z.B. die Richtlinie zur privaten Mail-Nutzung), welches vor 3 Monaten angelegt wurde, nun automatisch aus dem File-System in das Archiv migriert und dort evtl. unveränderbar abgelegt, obwohl es sich noch im lebenden Redaktionsprozess befindet. Also werden ab jetzt Versionen erzeugt, das eigentliche Dokument kann nicht mehr überschrieben werden. Statt Speicherplatz zu sparen, werden unnötige Versionen erzeugt. Es wird keine Regel geben, die die unterschiedlichen Anforderungen der Anwender sauber abdecken kann. Jeder kennt und hat Ablagestrukturen, wo sich bereits innerhalb eines Dateiordners sehr unterschiedliche Dokumentarten befinden, die wiederum nach sehr unterschiedlichen Regeln archiviert werden müssten. Und diese Unterscheidung trifft der Mensch aufgrund der von ihm situativ beurteilten fachlichen Merkmale. Ein Regelwerk kann nur Dinge auswerten, die sich im Dokument befinden und eine sichere, eindeutige Zuordnung erlauben.
Eine ECM-Lösung ist die bessere File-System Archivierung: Die automatische File-System-Archivierung sehen wir äußerst kritisch. Was in den 80er und 90er Jahren sinnvoll gewesen sein mag, schafft heute mehr Probleme, als sie löst. Viele Unterlagen gehören sicherlich nicht ins File-System. Aber nicht etwa, weil eventuell regulatorische Anforderungen nicht eingehalten werden, sondern vor allem, weil dort keine Ordnung herrscht. Der Mangel an Ordnung kostet nämlich erheblich Zeit und Geld. Und das ist bei vielen Unternehmen das größere Problem als der erhobene Zeigefinger der Prüfer, wenn sie Handelsbriefe auf dem File-System entdecken. Der bessere Weg, diese Unterlagen aufzubewahren sind häufig ECM-Lösungen, in denen neben den Unterlagen vom File-System auch die Unterlagen aus dem Papiereingang, die Dokumente aus den Fachanwendungen und die aufbewahrungspflichtigen E-Mails verwaltet werden. Diese Systeme erlauben die Vorgabe von Ordnungsstrukturen, die sich den abteilungs- oder prozessspezifischen Anforderungen anpassen lassen. Die elektronische Akte ist dann wieder verlässlich auskunftsfähig und verteilt sich nicht wie heute auf eine Vielzahl von Systemen. Und wenn die Mitarbeiter angehalten werden, bestimmte Dokumente nicht mehr unter C/EIGENES CHAOS oder dem File-Server, sondern in diejenigen Aktenregister abzulegen, hinter denen der Kollege diese Dokumente auch vermutet (also vereinbarte, akzeptierte und angewandte Ordnung), dann wird sich auch der File-Server verschlanken. Die am häufigsten unterschätzte Funktionalität – die systemgestützte Versionierung – wird ebenfalls dazu beitragen, dass der letztgültige Versionsstand von Dokumenten den Mitarbeitern zur Verfügung gestellt wird, ohne dass diese 50 ähnlich betitelte Dokumente durchsuchen müssen. Und wenn man weiß, wo man Dinge ablegen kann, reduziert sich automatisch die Mehrfachablage. Es gibt eine Fülle weiterer Vorteile, die dafür sprechen, aufbewahrungswürdige oder sogar aufbewahrungspflichtige Dokumente nicht per automatischer File-System-Archivierung, sondern in einer ECM-Lösung aufzubewahren.
Aber nicht jedes Dokument muss in eine ECM-Lösung. Manche Anwender verfolgen die Idee, das komplette File-System abzuschalten und durch eine ECM-Lösung zu ersetzen. Dabei wird vergessen, dass die Vorteile der ECM-Lösung mit Trainingsaufwand für neue Funktionen und Oberflächen und einer häufig auch schlechteren Performance für viele Ablage- und Rechercheoperationen im direkten Vergleich mit dem File-System verbunden ist. Man sollte die Kirche im Dorf lassen: aufbewahrungswürdige oder –pflichtige Dokumente, die auch anderen in einer verlässlichen Ordnung zur Verfügung stehen sollen, sind wahrscheinlich in einer ECM-Lösung besser aufgehoben. Für andere Dateien und Unterlagen sollte man mit dem gesunden Menschenverstand abwägen, ob die Vorteile einer ECM-Lösung in einem sinnvollen Verhältnis zu den Nachteilen (Kosten, Akzeptanz der Benutzer) stehen.