In jedem Unternehmen speichern Dateiserver tausende von Dokumenten in oft tief verschachtelten Baumstrukturen, sodass Anwender Schwierigkeiten haben, dringend benötigte Dokumente rasch aufzufinden. Durch Navigation in mehr oder weniger aussagekräftig benannten Ordnerstrukturen wird häufig vergeblich versucht, die gewünschte Information zu erhalten.
Einen Ausweg aus dieser Misere, die sich täglich durch die Erzeugung neuer Dateibestände verschärft, bieten Portallösungen. Hier soll am Beispiel des Microsoft SharePoint Portal Servers 2003 aufgezeigt werden, welche Konzepte hilfreich sein können und welche Aspekte in diesem Anwendungsszenario besonders zu beachten sind.
Der SharePoint Portal Server (SPS) kann, wie einige andere Portallösungen auch, neben den direkt in der Portalumgebung verwalteten Informationen, auch Objekte aus „fremden“ Datenhaltungen, z.B. Exchange Mailserver, externe Websites und Dateisysteme in seinen Suchkatalog aufnehmen. Dadurch ist der Portalbenutzer in der Lage, mit einer einzigen Suchabfrage mehrere Inhaltsquellen zu durchsuchen und die gefundenen Objekte in einer gemeinsamen Trefferliste zu sichten.
Ist die Inhaltsquelle ein Dateiserver, besteht die Möglichkeit, sämtliche im SharePoint-Server explizit eingetragenen Verzeichnisse und Unterverzeichnisse nach einem einstellbaren Zeitplan zu durchsuchen und im SPS zu registrieren. Dieser Prozess wird auch als „Crawling“ bezeichnet und kann entweder den Index vollständig neu aufbauen oder nur aktualisieren, d.h. neue oder geänderte Dateien im Index aufnehmen.
Microsofts Office-Formate werden standardmäßig beim Crawling erkannt, für weitere gängige Dateiformate wie z.B. PDF stehen sogenannte iFilter zur Verfügung, die Dokumenteninhalte für eine Volltextsuche erschließen.
Typischerweise sind Ordner der Dateiserver gegen unbefugten Zugriff durch ein Sicherheitssystem geschützt. Benutzer oder Benutzergruppen werden mit der Ressourcenverwaltung des Windows Servers für lesenden oder schreibenden Zugriff auf Ordner oder Dateien berechtigt.
Der SharePoint Portal Server benutzt bei seinem Crawling ein Systemkonto mit möglichst weitgehenden Zugriffsrechten, die einen lesenden Zugriff auf alle Dokumente in einem Suchpfad und somit die Registrierung im SPS-Index ermöglichen. Erst zum Zeitpunkt der Suchabfrage werden die tatsächlichen Zugriffsrechte des Benutzers auf einzelne Dokumente bei der Zusammenstellung der Trefferliste berücksichtigt. Das Resultat ist, dass Dokumente, auf die der Anwender keinen Zugriff hat, erst gar nicht in der Trefferliste erscheinen.
Dieses Systemkonzept hat wichtige Konsequenzen im Bezug auf die Zugriffssicherheit: Werden beispielsweise Dokumente mit dem Suchbegriff „Leistungsbewertung“ recherchiert, können zwei Fälle unterschieden werden.
Unkritischer Fall: Ein Dokument mit dem Namen „Leistungsbewertung Maier 2004.doc“ liegt in einem geschützten Dateiverzeichnis und ist nur durch Mitglieder der Benutzergruppe Personalleitung zu lesen. Der SharePoint Portal Server liefert – wie gewünscht – nur den Mitgliedern der Personalleitung das Dokument in ihrer Trefferliste.
Kritischer Fall: Das gleiche Dokument liegt in einem Unterverzeichnis des oben genannten geschützten Verzeichnisses und hat z.B. die Leserechte für „alle Mitarbeiter“ gesetzt. Gegen einfache Navigation per Windows Explorer ist das Dokument zwar durch das gesicherte Elternverzeichnis geschützt, nicht jedoch gegen den Zugriff via SPS-Portal. Jeder Mitarbeiter findet bei entsprechender Recherche den Eintrag zum Dokument in seiner Trefferliste und kann das Dokument per Mausklick öffnen.
Solche Überraschungseffekte treten häufig bei umfangreichen Verzeichnisstrukturen auf, die im laufe der Jahre gewachsen sind und nicht konsequent gepflegt wurden. Deshalb hat sich vor Einführung der neuen Suchmöglichkeiten via Portal als Maßnahme bewährt, die verwendeten Benutzergruppen und die Rechtevergabe innerhalb der Baumstrukturen zu überprüfen und gegebenenfalls zu konsolidieren. Aufpassen muss man besonders, wenn Dateibäume innerhalb oder zwischen NTFS-Partitionen kopiert oder verschoben werden, da diese Ordner nicht immer automatisch die „richtigen“ Rechte erhalten.
Aus der praktischen Erfahrung in mehreren Projekten ist festzustellen, dass die Microsoft-Suchmaschine auf Anhieb exzellente Trefferlisten mit den erwarteten Dokumenten lieferte. Aus Anwendersicht besteht immer der Wunsch möglichst kurze Trefferlisten zu erhalten und die relevantesten Dokumente möglichst ganz oben in der Liste führen. Häufig sind die Trefferlisten jedoch zu umfangreich oder enthalten zahlreiche, nicht zum Thema passende Einträge.
Eine effektive Maßnahme zur Qualitätsverbesserung von SPS-Trefferlisten ist die Überprüfung der Rechtestruktur des Dateiservers. Wurden Zugriffsrechte restriktiv genug vergeben? Bei der Vergabe von Zugriffsrechten sollte sehr kritisch geprüft werden, ob bestimmte Benutzergruppen tatsächlich den Zugang zu bestimmten Bereichen des Dateiservers benötigen. Ist das nicht der Fall, empfiehlt sich dringend, diesen Benutzern entsprechende Zugriffrechte auf Dateiebene zu entziehen und damit zu garantieren, dass diese tatsächlich nicht in der Trefferliste auftauchen.
Weiterhin ist es oft nützlich, logische Suchbereiche zu definieren, denen gezielt physikalische Suchpfade zugeordnet werden. So können beispielsweise einem Suchbereich „Produktentwicklung“ mehrere, auch auf verschiedenen Servern liegende Verzeichnisbäume zugeordnet werden. Der Anwender wählt in der Suchmaske einfach die zu durchsuchenden Suchbereiche aus und selektiert damit die für ihn relevanten Pfade. Als Ausgangsbasis für die Definition von Suchbereichen hat sich eine Orientierung an bereits bestehenden logischen Strukturen, wie z.B. die Organisationsbereiche eines Unternehmens, bewährt.
Oft beobachtet man, dass sich ein jahrelanger Wildwuchs auf Dateiservern nun bei der Einführung von leistungsfähigen Suchverfahren rächt – plötzlich tauchen zahlreiche Kopien von gleichen Dateien in den Trefferlisten auf.
In der Praxis werden häufig Kopien von Dateien oder gar ganzen Ordnerstrukturen angelegt, um entweder mit anderen Rechten auf den gleichen Dokumenten zu arbeiten oder einfach einen bequemeren Zugang zu haben. Hier führt kaum ein Weg an einer manuellen Konsolidierung der Dateibestände vorbei.
Auf jeden Fall sollten vor Produktivsetzung einer solchen Lösung nicht nur eine Betrachtung der Problematiken der bereits erwähnten Zugriffsrechte, sondern auch im Hinblick auf die Trefferqualität einige Testreihen durchgeführt werden, um eine möglichst gute Benutzerakzeptanz sicherzustellen.
Mit den vorgestellten Suchfunktionen wird nur ein kleiner Ausschnitt des Produkts beleuchtet. Der SharePoint Portal Server 2003 ist ein komplexes Produkt mit weiteren attraktiven Funktionen, um Informationen innerhalb eines Teams oder auch im gesamten Unternehmen zu bearbeiten und einfacher zugänglich zu machen. Die Lösung stellt konkrete Anforderungen an die Systemumgebung: So muss als Serverplattform Windows 2003 Server mit Active Directory und SQL-Server eingesetzt werden. Ein Exchange Server für Benachrichtigungen zu abonnierten Inhalten ist nützlich und auf den Benutzer-Clients sollte Office 2003 installiert sein. Letzteres ist für ein komfortables Dokumentenhandling und Nutzung der Collaboration-Funktionen unerlässlich.