Immer mehr Unternehmen und Organisationen etablieren die digitale Poststelle und geben die Eingangspost nur noch elektronisch in Umlauf. Dennoch befinden wir uns erst am Anfang einer Entwicklung, die zwar erfreulich an Fahrt gewinnt, aber noch zahlreiche Herausforderungen zu meistern hat. Was nach Stand der Technik möglich ist und wie die ehrgeizigen Ziele erreicht werden können, zeigt der folgende Artikel.
Die „digitale Poststelle“ ist kein verbindlich definierter Begriff. Viele Anwender von Dokumenten-Management Systemen (DMS) und der Autor selbst verstehen bereits die „normale“ Scanstelle als digitale Poststelle, falls dort der Posteingang digitalisiert und über elektronische Postkorbsysteme zur Sachbearbeitung geleitet wird.
Andere Anwender, die vielleicht noch kein DMS einsetzen, haben oft ein weiter gehendes Verständnis von diesem Begriff und setzen ihn mit einem anderen ebenso wenig definierten Begriff gleich, der sogenannten Mailroom-Lösung. Hierunter wird in der Regel verstanden, dass jeglicher Dokumenteneingang in der Poststelle zentral aufgenommen und anschließend digital in die Sachbearbeitung geleitet wird, egal, aus welcher Quelle er stammt bzw. auf welchem Wege er übermittelt wurde. In diesem weiter gehenden Verständnis ist der Posteingang somit nicht auf die Papierpost begrenzt, sondern umfasst alle Medien und Verfahren, die bearbeitungsrelevante Dokumente zustellen, in vorderster Front E-Mail, aber auch Fax-Eingang und Datenübermittlungen wie EDI sowie andere elektronische Datenaustauschverfahren.
Herausforderungen im frühen Papiereingang-Scannen
Das frühe Scannen des gesamten Papiereingangs stellt zunächst zahlreiche Herausforderungen an Unternehmen.
Auf der organisatorischen Seite gibt es wesentliche Fragen zu klären, beispielsweise nach welchen fachlichen Kriterien der Dokumentenzuschnitt erfolgen soll oder ob der Anhang als separates Dokument oder als Folgeseiten des Anschreibens gescannt werden soll.
Zudem ist die Papierlagerung im Anschluss an die Scanverarbeitung zu organisieren. Diese Aufgabe gewinnt an Bedeutung, wenn ein spürbarer Anteil der Post noch im Original benötigt wird, wie z.B. Kundenunterlagen, die wieder zurückgesendet werden müssen. Insbesondere ist jedoch zu klären, für welchen Zeitraum die Lagerung der Originale vorzusehen ist: Zunächst sind diejenigen Unterlagen, die dauerhaft aufbewahrt werden sollen, von den zu vernichtenden Unterlagen zu trennen und anschließend in eine Lagerstätte zu transportieren. Häufig kommen für die Trennung Regeln zum Einsatz, die von der Klassifizierung der Dokumente abhängig sind, wie z.B. „Verträge 10 Jahre aufbewahren, Korrespondenz nach kurzer Zwischenlagerung vernichten“. Erfolgt die Klassifizierung der Dokumente jedoch erst nach dem Scanvorgang, dann müssen die gescannten Unterlagen nachträglich in den aufzubewahrenden und den zu vernichtenden Teil getrennt werden, eine relativ mühselige und fehlerträchtige Tätigkeit.
Insgesamt wachsen durch das frühe Scannen die Anforderungen an die Post- bzw. Scanstelle deutlich, es wird ein erweitertes Verständnis für die Sachbearbeitung verlangt und damit die Verantwortung der Mitarbeiter in diesem Bereich teilweise deutlich erweitert.
Nutzen automatischer Erkennung
Das frühe Scannen allein bietet bereits den Vorteil, die Eingangspost beschleunigt durch die Bearbeitung schleusen zu können und frühzeitig eine hohe Auskunftsfähigkeit herbeizuführen. Durch automatische Datenerkennung innerhalb der Eingangsbearbeitung können überdies Dateneingaben sowohl im Dokumentenerfassungsprozess sowie in der eigentlichen Sachbearbeitung eingespart werden. Dieses Ansinnen gelingt dank erstaunlich leistungsfähiger Erkennungsprodukte (auch „Capture“-Produkte genannt) zwischenzeitlich erheblich besser als noch vor wenigen Jahren. Können alle benötigten Vorgangsdaten aus dem Dokumenteninhalt ermittelt werden, erfolgt immer häufiger eine vollautomatische fachliche Bearbeitung, die sog. „Dunkelverarbeitung“. Diese Variante bietet natürlich das höchste Einsparpotenzial, bedingt aber besonders gute Erkennungsraten und Sicherheit in der Datenermittlung, die mit heutiger Technik nur für einige vollständig strukturierte Formulare und für wenige zumindest halbwegs strukturierte Dokumente, wie manche Rechnungen, erreichbar sind.
Zwei Hauptaufgaben: Klassifizierung und Datenermittlung
Für die geordnete DMS-Ablage und Zuleitung früh gescannter Unterlagen zum zugehörigen Sachbearbeiter müssen in der Regel zwei unterschiedliche Arten fachlicher Zuordnungen stattfinden: Zunächst ist das Dokument in eine vorgegebene Dokumentenklasse einzuordnen („Vertrag“, „Bestellung“, „Rechnung“ etc.) und anschließend sind die zugehörigen Suchkriterien abhängig von der Dokumentenklasse zu ermitteln, beispielsweise bei Bestellungen die Bestellnummer und der Debitor, bei Rechnungen die Rechnungsnummer und der Kreditor.
Erfassungslösungen stellen daher für diese beiden Aufgabenstellungen häufig separate Anwendungsmodule bereit. Diese Trennung ist sinnvoll, denn längst nicht in allen Erfassungsumgebungen werden beide Funktionen – die Klassifizierung und die Datenermittlung – benötigt. So kann eine Vorsortierung von Papierunterlagen, z.B. das Bilden von Rechnungsstapeln, eine elektronische Klassenermittlung unnötig machen, wenn die Dokumentenklasse (hier: Rechnung) direkt bei der Stapelanlage angegeben wird. Basis jeglicher Erkennung ist in den meisten Fällen die vorherige Wandlung der Bildinhalte in Text, die mittels OCR-/ICR-Technik (Optical / Intelligent Character Recognition) erfolgt.
Für die automatische Ermittlung der Dokumentenklasse kommen zumeist „Trainings“-Verfahren zum Einsatz. Hierfür stellt ein Fachadministrator zunächst eine Trainingsmenge gescannter Unterlagen mit vorgegebener Dokumentenklassenzuordnung zur Verfügung. Im Rahmen des automatisch ablaufenden Trainings ermittelt das Capture-System dann eigenständig Regeln zur Unterscheidung der einzelnen Dokumentenklassen, die es je nach Produkt aus Layout- und Textinformationen der bereitgestellten Dokumente ableitet. Einige Produkte erlauben dem Administrator, anschließend durch Customizing oder Programmierung zusätzlich Einfluss auf die Regelverarbeitung zu nehmen. Manche Systeme sind überdies mit einer dynamischen Lernfunktion ausgestattet, die Korrektureingaben der Anwender überwacht und selbstständig das Regelwerk im laufenden Betrieb anpasst. Hierdurch erhöht sich zwar die Flexibilität der Regelpflege enorm, allerdings wird es immer schwieriger nachzuvollziehen, welche Einstellungsänderung welche Erkennungswirkung hervorruft, was gerade bei Verschlechterungen der Erkennungsleistung von besonderer Wichtigkeit ist.
Abbildung 1: Aufgabenspektrum der Erkennungsverarbeitung
Die Vorgaben bestimmen den Erfolg
Für die Festlegung der Dokumentenklassen und die Zusammensetzung der Trainingsmengen ist ein großer Erfahrungsschatz hilfreich, denn ungünstig gestaltete Klassifizierungsanforderungen verhindern einen hohen Automationsgrad; bei unzureichenden Erkennungsraten sind häufig nicht nur die Produkteinstellungen, sondern ggf. auch die Trainingsdokumente und der Klassifizierungsrahmen anzupassen.
Bei der produktiven Eingangsbearbeitung wenden die Erkennungslösungen die Klassifizierungsregeln an und ermitteln Wahrscheinlichkeiten für die Zuordnung des einzelnen Dokuments zu den verschiedenen trainierten Dokumentenklassen. Über teilweise einstellbare Schwellwerte wird entschieden, ob die ermittelte Dokumentenklasse ungeprüft übernommen oder ob eine von einem Bediener besetzte Korrekturfunktion angesteuert wird.
In vielen Fällen besteht die Unsicherheit darin, ob das Dokument einer Klasse A oder der alternativen Klasse B zuzuordnen ist. Bei der Schwellwertvergabe für die automatische Entscheidung kann der Administrator daher in einigen Systemen festlegen, wie hoch die Mindestwahrscheinlichkeit für die Zuordnung zur Klasse B ausfallen muss und in manchen Systemen auch, wie groß die Differenz zwischen den Zuordnungswahrscheinlichkeiten zwischen A und B liegen muss, um eine „sichere“ Entscheidung zu treffen.
Nie sicher – immer nur wahrscheinlich
Diese auf Wahrscheinlichkeiten beruhende Entscheidung kann dennoch falsch sein, man spricht dann von einer „False Positive“-Zuordnung. Solche Fehlzuordnungen können gravierende Auswirkungen haben: Im harmlosesten Fall gelangt das Dokument zum „falschen“ Bearbeiter, der eine Korrektureingabe tätigen und hiermit die Zuleitung zum zuständigen Sachbearbeiter initiieren muss. In ungünstigeren Fällen gelangt das Dokument beispielsweise gar nicht erst in die Bearbeitung und bleibt in der falschen Akte liegen oder ein besonders schützenswertes Dokument könnte solchen Mitarbeitern zugänglich werden, die fachlich nicht zugriffsberechtigt sind.
Als Nebenbedingung für die automatische Klassifizierung ist für viele Anwender daher wichtig, „False Positive“-Entscheidungen tunlichst zu vermeiden. Hierfür eignen sich einerseits die in den Produkten enthaltenen manuellen Prüffunktionen sowie die fachliche Aufteilung der Dokumente in möglichst eindeutig erkennbare Klassen.
Für die zweite Erkennungsaufgabe, die Ermittlung von Recherche- und Fachdaten, verwenden die Lösungen für Formulare zumeist positionsbezogene Datenermittlungsverfahren und für semi-strukturierte Dokumente wie Rechnungen und Bestellungen komplexere Text-, Phrasen- und Datensuchverfahren. Positionsbezogene Datenermittlungsverfahren liefern heutzutage bei guten Vorlagen bereits sehr hohe Erkennungsraten – allerdings muss der Administrator in den meisten Systemen für alle Formulare und für alle Formularvarianten angeben, an welcher Position welche Daten auszulesen sind. Hierdurch entsteht ein hoher Pflegeaufwand, der sich nur bei entsprechend hohem Formularaufkommen rechnet.
Die Datenermittlungsaufgabe ist für semi-strukturierte Dokumente erheblich komplexer als für Formulare: In diesen Lösungen muss die Erfassungsanwendung eigenständig die gesuchten Informationen finden und sucht hierbei bspw. zunächst nach Begriffen wie „Bestellung“ oder „Bestellnummer“ in allen möglichen Schreibweisen sowie deren Synonyme, um im Umfeld dieses Begriffes im nächsten Schritt die Bestellnummer zu ermitteln, auf die sich die Rechnung bezieht. Um die fachlichen Fehler, insbesondere Fehlzuordnungen, zu vermeiden, wird in Scanumgebungen typischerweise auf Fachdaten zurückgegriffen. Hierfür werden die Indexieranwendungen mit Prüfroutinen und Nachschlagetabellen versehen, die es der Lösung erlauben, die Einheit der Dokumenteninhalte mit den zum Dokument vergebenen Schlüsselzuordnungen (Kunde, Lieferantennummer etc.) und weiteren Zuordnungsdaten, wie Name und Adresse, abzugleichen.
Bei der Auswahlentscheidung für eine bestimmte Erkennungslösung muss daher immer auch die Möglichkeit zur Datenintegration berücksichtigt werden, die am besten über eine vom Hersteller mitgelieferte Standardfunktion bereitgestellt wird. Die Schnittstelle muss bi-direktional gestaltet sein, denn einerseits nutzt die Erkennungslösung bestehende Fachdaten für die Verifizierung ermittelter Daten, und andererseits stellt die Lösung erkannte Daten für die Fachanwendung bereit. Für gängige Fachdaten- und ERP-Systeme, insbesondere für SAP, bieten die Hersteller von Erkennungssystemen häufig Standard-Schnittstellen an.
Bereits die bisherigen Darstellungen verdeutlichen die Komplexität der am Markt angebotenen Capture-Lösungen, die häufig aus vielfältigen Modulen bestehen und mit unterschiedlichen Systemen und Anwendungen zu integrieren sind, wie folgende Grafik zusammenfasst:
Abbildung 2: Einbindung von Capture-Systemen in Systeme und Abläufe
Vorkonfigurierte Lösungen
Für einzelne Anwendungsbereiche, wie die Rechnungseingangsbearbeitung, werden vorkonfigurierte Lösungen angeboten. Wesentlicher Bestandteil der Lösungen sind zumindest Erfassungsfunktionen, die bereits auf typische Belegarten wie Rechnungen und Gutschriften trainiert sind. Daher kennen diese Anwendungen bereits den typischen Grundaufbau bestimmter Dokumentenarten (hier Rechnung) und sind darauf eingerichtet, typische Dokumentendaten wie Teil- und Gesamtbeträge, MwSt.-Sätze und –Beträge sowie Steuernummern und Bankverbindungen eigenständig zu ermitteln.
Zu den besonderen Herausforderungen der Rechnungsdatenerkennung gehören die Kreditorenermittlung sowie die automatische Rechnungseinzelpostenerkennung. Die Kreditorenermittlung gestaltet sich umso schwieriger, je mehr Adress- und Firmendaten auf einer einzigen Rechnung zu finden sind, was z.B. bei Rechnungen von Unternehmen größerer Konzerne häufiger der Fall ist.
Die Rechnungseinzelpostenerkennung stellt deshalb eine Herausforderung dar, weil es keine einheitliche (Tabellen-)Struktur von Rechnungsposten gibt und die einzelnen Rechnungsposten für die Erkennungssoftware schwierig voneinander abzugrenzen sind, da sie sich über mehrere Zeilen erstrecken können.
Was das menschliche Auge schnell als zusammengehörig erkennt, kann für eine automatisierte Erkennung zu einer echten Herausforderung werden. Dies gilt auch häufig für die Bankverbindungsdaten, die vornehmlich im Fußbereich klein gedruckt bei einigen Rechnungen vertikal und bei anderen Rechnungen horizontal tabellarisch aufgeführt sind.
Zumeist enthalten Rechnungseingangslösungen neben Erkennungsfunktionen auch Postkorb- und Fachfunktionen, wie z.B. das Rechnungseingangsbuch. Daher bieten diese Fachlösungen Unternehmen häufig einen besonders schnellen, fachspezifischen Einstieg in die digitale Posteingangsbearbeitung bei gleichzeitig deutlich erhöhter Übersicht über laufende Prozesse und Außenstände.
Vorkonfigurierte Erkennungslösungen werden zunehmend auch für weitere Fachfunktionen angeboten, wie z.B. für das Bestellwesen, Personal- und Vertragsverwaltung, allerdings ist das Angebot für elektronische Eingangsrechnungsbearbeitung derzeit am weitesten gestreut.
E-Mail wehrt sich gewaltig
Viele Anwender glauben, dass die automatisierte Verarbeitung des E-Mail-Posteingangs (sog. Mailroom-Lösung) erheblich einfacher vonstatten gehen sollte als die potenziell fehlerbehaftete OCR-Wandlung und anschließende Fachdatenextraktion aus Papierunterlagen. Tatsächlich sind jedoch für die automatische Klassifizierung, Schlüsselermittlung und Datenauslesung von E-Mails erhebliche Hürden zu nehmen, um zu brauchbaren Ergebnissen zu gelangen. Die Schwierigkeiten liegen einerseits darin, dass es praktisch keine vereinbarten Dateiformate und Layoutvorgaben für E-Mails gibt und dass E-Mails durch enthaltene Dateianhänge eine bisweilen sehr komplexe Struktur aufweisen können. Zudem erfolgt die Korrespondenz per E-Mail häufig erheblich individueller und unvollständiger als per Briefpost, so dass Sachverhalte und Zusammenhänge in E-Mails vielfach nicht klar ausgeführt sind, da sie parallel bereits über einen anderen Kommunikationskanal ausgetauscht wurden.
Postverteilung: Von der Scanstelle in die Sachbearbeitung
Funktionen für die Postverteilung und den Postkorbzugriff werden zwar in den angesprochenen Rechnungsverarbeitungslösungen häufig mitgeliefert, reine Capture-Lösungen enthalten solche Funktionskomponenten in der Regel jedoch nicht. Zu Recht gehen die Anbieter von Capture-Lösungen davon aus, dass es für diese Aufgabenstellungen bereits etablierte, häufig auf das jeweils eingesetzte DMS bezogene Postkorblösungen gibt, für die eine Anbindung sinnvoller ist als die Schaffung eines Postkorb-Konkurrenzproduktes.
Für Anwenderunternehmen bedeutet die Einführung der digitalen Poststelle allerdings, dass sie neben der Erfassungsfunktion zusätzlich eine Postkorbfunktion inklusive Dokumentenverteilung benötigt. Während das Zuordnungsregelwerk für Eingangspost in fast allen Projekten zunächst als trivial eingestuft wird, wird das Ausmaß der Komplexität häufig erst im weiteren Projektverlauf deutlich. Gruppen- und rollenbezogene Postkörbe sollen dann häufig die Anwendung unabhängig von der Verfügbarkeit einzelner Personen gestalten. Allerdings besteht auch in diesen Umgebungen die Notwendigkeit zu überwachen, ob die Gruppen bzw. Rollen überhaupt besetzt sind und die zugeordnete Eingangspost auch abgearbeitet wird. Hier helfen Postkorblösungen, die neben der reinen Zustellfunktion flexible Verteilfunktionen bieten und bestehende Postkorbinhalte nicht aus dem Auge verlieren.
Wesentliche nicht-funktionale Anforderungen
Auf der technischen Seite erfordert die digitale Posteingangsbearbeitung zugleich erheblich höhere Systemressourcen einerseits für die automatisierten Erfassungsaufgaben und andererseits für die erhöhte Zugriffslast, die das DMS-/Postkorbsystem bedienen muss. Bedingt durch die elektronische Bereitstellung der Unterlagen finden in Postkorblösungen bereits während der Sachbearbeitung zahlreiche Dokumentenzugriffe auf die Eingangspost statt, die in Umgebungen späterer Archivierung entfallen.
Im Bereich der Erfassungslösungen besteht in der Regel ständiger Optimierungsbedarf. Um die hierfür notwendigen Konfigurationsänderungen sicher in die Produktionsumgebung einspielen zu können, ohne hierbei Einbußen in der bestehenden Produktion hinnehmen zu müssen, sind Test- und Change-Verfahren sowie deren systemtechnische Unterstützung von besonders hoher Bedeutung.
Zudem ist durch geeignete technische Maßnahmen sicherzustellen, dass die Erfassungs- und Postkorb-Lösung ständig verfügbar ist, denn ihr Ausfall verhindert die Verarbeitung der Eingangspost durch die Sachbearbeitung. In einigen Kundenumgebungen ist es überdies wichtig, dass die Erfassungslösung unterschiedliche Verarbeitungskanäle bereitstellt und über Priorisierung ermöglicht, dass einzelne Kanäle, wie z.B. Faxeingang, zu einer unmittelbaren Erkennung geleitet werden, vergleichbar der Schnellkasse im Supermarkt.
Der richtige Ansatz
Wesentlich für den Erfolg bei der Einrichtung der digitalen Poststelle ist die realistische Einschätzung und Planung des Automatisierungsumfangs. Unternehmen sollten ihre Ausgangspost dahingehend analysieren, welche Schreiben und Formulare vom Partner ausgefüllt zurückgesendet werden und diese mit einem Barcode oder QR-Code versehen. In der digitalen Poststelle können diese Markierungen mit besonders hoher Sicherheit eine Klassifizierung unterstützen und ggf. auch zur Datenermittlung genutzt werden.
Für die Auswahl der „richtigen“ Lösung sind einerseits die Dokumenteneingänge zu analysieren und andererseits griffige Klassendefinitionen vorzunehmen, wobei die Zuordnungen aus den Dokumenteninhalten möglich sein sollten. Um Lösungen geordnet vergleichen zu können, hat es sich bewährt, Anforderungskataloge mit den wesentlichen geforderten Funktionskomponenten zu verwenden, auch wenn diese noch keine Antwort auf die Frage bieten können, welche Erkennungsraten die einzelnen Produkte tatsächlich liefern. Die Abschätzung der Erkennungsraten erfolgt in vielen Projekten tatsächlich auf Basis von Teststellungen. Doch aufgepasst – die ordentliche Planung und Durchführung von Erkennungstests erfordert einen hohen Vorbereitungs-, Durchführungs- und Auswertungsaufwand.
Fazit
Die digitale Poststelle ist zu Recht auf dem Vormarsch. Auf dem Markt gibt es zwischenzeitlich zahlreiche Lösungsangebote, die teilweise unter Verwendung gänzlich unterschiedlicher Techniken arbeiten. Einige Lösungen gehen über reine Erfassungsfunktionen hinaus und bieten Unterstützung für die weitergehende Postkorbbearbeitung sowie Fachfunktionen. Mit geeigneten Werkzeugen und dem richtigen Vorgehen finden Anwender die passende Lösung, die sowohl die funktionalen als auch die nicht-funktionalen Anforderungen abdeckt und deren Beschaffungs- und Betriebskosten in einer wirtschaftlichen Relation zum Automatisierungserfolg stehen.
Hinweis: Dieser Artikel ist in ähnlichem Wortlaut in der Computerwoche-Online am 11. März 2013 veröffentlicht worden.