Der Hauptzweck des automatisierten Posteingangs ist die schnellere und günstigere Vorgangsbearbeitung. Eine Herausforderung ist der Zuwachs an elektronischer Kommunikation mit Kunden und Lieferanten.
Waren Lösungen zur automatischen Posteingangsverarbeitung bis vor einigen Jahren nur bei einer hohen Anzahl von zu verarbeitenden Dokumenten wirtschaftlich zu betreiben, so macht inzwischen die hohe funktionale und preisliche Attraktivität diese Anwendungen auch für kleinere Organisationen interessant. Aus Anwendersicht stellt sich der Markt für die sogenannten Mailroom-Lösungen aufgrund unterschiedlicher Anbietergruppen und Produktansätze sehr unübersichtlich dar. Die folgende Typisierung soll Licht ins Dunkel bringen.
Grundsätzlich beschleunigt bereits die elektronische Weiterleitung von Dokumenten den Transport von Vorgängen zu den Mitarbeitern und ermöglicht eine dezentrale ortsunabhängige Sachbearbeitung. Durch das „frühe“ Scannen der Eingangspost erhalten Anwender außerdem früher die Kontrolle über den ausgelösten Geschäftsprozess, sind somit jederzeit auskunftsfähig und können Vorgänge besser steuern und bei Bedarf auch eskalieren.
Manuelle Tätigkeiten wie das Sortieren, Klassifizieren und Indizieren des Posteingangs erfordern typischerweise Zusatzaufwände im Vergleich zu einer papierbasierten Verarbeitung. Durch das Automatisieren der Posteingangsverarbeitung mit regelbasierter Klassifizierung sollen die Kosten für die Datenerfassung und die dafür erforderlichen Ressourcen reduziert werden.
Weiteres Nutzenpotential verspricht die automatisierte Verteilung von Eingangspost – idealerweise direkt zum richtigen Sachbearbeiter. Durch die maschinelle Verarbeitung lassen sich Erfassungstätigkeiten zentralisieren und Regelwerke vereinheitlichen.
Dunkelverarbeitung spart manuelles Eingreifen
Eine wichtige Zielsetzung bei vielen Anwendern ist die Umsetzung einer sogenannten Dunkelverarbeitung. Insbesondere Standardvorgänge werden dann automatisiert erledigt, ohne dass ein Anwender in den Erfassungs- und Bearbeitungsprozess eingreifen muss. Typische Beispiele dafür sind einfache Bestellvorgänge, die nach vollständiger Erkennung aller relevanten Informationen eine Bestellabwicklung anstoßen oder Mitteilungen von Kunden zu Adressänderungen, die eine automatische Anpassung der Stammdaten in einem betriebswirtschaftlichen System (ERP/Enterprise Resource Planning) veranlassen. In einfachen Fällen kann dies eine automatische Zuordnung von unterschriebenen Rückläuferdokumenten wie Erklärungen oder Verträgen in eine elektronische Akte oder zu einem bestehenden Vorgang sein.
Vorrausetzungen für eine Dunkelverarbeitung sind vorbereitende organisatorische Maßnahmen. Dazu gehört neben der Anpassung eigener Formulare zur Wiedererkennung auch die Abstimmung von Regelwerken mit Partnern, die Dokumente liefern. So kann beispielsweise eine Bestellung ohne Angabe der eigenen Artikelnummer nicht automatisiert verbucht werden. Oftmals bildet die automatische Erfassung einen Einstieg in die Prozessautomation
Strukturierte Inhalte werden gut erkannt
Eine der wesentlichen Herausforderungen bei der automatischen Erkennung von Dokumenten stellt die unterschiedliche Komplexität der Inhalte dar. Vollstrukturierte Dokumente wie beispielsweise Antragsformulare mit festem Layout – die Informationen stehen immer an fest vorgegebenen Stellen – bieten in der Regel die besten Voraussetzungen für das automatische Auslesen.
Stolpersteine sind handschriftliche Texteingaben, die sich mit den aktuell verfügbaren Techniken nur schwer auslesen lassen. Sogenannte semistrukturierte Dokumente besitzen zwar ähnliche Struktur- und Inhaltsmerkmale, sehen dennoch im Detail unterschiedlich aus. Rechnungen sind typische Vertreter semistrukturierter Dokumente. Sie enthalten viele identische Informationsarten, wie Rechnungsnummer, Bruttobetrag, Umsatzsteuer-ID, Bankverbindung, allerdings weicht der Informationsgehalt (Anzahl Rechnungspositionen, Bestellbezug), das Rechnungslayout und damit die Position der relevanten Informationen von Rechnung zu Rechnung deutlich voneinander ab.
Noch komplexer für die automatische Erkennung stellen sich unstrukturierte Dokumente wie Freitext-Schreiben oder klassische Briefe dar. Diese Dokumente weisen in der Regel sehr geringe Formatregeln auf und die für die Weiterverarbeitung notwendigen Informationen sind sehr individuell verteilt.
Vorsortieren senkt die Fehlerquote
Ein Scannen sämtlicher eingehender Papierpost ist nur selten sinnvoll. Meist ist ein manuelles Vorsortieren vor dem Scannen sowieso erforderlich, um entweder sensible Dokumente an den Vorstand, Betriebsrat oder die Personalabteilung oder für die Sachbearbeitung nicht relevante Eingänge wie Werbung und Zeitschriften auszusortieren.
In der Praxis empfiehlt sich eine Dokumententrennung durch Aufbringen von Barcodes oder Einlegen von Trennblättern. Dokumentanhänge, die für die Erkennung nicht relevant sind, sollten idealerweise innerhalb eines Dokuments markiert werden. Belege mit Handschrift sollten im Zuge der Dokumentenvorbereitung aussortiert und einem anderen Verarbeitungsprozess zugeführt werden. Neben der Erleichterung der Klassifizierung lassen sich so auch Lizenzkosten für die Erkennungssoftware sparen. Die Lizenzmodelle vieler Anbieter basieren nämlich auf der Anzahl der jährlich gelesenen Seiten.
Einzelne Anwender überlegen, jeglichen Posteingang von Papierdokumenten, Fax und E-Mail bis zu elektronischen Daten wie EDIFACT-Daten über eine digitale Poststelle zu erfassen und zu steuern. Insgesamt wachsen durch das frühe Scannen die Anforderungen an die Post- beziehungsweise Scanstelle deutlich. Nötig ist ein erweitertes Verständnis für die Sachbearbeitung, und dadurch steigt die Verantwortung der Mitarbeiter in diesem Bereich.
Bei Papierdokumenten erfolgt als Basis einer jeglichen Erkennung die vorherige Wandlung der eingescannten Bildinhalte in Text mittels OCR-Technik (Optical Character Recognition). Die Erkennungsqualität und damit die Richtigkeit der erzeugten Zeichen hängen von mehreren Faktoren ab. Wichtig ist eine gute Bildqualität der Dokumente. Eine zu niedrige Auflösung – oftmals bei Faxübertragung – schlechte Bildqualität oder kleine Schriftarten erschweren den Leseprozess. Bei ausländischen Rechnungen muss die OCR-Engine die dazugehörigen Sprachen sowie Wörterbücher lesen können. Teilweise bieten Erkennungslösungen Möglichkeiten eines Votings an. Das heißt, die Erkennungsanwendung setzt mehrere OCR-Engines parallel zur Erkennung der Zeichen ein, die dann über ihre Ergebnisse abstimmen.
Klassifizierung anhand von Regeln und Statistik
Im nächsten Schritt geht es darum, Informationen aus den Dokumenten zu interpretieren und sogenannte Dokumentklassen zu ermitteln. Die angebotenen Lösungen unterscheiden sich dabei bei den Methoden, die teilweise auch parallel eingesetzt werden. Neben der regelbasierten Erschließung über das Dokumentlayout – die identifizierenden Informationen wie eine Formularbezeichnung stehen immer an derselben Stelle – gibt es die regalbasierte Inhaltssuche nach definierten Begriffen, Nummern, Kennzeichen oder bestimmter Kombinationen. Statistische Verfahren schließen auf Basis der Häufigkeiten von Begriffen im Dokumenttext auf die Dokumentklasse.
Viele Anwender glauben, dass die automatisierte Verarbeitung des E-Mail-Posteingangs erheblich einfacher ist als die potenziell fehlerbehaftete OCR-Wandlung und anschließende Fachdatenextraktion aus Papierunterlagen. Die Schwierigkeiten liegen einerseits darin, dass es für elektronische Post praktisch keine vereinbarten Dateiformate und Layout-Vorgaben gibt und dass E-Mails durch Dateianhänge eine bisweilen sehr komplexe Struktur aufweisen können.
Für die automatische Ermittlung der Dokumentenklasse kommen zumeist sogenannte Trainingsverfahren zum Einsatz. Hierfür stellt ein Fachadministrator zunächst eine Trainingsmenge relevanter gescannter und elektronischer Unterlagen mit vorgegebener Dokumentenklassenzuordnung zur Verfügung. Im Rahmen des automatisch ablaufenden Trainings ermittelt das Capture-System dann eigenständig Regeln zur Unterscheidung der einzelnen Dokumentenklassen.
Mehrere Themen auf einmal überfordern die Automatik
Stolpersteine bei der Klassifizierung sind Dokumente mit mehreren Geschäftsvorgängen in einem Dokument: Ein Kunde möchte in einem Schreiben beispielsweise eine Adressänderung mitteilen und gleichzeitig eine seiner Versicherungen kündigen. Diese Aufgabenstellung ist für eine automatische Klassifizierung kaum lösbar.
Auch eine hohe Ähnlichkeit bei Dokumenten, wie oftmals bei Antragsformularen, die aber unterschiedliche Prozesse in der Folgebearbeitung auslösen, kann zu Missverständnissen bei der Einschätzung der Klassifizierung durch die Erkennung führen. Hier sollte der Anwender für das Aufbringen von eindeutigeren Identifizierungsmerkmalen sorgen.
In vielen Fällen wird Unsicherheit darin bestehen, ob das Dokument einer Klasse A oder der alternativen Klasse B zuzuordnen ist. Über eine Schwellwertvergabe für die automatische Entscheidung kann im System festgelegt werden, wie hoch die Mindestwahrscheinlichkeit für die Zuordnung in die einzelnen Klassen ausfallen muss. Das Risiko einer unerkannten Fehlzuordnung von Dokumenten („False-Positive“) durch eine vermeintlich sichere, daher unkontrollierte, aber falsche Klassifizierung lässt sich so deutlich verringern.
Extraktion erschließt die Dokumenteninhalte
Nachdem die Dokumentklasse identifiziert wurde, geht es darum, die fachlich relevanten Informationen aus den Dokumenten zu gewinnen. Dazu muss das System, basierend auf Regelwerken, die Dokumente nach den für die Weiterverarbeitung erforderlichen Daten durchsuchen. Typische Fragen hierbei lauten: Welche Zahl ist der Rechnungsnettobetrag? Welcher Textbereich beinhaltet den Kundennamen? Welche Zeichenkette benennt die Kontonummer? Wie lautet das Rechnungsdatum?
Die Erkennungsqualität und damit Richtigkeit der gelieferten Daten hängt zu einem wesentlichen Teil von den Überprüfungsmöglichkeiten der ausgelesenen Informationen gegen vorhandene Stamm- und Bewegungsdaten aus dem ERP-System oder aus Fachanwendungen ab.
Manche Lösungen bieten bei Erkennung anhand von Stammdaten mit fehlertoleranten Suchen (Fuzzy Search) die Möglichkeit, Erkennungs- oder Schreibfehler auszugleichen und aufgrund von Ähnlichkeiten zwischen dem Suchbegriff und den Einträgen in der Datenbank trotzdem den entsprechenden Kunden zu ermitteln. Hierbei trifft die Software über Schwellwerte eine Entscheidung zwischen „sicher“, „unsicher“ oder „nicht erkannt“.
Nachbearbeitung korrigiert falsche Zuordnungen
Auch das beste System wird immer wieder einmal Belege nicht korrekt erkennen. Diese Belege und die bis dato ermittelten Daten werden den dafür verantwortlichen Mitarbeitern zur Validierung vorgelegt, geprüft und gegebenenfalls korrigiert.
Hierbei unterscheiden sich u.a. auch die Trainingskonzepte der Lösungen. Sogenannte selbstlernende Systeme merken sich die Korrekturen durch Validierungsmitarbeiter, so dass sie beim nächsten Beleg des gleichen Typs den Aufbau und die Position der auszulesenden Daten ohne Korrektur erkennen. Der Nachteil dieser Variante ist, dass durch das Training von Dokumenten des gleichen Typs durch mehrere Mitarbeiter mit Definition unterschiedlicher Merkmale, nach einer Weile des produktiven Betriebs das Zusammenwirken des Regelwerks nicht mehr nachvollziehbar und auch nicht mehr korrigierbar ist.
Wegen der vorher beschriebenen Problematik bauen andere Lösungskonzepte auf konkreten, definierten Trainingsmengen auf. Läuft ein Beleg in der Validierung auf einen Fehler, kann der Anwender diesen Beleg in einen definierten Trainingsprozess geben. Da der Einsatz dieser Funktionen ein umfangreiches Know-how der Lösung und der Arbeitsweise der Erkennung und Validierung erfordert, sollte das Training der Lösungen auf wenige, speziell geschulte Personen begrenzt werden, um sicherzustellen, dass nur sinnvolle Inhalte in das produktive Regelwerk übernommen werden.
Rechnungen und Bestellungen out-of-the-box erkannt
Einer der am weitesten verbreiteten vorkonfigurierten Erkennungslösungen ist die automatisierte Rechnungseingangsbearbeitung. Wesentlicher Bestandteil dieser Anwendungen sind Erfassungsfunktionen, die auf Belegarten wie Rechnungen und Gutschriften trainiert und darauf eingerichtet sind, typische Dokumentendaten wie Teil- und Gesamtbeträge, Mehrwertsteuer sowie Steuernummer und Bankverbindungen eigenständig zu ermitteln. Das ZUGFeRD-Konzept („Zentraler User Guide des Forums elektronische Rechnung Deutschland“) ermöglicht es, dass Rechnungen eine visuelle Darstellung in einem PDF-Dokument und gleichzeitig (in einer strukturierten XML-Datei) formalisierte Rechnungsinformationen bieten. Der Rechnungsempfänger kann dadurch die strukturierten Rechnungsdaten ohne Erkennungsfunktionen direkt an die Buchhaltungssoftware oder das Dokumenten Management System übergeben. Ähnliche Lösungspakete gibt es auch für die Bestell- und Vertragsverarbeitung.
Der Posteingang ist im heutigen Verständnis nicht auf Papierpost begrenzt, sondern umfasst sämtliche Medien und Verfahren, die bearbeitungsrelevante Dokumente zustellen. In vorderster Front sind das E-Mail, aber auch Faxe und elektronische Datenübermittlungen wie EDI (Electronic Data Interchange). Für Unternehmen bedeutet die Einführung einer digitalen Poststelle, dass sie neben der Zentralisierung des Posteingangs und automatisierter Erfassungsfunktionen zusätzlich eine Postkorbfunktion inklusive einer Dokumentenverteilung benötigen.
Reine Erkennungslösungen enthalten solche Funktionskomponenten nur selten. Anbieter von Capture-Lösungen gehen davon aus, dass diese Aufgabe spezialisierte Postkorbanwendungen übernehmen, die häufig eng mit dem Dokumenten Management System integriert sind. Wichtig aus Benutzersicht ist einheitliche und ergonomische Bedienung der Capture-Anwendung für Verarbeitung unterschiedlicher Eingangskanäle. Alternativ bieten auch Dienstleister Möglichkeiten der automatisierten Posteingangsverarbeitung und Bereitstellung der Dokumente und Daten.
Vorabanalyse sichert den Projekterfolg
Wesentlich für den Projekterfolg bei der Einrichtung einer automatischen Posteingangsverarbeitung ist die realistische Einschätzung des Automatisierungsumfangs. Neben der Eingangspost sollten Unternehmen auch ihre Ausgangspost dahingehend analysieren, welche Schreiben und Formulare vom Partner ausgefüllt zurückgesendet werden und diese mit einem Barcode oder QR-Code (Quick Response Code) versehen. Diese Markierungen unterstützen die Klassifizierung mit besonders hoher Sicherheit und tragen zudem zur Erhöhung der Dunkelverarbeitung bei. Pauschale Aussagen zu möglichen Erkennungsquoten sind immer in Relation zur Bezugsgröße zu betrachten. Die realistische Einschätzung der Erkennungsraten kann nur auf Basis von Tests mit eigenem Beleggut erfolgen.
Ein wichtiger Erfolgsfaktor ist die Bereitstellung entsprechender Qualität der Dokumente am Posteingang. Dazu gehört neben der Qualität der Lesbarkeit auch die Vorbereitung und fachlich richtige Trennung von Dokumenten und Anhängen. Einzuplanen sind auch regelmäßige administrative Tätigkeiten wie Training von Dokumenten, Überwachung der gesamten Verarbeitung aus fachlicher und technischer Sicht. Insgesamt wachsen durch die automatische Posteingangsverarbeitung die Anforderungen an die Post- beziehungsweise Scanstelle in Bezug auf ein erweitertes Verständnis für die Sachbearbeitung und die Verantwortung.
Die automatisierte Posteingangsverarbeitung ist zu Recht auf dem Vormarsch. Auf dem Markt gibt es inzwischen zahlreiche leistungsfähige Produkte, die teilweise mit gänzlich unterschiedlichen Techniken arbeiten. Einige Lösungen gehen über reine Erfassungsfunktionen hinaus und unterstützen die weitergehende elektronische Postkorbbearbeitung.
Mit dem richtigen Auswahlverfahren finden Anwender die für sie am besten passende Lösung, die sowohl die eigenen funktionalen als auch die organisatorischen Anforderungen abdeckt und deren Beschaffungs- und Betriebskosten in einer wirtschaftlichen Relation zum Automatisierungserfolg stehen. Parallel zur Einführung der Capture-Lösung muss aber die eigene Organisation für die zukünftigen Verarbeitungsprozesse vorbereitet werden. Die Capture-Lösung wird schließlich zu einer erfolgskritischen Komponente für das Unternehmen.