Fachbeiträge

Ausgabe 12 / /2019
Fachbeitrag Dokumentenmanagement

KI richtig nutzen: Wie Unternehmen von Document Intelligence profitieren

von Karolin Köstler

Die Mehrheit der Unternehmen ist mit steigenden Anforderungen an das Dokumentenmanagement konfrontiert. Sie müssen Arbeitsabläufe, Geschäftsprozesse und den Zugriff auf Dokumenteninhalte verbessern, die Kosteneffizienz steigern sowie Sicherheit und Compliance gewährleisten. Document Intelligence unterstützt Unternehmen bei der Bewältigung dieser Aufgaben, indem es mittels maschinellen Lernens umfangreiche Dokumentenmanagementprozesse automatisiert. Dabei existieren verschiedene Typen von Document Intelligence, die aufeinander aufbauen. Einige der Typen finden in gehobenen mittelständischen und Großunternehmen bereits Anwendung. Andere werden erst in der Zukunft relevant sein. Sie können aber bereits jetzt ein Anhaltspunkt sein, wohin sich die Wirtschaft entwickeln wird und wie Unternehmen zukünftig von der Künstlichen Intelligenz (KI) profitieren. Die richtige Wahl setzt jedoch fundierte Kenntnisse der einzelnen Typen voraus.

Inhaltsübersicht:

Typ 1 – Dokumentenklassifizierung KI

Der erste Document-Intelligence-Typ ist die KI-gestützte Klassifizierung von Dokumenten. Dabei werden Dokumente automatisiert einer oder mehreren Kategorien zugeordnet. Mithilfe maschinellen Lernens wird der Inhalt eines Dokuments analysiert, indiziert und mit Strukturinformationen versehen (Tagging). Mittels Taggings können Dokumente automatisiert in definierte Ordner abgelegt bzw. an bestimmte Gruppen oder Personen weitergeleitet werden. Davon profitieren insbesondere Organisationen wie Bibliotheken oder Medienunternehmen, die mit einer riesigen Menge unterschiedlicher Inhalte konfrontiert sind. Es kann aber auch für eine Vielzahl anderer Funktionen hilfreich sein. Beispielsweise werden im Rahmen der Dokumentenklassifizierung Rechnungen erkannt, als solche gekennzeichnet und an die Kreditorenbuchhaltung weitergegeben. Dieser Klassifizierungsprozess lässt sich durch das Erlernen von Benutzeraktionen mit Dokumenten weiter verfeinern. Dokumente werden dann – basierend auf aktuellen Arbeitsabläufen und spezifischen Inhaltsanforderungen – einzelnen Personen automatisch zugewiesen.

Typ 2 – Dokumenteninhalt KI

Ein KI-gestützter Dokumenteninhalt greift die Klassifizierung (Typ 1) auf und erweitert sie. Nachdem die Algorithmen des maschinellen Lernens die Klassifizierung verstanden haben, können sie weiter in die Tiefe gehen und untersuchen, ob domänenspezifische Begriffe erkannt und extrahiert werden können. Falls dies gelingt, werden sie in geordnete Objekte umgewandelt und mithilfe von APIs (Application Programming Interfaces; deutsch: Programmierschnittstellen) anderen Anwendungen, wie Rechnungswesen- oder Finanzsystemen, zugeordnet. Für Dokumente, die Standardformaten wie Rechnungen oder Bestellformulare entsprechen, ist dies leichter umsetzbar. Beispielsweise können Daten wie der Zahlungsempfänger, der Zahlungsbetrag und die Zahlungsbedingungen aus einer Rechnung extrahiert und direkt in ein Kreditorensystem eingespeist werden. So wird die Verarbeitung weiter automatisiert und die Datengenauigkeit erhöht, da menschliche Übertragungsfehler ausgeschlossen sind.

Typ 3 – Textanalyse oder Zusammenfassung mittels KI

Eine KI-basierte Textanalyse oder inhaltliche Zusammenfassung ist ein weiterer Ansatz zur Analyse des Dokumenteninhalts. Im Gegensatz zu Typ 2, bei dem Daten in geordneten Objekten extrahiert und strukturiert werden, versteht Typ 3 das Thema und die Semantik des Inhalts als Ganzes und stellt diese in Form einer Zusammenfassung zur Verfügung. Dieser KI-Typ eignet sich am besten für Unternehmen, die sehr große und komplexe Dokumente erhalten und schnell verstehen müssen, welche Informationen das Dokument enthält. Beispiele dafür sind rechtliche Überprüfungen oder die Prüfung neuer Arzneimittel.

Der Status quo in Unternehmen

Derzeit sind viele Unternehmen dabei, eine KI-gestützte Dokumentenklassifizierung (Typ 1) zu implementieren und den Einsatz KI-gestützter Dokumenteninhalte (Typ 2) zu evaluieren. Großunternehmen, wie Versicherungsunternehmen oder Banken mit großen internen Data-Science-Teams, sind dahingegen häufig schon einen Schritt weiter und interessieren sich für eine Einführung von Typ 3, um Dokumente inhaltlich zu verstehen.

Das bringt die Zukunft: Typ 4 – Deep Document Recognition KI

Die zuvor beschriebenen Typen von Künstlicher Intelligenz eignen sich am besten für Dokumente mit reinem Text, ohne ausgefallene Formatierungen oder komplexe Inhalte. Welche Art von Dokumenten enthält erweiterte Formatierungen und Inhalte? Beispiele hierfür wären eine Zeitung, in der Artikel von einer Seite zu einer bestimmten Stelle auf einer anderen Seite „springen“, Dokumente mit mehreren Spalten oder solche, die Inhalte mit vielen Sprüngen über Tabellen, Bilder oder Diagramme hinweg enthalten. Ebenso sind es Dokumente in einer Fremdsprache, die übersetzt werden müssen. Ein weiteres Beispiel sind Dokumente, die gescannte Diagramme oder Tabellen enthalten, die in eine CSV-Datei oder nach Excel konvertiert werden müssen. Beides kann durch automatische Verarbeitung mit einer Deep Document Recognition gelingen. Doch wie können Algorithmen für maschinelles Lernen die Lesereihenfolge und den Inhalt der Informationen in diesen Dokumententypen genau erkennen und erlernen? KI-Entwickler haben diese Probleme noch nicht gelöst, aber sie werden in den kommenden Jahren im Mittelpunkt von Anbietern im Bereich Document Intelligence stehen.

Das Kosten- vs. Genauigkeits-Dilemma

Algorithmen für maschinelles Lernen sind sehr komplex und erfordern eine hohe Rechenleistung, um präzise zu sein. Infolgedessen wird die KI-basierte Dokumentenverarbeitung meist in der Cloud ausgeführt, in der weit mehr Rechenressourcen verfügbar sind als auf dem Desktop. Daher müssen Client-Anwendungen KI-Dienste entweder von Private Clouds anfordern (d. h. Cloud-Diensten, die „on premise“ sind; das bedeutet, die Dienste werden auf Servern innerhalb der unternehmensinternen Firewall installiert) oder von Public Clouds (das heißt, die Dienste werden auf Servern außerhalb der Firewall des Unternehmens installiert). Der Vorteil von Public Clouds besteht darin, dass sie in der Regel kostengünstiger sind und durch eine monatliche Gebühr sowohl der Service als auch die Kosten für die IT-Verwaltung abgedeckt sind. Der Vorteil von Private Clouds besteht darin, dass die Daten die Unternehmensinfrastruktur nicht verlassen. Das vermittelt Unternehmen das Gefühl, dass ihre Daten besser geschützt sind.

Das Kosten- vs. Genauigkeits-Dilemma besteht also darin, dass mehr Rechenleistung maschinellen Lernalgorithmen mehr Komplexität ermöglicht und sie mit einer höheren Präzision lernen können. Gleichzeitig bedeutet das aber auch, dass höhere Kosten und längere Verarbeitungszeiten für Dokumente anfallen. Unternehmen können die Kosten senken und die Leistung steigern, indem sie die Algorithmen vereinfachen, was allerdings die Genauigkeit des maschinellen Lernens beeinträchtigt.

Welche der vorgestellten Document-Intelligence-Typen am besten geeignet sind, hängt vom Unternehmen und der Art der empfangenen, verarbeiteten und gespeicherten Dokumente ab. IT-Verantwortliche sollten das Kosten-Nutzen-Verhältnis der aufwendigen Verarbeitungsinfrastruktur abwägen. Ehe sie hochkomplexe Algorithmen für maschinelles Lernen implementieren, sollten sie prüfen, ob der operative Nutzen eine erweiterte Dokumentenmanagement-Automatisierung rechtfertigt. Nach Abschluss dieser Analyse ist in der Regel klar, welcher Typ der KI-gestützten Dokumentenverarbeitung für das jeweilige Unternehmen am besten geeignet ist.

Unabhängig von der Art der Document Intelligence, die Unternehmen auswählen, kann die Leistungsfähigkeit von KI und maschinellem Lernen einen außergewöhnlichen Nutzen und ROI liefern, indem Document Intelligence die Geschäftsprozesse weiter automatisiert und verbessert.

Diese Artikel könnten Sie auch interessieren

82010
Dokumentation + Kommunikation       Dokumentenmanagement

Informationen bündeln, strukturieren & elektronisch verwalten

von Michael Duhme

Artikel lesen


Online Fachbeiträge Ausgabe 6 / 2005
Fachbeitrag       Best Practice

Dokumentenmanagement bei Energieversorgern

von Olaf C. Heinrich

Artikel lesen


Online Fachbeiträge Ausgabe 9 / 2005
Fachbeitrag       Technische Domumentation

Starke Lösung für Übersetzung und Dokumentenmanagement

von Corinna Wälz

Artikel lesen


Online Fachbeiträge Ausgabe 10 / 2005
Fachbeitrag       Dokumentenmanagement

Starke Lösung für Übersetzung und Dokumentenmanagement, Teil 2

von Corinna Wälz

Artikel lesen


Online Fachbeiträge Ausgabe 1 / 2000
Fachbeitrag       Teamarbeit

Workmanagement – eine wichtige Basis für Wissensmanagement

von Renate Mayer und Ulf Freiberg

Artikel lesen


Unsere Empfehlungen