Fachartikel

End-to-End-Automatisierung des Firmenkreditprozesses

In diesem Beitrag werden wir uns eingehend mit der Frage beschäftigen, welche Rolle Technologien wie klassische Texterkennung, Text Mining und künstliche Intelligenz im Zusammenhang mit der Automatisierung des Firmenkreditprozesses spielen.

1288
8 Minuten Lesezeit
End-to-end-Automatisierung Firmenkreditprozesse

Die Automatisierung von Firmenkreditprozessen

Teil 2: Texterkennung, Text Mining und künstliche Intelligenz

Im ersten Teil unserer Artikelserie „End-to-End-Automatisierung des Firmenkreditprozesses“1 haben wir uns mit der Optimierung und der Digitalisierung des Prozesses im Allgemeinen beschäftigt. Dabei kamen unter anderem die Steuerung über eine Process Engine, die Umsetzung der automatisierten E-Mail-Bearbeitung und RPA-Bots zur Sprache.

Im zweiten Teil werden wir uns nun eingehender mit der Frage beschäftigen, welche Rolle Technologien wie klassische Texterkennung, Text Mining und künstliche Intelligenz im Zusammenhang mit der Automatisierung des Firmenkreditprozesses spielen.

Dokumenteneingangskanäle

Zunächst ist der Umstand zu betrachten, dass es für Dokumente und Informationen, die für den Firmenkreditprozess benötigt werden, nicht nur einen, sondern eine Vielzahl von Eingangskanälen gibt. Das reicht von der persönlichen Übergabe im Rahmen des Kreditgesprächs, dem (Brief-)- Posteingang und dem Eingang als E-Mail-Anhang bis hin zu moderneren Varianten, wie dem Upload im zugangsgeschützten Bereich des Onlinebankings. Ein Kreditinstitut kann sich also in aller Regel nicht auf nur einen Eingangskanal beschränken. Das entspricht auch der heutigen Bedeutung des Multikanalmanagements und den Veränderungen bei der Nutzung der Kanäle durch die Kunden. Während das klassische Fax, wenn überhaupt noch im Einsatz, langfristig wohl keine Rolle mehr spielen wird, sind E-Mail, Onlinebanking und standardisierte Schnittstellen, wie etwa DATEV für Steuerberaterinformationen, weiter auf dem Vormarsch.

Nahezu alle kürzlich von msg GillardonBSM befragten Fach- und Führungskräfte aus dem Vertrieb und Kundenmanagement von Banken stimmten der Aussage zu, dass der Orchestrierung der Kanäle eine große Bedeutung zukommt und dass auch die Kunden digital mündiger werden.

Je nachdem, welcher Eingangskanal gewählt wurde, schließen sich daran unterschiedliche Prozessschritte an (Ausdruck, physische Ablage, Speicherung von Anhängen, Speicherung von Uploads). Die Problematik besteht im klassischen, nicht automatisierten Prozess allerdings in der manuellen, fehleranfälligen Erfassung, in der unter Umständen lokalen Speicherung von personenbezogenen Daten, dem fehlenden digitalen Workflow im Anschluss an die Erfassung und der Tatsache, dass Daten nicht für weitere Auswertungen über alle Kreditnehmer hinweg oder Reportings verfügbar sind.

Am Ende der automatisierten Verarbeitung steht daher immer das Ziel, den Inhalt eines Dokuments in maschinenlesbare und interpretierbare Form zu überführen, idealerweise in Form eines Datenbankeintrags. Erst das bringt die Potenziale der Prozessautomation richtig zur Geltung.

Dabei ist digital nicht gleich digital, woraus sich die Frage des Digitalisierungsgrads und der Dokumentenarten ergibt.

Dokumente in Papierform, also im analogen Format, sind am weitesten vom gewünschten Digitalisierungsgrad entfernt. Da hier der erste Schritt das zeit- und kostenaufwendige Einscannen ist, liegt es im Interesse des Kreditinstituts, diesen Bearbeitungsschritt, wo möglich, durch den Einreicher erledigen zu lassen. Scanner erzeugen allerdings Rastergrafiken, also in Pixel unterteilte Bilder mit unterschiedlichen Farb- und Helligkeitswerten je Bildpunkt (gemessen beispielsweise in HSL = hue, lightness und saturation). Ähnliches gilt auch für eingereichte Bilder, etwa im JPG-Format.

Das fehlerfreie Zurückführen der Bildpunkte in digitale Zeichen, überwiegend im UTF-8-Unicode- Format, stellt daher eine besondere Herausforderung dar. Insbesondere dann, wenn noch das Erkennen von Handschriften oder die Eliminierung von Verschmutzungen und Textüberlagerungen hinzukommt.

Automatisierung Firmenkreditprozess_msg.SIMA

Abbildung 1: msg.SIMA

Hierfür stehen praktikable Softwaretools, wie zum Beispiel die Smart-Inputmanagementlösung msg.SIMA, zur Verfügung, die auch als „Software-as-a-Service“ (SaaS) ohne kostenintensive Installation vor Ort genutzt werden kann. Die Daten werden dabei im XML-Format für die Weiterverarbeitung zur Verfügung gestellt.

Häufig wurden PDF-Dokumente aber auch direkt am Computer aus einer Datei heraus erzeugt. Dann lassen sich die darin enthaltenen Informationen auch direkt auslesen. Noch einfacher geht es mit Word- sowie Excel- und CSV-Formaten, die bereits digitalisiert sind und sich vergleichsweise einfach weiterverarbeiten lassen.

Neben dem Digitalisierungsgrad sind Dokumente aber auch unter- schiedlich strukturiert, was die Komplexität des Einlese- und Interpretationsvorgangs beeinflusst.

Der einfachste Fall sind vollkommen strukturierte Dokumente, etwa wenn das Kreditinstitut den Kunden ein Formular bereitstellt, dessen Felder bereits in einer Dokumentenerfassungslösung definiert wurden. So kann beispielsweise der Kreditnehmer gebeten werden, bestimmte Basisangaben in Formularform zur Verfügung zu stellen. Auch andere Dokumente, wie zum Beispiel ein Handelsregisterauszug, sind überwiegend gleich strukturiert und daher relativ einfach einlesbar.

msg.SIMA - Screenshot

Abbildung 2: msg.SIMA - Screenshot

Semistrukturierte Dokumente enthalten im Wesentlichen die gleichen Informationen, unterscheiden sich jedoch hinsichtlich Inhalt und Aufbau schon deutlicher. So können betriebswirtschaftliche Auswertungen unterschiedliche Kontenrahmen verwenden, unternehmensindividuelle Konten und Unterkonten enthalten und Anhänge mit sich führen. Die Herausforderung besteht dann darin, diese unterschiedlichen Fälle weitestgehend zu antizipieren, um die gewonnenen Finanzdaten in eine automatisierte Bilanz- und GuV- Analyse überführen zu können.

Zur Klasse der weitestgehend oder vollständig unstrukturierten Dokumente kann man Jahresabschlüsse zählen. Zwar folgen sie mit ihren Bestandteilen Bilanz, GuV, Anhang und Lagebericht noch einer gewissen Form, die sich allerdings bereits nach Unternehmensgröße und Unternehmensgegenstand schon deutlich voneinander unter- scheiden. Auch spezielle Informationen, die für die automatisierte Bilanz- und GuV-Analyse benötig werden, können sich im Jahresabschluss an unterschiedlichen Stellen befinden.

Als Beispiel seien hier die kurzfristigen Verbindlichkeiten mit einer Restlaufzeit von unter einem Jahr genannt. Sie können einerseits direkt in der Bilanz erscheinen, andererseits auch nochmals weiter detailliert in einem Verbindlichkeitenspiegel. Die Herausforderung besteht dann darin, im Gesamtdokument die relevanten Stellen zu identifizieren und fehlerfrei einzulesen.

msg GillardonBSM hat hier bereits auf Basis von Python-Skripts, die mit der Process Engine kommunizieren, Lösungen entwickelt, um strukturierte und seminstrukturierte Dokumente einzulesen. Dabei kommen Libraries wie Numpy (Mathematik- und Vektorbibliothek), Pandas (Datenbank- und Tabellenbibliothek) und PDF-Plumber (Bibliothek für einfaches Einlesen und Verarbeiten von PDF- Dateien) zum Einsatz.

Im simpelsten Fall kann eine Tabelle durch vorgefertigte Funktionen vollständig ausgelesen werden. Es ist dann nur noch das Formatieren des Textes und einzelner Zellen erforderlich. Diese Methode wird für das Auslesen der Auszüge des Handelsregisters verwendet.

Falls Tabellen keine konventionellen Rahmenlinien besitzen, muss manuell eine Tabelle gebildet wer- den. Dabei werden Algorithmen zur Berechnung und Abschätzung von Zellengrenzen verwendet, die Tabellen aus Informationen über Wortpositionen und Darstellungsbreite/- höhe aufbauen.

Prozessuale Verarbeitung

Abbildung 3: Prozessuale Verarbeitung

Prozessuale Verarbeitung

Die prozessuale Verarbeitung lässt sich in drei wesentliche Schritte unterteilen (Abbildung 3).

Einlesevorgang

  • Überführung unterschiedlicher Formate, Strukturen und Inhalte in eine maschinenlesbare Form (Datenbanktabelle) unter Verwendung einer großen Auswahl an Schriftzeichensätzen.
  • PDF-Dateien werden vollautomatisiert eingelesen; andere Dateiformate der Inputdokumente werden in ein PDF-Format konvertiert und eingelesen (*.txt,*.jpg, *.tiff, Excel).
  • Mithilfe von Optical Character Recognition (OCR) können mehrseitige, auch handschriftliche Dokumente eingelesen und zusammengehörende Seiten identifiziert werden.

Qualitätssicherung

  • Bei entsprechender Parametrisierung können in der Regel 80 bis 85 Prozent der enthaltenen Daten fehlerfrei und sicher eingelesen werden. Plausibilisierungen, Listen von akzeptierten Werten und das Training der Daten unterstützen dabei, die Fehleranfälligkeit zu reduzieren.
  • Eine hundertprozentige Automatisierung zu versprechen, wäre allerdings keine seriöse Herangehensweise, da es auch zu zweifelhaften Fällen kommen kann, die ein Eingreifen an der Mensch- Maschine-Schnittstelle erforderlich machen, beispielsweise bei verschmutzten, geknickten oder mit handschriftlichen Bemerkungen überlagerten Dokumenten. Auch kann es sein, dass es sich um die falschen Dokumente handelt.
  • Zur Qualitätssicherung ist daher eine Anzeige zweifelhafter oder zurückgewiesener Dokumente zur manuellen Beurteilung notwendig. Ein Ampelsystem kann hier eine Prüfroutine visualisieren, die zweifelhafte oder zurückgewiesene Dokumente klassifiziert.

Interpretation

Mit der Überführung in eine maschinenlesbare und damit auswertbare Form sind die wesentlichen Voraussetzungen zum Heben der Potenziale in der Kreditprozessautomation erfüllt.

Mithilfe von künstlicher Intelligenz (KI) lassen sich im nächsten Schritt aber auch noch weitere Vorteile erzielen. KI kommt immer dann zum Einsatz, wenn es darum geht, neues Wissen aus vorhandenen Daten zu generieren, sofern man über rein deterministische Ansätze hinaus- gehen will. Im Zusammenhang mit Eingangsdokumenten ist hier vor allem das Text Mining zu nennen.

Dabei geht es unter den Stichworten Natural Language Processing und Natural Language Understanding um die kognitive Erfassung und semantische Analyse der Inhalte mit Methoden des maschinellen Lernens.

Eingangsdokumente werden also nicht einfach nur ausgelesen, sondern auch interpretiert. Das kann sinnvoll sein bei der Analyse von Dokumenten aus speziellen Brancheninformationsdiensten, bei der Sentimentsanalyse oder allgemein bei der Auswertung unstrukturierter Dokumente, wie sie in NoSQL- Datenbanken wie MongoDB oder CouchDB abgespeichert werden. Zur Visualisierung eignen sich Wordclouds und Histogramme.

Neben den weitverbreiteten Bibliotheken und Frameworks, wie Tensorflow, PyTorch oder scikitlearn, existieren hier auch spezielle Libraries wie Gensim, NLTK oder SpaCy für die Analyse semantischer Strukturen und Schlüsselwörter.

 Business Case

Die Metrik zur Berechnung der Vorteilhaftigkeit automatisierter Dokumentenerfassung unterscheidet sich von Bank zu Bank abhängig von den verwendeten Parametern wie Mengengerüst, eingesetzte Mitarbeiterkapazitäten oder Personal- kosten. Grundsätzlich lassen sich jedoch einige Eckpunkte festlegen. Auf der Aufwandsseite stehen:

  • Implementierungskosten (Installation, Customizing und Training), die sich durch eine SaaS-Lösung allerdings reduzieren beziehungsweise variabilisieren lassen.
  • Nutzungs- und Lizenzgebühren, die sich in der Regel an der Anzahl der eingelesenen Dokumente pro Jahr in Form von Paketpreisen orientieren.

Dem stehen auf der Ertragsseite gegenüber:

  • Reduzierung der für die manuelle Erfassung notwendigen Mitarbeiterkapazitäten.
  • Vereinfachung, Beschleunigung und Stabilisierung des gesamten Prozesses.

In Form einer dynamischen Amortisationsrechnung lässt sich unter Berücksichtigung des Zeitwerts, des anfänglichen Kapitaleinsatzes, des jährlichen Kapitalrückflusses und eines Diskontierungsfaktors die Vorteilhaftigkeit sehr gut in messbaren und überprüfbaren Größen darstellen.

Fazit

Übereinstimmend berichten viele Banken, dass die Optimierung und Automatisierung ihrer Prozesse sowohl an der Kundenschnittstelle als auch in der Marktfolge für sie wichtige Hebel sind, um die Customer Experience in puncto Schnelligkeit, Zuverlässigkeit und Einfachheit zu verbessern.

Selbstlernende Systeme, die sich im laufenden Betrieb ständig verbessern, eine Vielzahl unterstützter Dokumentenformate und voll konfigurierbarer Output garantieren heutzutage höchstmöglichen Nutzen. Auch hinsichtlich der Betriebsvarianten, ob on premise, hybrid oder in der Cloud, stehen viele Möglichkeiten zur Verfügung und setzen wertvolle Zeit für wertschöpfende Tätigkeiten frei. Das volle Nutzenpotenzial kann zusätzlich ausgeschöpft werden, wenn an die Automation entsprechende Workflows angebunden werden – und dies bei Einhaltung der Governance und Compliance und einer maximalen Nachvollziehbarkeit für Revisionszwecke.

Quelle

Related Collections

Kundenmagazin NEWS 03/2021

Liebe Leserinnen und Leser, Nachhaltigkeit ist Zukunft, und sie betrifft alle Bereiche unseres privaten, gesellschaftlichen und wirtschaftlichen Lebens. Auch in der Branche Banking ist sie auf dem besten Weg, sich vom Nischenthema zu einem zentralen Leitmotiv zu entwickeln. Für Banken entsteht daraus auf der einen Seite Handlungsdruck, auf der anderen Seite bieten sich Chancen für ihr Geschäftsmodell. Die Brisanz und die spannende Entwicklung des Themas haben uns zu unserer aktuellen Studie „Sustainable Banking“ motiviert, die wir Ihnen in dieser NEWS vorstellen. Neben interessanten Befragungsergebnissen bietet die Studie aufschlussreiche Interviews mit hochkarätigen Experten der Finanzbranche. Die Studie ist kostenfrei, den Download finden Sie hier. Darüber hinaus wird die Zukunft des Bankings von vielen weiteren Entwicklungen, wie zum Beispiel Payments Outsourcing, digitale Zentralbankenwährungen, die Digitalisierung der Kreditprozesse, geprägt, über die wir ebenfalls in dieser NEWS berichten. Auch mit dem MARZIPAN Sprachsteuerungstool KAI, das wir Ihnen hier vorstellen, machen wir einen großen Schritt Richtung Zukunft. Außerdem informieren wir Sie in einem Praxisbericht mit der Sparkasse Kärnten über die Einführung unserer Banksteuerungslösung THINC, über die Auswirkungen der NSFR auf die Banksteuerung, über aktuelle aufsichtsrechtliche Entwicklungen und vieles mehr. Ich wünsche Ihnen viel Freude beim Lesen dieser NEWS. Mit ihrem breiten und diversen Themenspektrum passt sie gut zu dem zu Ende gehenden Jahr 2021, das geprägt war von Krisen und Katastrophen, aber auch von Hoffnung, Veränderung und Aufbruch. Haben Sie eine besinnliche Weihnachtszeit und einen guten Start ins neue Jahr 2022. Bleiben Sie gesund und zuversichtlich. Dr. Frank Schlottmann Vorstandsvorsitzender der msg GilllardonBSM AG

msg for banking Logo

msg for banking

denkt Banking neu und bietet seinen Kunden smarte, innovative und plattformbasierte digitalisierte Lösungen aus einer Hand.

Schreiben Sie einen Kommentar

Sie müssen sich anmelden, um einen Kommentar zu schreiben.