Mit der richtigen OCR Software und dem Einsatz von Künstlicher Intelligenz kann der Mehrwert weiter gesteigert werden. Wie OCR funktioniert und warum besonders Banken von dieser Technik profitieren, erfahren Sie in diesem Artikel.

Was ist OCR?

Die Technik hinter einem OCR Server ist grundsätzlich nicht neu. Die Abkürzung steht für Optical Character Recognition – optische Zeichenerkennung – und ermöglicht bereits seit den 1990er Jahren das Digitalisieren von Verträgen, Rechnungen und vielen weiteren Dokumenten. Seitdem hat sich die Technik stetig entwickelt und der Anteil der notwendigen manuellen Arbeiten wurde immer geringer. ~~Besonders Funktionen, die durch den Einsatz von Künstlicher Intelligenz ermöglicht werden, erleichtern den bürokratischen Aufwand und sorgen für neue Evolutionsstufen der Software.~~

So sind ICR (Intelligent Character Recognition), IDP (Intelligent Document Processing) sowie RPA (Robotic Process Automation) die logischen Weiterentwicklungen von OCR, die es ermöglichen, aus den gescannten Dokumenten, strukturierte und verwertbare Informationen zu erlangen. Durch den Einsatz kann die Strukturierung und direkte Verarbeitung der gewonnenen Informationen automatisiert umgesetzt werden. Dies war bei klassischen OCR Lösungen lange nur manuell möglich. Beispiele für Dokumente, die durch Texterkennung und intelligente OCR Lösungen in bearbeitbare und durchsuchbare Dateien umgewandelt werden können, sind:

Verträge
Personalausweise und Reisepässe
Kreditanträge
Energieausweise
Versicherungspolicen
Fahrzeugscheine
Gehaltsnachweise
Mietverträge
u.v.m.

Dokumente scannen mit dem OCR Server

Die Basis eines OCR Prozesses ist es, den Scan des Dokuments in Form eines Fotos auf einen OCR Server zu übertragen. Das digitalisierte Dokument wird zunächst lediglich als Bild, in Form einer Rastergrafik, abgelegt. Im Anschluss wird der Inhalt der Grafik durch eine automatisierte Texterkennung ausgelesen und die Inhalte zur weiteren Verarbeitung in ein Textdokument übertragen.

OCR Texterkennung

Im nächsten Schritt kommt die Software zur Texterkennung zum Einsatz und wandelt die gescannten Dokumente in einen Volltext um. Dabei prüft die OCR Software Zusammenhänge zwischen den erkannten Pixeln, um Übereinstimmungen von Buchstaben, Ziffern, Satzzeichen und Wörtern zu finden.

Das Programm wandelt auf diesem Wege die eingescannten Dokumente in eine gängige Textcodierung, wie beispielsweise auch von Textverarbeitungsprogrammen genutzt wird, um. Dabei können selbst einfache OCR Server sowohl Computerschriftarten sowie Handschriften erkennen, auch wenn bei letzterem die Fehlerquote noch deutlich höher ist und die Erkennung dieser vor allem durch Künstliche Intelligenz und den Lernprozess der Algorithmen verbessert wird.

Das richtige Format: JSON

Die Konvertierung von Foto zu Text bietet zunächst jedoch nur einen geringen Mehrwert, geht es um die strukturierte Weiterverarbeitung der im Dokument enthaltenen Informationen. Um diesen nächsten Schritt automatisiert zu ermöglichen benötigt es den Einsatz künstlicher Intelligenz sowie Verwendung eines kompatiblen Dateiformats. Während die Möglichkeiten von klassischen Text- und PDF Dokumenten sehr beschränkt sind, empfiehlt es sich, das Dateiformat JSON zu verwenden.

JSON (JavaScript Object Notation) ist ein kompaktes Datenformat in einer maschinenlesbaren, strukturierten Textform, dass sich besonders gut für den Datenaustausch zwischen Anwendungen eignet, da es sehr hohe Schnittstellenstandards erfüllt. Aus diesem Grund ist JSON nicht nur in der Webentwicklung ein wichtiges Format. Ein weiterer Vorteil dieses Formats ist es, dass es von Programmiersprachen unabhängig ist. Dies reduziert den Programmieraufwand bei der Integrationen von Software und ermöglicht eine standardisierte Verarbeitung im Vergleich zu vielen anderen Dateiformaten.

OCR und künstliche Intelligenz

Für die weitere Verarbeitung der erfassten und digitalisierten Daten ist künstliche Intelligenz der Schlüssel. Diese ermöglicht es, die erfassten Daten in strukturierte Informationen zu übertragen, diese zu kategorisieren und einfache, repetitive Aufgaben automatisiert zu übernehmen. Diese Kombination von Künstlicher Intelligenz und OCR revolutioniert die Dokumentenerfassung, -verwaltung und -verarbeitung und bietet vielen Unternehmen eine schnelle und verlässliche Lösung bei der Bearbeitung von Dokumenten.

Welche KI-Anwendungen bieten sich in Banken?

Der Geschäftsalltag im Bankwesen ist in besonderem Maße durch die Prüfung, Verarbeitung und Archivierung von Dokumenten geprägt. Diese Masse an Anträgen, Gutachten und offiziellen Dokumenten erzeugt selbst in digitalisierter Form, oft in Form von Scans, einen großen manuellen Aufwand. Ganz abgesehen von dem sensiblen Umgang der darin enthaltenen personenbezogenen Daten. Zudem müssen alle nötigen Dokumente schnell und störungsfrei eingelesen und verarbeitet werden. Nur so erhält der Kunde möglichst schnell eine Auskunft über seine Anfragen und Prozesse können zeitnah abgeschlossen werden. Daher ist die Kombination von OCR und künstlicher Intelligenz in einer Bank oder einem Finanzdienstleister besonders effektiv.

Durch die Verarbeitung auf einem professionellen OCR Server können viele Vorgänge digitalisiert und automatisiert sowie gesetzliche Auflagen stets eingehalten werden. Von der Identitäts- und Dublettenprüfung, bis zu einer Automatisierung des Mahnwesens und der Kreditvergabe sind viele interne Abläufe automatisiert möglich. Außerdem helfen OCR Server Banken und Finanzdienstleistern bei der Verwaltung von Schecknummern, Kontonummern und der Überprüfung von Unterschriften. Dieser Detaillierungsgrad ist beispiellos und entscheidend für die Effizienz von OCR in Banken.

OCR und Robotic Process Automation

Ein Beispiel für die Verbindung von OCR-Software und Künstlicher Intelligenz ist RPA (Robotic Process Automation). RPA kann die Fehleranfälligkeit der Texterkennung minimieren und die Qualität der erfassten Daten maximieren. Erfasste Daten können darüber hinaus direkt und ohne manuellen Aufwand in strukturierte Informationen übertragen werden und einfache Folgeaufgaben automatisiert erfüllt werden. So können durch RPA Dokumente sortiert sowie einfache Entscheidungen und repetitive Prozesse automatisiert erledigt werden. [DataSpark Artikel wird hier verlinkt!]

Jeder bürokratische Prozess, der wiederholende Aufgaben erfordert, kann potenziell mit RPA digitalisiert werden. ~~Digitalisieren bedeutet in diesem Fall nicht nur, dass Scannen des Dokuments, sondern auch, dass weniger Fehler auftreten.~~ Dies ist besonders für Unternehmen mit komplexen Genehmigungsabläufen interessant, da komplexe Workflwos die Wahrscheinlichkeit menschlicher Fehler erhöhen. Komplexe Aufgaben, die die Fähigkeiten und Funktionen von RPA, OCR und KI überschreiten, werden an den Menschen übergeben.

Die professionelle KI-Lösung für Banken: Finted

Eine professionelle und verlässliche Lösung für OCR Server, die mithilfe Künstlicher Intelligenz all diese Vorteile und Funktionen bietet sowie mit dem Dateiformat JSON arbeitet, ist finted. Die

Verbindung der finted AI mit Workflow Engines ermöglicht es, die Dokumentverarbeitung, um individuelle Regeln zu ergänzen, um die Lösung so individuell an die Ansprüche verschiedener Unternehmen anzupassen. Als Joint Venture des Anbieters für Kernbankensystemen fintus und der deutschen AI Firma Helm & Nagel GmbH vertreibt finted ausschließlich an Banken. ~~Finted ist damit der einzige deutsche Anbieter für Software, der Dokumente bankfachlich automatisiert.~~

Use-Case

OCR Server – Optimierte Dokumentenverarbeitung durch intelligente Software