OCR Texterkennung als Kernfunktion des Dokumentenmanagementsystems

Docutain
4 min readJul 11, 2022

--

Erfahren Sie in diesem Artikel, was OCR überhaupt ist, wie OCR Software in Docutains DMS arbeitet und welchen Nutzen es für Sie hat.

Was ist OCR?

Die Abkürzung OCR steht für „Optical Character Recognition”, also übersetzt eine optische Zeichenerkennung oder Texterkennung. Die Technologie der Bild- und Texterkennung ermöglicht es beispielsweise, dass Texte eines gescannten oder importierten Dokumentes erkannt und extrahiert werden können. So entsteht aus einem vermeintlichen Bild ein maschinencodierter Text.

Wie funktioniert OCR Texterkennung?

Wenn ein Dokument in einem ersten Schritt eingescannt wird, liegt es meist digital als Bild vor. Zunächst handelt es sich dabei um eine sogenannte Rastergrafik, die sich aus verschiedenen Pixeln, Zahlen, Buchstaben und Satzzeichen zusammensetzt. Die OCR Technologie sucht das Dokument nun auf erkannte Formen (Merkmalserkennung) und bestimmte Muster (Mustererkennung) ab, die es in einem hinterlegten Katalog gespeichert hat und setzt so die erkannten Zeichenbestandteile zu einem Text zusammen. Auf diese Weise entsteht ein digitaler Text, der weiterbearbeitet oder extrahiert werden kann.

Es gibt als Erweiterung der OCR auch die Intelligent Character Recognition, kurz ICR, die in der Lage ist, handschriftliche Notizen oder Briefe in einen maschinenlesbaren Text umzuwandeln. Die Basis ist auch hier eine künstliche Intelligenz, die das Trainieren von Mustern forciert.

Wie wird OCR Software im Alltag eingesetzt?

Die Funktion Texte erkennen mit OCR ist ein wahrer Alltagsheld.
Klassische Beispiele hierfür sind die Fotoüberweisungen bei mobilen Banking-Apps. Aus der digital vorliegenden Rechnung werden die relevanten Informationen des Dokumentes wie Betrag, IBAN und Verwendungszweck herausgelesen, um das Überweisungsformular auszufüllen. Das erspart das manuelle Abtippen und reduziert die Anzahl der Fehler nachweislich.

Auch im Bereich e-Commerce wird OCR Erkennung vermehrt eingesetzt, indem Kunden beim Bezahlen die Option geboten wird, die Kreditkarte per Kamera mit OCR einzulesen. Dadurch wird das Bezahlformular dann automatisch ausgefüllt.

Die OCR Funktion ist oftmals auch bei Übersetzer-Apps ein wesentlicher Bestandteil, sofern Foto-Übersetzung genutzt wird. Der Text wird mit der Kamera fotografiert, die OCR läuft über das Dokument und die erkannten Daten werden dann in die gewünschte Sprache übersetzt.

OCR Texterkennung im Bereich Dokumentenmanagement — Praxisbeispiel Docutain

Neben den oben genannten Alltagsbeispielen bildet die OCR Technologie meist das Herzstück einer Dokumenten management Software, kurz DMS. Dies ist auch beim DMS Docutain der Fall, wobei die Texterkennung in der App und auch bei der Windows Desktop Software gleichermaßen funktioniert.

Ablauf eines Workflows in Docutain

  1. Ein Dokument wird mit der Docutain-App oder mit einem angeschlossenen Scanner in Docutain eingescannt. Während des Scans startet die OCR Texterkennung, um das Dokument nach bestimmten Informationen, den sogenannten Indexinformationen, zu klassifizieren.
  2. In Docutain hat der Nutzer die Möglichkeit, neben der Benennung des Dokumentes weitere Indexinformationen wie Dokumententyp, Schlagwort, Dokumentendatum, Adresse, Betrag sowie die Kennzeichen „steuerrelevant” und „bezahlt” zu setzen. Abgesehen von den Kennzeichen schlägt Docutain dank der OCR automatisch geeignete Indexinformationen anhand der erkannten Informationen des Dokumentes vor, damit der Nutzer diese Daten nicht manuell eintragen muss.
  3. Ist das Dokument nach der Indexierung in Docutain gespeichert kann es jederzeit in nur wenigen Klicks schnell wiedergefunden werden dank OCR. Der Grund: In Docutain kann nach erkanntem Text innerhalb eines Dokumentes gesucht werden. Neben vielseitigen Möglichkeiten der Dokumentensuche können Sie also auch direkt eine Volltextsuche eines Dokumentes starten.

Ein weiterer Vorteil bei der Dokumentenverwaltung mit Docutain: Durch die Kombination der Nutzung der OCR App und der Windows Software können Sie Dokumente jederzeit mit dem Smartphone und am PC scannen, einsehen und verwalten.

Rechnungen aus Docutain heraus zur Zahlung anweisen

Ein weiteres Anwendungsbeispiel der Texterkennung in der Docutain App ist die Funktion eine gescannte oder importierte Rechnung aus Docutain zu bezahlen. Die OCR fokussiert sich bei den Rechnungsinformationen auf die Parameter IBAN, Betrag, Empfänger und Verwendungszweck. Diese vier erkannten Parameter werden dem Nutzer in einer Überweisungsvorschau zur Prüfung und angezeigt. Ist der User mit der OCR Erkennung der Daten zufrieden, kann er diese Werte an seine mobile Banking-App weiterleiten. Die Zahlung wird in der Banking App selbst angewiesen und nach erfolgter Zahlung wird in Docutain das Kennzeichen „bezahlt” an der Rechnung gesetzt.

Aktuell angebundene mobile Banking Apps sind Outbank, StarMoney, finanzblick & Banking4. Weitere Anbindungen sind geplant.

Vorteile der OCR Funktion von Docutain im Überblick

  • Indexinformationen zum Dokument werden automatisch erkannt — Weniger Aufwand für Sie!
  • Dank OCR kann in Docutain eine Volltextsuche der durchsuchbaren PDFs gemacht werden — Dokumente finden Sie so in Sekundenschnelle!
  • Dank der automatischen Erkennung der Indexinformation unterstützt Sie Docutain bei Plausibilitätschecks der Dokumente — Ihnen entgeht keine Preissteigerung!
  • Die OCR Funktion läuft bei Docutain lokal auf dem Gerät — es ist keine Internetverbindung notwendig und es sind keine externen Server oder Drittanbieter involviert — Höchste Sicherheit für Ihre Dokumente!
  • Erkannten Text eines PDFs können Sie jederzeit exportieren und versenden — Bleiben Sie flexibel & agil!

Docutains Scanner & OCR SDK

Um die Vorteile der starken Scanfunktionalität und der intelligenten Texterkennung von Docutain auch für andere App- bzw. Softwareanbieter zur Verfügung zu stellen, die selbst die Entwicklungskapazität oder das Know-How nicht haben, bietet Docutain ein Scan und Texterkennungs-SDK ( Software Development Kit) an.
Weitere Informationen zum SDK-Angebot von Docutain finden Sie hier: Docutain SDK

Originally published at https://docutain.de.

--

--

Docutain
Docutain

Written by Docutain

Dokumentenmanagementsystem mit integriertem Scanner: https://www.docutain.de Für B2B-Kunden auch als Scanner & Datenextraktions-SDK: https://sdk.docutain.com