OCR-Texterkennung: Was ist das?
Den Text eines gescannten Dokuments kannst aus der als Bild auf deinem Rechner abgelegten Datei mit Programmen für OCR-Texterkennung automatisch per Zeichenerkennung auslesen lassen. Diese Programme – es gibt sie auch als Apps für mobile Geräte – erkennen Buchstaben, Zahlen und Satzzeichen des Dokuments. Auf diese Weise wird aus dem eingescannten Papierdokument ein digitales Textdokument. Dieses Dokument kann je nach verwendeter Software weiterbearbeitet werden.
Die OCR-Texterkennung erspart dir mit Hilfe eines Scanners also das zeitraubende und mühselige Abtippen des Texts von Papierdokumenten beim Anlegen von Dateien. Außerdem werden die von der OCR-Texterkennung umgewandelten Dokumente digital durchsuchbar.
Wir geben dir einen Überblick über die OCR-Texterkennung und beantworten die 11 häufigsten Fragen zu dieser Technologie.
Inhaltsverzeichnis
- Frage - Wofür steht OCR-Texterkennung?
- Frage - Wie funktioniert die OCR-Texterkennung?
- Frage - Wie gut sind die Ergebnisse der maschinelle OCR-Texterkennung?
- Frage - Kannst du Resultate der OCR-Texterkennung manuell korrigieren?
- Frage - Welche Software, Apps und Tools kannst du für die OCR-Texterkennung nutzen?
- Frage - OCR und Handschriften: Was ist die IWR-Technik?
- Frage - Welche Trends gibt es bei der OCR-Technik?
- Frage - Was bestimmt die Qualität der Erkennung von Texten noch?
- Frage - In welchen Bereichen kommt die OCR-Texterkennung besonders zur Anwendung?
- Frage - Wo kommt die OCR-Technik noch zum Einsatz?
- Frage - Was hat die OCR-Texterkennung im Handy zu suchen?
- Fazit: Die OCR-Texterkennung bietet Vorteile und gewinnt an Bedeutung
Frage 1: Wofür steht OCR-Texterkennung?
Das Kürzel der Bezeichnung OCR-Texterkennung leitet sich von „optical character recognition“ ab. Dieser englische Begriff wird wörtlich mit „optische Wiedererkennung von Schriftzeichen“ übersetzt. In der Umgangssprache wird dieser Vorgang Texterkennung genannt, sie kann bei einem mit einem Scanner gescannten Dokument zum Einsatz kommen.
Für die OCR-Zeichenerkennung ist wie eingangs erwähnt eine spezielle Software erforderlich und diese gehört häufig zum serienmäßigen Lieferumfang vieler Scanner und Multifunktionsgeräte. Einige OCR-Programme kannst du alternativ kostenlos aus dem Internet laden, andere sind kostenpflichtig erhältlich.
Frage 2: Wie funktioniert die OCR-Texterkennung?
Hast du ein Dokument, das Text enthält, mit einem Scanner eingescannt, wird es als Bild (fachlich korrekt als Rastergrafik) auf deinem Rechner gespeichert. Nun prüft die OCR-Software die Zusammenhänge zwischen den erkannten Pixeln der Datei, es findet die Zeichenerkennung des gescannten Texts statt.
Die erkannten Formen werden mit Vorlagen in einem Katalog verglichen. Dieser Katalog umfasst die Zeichensätze der gängigsten Computerschriftarten. Bei diesem Vergleich sucht das OCR-Programm die umfangreichste Übereinstimmung und setzt die daraus abgeleiteten Buchstaben, Ziffern und Satzzeichen ein, es wandelt also die im eingescannten Dokument erkannten Zeichen in die übliche Textcodierung um, die beispielsweise auch von Textverarbeitungsprogrammen genutzt wird. Das Resultat ist ein Rohdokument mit digitalem Text, welches in weiteren Schritten bearbeitet werden kann.
Frage 3: Wie gut sind die Ergebnisse der maschinelle OCR-Texterkennung?
Ausgereifte Texterkennungsprogramme liefern inzwischen ziemlich gute Ergebnisse und korrigiert mittels Algorithmen überwiegend ihre Fehler vor der Auslieferung an dich. Einer der Gründe ist, dass die OCR-Texterkennung mit der Technik Intelligent Charakter Recognition, kurz ICR, gekoppelt ist. Der englische Begriff wird wörtlich mit „intelligente Zeichenerkennung“ übersetzt.
Die ICR-Technologie realisiert eine Fehlerkorrektur auf Zeichenebene und nutzt dazu ein Grundprinzip der Statistik. Das heißt, sie prüft, mit welcher Wahrscheinlichkeit eine erkannte Zeichenkombination richtig oder falsch ist. Die Kombination mit der höchsten Wahrscheinlichkeit eines Treffers wird im Dokument eingesetzt.
Auch der Kontext der erfassten Zeichen zum Text wird berücksichtigt und entsprechend das passendere Wort von verschiedenen Möglichkeiten gewählt. Außerdem ist OCR-Software in der Lage, übergreifende Strukturen wie Absätze, Zeilen, Textblöcke und Grafiken der Datei voneinander zu unterscheiden. Auch unterschiedliche Sprachen werden erkannt.
Frage 4: Kannst du Resultate der OCR-Texterkennung manuell korrigieren?
Eine allgemeingültige Antwort darauf gibt es nicht. Grundsätzlich besteht die Möglichkeit aber, da unter anderem genau das der Zweck der Texterkennung ist.
Ob du konkret eine manuelle Fehlerkorrektur bei der OCR-Texterkennung vornehmen kannst, hängt letztlich davon ab, welches Programm du verwendest. Leider bieten nicht alle OCR-Softwarepakete eine solche Funktion, aber doch die meisten.
Darüber hinaus kommt es darauf an, in welchem Format dir das OCR-Programm die Resultate der Texterkennung liefert. Erfolgt die Ausgabe der OCR-Texterkennung als PDF-Datei, musst du in der Regel diese Datei zuerst in ein bearbeitungsfähiges Format umwandeln. Hast du beispielsweise Office 365 auf deinem Rechner installiert, kannst du das PDF von Word in eine docx-Datei verwandeln lassen. Das hat im Anschluss den Vorteil, dass die Word-Rechtschreibkorrektur Erkennungsfehler signalisiert.
Frage 5: Welche Software, Apps und Tools kannst du für die OCR-Texterkennung nutzen?
OCR-Software für Rechner
Wenn du dir OCR-Texterkennung mit freier Software wünschst, könntest du beispielsweise OCRopus installieren. Diese Software kam im Jahr 2007 als Gemeinschaftsentwicklung des Deutschen Forschungszentrums für Künstliche Intelligenz und Google auf den Markt. Das Programmpaket OCRopus steht für die Betriebssysteme Windows 10, macOS, Linux und FreeBSD zur Verfügung.
Als Alternativen kommen zum Beispiel GOCR, Tesseract und Transkribus in Frage. Transkribus hat den Vorteil, dass es auch Handschriften erkennen kann.
Bist du bereit, etwas Geld in ein gutes Programm zur Texterkennung zu investieren, könntest du dich für den von ABBYY entwickelten FineReader oder das Paket FormPro von OCR Systeme entscheiden.
Weitere mögliche Alternativen sind das Modul Text Capture im Acrobat-Reader von Adobe, OCR-Trace von Corel Draw oder die Nutzung von OneNote aus dem Hause Microsoft sowie der PDF-XChange Viewer.
OCR-Software für Smartphone und Tablet
Falls du keinen Scanner hast, gerne aber die OCR-Texterkennung nutzen möchtest, kannst du ganz einfach für dein Handy oder Tablet eine App zum Scannen nutzen, denn: Einige dieser Scanner-Apps haben eine OCR-Texterkennung integriert, beispielsweise Office Lens von Microsoft oder Adobe Scan. Beide Apps sind für iPhone und iPad (iOS) und für Geräte mit Android-Betriebssystem erhältlich, Office Lens zusätzlich für Windows Phone.
OCR-Texterkennung Online-Tools statt App und PC-Software
Falls du weder eine App, noch eine Software für deinen Rechner nutzen möchtest, kannst du auch bei Online-Diensten auf OCR-Texterkennung-Tools zugreifen. Beispielsweise findest du auf der Webseite von PDF24.org ein kostenlos nutzbares OCR-Tool.
Frage 6: OCR und Handschriften: Was ist die IWR-Technik?
Die Abkürzung IWR steht für die Intelligent Word Recognition, was auf Deutsch „intelligente Worterkennung“ bedeutet. Sie entstand neben der OCR-Texterkennung und bezieht sich auf die Zeichenerkennung von Handschriften und beispielsweise auch von arabischer Schrift.
Allerdings ist die IWR-Technik wegen der sehr unterschiedlichen Handschriften nur eingeschränkt nutzbar. Daher wurde sie lange Zeit nur in bestimmten, meist unternehmerischen Bereichen eingesetzt, wo kurze, klar definierbare, handschriftliche Passagen in Dokumenten zu Textkodierung konvertiert werden, beispielsweise Geldbeträge.
Die IWR-Technik wurde so weiterentwickelt, dass in Verbindung mit der OCR-Texterkennung die Anzahl der Fehler bei der maschinellen Erkennung von Handschriften reduzierbar ist. Dafür werden zuerst die von der OCR-Software im Dokument erkannten Einzelzeichen analysiert. Anschließend fügt die Software die Zeichen zu Silben und Wörtern zusammen. Danach kommen die sogenannten Klassifikatoren der IWR-Technik zum Einsatz. Dabei handelt es sich um spezielle Wörterbücher für den Abgleich der Resultate.
Dafür nutzt die IWR-Technik der OCR-Texterkennung die charakteristischen Gesamtumrisse, die beim Schreiben der Wörter üblicherweise entstehen. Sie werden durch die Oberlängen und die Unterlängen der einzelnen Buchstaben bestimmt. So lässt sich beispielsweise eine Fehlerkennung des Wortes „und“ durch „uns“ oder die Endung „ung“ recht zuverlässig vermeiden.
Frage 7: Welche Trends gibt es bei der OCR-Technik?
Schon seit einiger Zeit gibt es erfolgreiche Bestrebungen, die Qualität der OCR-Texterkennung durch die Nutzung künstlicher neuronaler Netze zu verbessern. Dabei bewertet die automatische Fehlerkorrektur nicht nur die Wahrscheinlichkeiten bei der Erkennung von Wörtern, sondern bezieht auch den Kontext mit ein, in welchem die erkannten Wörter stehen. Aus diesen Zusammenhängen heraus können beispielsweise auch Grammatikfehler korrigiert werden.
Künstliche neuronale Netzwerke spielen vor allem bei der Handschriftenerkennung eine wichtige Rolle, weil Handschriften in modernen Technologien immer wichtiger werden. Die für Handschriften gewonnenen Erkenntnisse werden auch auf gedruckten Text umgesetzt. So wenden beispielsweise die Programmpakete Tessaract und OCRopus in Form der zeilenweisen Texterkennung neuronale Netze an.
Frage 8: Was bestimmt die Qualität der Erkennung von Texten noch?
Wie hoch die Fehlerquote bei der OCR-Texterkennung ist, hängt von verschiedenen Kriterien ab. Eine große Rolle spielt die Qualität deiner Vorlage, mit der du deinen Scanner fütterst:
- Sie sollte eine solide Bildschärfe, deutliche Kontraste sowie eine ausreichend große und möglichst serifenfreie Schriftart aufweisen.
- Manchmal ist es lohnenswert, ein farbiges Dokument vor der maschinellen Texterkennung im Schwarz-Weiß-Modus zu kopieren.
- Die Optimierung über ein Bildbearbeitungstool durch die Verstärkung des Kontrasts und Hochskalierung der Auflösung ist eine sinnvolle Maßnahme, wenn die OCR-Software beim Einlesen eines qualitativ minderwertigen Originaldokuments zu viele Fehler liefert. Auch Scanner bieten Optionen wie etwa zur Veränderung des Kontrasts.
Frage 9: In welchen Bereichen kommt die OCR-Texterkennung besonders zur Anwendung?
Den mit Abstand wichtigsten Stellenwert hat die maschinelle Texterkennung bei der Digitalisierung Papierdokumenten. Sie unterstützt eine zentrale Dokumentenverwaltung, für die keine Archive notwendig sind, die viel Platz benötigen.
Ein weiterer Vorteil ist die maschinelle Durchsuchbarkeit der digitalen Archive, die im Vergleich zur traditionellen Archivierung in Papierform eine enorme Zeitersparnis mit sich bringt. Vergleiche dazu auch die Informationen zum papierlosen Büro aus unserer Feder bzw. Tastatur.
Die OCR-Texterkennung ist außerdem ein wichtiges Hilfsmittel für Blinde. Sie können normal ausgedruckte Texte erkennen und sie sich anschließend vom Computer vorlesen lassen.
Frage 10: Wo kommt die OCR-Technik noch zum Einsatz?
Wenn du einen Bußgeldbescheid für eine Geschwindigkeitsüberschreitung oder einen Rotlichtverstoß bekommst, war die OCR-Texterkennung daran ebenfalls beteiligt. Sie ist für das Auslesen von KFZ-Kennzeichen aus Bildern verantwortlich, die von den Blitzerkameras und Ampelkameras aufgenommen werden.
Google, Bing und Co. greifen bei der Indexierung von Inhalten des Internets für die Bestückung der Datenbanken, aus denen die Suchergebnisse stammen, ebenfalls auf die maschinelle Texterkennung zurück. Anders könnten die Crawler der Suchmaschinen die in Grafiken und Fotos enthaltenen Textinformationen nicht berücksichtigen.
Ein weiteres Einsatzgebiet der OCR-Texterkennung ist die Inventarisierung. Dabei analysiert die OCR-Software Fotos von den Etiketten der Maschinen, Anlagen und des Mobiliars. Allerdings sind in diesem Bereich Barcodes in Strichform sowie QR-Codes beliebter.
Frage 11: Was hat die OCR-Texterkennung im Handy zu suchen?
Ja, du hast richtig gelesen. In einigen Fällen ist die OCR-Texterkennung als Grundausstattung von Smartphones unverzichtbar. Würde es sie nicht geben, wären Smartphones wie beispielsweise das Samsung Galaxy Note nicht entwickelt worden. Dort kannst du den Eingabe-Pen sowohl zum Tippen auf der virtuellen Tastatur als auch für handschriftliche Eingaben in das Smartphone verwenden.
Eine Sicherung der Notizen als Grafiken erfordert auf Dauer viel zu viel Speicherkapazität. Deshalb werden die Notizen mit OCR-Software eingelesen und in andere Speicherformate umgewandelt.
Fazit: Die OCR-Texterkennung bietet Vorteile und gewinnt an Bedeutung
Eine ganze Reihe von Arbeiten kannst du im Alltag mit der OCR-Technologie deutlich vereinfachen. Dabei ist die Zeitersparnis durch ein digitales Dokumentenmanagement ein wichtiger Faktor.
Bei den Ordnungshütern spart sie Zeit, weil sie KFZ-Kennzeichen nicht manuell auslesen müssen. Kriminalisten können die Bilder von Überwachungskameras für die computergestützte Verfolgung von Fahrzeugen beispielsweise nach Straftaten ausnutzen.
An anderer Stelle spart die OCR-Texterkennung Speicherplatz oder verbessert beispielsweise den Nutzerkomfort von Smartphones.
Ohne diese Technologie wäre es Suchmaschinen nicht möglich, Fotos und Grafiken für die Suchergebnisse indexieren zu können, wenn die Website-Betreiber keine Beschreibung mit entsprechenden Tags hinterlegen.
Die technischen Entwicklungen sorgen dafür, dass die von einer OCR-Software gelieferten Resultate immer weniger Erkennungsfehler enthalten. Eine niedrige Fehlerquote ist die Hauptherausforderung für die Integration der OCR-Texterkennung in weitere Bereiche des Alltags. Denkbar sind beispielsweise Display für Kühlschränke, die handschriftliche Notizen für den Einkaufszettel erfassen können. Ähnliche Displays für Eingaben mit speziellen Stiften könnten die Schulen erobern und die Erhaltung der Handschrift auch bei einer voranschreitenden Digitalisierung des Lernens garantieren.
Folgendes Video erklärt die Funktion von OCR-Texterkennung (Englisch):
Leser interessieren sich auch für diese Themen:
- Rebuilt-Toner: umweltschonend und günstig - warum?
- Laserdrucker-Feinstaub: umfassend betrachtet
- WLAN-Drucker einrichten: Anleitung und Tipps bei Problemen
Bildquellen:
Bild-ID: 147804159 - nikolay100, depositphotos.com
Bild-ID: 149931132 - merznatalia, depositphotos.com