Freitag, 29. November 2019
ocr
Kürzlich steiß ich auf ein gutes Programm zur Texterkennung: tesseract
Gut, ich habe es nicht intensive getestet, aber was ich erkennen ließ, war fehlerfrei. Ich kann es also empfehlen. Wichtig ist, daß man auch die passende Sprache installiert. Für deutsch scheint es auch Fraktur (deu_frak) zu geben. Das muß ich bei Gelegenheit mal ausprobieren.

Nachtrag: "Tesseract is an optical character recognition engine for various operating systems. It is free software, released under the Apache License, Version 2.0, and development has been sponsored by Google since 2006. In 2006, Tesseract was considered one of the most accurate open-source OCR engines then available" wikipedia. Es gibt auch ein gui dafür OCRFeeder.

Nachtrag (3.12.2019): Inzwischen habe ich etwas mit deu_frak experimentiert und mußte feststellen, daß die Ergebnisse nicht ganz so gut sind. Ich denke aber, ein wichtiger Faktor dürfte die Qualität der Vorlage sein.

... link