diego.blogger.de: ocr

Freitag, 29. November 2019

ocr

diegolego, 22:37h

Kürzlich steiß ich auf ein gutes Programm zur Texterkennung: tesseract
Gut, ich habe es nicht intensive getestet, aber was ich erkennen ließ, war fehlerfrei. Ich kann es also empfehlen. Wichtig ist, daß man auch die passende Sprache installiert. Für deutsch scheint es auch Fraktur (deu_frak) zu geben. Das muß ich bei Gelegenheit mal ausprobieren.

Nachtrag: "Tesseract is an optical character recognition engine for various operating systems. It is free software, released under the Apache License, Version 2.0, and development has been sponsored by Google since 2006. In 2006, Tesseract was considered one of the most accurate open-source OCR engines then available" wikipedia. Es gibt auch ein gui dafür OCRFeeder.

Nachtrag (3.12.2019): Inzwischen habe ich etwas mit deu_frak experimentiert und mußte feststellen, daß die Ergebnisse nicht ganz so gut sind. Ich denke aber, ein wichtiger Faktor dürfte die Qualität der Vorlage sein.

Letzte Änderungen

RIP PM?
Am Wochende mußte ich im Kaufland feststellen,...

by diegolego (2026.04.17, 16:43)

zusammenhangslos
Aadam Jacobs Collection at the Live Music Archive

by diegolego (2026.04.16, 12:57)

zurück
Nach dem Umzug, dem Urlaub, und dem heutigen Internet-Anschluß,...

by diegolego (2026.04.14, 22:03)

Long
Ihr habt Euch gewundert, warum ich so lange nichts...

by diegolego (2026.04.02, 12:44)

skynet
eurosky Das soll wohl ein europäisches Soziales...

by diegolego (2026.03.24, 08:25)

November 2019
Mo	Di	Mi	Do	Fr	Sa	So
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30
Oktober				Dezember

diego.blogger.de

Navigation

Suche

Links

Twitter

Statistik

Archiv

Letzte Änderungen