OCR-Ergebnis mit in ein PDF packen

Jan-Benedict Glaw jbglaw at lug-owl.de
Tue Apr 21 10:49:11 CEST 2009


On Mon, 2009-04-20 22:21:54 +0200, Ralf Gesellensetter <rgx at gmx.de> wrote:
> Am Montag 20 April 2009 schrieb Martin Heggemann:
> > Hast Du u.U. vom OCR-Programm ein *.deb gebaut, das Du zur Verfügung
> > stellen könntest?
> 
> Hi - ich verfolge das Thema OCR unter Linux ebenfalls schon eine Weile 
> und möchte zunächst einige URLs einwerfen.
> 
> Auf diesen Wikiseiten werden wichtige Infos zum Thema gesammelt 
> (Ergänzung erwünscht):
> 
> http://wiki.skolelinux.de/TextErkennungOCR

Hast Du Dir das Bild mal genau angeschaut? Die Qualität ist rottig.
Das mag einem Menschen reichen, aber ein guter Scan ist das nicht :)

Wurden die Programme auf den Text angelernt? Bei meinen Scans ist die
Erkennungsrate (ohne Anlernen) auch nicht gerade berauschend, aber der
Ursprungstext ist durchaus erkennbar.

> http://wiki.skolelinux.de/ProduktiveSoftware/AbbyyFinereaderOCR

Lizenz: proprietär

> Außerdem wurde vor Jahren mal an der Uni Kaiserslautern eine PhD-Stelle 
> zum Thema OCR ausgeschrieben. Google entwickelt/lässt entwickeln 
> (Summer of Code) - wir werden sehen. Für professionelle Zwecke scheint 
> mir der Abbyy Finereader (Linux Edition) interessant.

hocr / ocropus ist das IMHO. Das benutz' ich auch. Hat den Vorteil,
daß man mit dem einen Frontend ggf. auch unterschiedliche
Scan-Backends nutzen kann.

MfG, JBG

-- 
      Jan-Benedict Glaw      jbglaw at lug-owl.de              +49-172-7608481
Signature of:                   ...und wenn Du denkst, es geht nicht mehr,
the second  :                          kommt irgendwo ein Lichtlein her.
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 197 bytes
Desc: Digital signature
URL: <http://lug-owl.de/pipermail/linux/attachments/20090421/e68bd60d/attachment.sig>


More information about the Linux mailing list