ocr mit python unter linux
Verfasst: Mittwoch 1. September 2010, 13:19
Hallo,
ich würde gerne mit einem Script text aus jpeg und png Bilder extrahieren.
Am liebsten wäre mir wenn es so funktioinert wie bei pytesser:
also einfach ein "print image_file_to_string(bild.jpg) und ich habe ein Resultat oder eben nicht.
Leider scheint pytesser nur mit tiff Dateien und unter Windows zu funktionieren ;/
Sonstige Module die ich zum Thema gefunden habe, sind auch schon relatv veraltet. Was nimmt man denn heutzutage am besten?
Gruß
Herr Lehmann
ich würde gerne mit einem Script text aus jpeg und png Bilder extrahieren.
Am liebsten wäre mir wenn es so funktioinert wie bei pytesser:
Code: Alles auswählen
>>> from pytesser import *
>>> image = Image.open('fnord.tif') # Open image object using PIL
>>> print image_to_string(image) # Run tesseract.exe on image
fnord
>>> print image_file_to_string('fnord.tif')
fnord
Leider scheint pytesser nur mit tiff Dateien und unter Windows zu funktionieren ;/
Sonstige Module die ich zum Thema gefunden habe, sind auch schon relatv veraltet. Was nimmt man denn heutzutage am besten?
Gruß
Herr Lehmann