Text von TIF mittels Pytesseract nicht erkannt
Verfasst: Mittwoch 11. Dezember 2019, 18:49
Hallo Zusammen,
ich möchte die Verarbeitung von Faxen automatisieren (leider bin ich noch auf diese Technik angewiesen). Dafür setzte ich einen zum Fax umgebauten Raspberry Pi 3 ein.
Um die Faxe zu verarbeiten benutze ich Pytesseract.
Wenn ich ein Fax ausdrucke und als TIF einscanne funktioniert das ganze problemlos mit image_to_string.
Sobald ich aber ein Fax (ebenfalls TIF), das der Rasperry direkt empfangen hat, mittels image_to_string einlesen möchte, wird kein Text erkannt.
Ich habe auch schon probiert die TIF-Datei in ein JPEG umzuwandeln. Auch kein Ergebnis.
Einziger Unterschied der mir spontan auffällt ist die Dateigröße und somit die Auflösung.
Hat jemand von euch hier Erfahrung mit Pytesseract und kann mir weiter helfen, wo das Problem liegen könnte?
Vielen Dank vorab.
Grüße
Oceanblue87
ich möchte die Verarbeitung von Faxen automatisieren (leider bin ich noch auf diese Technik angewiesen). Dafür setzte ich einen zum Fax umgebauten Raspberry Pi 3 ein.
Um die Faxe zu verarbeiten benutze ich Pytesseract.
Wenn ich ein Fax ausdrucke und als TIF einscanne funktioniert das ganze problemlos mit image_to_string.
Sobald ich aber ein Fax (ebenfalls TIF), das der Rasperry direkt empfangen hat, mittels image_to_string einlesen möchte, wird kein Text erkannt.
Ich habe auch schon probiert die TIF-Datei in ein JPEG umzuwandeln. Auch kein Ergebnis.
Einziger Unterschied der mir spontan auffällt ist die Dateigröße und somit die Auflösung.
Hat jemand von euch hier Erfahrung mit Pytesseract und kann mir weiter helfen, wo das Problem liegen könnte?
Vielen Dank vorab.
Grüße
Oceanblue87