Brief einlesen

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
meego
User
Beiträge: 380
Registriert: Montag 4. März 2013, 14:36

Wirklich gut scheint das Ganze aber nicht zu funktionieren. Ich habe jetzt einmal tesseract mit einem Fahrschein ausprobiert. Ist das wirklich der Stand der Technik?
Benutzeravatar
pixewakb
User
Beiträge: 1412
Registriert: Sonntag 24. April 2011, 19:43

Für Testzwecke würde ich erst einmal ein einfaches Beispiel nutzen und gucken, was tesseract dann leistet. OCR ist nicht, als wenn du es selbst abtippen würdest. Zumindest ist das meine bisherige Erfahrung. In manchen Fällen ist OCR aber trotzdem sehr hilfreich.
meego
User
Beiträge: 380
Registriert: Montag 4. März 2013, 14:36

Ich fand das war ein einfaches Beispiel. :)

Funktioniert's bei geschriebenem Text (Büchern) denn besser als bei Tickets, Bons, etc? Kann man das trainieren?

Bild

=

Code: Alles auswählen

NUTZEN SIE D_I_E__EDECARD
PUNKTE SAMMELN+PRAMLEN ERWERBEN
IHR EINKAUF IA’ARE UNS

1 BÜNUSPUNKTE WERT GEWESEN !
Benutzeravatar
pixewakb
User
Beiträge: 1412
Registriert: Sonntag 24. April 2011, 19:43

Ich konnte bislang noch nicht die Sprache als Parameter übergeben. Wenn das klappt, könnte das das Ergebnis etwas verbessern. Ich denke aber fast, dass dein Ergebnis schon ziemlich gut ist.
Sirius3
User
Beiträge: 17754
Registriert: Sonntag 21. Oktober 2012, 17:20

@meego: dein Scan ist sehr schlecht. Die Rückseite druckt durch und die Schrift ist löchrig. OCR funktioniert gut bei guten Vorlagen.
Benutzeravatar
sparrow
User
Beiträge: 4195
Registriert: Freitag 17. April 2009, 10:28

@meego: Ich finde das Ergebnis ziemlich gut dafür dass du einen Text umwandeln möchtest, bei dem quasi gar kein Abstand zwischen den Zeilen existiert. Da werden dann Serifen und Tremata gerne der Zeile darüber oder darunter zugeordnet.
meego
User
Beiträge: 380
Registriert: Montag 4. März 2013, 14:36

Ist es möglich OCR zu verwenden, wenn das Bild von einem Foto und nicht von einem Scan stammt? (Wenn man also noch Schreibtisch, Schatten etc. drauf hat.)

Deutsch war selektiert. (-> gImageReader)
Benutzeravatar
sparrow
User
Beiträge: 4195
Registriert: Freitag 17. April 2009, 10:28

So pauschale Aussagen sind möglich. Probier es einfach aus.

Für mein Projekt wurde ein stinknormale Scanner mit Einzug verwendet. Das klappte überraschend gut.
Ein paar Probleme gab es bei Belegen, die mi einem Nadeldrucker gedruckt waren, bei denen ein paar Nadeln defekt waren. Ansonsten war die Fehlerquote absolut im Toleranzbereich.
meego
User
Beiträge: 380
Registriert: Montag 4. März 2013, 14:36

Ein Scanner ist leider unmöglich, es müssten bei mir Fotos sein.

Was käme denn in Frage um bei den Fotos in einem ersten Durchgang die Quadrate der Rechnungen zu erkennen, automatisch Sättigung, u. Belichtung zu verstellen, etc? Vielleicht SimpleCV?
Benutzeravatar
sparrow
User
Beiträge: 4195
Registriert: Freitag 17. April 2009, 10:28

Du solltest versuchen das Problem so früh wie möglich zu lösen, nicht hinterher in Software.
Man kann zwar in Software aufhübschen aber keine Informationen herstellen, die vorher nicht da waren.

Ich habe das zum Beispiel mal mit Büchern begleitet. Da wurde dann eine gute Kamera auf ein Stativ über das Buch gehängt. Die Herausforderung war, die "Biegung" bei der aufgeschlagenen Seite nicht aufkommen zu lassen. Die ersten Versuche gingen hier auch dahin, das Problem in der Software zu lösen (Buch ausschneiden, Biegung der Seite Buchrücken->Rand rausrechnen), das war aber viel fehleranfälliger, als die Seite auf einer vorbereiteten Oberfläche zu fixieren.

Fang also besser nicht an irgendwelche Dokumente mit deinem Handy zu fotografieren. Da ist Frust vorprogrammiert.
meego
User
Beiträge: 380
Registriert: Montag 4. März 2013, 14:36

Schon klar. Nur ist das in diesem Fall aber - wie gesagt - leider unmöglich. Biegung gibt es bei Smartphonecams auch.
Unmöglich ist es allerdings nicht. Es gibt einen (kommerziellen) Anbieter.
meego
User
Beiträge: 380
Registriert: Montag 4. März 2013, 14:36

Gibt es jemanden, der das auf Server Seite (Server Side OCR) anbieten kann?:
Link

Testet es selber einmal aus, die Resultate sind viel besser, als was Tesseract produziert (offenbar hält Google - wie andernorts gelesen - auch viele Neuentwicklungen zu Tesseract unter Verschluss).
Die Microsoft Ingenieure haben hier wirklich eindrückliche Arbeit geleistet. So viel ich als Noob hier herauslese, gibt es das ganze aber nicht auf Server Seite: Link

Gruss
Benutzeravatar
sparrow
User
Beiträge: 4195
Registriert: Freitag 17. April 2009, 10:28

Ich habe bisher immer gedacht, dass A9T9 auf Tesseract aufbaut. Die scheinen aber teilweise auch die Microsoft OCR-Software zu benutzen.
Die Tests, die ich damit in der Vergangenheit gemacht habe, waren aber nicht überzeugender als Tesseract. Wenn man da dein Beispiel hier aus dem Thread verwendet, ist das Ergebnis sogar noch schlechter.

Wie gesagt, ich wiederhole mich da gerne, OCR ist dann gut, wenn die Vorlage gut ist.
meego
User
Beiträge: 380
Registriert: Montag 4. März 2013, 14:36

Code: Alles auswählen

NUTZEN SIE DIE EDECARO 
PUNKTE ERWERBEN 
IHR EINKAUF RARE ONS 
I BONUSPUNKTE WERT GEWESEN ! 
Ist doch akkurater. Es zeigt halt offenbar nur die Worte nicht an, die es wirklich kennt.
Versuch's mal mit einem Bild von einem Ticket wo das Ticket dann nicht so schön auf dem Tisch liegt oder noch andere Gegenstände drauf sind.

Vergleich

Betr. Microsoft: Link

Betreffend Vorbereitung habe ich das hier gefunden: Link - allerdings: $$$$.
Benutzeravatar
sparrow
User
Beiträge: 4195
Registriert: Freitag 17. April 2009, 10:28

Code: Alles auswählen

NUTZEN SIE DIE EDECARO 
PUNKTE ERWERBEN 
IHR EINKAUF RARE ONS 
I BONUSPUNKTE WERT GEWESEN ! 
gegen

Code: Alles auswählen

NUTZEN SIE D_I_E__EDECARD
PUNKTE SAMMELN+PRAMLEN ERWERBEN
IHR EINKAUF IA’ARE UNS

1 BÜNUSPUNKTE WERT GEWESEN !
Da findest du das Erste akkurater? Ernsthaft?
meego
User
Beiträge: 380
Registriert: Montag 4. März 2013, 14:36

Wenn man mit dem Text etwas anstellen will schon. Wie soll man denn die Unterstriche vernünftig entfernen und da Worte herauskristallisieren?
meego
User
Beiträge: 380
Registriert: Montag 4. März 2013, 14:36

Hier noch einmal ein Beispiel:
Bild

Tesseract:

Code: Alles auswählen

ihund VVT ‚v5 ’
 rgalm H+R
 6.20€
g: Inkl. ges. List,
gc? 102255
 001368
Microsoft OCR:

Code: Alles auswählen

****** Result for Image/Page 1 ******
Verkehrsverbund VVT IVB 
Mutterbergalm H+R 
Zone Innsbruck 
nach zone Sulzenau 
OIP 09Z 
6.20€ 
270066 
004000 
Inkl. ges. Ust 
102256 
02.01.12 09:28 
00136s
Das sind Welten.
Antworten