Zeichenketten mit flexiblen Suchstrings durchsuchen

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
drnicolas
User
Beiträge: 105
Registriert: Sonntag 24. Juli 2016, 10:32

Mir fällt leider keine bessere Formulierung für mein Problem ein. Wenn ich dafür einen korrekten Fachterminus hätte, würde Tante Google vermutlich das Problem lösen.
Eventuell habe ich so eine Frage auch hier schon mal gestellt; ich beschäftige mich schon ewig damit.

Allllssssooooooo ....
- ich habe viele gescannte PDFs, jeweils mit textlayer
- Ich habe viele Bankbuchungen, sie sich auf die PDFs beziehen

Mal habe ich EINE konkrete rechnungsnummer in der Bankbuchung, mit Entsprechung in der PDF
manchmal habe ich mehrere Angaben im Zweck der Bankbuchung, von denen EINE eine Entsprechnung im PDF hat.
manchmal habe ich Angaben im Zweck, die eine der Angaben aus der PDF ENTHALTEN.
Manchmal passt nichts.

Ich müsste also das PDF nach sehr inhomogenen Angaben durchsuchen. Einzelstring, teilstring, multiple Strings.

Gibt es dafür eine Lösung in Python?
Sirius3
User
Beiträge: 18253
Registriert: Sonntag 21. Oktober 2012, 17:20

Wenn es ein Muster gibt, nach dem man suchen kann, dann benutzt man reguläre Ausdrücke.
Wenn es damit nicht geht, mußt Du konkreter werden.
Antworten