Mir fällt leider keine bessere Formulierung für mein Problem ein. Wenn ich dafür einen korrekten Fachterminus hätte, würde Tante Google vermutlich das Problem lösen.
Eventuell habe ich so eine Frage auch hier schon mal gestellt; ich beschäftige mich schon ewig damit.
Allllssssooooooo ....
- ich habe viele gescannte PDFs, jeweils mit textlayer
- Ich habe viele Bankbuchungen, sie sich auf die PDFs beziehen
Mal habe ich EINE konkrete rechnungsnummer in der Bankbuchung, mit Entsprechung in der PDF
manchmal habe ich mehrere Angaben im Zweck der Bankbuchung, von denen EINE eine Entsprechnung im PDF hat.
manchmal habe ich Angaben im Zweck, die eine der Angaben aus der PDF ENTHALTEN.
Manchmal passt nichts.
Ich müsste also das PDF nach sehr inhomogenen Angaben durchsuchen. Einzelstring, teilstring, multiple Strings.
Gibt es dafür eine Lösung in Python?