ich möchte mit Python Geldbeträge aus einem PDF Dokument auslesen und in einer SQL-Datenbank speichern.
Von Sachverständigen bekomme ich Gutachten zu Verkehsunfällen mit allen benötigten Daten. Das Gutachten ist ein PDF Dokument und irgendwo im PDF Dokumnet findet man folgende Daten (zur Veranschaulichung hab ich die Daten aus 3 verschiedenen Gutachten rauskopiert):

Ich möchte jetzt die Reparaturkosten netto auslesen. Im Beispiel 1 "3.702,37", im Beispiel 2 "5.497,80" und im Beispiel 3 "6.989,97". Sonst nichts. Nur die Zahl soll in der Datenbank gespeichert werden.
Jetzt zu meinem Problem: Ich kann nach bestimmten Wörtern (Keywords) suchen. Die Suche nach "Reparaturkosten" bzw. "Reparaturkosten netto" bringt mir aber nichts. Ich möchte nicht ein bestimmtes Wort finden, sondern den €-Betrag rechts daneben.Der €-Betrag ist immer ein anderer. Es wäre Zufall, wenn in 2 Gutachten die selben Reparaturkosten vorkommen.
Mein Lösungsansatz:
1. Alle Gutachter nutzen als Wort entweder "Reparaturkosten" oder "Reparaturkosten netto".
2. Die von mir gesuchte Zahl steht immer rechts neben dem Wort.
3. Deshalb kann ich die gesamte Zeile in der das Keyword vorkommt einlesen und alles bis auf die kleinste Zahl löschen. Dann bliebe im Beispiel 1 "3.702,37", im Beispiel 2 "5.497,80" und im Beispiel 3 "6.989,97" übrig.
Mein Anliegen: Den oben beschriebenen Lösungsansatz bekomme ich nicht hin. Ich bin für jeden Tip dankbar.
Das PDF lade ich wie folgt:
import re
from pdfminer.high_level import extract_pages, extract_text
for page_layout in extract_pages("gutachten.pdf"):
for element in page_layout:
print(element)