Regular Expression - re.finditer oderverknüpfte Suche
Verfasst: Freitag 18. März 2022, 14:14
Hallo zusammen,
nachdem ich mich jetzt erfolglos mit meiner Aufgabe versucht habe, hoffe ich dass mir hier jemand helfen kann. Ich habe folgendes Problem. Ich will ein PDF Text auslesen, dessen Kapitel wie folgt unterteilt ist:
(1)
.....
(1.1)
.....
(1.1.1)
..... usw.
Das Auslesen der PDF und finden der Einzelnen Kapiteln ist kein Problem, damit komme ich klar.
Sobald ich den Textinhalt der PDF in ein String umgewandelt habe, versuche ich mit folgender Methode die einzelnen Kapitel zu finden:
count = 0
for match in re.finditer(r"\n\((\d\)|\n\((\d.\d\)|\n\((\d.\d.\d\)", String):
count += 1
print("match", count, match.group(), "start index", match.start(), "End index", match.end(),)
Was ich mich noch frage ist: Gibt es auch eine Möglichkeit herauszufinden welche dieser drei Bedingungen erfüllt wurde? Ausgehend davon würde ich gerne unterschiedliche Operationen durchführen.
Ich hoffe ihr könnt mir weiterhelfen.
Vielen Dank und viele Grüße
nachdem ich mich jetzt erfolglos mit meiner Aufgabe versucht habe, hoffe ich dass mir hier jemand helfen kann. Ich habe folgendes Problem. Ich will ein PDF Text auslesen, dessen Kapitel wie folgt unterteilt ist:
(1)
.....
(1.1)
.....
(1.1.1)
..... usw.
Das Auslesen der PDF und finden der Einzelnen Kapiteln ist kein Problem, damit komme ich klar.
Sobald ich den Textinhalt der PDF in ein String umgewandelt habe, versuche ich mit folgender Methode die einzelnen Kapitel zu finden:
count = 0
for match in re.finditer(r"\n\((\d\)|\n\((\d.\d\)|\n\((\d.\d.\d\)", String):
count += 1
print("match", count, match.group(), "start index", match.start(), "End index", match.end(),)
Was ich mich noch frage ist: Gibt es auch eine Möglichkeit herauszufinden welche dieser drei Bedingungen erfüllt wurde? Ausgehend davon würde ich gerne unterschiedliche Operationen durchführen.
Ich hoffe ihr könnt mir weiterhelfen.
Vielen Dank und viele Grüße