Ich möchte gerne eine Text datei einlesen und dort jeweils die einzelnen Sätze rausgeben lassen.
Dafür fange ich damit an, mit einem RegEx jeweils die letzten Worte in einem Satz zu finden.
mit re.sub würde ich jetzt gerne alle "!", "." und "?" und ":" durch "." ersetzen. Damit ich anschließend mit einer for Schleife nur noch nach "." suchen muss, damit mir alle Sätze angezeigt werden.
Bisher bin ich soweit:
Code: Alles auswählen
import re
def saetze():
text= open("probecdu.txt") # liest den Inhalt der Datei
inhalt= text.read()
regex= r"\w*[.?!]+(?=\s)"
if re.search (r"\w[.?!]+(?=\s)",inhalt):
print (inhalt)
Das Problem ist, dass jetzt der komplette Text ausgegeben wid. Ich möchte aber lediglich die die Stellen, an denen ein Satzzeichen hinter einem Wort steht.
Wie kann ich das beheben?
Ich weiß, ich bin leider nicht so der Pro, aber dafür für jede Hilfe umso dankbarer!
LG