ich habe eine Textdatei in der ich gerne die Silbentrennung auflösen würde.
Dazu habe ich den Text eingelesen und eine leere Liste Zeilen erstellt.
In der Liste sind nun alle einzelnen Zeilen aufgelistet.
Dann habe ich nach den Worten gesucht, die mit einem Bindestrich aufhören und diese in eine extra Liste Wörter eingefügt.
Jetzt will ich den Bindestrich durch so einen Strich | ersetzten und den Rest des Wortes aus der nachfolgenden Zeile zu dem Anfang des Wortes in der vorherigen Zeile anhängen.
Ich hatte überlegt, dass ich bei diese beiden Zeilen dann die einzelnen Wörter in Listen zerlege und das Ende abschneide um er in der vorherigen Zeile ans Ende der Wörterlist anhängen.
Vielleicht kann mir da jemand einen Tipp/ Ansatz geben wie ich da weiterkommen könnte.
Liebe Grüße
Code: Alles auswählen
import re
f=open("Datei.txt","rt", encoding="utf-8")
zeilen=[]
count=0
for line in f:
zeilen.append(line)
count=count+1
f.close()
for eintrag in zeilen:
suchen=re.findall(r"[A-Z]?[a-z]+ - [\n]", eintrag)
wörter=[]
for x in suchen:
wörter.append(x)
print(wörter)