Ich habe eine längere Textdatei (mit codecs.open(u"dateiname.txt", mode='r', encoding='utf8' geöffnet), die ich in einzelne Abschnitte aufteilen möchte.
Die einzelnen Abschnitte enden jeweils mit "---\n".
Ich möchte also am Ende einige Abschnitte in Variablen gespeichert haben:
a = dateianfang bis zum ersten "---\n"
b = von ende von a bis zum nächsten "---\n"
...
n = von ende von n-1 bis zum letzten "---\n"
Meine bisherigen Ansätze mit re waren überhaupt nicht erfolgreich. Müsste ich die einzelnen Abschnitte nicht mit einem regulären Ausdruck suchen, der etwa wie im Folgenden aussieht?
Code: Alles auswählen
inputfile = codecs.open(u"har_accuracy_anova_items_results.txt", mode='r', encoding='utf8')
wholefile = inputfile.read()
paragraph = re.findall(r'^.+---\n', wholefile)
print paragraph
Leider ist paragraph immer nur eine leere Liste.
Ich stehe glaube ich gerade auf dem Schlauch. Was ist an meiner regex falsch?
Oder gibt es vielleicht sogar für mein Problem einen eleganteren Weg ohne re?
Vielen Dank für Eure Hilfe.
Grüße,
Johannes