Hali, Halo, und weiter gehts:
# Alle Wörter am Satzanfang finden
for match in re.finditer(r'.\s+([A-Z][a-z]*)\s+',text):
wort = match.group(1)
print "Altes Wort:", wort
# Ist das gefundende Wort woanders im Text kleingeschrieben
if wort.lower() in tokens_lowercase_set:
# Dann wird das Wort am ...
Die Suche ergab 34 Treffer
- Freitag 3. Juli 2009, 14:26
- Forum: Allgemeine Fragen
- Thema: Aufsplitten vom Text via RegExp statt .split()!
- Antworten: 14
- Zugriffe: 2653
- Mittwoch 1. Juli 2009, 23:53
- Forum: Allgemeine Fragen
- Thema: Aufsplitten vom Text via RegExp statt .split()!
- Antworten: 14
- Zugriffe: 2653
- Mittwoch 1. Juli 2009, 22:26
- Forum: Allgemeine Fragen
- Thema: Aufsplitten vom Text via RegExp statt .split()!
- Antworten: 14
- Zugriffe: 2653
- Mittwoch 1. Juli 2009, 21:44
- Forum: Allgemeine Fragen
- Thema: Aufsplitten vom Text via RegExp statt .split()!
- Antworten: 14
- Zugriffe: 2653
- Mittwoch 1. Juli 2009, 20:09
- Forum: Allgemeine Fragen
- Thema: Aufsplitten vom Text via RegExp statt .split()!
- Antworten: 14
- Zugriffe: 2653
- Mittwoch 1. Juli 2009, 20:07
- Forum: Allgemeine Fragen
- Thema: Aufsplitten vom Text via RegExp statt .split()!
- Antworten: 14
- Zugriffe: 2653
- Mittwoch 1. Juli 2009, 19:07
- Forum: Allgemeine Fragen
- Thema: Aufsplitten vom Text via RegExp statt .split()!
- Antworten: 14
- Zugriffe: 2653
- Mittwoch 1. Juli 2009, 18:34
- Forum: Allgemeine Fragen
- Thema: Aufsplitten vom Text via RegExp statt .split()!
- Antworten: 14
- Zugriffe: 2653
Aufsplitten vom Text via RegExp statt .split()!
Howdy,
und wieder ich!
Immer noch am Thema reguläre Ausdrücke.
Ich muss einen Text tokensieren (und normalisieren), und dann je Zeile 1 Token ausgeben. Tokensieren heißt jedes Wort/Satzzeichen entnehmen und ausgeben oder in Liste einfügen.
Folgender Beispieltext untokensiert:
Soddoma (eigentlich ...
und wieder ich!
Immer noch am Thema reguläre Ausdrücke.
Ich muss einen Text tokensieren (und normalisieren), und dann je Zeile 1 Token ausgeben. Tokensieren heißt jedes Wort/Satzzeichen entnehmen und ausgeben oder in Liste einfügen.
Folgender Beispieltext untokensiert:
Soddoma (eigentlich ...
- Donnerstag 25. Juni 2009, 20:29
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
- Donnerstag 25. Juni 2009, 19:08
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
- Donnerstag 25. Juni 2009, 18:37
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
- Donnerstag 25. Juni 2009, 18:22
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
- Donnerstag 25. Juni 2009, 17:46
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
- Donnerstag 25. Juni 2009, 17:33
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
- Donnerstag 25. Juni 2009, 09:18
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
- Mittwoch 24. Juni 2009, 21:38
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
- Mittwoch 24. Juni 2009, 20:41
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
- Mittwoch 24. Juni 2009, 19:27
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
- Mittwoch 24. Juni 2009, 18:57
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
- Mittwoch 24. Juni 2009, 18:27
- Forum: Allgemeine Fragen
- Thema: Reguläre Ausdrucke
- Antworten: 26
- Zugriffe: 4540
Reguläre Ausdrucke
Hallo,
mal wieder ich. Diesmal geht es um reguläre Ausdrucke.
Ich habe eine Textdatei. Darin sind halt normale Sätze wie z.B.
Ich fahre heute Auto , und bin glücklich dabei . Usw. usf. die Leerzeichen zwischen den Satz- und Sonderzeichen sind absicht im Text, damit das einfacher wird.
Folgendes ...
mal wieder ich. Diesmal geht es um reguläre Ausdrucke.
Ich habe eine Textdatei. Darin sind halt normale Sätze wie z.B.
Ich fahre heute Auto , und bin glücklich dabei . Usw. usf. die Leerzeichen zwischen den Satz- und Sonderzeichen sind absicht im Text, damit das einfacher wird.
Folgendes ...
