Die Suche ergab 3 Treffer
- Freitag 22. Oktober 2021, 15:53
- Forum: Allgemeine Fragen
- Thema: Sätze aus dt. Text mit nltk und dehyphen
- Antworten: 6
- Zugriffe: 1107
Re: Sätze aus dt. Text mit nltk und dehyphen
@ohrs,
vielleicht das:
https://spacy.io/
Es kommt ja auch darauf an, was du eigentlich erreichen möchtest.
Wie stark würde das Ergebnis beeinträchtig, wenn Wortfetzen wie "angewie" und "sen" einfach wegfallen, weil sie alleine keinen Sinn mehr ergeben?
Danke für den Hinweis!
Ich hatte den ...
- Freitag 22. Oktober 2021, 09:44
- Forum: Allgemeine Fragen
- Thema: Sätze aus dt. Text mit nltk und dehyphen
- Antworten: 6
- Zugriffe: 1107
Re: Sätze aus dt. Text mit nltk und dehyphen
Was immer geht:
Du schaust dir für ein Element an, ob das letzte Zeichen ein Bindestrich ist: Beginnt das nachfolgende Wort mit einem Großbuchstabe, wird der Bindestrich nicht entfernt aber die beiden Elemente vereint - beginnt das nachfolgende Element mit einem Kleinbuchstaben, werden die beiden ...
- Donnerstag 21. Oktober 2021, 19:54
- Forum: Allgemeine Fragen
- Thema: Sätze aus dt. Text mit nltk und dehyphen
- Antworten: 6
- Zugriffe: 1107
Sätze aus dt. Text mit nltk und dehyphen
Diesen Satz habe ich mit nltk.sent_tokenize aus einem größeren Text erstellt:
"Die Bürgerinnen und Bürger in Nordrhein- Westfalen sind dringend auf neue Forschungser- gebnisse für lebensrettende Medikamente angewie- sen."
Dabei macht es keinen Unterschied, ob ich
german_tokenizer = nltk.data.load ...
"Die Bürgerinnen und Bürger in Nordrhein- Westfalen sind dringend auf neue Forschungser- gebnisse für lebensrettende Medikamente angewie- sen."
Dabei macht es keinen Unterschied, ob ich
german_tokenizer = nltk.data.load ...
