Die Suche ergab 3 Treffer

von ohrs
Freitag 22. Oktober 2021, 15:53
Forum: Allgemeine Fragen
Thema: Sätze aus dt. Text mit nltk und dehyphen
Antworten: 6
Zugriffe: 1107

Re: Sätze aus dt. Text mit nltk und dehyphen


@ohrs,

vielleicht das:
https://spacy.io/

Es kommt ja auch darauf an, was du eigentlich erreichen möchtest.
Wie stark würde das Ergebnis beeinträchtig, wenn Wortfetzen wie "angewie" und "sen" einfach wegfallen, weil sie alleine keinen Sinn mehr ergeben?


Danke für den Hinweis!

Ich hatte den ...
von ohrs
Freitag 22. Oktober 2021, 09:44
Forum: Allgemeine Fragen
Thema: Sätze aus dt. Text mit nltk und dehyphen
Antworten: 6
Zugriffe: 1107

Re: Sätze aus dt. Text mit nltk und dehyphen


Was immer geht:
Du schaust dir für ein Element an, ob das letzte Zeichen ein Bindestrich ist: Beginnt das nachfolgende Wort mit einem Großbuchstabe, wird der Bindestrich nicht entfernt aber die beiden Elemente vereint - beginnt das nachfolgende Element mit einem Kleinbuchstaben, werden die beiden ...
von ohrs
Donnerstag 21. Oktober 2021, 19:54
Forum: Allgemeine Fragen
Thema: Sätze aus dt. Text mit nltk und dehyphen
Antworten: 6
Zugriffe: 1107

Sätze aus dt. Text mit nltk und dehyphen

Diesen Satz habe ich mit nltk.sent_tokenize aus einem größeren Text erstellt:
"Die Bürgerinnen und Bürger in Nordrhein- Westfalen sind dringend auf neue Forschungser- gebnisse für lebensrettende Medikamente angewie- sen."

Dabei macht es keinen Unterschied, ob ich
german_tokenizer = nltk.data.load ...