Seite 1 von 1

NLTK Corpus

Verfasst: Montag 6. Februar 2017, 11:22
von sunny8691
Hallo,

ich muss von der Uni aus ein Projekt machen. Dabei geht es grob über Kindergeschichten, insbesondere um die wörtliche Rede darin sowie deren Sprecher. Ich möchte das Alter der Sprecher genauer untersuchen bzw diese dann einteilen können in Young,teen,adult,old. Ich weiss, dass es für die Untersuchung zB auf männlich und weiblich einen NLTK Corpus gibt.
Gibt es irgendwie auch so etwas für meine Richtung.
Insgesamt möchte ich das Age auf mehreren Ebenen untersuchen: Satzbau,Stilmittel,Satzzeichen und Satzebene.

Wäre für Tipps sehr dankbar :)

Re: NLTK Corpus

Verfasst: Montag 6. Februar 2017, 20:12
von nezzcarth
Hast du dir schon CHILDES und das neuere TalkBank angesehen?
NLTK bietet wohl auch Möglichkeiten, damit zu arbeiten (habe ich aber noch nicht selbst ausprobiert): http://www.nltk.org/howto/childes.html

Nebenbei: Korpus im Sinne von Textsammlung ist im Deutschen Neutrum. (Lehrende legen da i.d.R. großen Wert drauf ;) ).

Re: NLTK Corpus

Verfasst: Freitag 10. Februar 2017, 17:10
von sunny8691
Super vielen lieben Dank.
Leider muss ich das mit NLTK machen, aber das hilft mir schon sehr weiter.
Ich werde es mal versuchen anzuwenden.