NLTK Corpus

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
sunny8691
User
Beiträge: 6
Registriert: Montag 6. Februar 2017, 11:11

Hallo,

ich muss von der Uni aus ein Projekt machen. Dabei geht es grob über Kindergeschichten, insbesondere um die wörtliche Rede darin sowie deren Sprecher. Ich möchte das Alter der Sprecher genauer untersuchen bzw diese dann einteilen können in Young,teen,adult,old. Ich weiss, dass es für die Untersuchung zB auf männlich und weiblich einen NLTK Corpus gibt.
Gibt es irgendwie auch so etwas für meine Richtung.
Insgesamt möchte ich das Age auf mehreren Ebenen untersuchen: Satzbau,Stilmittel,Satzzeichen und Satzebene.

Wäre für Tipps sehr dankbar :)
nezzcarth
User
Beiträge: 1635
Registriert: Samstag 16. April 2011, 12:47

Hast du dir schon CHILDES und das neuere TalkBank angesehen?
NLTK bietet wohl auch Möglichkeiten, damit zu arbeiten (habe ich aber noch nicht selbst ausprobiert): http://www.nltk.org/howto/childes.html

Nebenbei: Korpus im Sinne von Textsammlung ist im Deutschen Neutrum. (Lehrende legen da i.d.R. großen Wert drauf ;) ).
sunny8691
User
Beiträge: 6
Registriert: Montag 6. Februar 2017, 11:11

Super vielen lieben Dank.
Leider muss ich das mit NLTK machen, aber das hilft mir schon sehr weiter.
Ich werde es mal versuchen anzuwenden.
Antworten