Die Suche ergab 4 Treffer

von PR1AN
Mittwoch 2. März 2011, 10:59
Forum: Allgemeine Fragen
Thema: Pythonscript zur Textkorpusanalyse
Antworten: 7
Zugriffe: 816

Re: Pythonscript zur Textkorpusanalyse

und täglich grüßt die shell :)

hab jetzt das script soweit fertig und es läuft auch ganz hervorragend (danke nochmal BlackJack&hyperion für die hilfe). einziges problem das ich habe, ist die limitierung bei der gesamtsumme der regulären ausdrücke. meine regex-datei ist ~ 150kb groß und python ...
von PR1AN
Donnerstag 24. Februar 2011, 14:50
Forum: Allgemeine Fragen
Thema: Pythonscript zur Textkorpusanalyse
Antworten: 7
Zugriffe: 816

Re: Pythonscript zur Textkorpusanalyse

@hyperion:
das mit dem umkehren ist ein guter punkt... würde wohl auch effizienter sein, da 40000 zeilen "besser" auf 6000 lexeme zu überprüfen sind als umgekehrt (rein rechentechnisch). ich werds mir mal genauer anschaun. bin außerdem durch BlackJacks hinweis gerade auf einen blöden fehler ...
von PR1AN
Donnerstag 24. Februar 2011, 14:11
Forum: Allgemeine Fragen
Thema: Pythonscript zur Textkorpusanalyse
Antworten: 7
Zugriffe: 816

Re: Pythonscript zur Textkorpusanalyse

hey danke für die schnelle antwort!

@BlackJack:
genau, fileRX ist eine textdatei welche eine unzahl von lexemen (wörter) enthaltet welche mit hilfe von regex modifiziert wurden (einfaches Bsp: Bücher --> B(ue|ü)cher). sobald einer dieser begriffe gematched wird, möchte ich die zeile in welcher er ...
von PR1AN
Donnerstag 24. Februar 2011, 13:16
Forum: Allgemeine Fragen
Thema: Pythonscript zur Textkorpusanalyse
Antworten: 7
Zugriffe: 816

Pythonscript zur Textkorpusanalyse

hallo allerseits!

jeden tag eine neue herausforderung... heut hab ich mir zur aufgabe gemacht einen großen textkorpus bestehend aus 400.000 zeilen mit einem regex-file zu durchforsten. hab mir diesbezüglich auch schon vieles überlegt und wie jeder gute koch hab ich mir auch schon was zurechtgelegt ...