und täglich grüßt die shell :)
hab jetzt das script soweit fertig und es läuft auch ganz hervorragend (danke nochmal BlackJack&hyperion für die hilfe). einziges problem das ich habe, ist die limitierung bei der gesamtsumme der regulären ausdrücke. meine regex-datei ist ~ 150kb groß und python ...
Die Suche ergab 4 Treffer
- Mittwoch 2. März 2011, 10:59
- Forum: Allgemeine Fragen
- Thema: Pythonscript zur Textkorpusanalyse
- Antworten: 7
- Zugriffe: 816
- Donnerstag 24. Februar 2011, 14:50
- Forum: Allgemeine Fragen
- Thema: Pythonscript zur Textkorpusanalyse
- Antworten: 7
- Zugriffe: 816
Re: Pythonscript zur Textkorpusanalyse
@hyperion:
das mit dem umkehren ist ein guter punkt... würde wohl auch effizienter sein, da 40000 zeilen "besser" auf 6000 lexeme zu überprüfen sind als umgekehrt (rein rechentechnisch). ich werds mir mal genauer anschaun. bin außerdem durch BlackJacks hinweis gerade auf einen blöden fehler ...
das mit dem umkehren ist ein guter punkt... würde wohl auch effizienter sein, da 40000 zeilen "besser" auf 6000 lexeme zu überprüfen sind als umgekehrt (rein rechentechnisch). ich werds mir mal genauer anschaun. bin außerdem durch BlackJacks hinweis gerade auf einen blöden fehler ...
- Donnerstag 24. Februar 2011, 14:11
- Forum: Allgemeine Fragen
- Thema: Pythonscript zur Textkorpusanalyse
- Antworten: 7
- Zugriffe: 816
Re: Pythonscript zur Textkorpusanalyse
hey danke für die schnelle antwort!
@BlackJack:
genau, fileRX ist eine textdatei welche eine unzahl von lexemen (wörter) enthaltet welche mit hilfe von regex modifiziert wurden (einfaches Bsp: Bücher --> B(ue|ü)cher). sobald einer dieser begriffe gematched wird, möchte ich die zeile in welcher er ...
@BlackJack:
genau, fileRX ist eine textdatei welche eine unzahl von lexemen (wörter) enthaltet welche mit hilfe von regex modifiziert wurden (einfaches Bsp: Bücher --> B(ue|ü)cher). sobald einer dieser begriffe gematched wird, möchte ich die zeile in welcher er ...
- Donnerstag 24. Februar 2011, 13:16
- Forum: Allgemeine Fragen
- Thema: Pythonscript zur Textkorpusanalyse
- Antworten: 7
- Zugriffe: 816
Pythonscript zur Textkorpusanalyse
hallo allerseits!
jeden tag eine neue herausforderung... heut hab ich mir zur aufgabe gemacht einen großen textkorpus bestehend aus 400.000 zeilen mit einem regex-file zu durchforsten. hab mir diesbezüglich auch schon vieles überlegt und wie jeder gute koch hab ich mir auch schon was zurechtgelegt ...
jeden tag eine neue herausforderung... heut hab ich mir zur aufgabe gemacht einen großen textkorpus bestehend aus 400.000 zeilen mit einem regex-file zu durchforsten. hab mir diesbezüglich auch schon vieles überlegt und wie jeder gute koch hab ich mir auch schon was zurechtgelegt ...
