Hierbei wird IMHO nicht das zerlegen des Textes oder das speichern der Meta Informationen der Flaschenhals sein. Sondern die Abfrage anderer Datenbanken nach den Informationen. Möchtest du dabei externe Datenbanken im Web nutzten?epsilon hat geschrieben:Den Text zerlege ich mit dem Lexer in kleinere Teile (Wörter, Satzendezeichen, restliche Satzzeichen, whitespaces). Über die Wörter möchte ich dann weitere Information raus finden, indem ich verschiedene Datenbanken abfrage (z.B. das Geschlecht des Wortes, die Wortart, Synonymen des Wortes).
PyPy: Was genau kann ich damit machen?
- jens
- Python-Forum Veteran
- Beiträge: 8502
- Registriert: Dienstag 10. August 2004, 09:40
- Wohnort: duisburg
- Kontaktdaten:
Also momentan hab ich die Daten in relativ großen Text-Dateien auf meiner Festplatte. In was für einem Format ich die Daten dann weiterverarbeiten soll, weiß ich noch nicht genau. 'ne "richtige" SQL-Datenbank brauche ich allerdings nicht, denke ich. Vielleicht lass ich die Daten im Text-Format und benutz' etwas wie xapian¹. Das muss ich dann testen (Hat jemand Erfahrung mit sowas?).jens hat geschrieben:Hierbei wird IMHO nicht das zerlegen des Textes oder das speichern der Meta Informationen der Flaschenhals sein. Sondern die Abfrage anderer Datenbanken nach den Informationen. Möchtest du dabei externe Datenbanken im Web nutzten?
¹ http://xapian.org/