Text Datei nach Key Word filtern und auslesen

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Depator/42
User
Beiträge: 5
Registriert: Mittwoch 1. Dezember 2021, 20:29

Hallo,

ich komme gerade leider nicht weiter.
Ich versuche in einer etwas längeren Textdatei, nach von mir gesetzten Keywords, den restlichen Satz ausgeben zu lassen.

Heißt ich setzte als Keyword Beispielsweise das Wort *lesen*. --> Dann möchte ich das mir Python jeden Satz aus meiner Textdatei ausgibt welcher dieses Wort beinhaltet.
In der Ausgabe dann--> .... lesen .... . ....lesen.... . usw.

Kann mir bitte einer sagen wie ich das Programm zu schreiben habe um das Ziel zu erfüllen?
Vielen Dank schonmal :)
Benutzeravatar
__blackjack__
User
Beiträge: 13100
Registriert: Samstag 2. Juni 2018, 10:21
Wohnort: 127.0.0.1
Kontaktdaten:

@Depator/42: Problem in kleinere Teilprobleme aufteilen und die dann lösen und zu einer Gesamtlösung zusammensetzen. Schritt 1 wäre wohl aus einer Textdatei eine Folge von Sätzen zu machen. Dann kannst Du dort die herausfiltern die das oder die Schlüsselworte enthält.
„All religions are the same: religion is basically guilt, with different holidays.” — Cathy Ladman
Depator/42
User
Beiträge: 5
Registriert: Mittwoch 1. Dezember 2021, 20:29

Danke für deine Nachricht.
Wie würde dann der Code aussehen?
Lg
Benutzeravatar
__blackjack__
User
Beiträge: 13100
Registriert: Samstag 2. Juni 2018, 10:21
Wohnort: 127.0.0.1
Kontaktdaten:

@Depator/42: So das er funktioniert. 😉

Welches konkrete Problem hast Du denn? Ein Python-Grundlagentutorial gibt es beispielsweise in der Python-Dokumentation.
„All religions are the same: religion is basically guilt, with different holidays.” — Cathy Ladman
Depator/42
User
Beiträge: 5
Registriert: Mittwoch 1. Dezember 2021, 20:29

Python Grundlagen Kenntnisse habe ich.
Mein Problem ist:
Das ich aus einem Text (10.000+ Wörter) die Sätze rausfiltern möchte die ein Keyword beinhalten.
(Dieses Key Word würde ich im Code festlegen)

Ist das auf Python möglich?

Danke für deine Zeit!
Sirius3
User
Beiträge: 17746
Registriert: Sonntag 21. Oktober 2012, 17:20

Jetzt wiederholst Du Dich. Und die Antwort bleibt die selbe, die Dir __blackjack__ schon gegeben hat: als erstes den Text in Sätze aufspalten, die Sätze in Wörter und dann suchen, ob ein Wort dem Keyword entspricht. Was hast Du in dieser Richtung schon versucht und wo kommst Du konkret nicht weiter. Zeige Deinen Code, den Input, und was daran nicht funktioniert.
Depator/42
User
Beiträge: 5
Registriert: Mittwoch 1. Dezember 2021, 20:29

Hi Sirius,
Danke für deine Antwort.

Ich weiß eben nicht wie man den Text in Sätze und die Sätze in Wörter aufspaltet.
Ich weiß wie man aus einem Zeilen ausgeben kann oder einzelne Wörter aber nicht bestimmte Sätze.

Kannst du mir vielleicht einen potentiellen Code dafür schicken?
Das würde mir sehr weiterhelfen.

Sorry ich hab mit programmieren und Informatik leider nicht viel am Hut, muss aber wissen wie ich fas hinkriege.

Lg
rogerb
User
Beiträge: 878
Registriert: Dienstag 26. November 2019, 23:24

Depator/42 hat geschrieben: Donnerstag 2. Dezember 2021, 20:17 Ich weiß eben nicht wie man den Text in Sätze und die Sätze in Wörter aufspaltet.
Dazu must du dir eine Definition überlegen, was ein Satz ist und die dann im Programm umsetzen.
Ist ein Satz der Text zwischen zwei Punkten? Wohl kaum, denn der Punkt wird in der Schriftsprache für alles mögliche verwendet.

Zum Glück haben sich andere auch schon dieser Frage gestellt. Ich denke das NLTK Paket hat so etwas eingebaut:
https://www.nltk.org/index.html

Bzw.:
https://www.nltk.org/api/nltk.tokenize. ... nize.punkt

Ich glaube es gibt für jede Sprache ein Punktuation Package
Depator/42
User
Beiträge: 5
Registriert: Mittwoch 1. Dezember 2021, 20:29

Vielen Dank rogerb!
Antworten