Die Suche ergab 10 Treffer
- Montag 27. April 2020, 13:30
- Forum: Allgemeine Fragen
- Thema: Text vom Web in text.txt mit Tokenization
- Antworten: 4
- Zugriffe: 808
Re: Text vom Web in text.txt mit Tokenization
Interessant, dein Code funktioniert. Ich wollte eigentlich den Text auf jedes einzelne Wort runter brechen. Zum Beispiel : { Ball; Geruest; Wiese}. Etwa in die Richtung. Deine Schleife funktioniert auch Prima, nur wüsste ich nicht ganz, wie ich die umschreiben sollte damit es auf einzelne Wörter ...
- Montag 27. April 2020, 00:57
- Forum: Allgemeine Fragen
- Thema: Text vom Web in text.txt mit Tokenization
- Antworten: 4
- Zugriffe: 808
Re: Text vom Web in text.txt mit Tokenization
Okay, hmm verstehe. Ich weiß nicht, wie ich die ganze Liste in die Datei bekomme und dann noch Tokenisiert. Ich bin halt wirklich ein blutiger Anfänger.
Danke dir, aber könntest du vielleicht mir einen Tipp geben, wie ich das Tokenisieren eines Textes aus dem Web in eine .txt Datei bekomme? Falls du ...
Danke dir, aber könntest du vielleicht mir einen Tipp geben, wie ich das Tokenisieren eines Textes aus dem Web in eine .txt Datei bekomme? Falls du ...
- Sonntag 26. April 2020, 22:57
- Forum: Allgemeine Fragen
- Thema: Text vom Web in text.txt mit Tokenization
- Antworten: 4
- Zugriffe: 808
Text vom Web in text.txt mit Tokenization
Ich möchte, wie im Betreff schon geschrieben, einen Text vom Web nehmen und den in eine .txt Datei bekommen + Tokenization. Ich habe schon einen Ansatz dafür, der auch zum Teil funktioniert.
from bs4 import BeautifulSoup
import requests
import spacy
dlf_artikel = 'https://www.deutschlandfunk.de ...
from bs4 import BeautifulSoup
import requests
import spacy
dlf_artikel = 'https://www.deutschlandfunk.de ...
- Sonntag 26. April 2020, 21:51
- Forum: Allgemeine Fragen
- Thema: Fehler beim auslesen eines file.txt
- Antworten: 4
- Zugriffe: 819
Re: Fehler beim auslesen eines file.txt
Ich glaube, ich weiß wo der Fehler liegt. Gut das jemand mich darauf hingewiesen hat.Sirius3 hat geschrieben: Sonntag 26. April 2020, 21:36 Ein japanisches Codec ist etwas exotisch. Woher kommt das?
- Sonntag 26. April 2020, 21:04
- Forum: Allgemeine Fragen
- Thema: Fehler beim auslesen eines file.txt
- Antworten: 4
- Zugriffe: 819
Re: Fehler beim auslesen eines file.txt
Benutzte diesen Code für das auslesen
f = open("file.txt", "r")
lines = f.readlines()
f = open("file.txt", "r")
lines = f.readlines()
- Sonntag 26. April 2020, 20:49
- Forum: Allgemeine Fragen
- Thema: Fehler beim auslesen eines file.txt
- Antworten: 4
- Zugriffe: 819
Fehler beim auslesen eines file.txt
Ich bekomme beim print befehl oder auch auslesen eine file.txt. Datei diesen Fehler UnicodeDecodeError: 'cp932' codec can't decode byte 0x93 in position 2962: illegal multibyte sequence
Hab etwas recherchiert, aber hab es irgendwie nicht ganz verstanden. Bin noch sehr neu in Python. Habe auch ...
Hab etwas recherchiert, aber hab es irgendwie nicht ganz verstanden. Bin noch sehr neu in Python. Habe auch ...
- Sonntag 5. April 2020, 11:40
- Forum: Allgemeine Fragen
- Thema: Website filtern
- Antworten: 9
- Zugriffe: 962
Re: Website filtern
Was hast Du denn versucht? Code zeigen. `range` ist falsch, weil Du doch schon eine Liste hast und direkt über dessen Elemente iterieren kannst.
So hab es geschafft mit
for liste in liste:
print (liste.get_text())
Der Code war nur Syntax halber. Aber das ist nun egal. Ich danke dir ...
- Sonntag 5. April 2020, 11:28
- Forum: Allgemeine Fragen
- Thema: Website filtern
- Antworten: 9
- Zugriffe: 962
Re: Website filtern
Das, was Du brauchst, ist eine for-Schleife.
Danke für den Tipp. Habe mich etwas rumprobiert, aber es klappt nicht ganz. Ich habe for x in range(...) print (x) als Basis genutzt, falls das überhaupt die richtige basis dafür ist. Es funktioniert nur zum teil mit einer Ausgabe wieder. Könntest du ...
- Sonntag 5. April 2020, 10:51
- Forum: Allgemeine Fragen
- Thema: Website filtern
- Antworten: 9
- Zugriffe: 962
Re: Website filtern
Danke euch ! Hat mir geholfen.
Habe aber den Code jetzt komplett anders geschrieben, aber konnte es hier nicht mehr posten, weil der Beitrag noch nicht freigeschalten war.
import requests
from bs4 import BeautifulSoup
seite = requests.get('https://daserste.ndr.de/annewill/archiv/Unsere-Gaeste ...
Habe aber den Code jetzt komplett anders geschrieben, aber konnte es hier nicht mehr posten, weil der Beitrag noch nicht freigeschalten war.
import requests
from bs4 import BeautifulSoup
seite = requests.get('https://daserste.ndr.de/annewill/archiv/Unsere-Gaeste ...
- Samstag 4. April 2020, 23:42
- Forum: Allgemeine Fragen
- Thema: Website filtern
- Antworten: 9
- Zugriffe: 962
Website filtern
Hallo erstmal,
ich bin relativ neu in Python.
Meine Aufgabe bestand darin, dass ich die Anne Wills Talkshow Website nach den Gästen filter.
ich habe einen Code erstellt, der eigentlich auch einwandfrei funktioniert. Ich habe die Gäste Liste nun als Ergebnis bekommen, aber mit teilen des html codes ...
ich bin relativ neu in Python.
Meine Aufgabe bestand darin, dass ich die Anne Wills Talkshow Website nach den Gästen filter.
ich habe einen Code erstellt, der eigentlich auch einwandfrei funktioniert. Ich habe die Gäste Liste nun als Ergebnis bekommen, aber mit teilen des html codes ...