Die Suche ergab 10 Treffer

von Newbie96
Montag 27. April 2020, 13:30
Forum: Allgemeine Fragen
Thema: Text vom Web in text.txt mit Tokenization
Antworten: 4
Zugriffe: 808

Re: Text vom Web in text.txt mit Tokenization

Interessant, dein Code funktioniert. Ich wollte eigentlich den Text auf jedes einzelne Wort runter brechen. Zum Beispiel : { Ball; Geruest; Wiese}. Etwa in die Richtung. Deine Schleife funktioniert auch Prima, nur wüsste ich nicht ganz, wie ich die umschreiben sollte damit es auf einzelne Wörter ...
von Newbie96
Montag 27. April 2020, 00:57
Forum: Allgemeine Fragen
Thema: Text vom Web in text.txt mit Tokenization
Antworten: 4
Zugriffe: 808

Re: Text vom Web in text.txt mit Tokenization

Okay, hmm verstehe. Ich weiß nicht, wie ich die ganze Liste in die Datei bekomme und dann noch Tokenisiert. Ich bin halt wirklich ein blutiger Anfänger.
Danke dir, aber könntest du vielleicht mir einen Tipp geben, wie ich das Tokenisieren eines Textes aus dem Web in eine .txt Datei bekomme? Falls du ...
von Newbie96
Sonntag 26. April 2020, 22:57
Forum: Allgemeine Fragen
Thema: Text vom Web in text.txt mit Tokenization
Antworten: 4
Zugriffe: 808

Text vom Web in text.txt mit Tokenization

Ich möchte, wie im Betreff schon geschrieben, einen Text vom Web nehmen und den in eine .txt Datei bekommen + Tokenization. Ich habe schon einen Ansatz dafür, der auch zum Teil funktioniert.

from bs4 import BeautifulSoup
import requests
import spacy


dlf_artikel = 'https://www.deutschlandfunk.de ...
von Newbie96
Sonntag 26. April 2020, 21:51
Forum: Allgemeine Fragen
Thema: Fehler beim auslesen eines file.txt
Antworten: 4
Zugriffe: 819

Re: Fehler beim auslesen eines file.txt

Sirius3 hat geschrieben: Sonntag 26. April 2020, 21:36 Ein japanisches Codec ist etwas exotisch. Woher kommt das?
Ich glaube, ich weiß wo der Fehler liegt. Gut das jemand mich darauf hingewiesen hat.
von Newbie96
Sonntag 26. April 2020, 21:04
Forum: Allgemeine Fragen
Thema: Fehler beim auslesen eines file.txt
Antworten: 4
Zugriffe: 819

Re: Fehler beim auslesen eines file.txt

Benutzte diesen Code für das auslesen

f = open("file.txt", "r")

lines = f.readlines()
von Newbie96
Sonntag 26. April 2020, 20:49
Forum: Allgemeine Fragen
Thema: Fehler beim auslesen eines file.txt
Antworten: 4
Zugriffe: 819

Fehler beim auslesen eines file.txt

Ich bekomme beim print befehl oder auch auslesen eine file.txt. Datei diesen Fehler UnicodeDecodeError: 'cp932' codec can't decode byte 0x93 in position 2962: illegal multibyte sequence
Hab etwas recherchiert, aber hab es irgendwie nicht ganz verstanden. Bin noch sehr neu in Python. Habe auch ...
von Newbie96
Sonntag 5. April 2020, 11:40
Forum: Allgemeine Fragen
Thema: Website filtern
Antworten: 9
Zugriffe: 962

Re: Website filtern


Was hast Du denn versucht? Code zeigen. `range` ist falsch, weil Du doch schon eine Liste hast und direkt über dessen Elemente iterieren kannst.


So hab es geschafft mit

for liste in liste:
print (liste.get_text())


Der Code war nur Syntax halber. Aber das ist nun egal. Ich danke dir ...
von Newbie96
Sonntag 5. April 2020, 11:28
Forum: Allgemeine Fragen
Thema: Website filtern
Antworten: 9
Zugriffe: 962

Re: Website filtern


Das, was Du brauchst, ist eine for-Schleife.


Danke für den Tipp. Habe mich etwas rumprobiert, aber es klappt nicht ganz. Ich habe for x in range(...) print (x) als Basis genutzt, falls das überhaupt die richtige basis dafür ist. Es funktioniert nur zum teil mit einer Ausgabe wieder. Könntest du ...
von Newbie96
Sonntag 5. April 2020, 10:51
Forum: Allgemeine Fragen
Thema: Website filtern
Antworten: 9
Zugriffe: 962

Re: Website filtern

Danke euch ! Hat mir geholfen.
Habe aber den Code jetzt komplett anders geschrieben, aber konnte es hier nicht mehr posten, weil der Beitrag noch nicht freigeschalten war.

import requests
from bs4 import BeautifulSoup

seite = requests.get('https://daserste.ndr.de/annewill/archiv/Unsere-Gaeste ...
von Newbie96
Samstag 4. April 2020, 23:42
Forum: Allgemeine Fragen
Thema: Website filtern
Antworten: 9
Zugriffe: 962

Website filtern

Hallo erstmal,
ich bin relativ neu in Python.
Meine Aufgabe bestand darin, dass ich die Anne Wills Talkshow Website nach den Gästen filter.
ich habe einen Code erstellt, der eigentlich auch einwandfrei funktioniert. Ich habe die Gäste Liste nun als Ergebnis bekommen, aber mit teilen des html codes ...