Seite 1 von 1

Webseite in Phyton anfragen und Inhalt auslesen

Verfasst: Mittwoch 30. Dezember 2020, 22:30
von Rotmilan
Hallo zusammen,

ich bin gerade neu angemeldet und beschäftige mich nach seeehr langer Programmierpause seit kurzem mit Python. Ich benutze PyCharm auf Linux.
Im Moment gehe ich der Frage nach, ob es wohl möglich ist, anfragen an Webseiten zu senden und das Ergebnis in Python weiter zu verarbeiten.
Da ich leider nur sehr rudimentäre Kenntnisse vom Webseitenprogrammieren habe, tue ich mich mit speziellen Inhalten schwer.

Über

response = requests.get(internetadresse)
print('webseite angefragt:', internetadresse)
print (response.content) #oder auch: print (response.text)


funktioniert das Auslesen ja erst mal sehr flott.

Problematisch wird es dann bei Inhalten, die nicht im Seitenquelltext (HTML) übertragen werden, sondern andere (hier kenne ich mich rein gar nicht aus) Funktionen oder Skripte nutzen. Ich habe hier mal versucht an deepl.com einen Text zu übergeben. Was nicht sonderlich schwer ist, weil dieser ja in der URL einfach angehängt wird.
Mit der "Element untersuchen" Funktion von Firefox wollte ich dann sehen, wo ich evtl. den Text des Antwortbereiches finde. Leider ist der eben nicht im HTML-Text enthalten.

Wie gesagt, ich vermute ein Skript - die Frage ist eben, wie ich an den Übersetzten Text heran komme...

Schöne Grüße,
ich freue mich auf eure Vorschläge

Re: Webseite in Phyton anfragen und Inhalt auslesen

Verfasst: Mittwoch 30. Dezember 2020, 23:23
von __blackjack__
@Rotmilan: DeepL hat eine kostenpflichtige API. Die mögen das eher nicht, dass man die Webseite automatisiert benutzt.

Re: Webseite in Phyton anfragen und Inhalt auslesen

Verfasst: Mittwoch 30. Dezember 2020, 23:25
von nezzcarth
Ja, die Übersetzung wird, wie du schon meintest, zur Laufzeit per JavaScript dynamisch nachgeladen. An sich gibt es zwar schon Methoden, mit denen man auch in solchen Fällen (oft) ans Ziel kommen kann (z. B. mit Selenium). Im konkreten Fall würde ich aber davon absehen, denn genau das, was du vorhast, bietet deepL in Form einer API als kostenpflichtigen Dienst an (https://www.deepl.com/de/docs-api/). Daher ist davon auszugehen, dass dein Ansatz nicht erwünscht ist und rechtlich befindet man sich da auch eher auf etwas wackligem Terrain.

EDIT: __blackjack__ war schneller :)

Re: Webseite in Phyton anfragen und Inhalt auslesen

Verfasst: Freitag 1. Januar 2021, 21:54
von Rotmilan
Vielen Dank für euere Antworten, natürlich will ich da keine illegalen Sachen programmieren. Allerdings ist das Projekt rein privat.

In der Tat hatte ich mir mehr zu Übungszwecken ein Projekt ausgedacht um Python erstmals in einer Anwendung zu testen. Da ich letztens immer mal wieder kurze englische Texte aus PDF-Dateien in deepl übersetzt hatte, bei denen aber viele unsinnige Zeilenumbrüche enthalten waren (was natürlich die Übersetzung stört), hatte ich mir jetzt ein Programm geschrieben welches die Zeilenumbrüche entfernt. Da kam mir die Idee, den Text dann auch gleich zum übersetzen zu schicken.
Aber es scheint wirklich so zu sein, dass über diese API auch Privatanwender angesprochen werden sollen - bzw. zumindest Einzelanwender. Das würde sich für mich aber in keinster weise lohnen...
Ich hatte jetzt noch keien Zeit mich tiefer in deren Geschäftsbedingungen einzuarbeiten, lohnt sich aber für mich auch nicht..

In sofern dann mal vielen Dank für den Hinweis + LG