Seite 1 von 1

Download von Dateien auf einer Website

Verfasst: Mittwoch 26. Februar 2020, 00:18
von Noname13
Guten Abend zusammen

Ich möchte mich ein bisschen mit programmieren beschäftigen sofern es die Zeit zulässt. Ich habe auf Humble Bundle (www.humblebundle.com) einige ebooks. Deswegen habe ich mir gedacht als übung für einen ersten Einstieg könnte ich ein Programm mit folgenden Funktionen machen:
  • Einloggen auf der Website
  • Navigieren zu den Downloads
  • Durchsuchen nach allen Ebooks
  • Download der Ebooks in den vorhandenen Formaten
  • Bennenen der Dateien
  • Erstellen einer Ordnerstruktur und ablage in dieser
Ich habe ein bisschen im Internet gseucht zu verschiedenen Themen. Als erstes habe ich mich mit dem Einloggen beschäftigt. Auf der Website gibt es eine Zwei-Faktor-Authentisierung. Ich habe mir verschiedene Möglichkeiten angeschaut. Mit Selenium könnte ich eventuell das Problem lösen aber dabei stosse ich dann auf das Problem eines Captchas dass ich (logischerweise) nicht umgehen kann. Ausserdem habe ich ein paar REST befehle gefunden (https://www.schiff.io/projects/humble-bundle-api) aber von diesen verstehe ich noch nicht wirklich wie sie funktionieren. Villeicht kann ich hier ja auch eine semiautomatische Lösung probieren. Da ich hier gerade nicht weiterkomme habe ich mich vorerst mit einem der anderen Probleme beschäftigt, und zwar mit dem download. Auch hier könnte ich eventuell selenium benutzten aber nach meiner recherche bin ich auf wget gestossen. Aber hier habe ich dass Problem dass ich nicht weiss wie ich an eine url für den download komme.

Weiter bin ich erst mal nicht gekommen weil ich die anderen Dinge ohne eine Lösung dieser zwei Probleme nicht richtig ausprobieren kann.
Was ich jetzt brauchen könnte wären alternative Ideen zum lösen des Problems, Schlagworte/Fachbegriffe die zu einer Lösung führen können, damit ich recherchieren kann und allgemeine Tipps.

Vielen Dank und schönen Abend
Noname

Re: Download von Dateien auf einer Website

Verfasst: Mittwoch 26. Februar 2020, 11:42
von __deets__
Statt externen Tools wie Selenium/Browsern und wget schau dir mal requests an. Und zum verarbeiten der Seiten BeatifulSoup. Das gesamte Thema nennt sich "web scraping", und da solltest du was finden. Wie genau man nun die Beschraenkungen von humble bundle umgehen kann, kann ich dir allerdings nicht sagen.

Verfasst: Mittwoch 26. Februar 2020, 22:36
von Noname13
Vielen Dank. Ich werde mich da ein bischen einlesen und rumprobieren. Dass hat mir bereits viel geholfen.