ich möchte eine Website einlesen (1), die dortigen Daten auslesen (2) und in der Konsole (später vielleicht mit GUI) ausgeben (3).
(1) Ist klar.
Ich nutze urllib.request.
(2) Ist mir noch nicht klar.
Würdet ihr html.parser verwenden oder im Dokument mit dem re-Modul suchen. Es läuft darauf hinaus die komplette Seite zu lesen, Sidewars, Footer usw. "auszublenden" und die eigentlichen Daten (Content) weiterzuverwenden. Falls html.parser in Frage kommt, wie mache ich das...
Ich habe mir das angelesen: https://docs.python.org/3.4/library/htm ... l#examples.
Eigentlich will ich aber nicht die komplette Seite lesen, sondern nur bestimmte Abschnitte der Website haben und dann zur weiteren Verarbeitung (denke an split, strip usw.) verarbeiten. Also ich will sagen: Gib mir den Inhalt der Div-Box mit der Klasse "Info" zurück... Ich bin auf html.parser gekommen, weil ich beautiful soup bei mir nicht zum Laufen bekam (Python 3.4).
Zwar kann ich auf der Website lesen:
In der Praxis schießt es bei mir aber wegen Inkompatibilität ab...Beautiful Soup 4 works on both Python 2 (2.6+) and Python 3.
(3) Spontan jemand eine Idee für eine sehr knappe Erklärung Objektorientierte Programmierung in Python? So eine 3 Seiten-Geschichte? Ich habe schon "einige" Ressourcen, aber das ist aktuell sehr viel mehr, als ich wohl zwigend bräuchte. Ich habe mir das vor einem Jahr schon mal intensiv angesehen, müsste es aber ziemlich knapp auffrischen. Wenn nicht, wäre das kein Problem.
Nur am Rande: Bei (2) brauche ich mal eine Einschätzung von jemand anderem, wie er das Problem angehen würde, wahrscheinlich wäre es das dann schon...
