Die Suche ergab 7 Treffer

von biofunc
Freitag 27. Mai 2022, 19:20
Forum: Allgemeine Fragen
Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Antworten: 10
Zugriffe: 684

Re: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren

Hallo Blackjack, vielen Dank für Deine Hinweise! Ein Freund hat mich unterstützt und nun habe ich einen Code, der macht, was er soll (mit zwei ergänzten Fehlerroutinen). Die Kommentare hat mein Freund für mich so hinterlegt, dass ich den Code als Anfänger auch verstehen kann. Hier das fertige Progra...
von biofunc
Montag 23. Mai 2022, 09:10
Forum: Allgemeine Fragen
Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Antworten: 10
Zugriffe: 684

Re: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren

Hallo zusammen, vielen Dank für Eure Hinweise. Ich habe nun einen funktionierenden Code (siehe unten). An einer Stelle habe ich aber noch ein Problem: for i, link in enumerate( soup.find_all("a", href=lambda url: url.endswith(".pdf")), 1 ): print("Downloading file: ", i...
von biofunc
Freitag 20. Mai 2022, 16:15
Forum: Allgemeine Fragen
Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Antworten: 10
Zugriffe: 684

Re: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren

Hallo sarrow, ich hatte schon einiges probiert, komme aber nun nicht mehr weiter (Anfänger). Funktioniert hat z.B. import requests import re from bs4 import BeautifulSoup url="https://trauer.mittelhessen.de/traueranzeigen-suche/zeitraum-01-05-2022-bis-03-05-2022/seite-1" page = requests.ge...
von biofunc
Freitag 20. Mai 2022, 15:07
Forum: Allgemeine Fragen
Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Antworten: 10
Zugriffe: 684

Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren

Hallo, wie kann ich alle Hyperlinks extrahieren, die "title="" >Anzeigen (*)" enthalten. Ergebnis soll sein: '"https://trauer.mittelhessen.de/traueranzeige/eleonore-hain/anzeigen"' "https://trauer.mittelhessen.de/traueranzeige/juergen-schaefer-1957/anzeigen" <...
von biofunc
Sonntag 15. Mai 2022, 19:47
Forum: Allgemeine Fragen
Thema: PDF-Dateien auf Unterwebsite downloaden
Antworten: 4
Zugriffe: 545

Re: PDF-Dateien auf Unterwebsite downloaden

Hallo blackjack,

vielen Dank für Deine Hinweise und den überarbeiteten Code! Ich werde mich wohl doch noch intensiver mit Python und BeautifulSoup beschäftigen müssen.
von biofunc
Samstag 7. Mai 2022, 15:51
Forum: Allgemeine Fragen
Thema: PDF-Dateien auf Unterwebsite downloaden
Antworten: 4
Zugriffe: 545

Re: PDF-Dateien auf Unterwebsite downloaden

Hallo Sirius3, vielen Dank für Deine Nachfrage. Hier der Code bzw. die Teile, die noch fehlen: 1. Öffne Seite https://trauer.mittelhessen.de/traueranzeigen-suche/zeitraum-01-01-2010-bis-31-12-2020/seite-1 2. Gehe auf die Links, die im Titel den Text "Anzeigen" enthalten und öffne die ents...
von biofunc
Sonntag 1. Mai 2022, 16:36
Forum: Allgemeine Fragen
Thema: PDF-Dateien auf Unterwebsite downloaden
Antworten: 4
Zugriffe: 545

PDF-Dateien auf Unterwebsite downloaden

Hallo, ich benötige als absoluter Neuanfänger Unterstützung der der Umsetzung eines Projektes mit BeautifulSoup. Ich schaffe es, mit BeautifulSoup alle PDFs einer Seite herunterzuladen, aber wenn sich die PDFs auf Unterseiten befinden, komme ich nicht weiter. Hier die Aufgabe: Die Hauptseite ist htt...