Die Suche ergab 7 Treffer
- Freitag 27. Mai 2022, 19:20
- Forum: Allgemeine Fragen
- Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
- Antworten: 10
- Zugriffe: 684
Re: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Hallo Blackjack, vielen Dank für Deine Hinweise! Ein Freund hat mich unterstützt und nun habe ich einen Code, der macht, was er soll (mit zwei ergänzten Fehlerroutinen). Die Kommentare hat mein Freund für mich so hinterlegt, dass ich den Code als Anfänger auch verstehen kann. Hier das fertige Progra...
- Montag 23. Mai 2022, 09:10
- Forum: Allgemeine Fragen
- Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
- Antworten: 10
- Zugriffe: 684
Re: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Hallo zusammen, vielen Dank für Eure Hinweise. Ich habe nun einen funktionierenden Code (siehe unten). An einer Stelle habe ich aber noch ein Problem: for i, link in enumerate( soup.find_all("a", href=lambda url: url.endswith(".pdf")), 1 ): print("Downloading file: ", i...
- Freitag 20. Mai 2022, 16:15
- Forum: Allgemeine Fragen
- Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
- Antworten: 10
- Zugriffe: 684
Re: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Hallo sarrow, ich hatte schon einiges probiert, komme aber nun nicht mehr weiter (Anfänger). Funktioniert hat z.B. import requests import re from bs4 import BeautifulSoup url="https://trauer.mittelhessen.de/traueranzeigen-suche/zeitraum-01-05-2022-bis-03-05-2022/seite-1" page = requests.ge...
- Freitag 20. Mai 2022, 15:07
- Forum: Allgemeine Fragen
- Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
- Antworten: 10
- Zugriffe: 684
Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Hallo, wie kann ich alle Hyperlinks extrahieren, die "title="" >Anzeigen (*)" enthalten. Ergebnis soll sein: '"https://trauer.mittelhessen.de/traueranzeige/eleonore-hain/anzeigen"' "https://trauer.mittelhessen.de/traueranzeige/juergen-schaefer-1957/anzeigen" <...
- Sonntag 15. Mai 2022, 19:47
- Forum: Allgemeine Fragen
- Thema: PDF-Dateien auf Unterwebsite downloaden
- Antworten: 4
- Zugriffe: 545
Re: PDF-Dateien auf Unterwebsite downloaden
Hallo blackjack,
vielen Dank für Deine Hinweise und den überarbeiteten Code! Ich werde mich wohl doch noch intensiver mit Python und BeautifulSoup beschäftigen müssen.
vielen Dank für Deine Hinweise und den überarbeiteten Code! Ich werde mich wohl doch noch intensiver mit Python und BeautifulSoup beschäftigen müssen.
- Samstag 7. Mai 2022, 15:51
- Forum: Allgemeine Fragen
- Thema: PDF-Dateien auf Unterwebsite downloaden
- Antworten: 4
- Zugriffe: 545
Re: PDF-Dateien auf Unterwebsite downloaden
Hallo Sirius3, vielen Dank für Deine Nachfrage. Hier der Code bzw. die Teile, die noch fehlen: 1. Öffne Seite https://trauer.mittelhessen.de/traueranzeigen-suche/zeitraum-01-01-2010-bis-31-12-2020/seite-1 2. Gehe auf die Links, die im Titel den Text "Anzeigen" enthalten und öffne die ents...
- Sonntag 1. Mai 2022, 16:36
- Forum: Allgemeine Fragen
- Thema: PDF-Dateien auf Unterwebsite downloaden
- Antworten: 4
- Zugriffe: 545
PDF-Dateien auf Unterwebsite downloaden
Hallo, ich benötige als absoluter Neuanfänger Unterstützung der der Umsetzung eines Projektes mit BeautifulSoup. Ich schaffe es, mit BeautifulSoup alle PDFs einer Seite herunterzuladen, aber wenn sich die PDFs auf Unterseiten befinden, komme ich nicht weiter. Hier die Aufgabe: Die Hauptseite ist htt...