Die Suche ergab 7 Treffer

von biofunc
Freitag 27. Mai 2022, 19:20
Forum: Allgemeine Fragen
Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Antworten: 10
Zugriffe: 1476

Re: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren

Hallo Blackjack,

vielen Dank für Deine Hinweise! Ein Freund hat mich unterstützt und nun habe ich einen Code, der macht, was er soll (mit zwei ergänzten Fehlerroutinen).
Die Kommentare hat mein Freund für mich so hinterlegt, dass ich den Code als Anfänger auch verstehen kann.
Hier das fertige ...
von biofunc
Montag 23. Mai 2022, 09:10
Forum: Allgemeine Fragen
Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Antworten: 10
Zugriffe: 1476

Re: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren

Hallo zusammen,

vielen Dank für Eure Hinweise. Ich habe nun einen funktionierenden Code (siehe unten).

An einer Stelle habe ich aber noch ein Problem:

for i, link in enumerate(
soup.find_all("a", href=lambda url: url.endswith(".pdf")), 1
):
print("Downloading file: ", i)
response = requests ...
von biofunc
Freitag 20. Mai 2022, 16:15
Forum: Allgemeine Fragen
Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Antworten: 10
Zugriffe: 1476

Re: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren

Hallo sarrow,
ich hatte schon einiges probiert, komme aber nun nicht mehr weiter (Anfänger).

Funktioniert hat z.B.
import requests
import re
from bs4 import BeautifulSoup

url="https://trauer.mittelhessen.de/traueranzeigen-suche/zeitraum-01-05-2022-bis-03-05-2022/seite-1"
page = requests.get(url ...
von biofunc
Freitag 20. Mai 2022, 15:07
Forum: Allgemeine Fragen
Thema: Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren
Antworten: 10
Zugriffe: 1476

Beautifulsoup: Hyperlink mit Titel und Wildcard extrahieren

Hallo,

wie kann ich alle Hyperlinks extrahieren, die "title="" >Anzeigen (*)" enthalten.
Ergebnis soll sein:
'"https://trauer.mittelhessen.de/traueranzeige/eleonore-hain/anzeigen"'
"https://trauer.mittelhessen.de/traueranzeige/juergen-schaefer-1957/anzeigen"


<div class="c-blockitem-footer ...
von biofunc
Sonntag 15. Mai 2022, 19:47
Forum: Allgemeine Fragen
Thema: PDF-Dateien auf Unterwebsite downloaden
Antworten: 4
Zugriffe: 1277

Re: PDF-Dateien auf Unterwebsite downloaden

Hallo blackjack,

vielen Dank für Deine Hinweise und den überarbeiteten Code! Ich werde mich wohl doch noch intensiver mit Python und BeautifulSoup beschäftigen müssen.
von biofunc
Samstag 7. Mai 2022, 15:51
Forum: Allgemeine Fragen
Thema: PDF-Dateien auf Unterwebsite downloaden
Antworten: 4
Zugriffe: 1277

Re: PDF-Dateien auf Unterwebsite downloaden

Hallo Sirius3,
vielen Dank für Deine Nachfrage. Hier der Code bzw. die Teile, die noch fehlen:

1. Öffne Seite https://trauer.mittelhessen.de/traueranzeigen-suche/zeitraum-01-01-2010-bis-31-12-2020/seite-1
2. Gehe auf die Links, die im Titel den Text "Anzeigen" enthalten und öffne die ...
von biofunc
Sonntag 1. Mai 2022, 16:36
Forum: Allgemeine Fragen
Thema: PDF-Dateien auf Unterwebsite downloaden
Antworten: 4
Zugriffe: 1277

PDF-Dateien auf Unterwebsite downloaden

Hallo,
ich benötige als absoluter Neuanfänger Unterstützung der der Umsetzung eines Projektes mit BeautifulSoup.
Ich schaffe es, mit BeautifulSoup alle PDFs einer Seite herunterzuladen, aber wenn sich die PDFs auf Unterseiten befinden, komme ich nicht weiter.

Hier die Aufgabe:

Die Hauptseite ist ...