Webscraping: <p> ohne id oder class

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
seemarc
User
Beiträge: 10
Registriert: Donnerstag 26. Dezember 2019, 18:52

Guten Morgen,
ich möchte ein <p>-Element auf einer Website parsen, jedoch hat dieses weder eine 'class' noch eine 'id' und ist nicht das einzigste <p>-Element. Aufbau der Website:

Code: Alles auswählen

(...)
<div class="card">
<p class="date">
<p class="costumer">
<p><i><a >(Inhalt)</a></i></p>
<p>Text</p> <!--- Das <p>-Element das ich brauche ---!>
<p>(Inhalt)</p>
<p>(Inhalt)</p>
<div>(Inhalt)</div>
</div>
(...)
Gibt es eine Möglichkeit bspw. das 4. <p>-Element auszulesen? Oder hat wer eine andere Idee wie in an das <p> Element komme.

LG
seemarc
Benutzeravatar
__blackjack__
User
Beiträge: 14051
Registriert: Samstag 2. Juni 2018, 10:21
Wohnort: 127.0.0.1
Kontaktdaten:

@seemarc: Man könnte tatsächlich das 4. <p> innerhalb von dem <div> ansprechen oder das <p> mit der "customer"-Klasse und dann zwei Geschwisterknoten weitergehen.
“Vir, intelligence has nothing to do with politics!” — Londo Mollari
seemarc
User
Beiträge: 10
Registriert: Donnerstag 26. Dezember 2019, 18:52

@___blackjack___: Das müsste ja dann mit "link.next_sibling.next_sibling" funktionieren.
Antworten