Hi,
ich stehe nun vor folgendem problem ich habe tags in derform von
<td class="ClassA"> Text <a href="..."> Zusatz </a></td>
wie kriege ich denn nur "Text Zusatz" raus.
Es würde funktionieren mit a = tree.xpath( //td[@class="ClassA"]/text())
was "Text" auswirft
+
b = tree.xpath(//td[@class ...
Die Suche ergab 3 Treffer
- Sonntag 7. Oktober 2012, 20:17
- Forum: Allgemeine Fragen
- Thema: HTMLparser nächstes Tag finden
- Antworten: 6
- Zugriffe: 811
- Dienstag 2. Oktober 2012, 13:46
- Forum: Allgemeine Fragen
- Thema: HTMLparser nächstes Tag finden
- Antworten: 6
- Zugriffe: 811
Re: HTMLparser nächstes Tag finden
Hallo,
vielen dank für die anregungen. Habe sowas schon vermutet.
Ich werde es mal mit lxml versuchen.
Der Test ode an im Schnelltest nicht funktioniert aber ich werde mich mal in lxml einlesen und gucken ob ich es zustande bekommen. Ansonsten melde ich mich bestimmt nochmal.
Gruß
EDIT: hab ...
vielen dank für die anregungen. Habe sowas schon vermutet.
Ich werde es mal mit lxml versuchen.
Der Test ode an im Schnelltest nicht funktioniert aber ich werde mich mal in lxml einlesen und gucken ob ich es zustande bekommen. Ansonsten melde ich mich bestimmt nochmal.
Gruß
EDIT: hab ...
- Montag 1. Oktober 2012, 21:39
- Forum: Allgemeine Fragen
- Thema: HTMLparser nächstes Tag finden
- Antworten: 6
- Zugriffe: 811
HTMLparser nächstes Tag finden
Hallo,
ich bin recht unerfahren in python und Programmieren allgemein. Für kleinere Scripts reicht es jedoch noch.
Nun stehe ich vor der Aufgabe HTML mittles html.parser zu parsen (Python 3).
Ich schaffe es Text „Text1“ zu Filter bei Tags in der Form von:
<td class="Class1"> Text1 </td>
Indem ...
ich bin recht unerfahren in python und Programmieren allgemein. Für kleinere Scripts reicht es jedoch noch.
Nun stehe ich vor der Aufgabe HTML mittles html.parser zu parsen (Python 3).
Ich schaffe es Text „Text1“ zu Filter bei Tags in der Form von:
<td class="Class1"> Text1 </td>
Indem ...
