HTMLparser nächstes Tag finden
Verfasst: Montag 1. Oktober 2012, 21:39
Hallo,
ich bin recht unerfahren in python und Programmieren allgemein. Für kleinere Scripts reicht es jedoch noch.
Nun stehe ich vor der Aufgabe HTML mittles html.parser zu parsen (Python 3).
Ich schaffe es Text „Text1“ zu Filter bei Tags in der Form von:
<td class="Class1"> Text1 </td>
Indem ich Tags <td> mit class “Class1” filtere und mittels
def handle_data(self, data):
print(data)
rausschreibe
Nun kommt es vor das in der HTML außerdem Sachen in der Form von:
<td class="ClassB”> Some Text</td>
<td class="ClassB”> Some Text1</td>
<td class="ClassB”> Some Text2</td>
.
.
</tr>
<tr class="new"><td class="ClassA">Text A</td>
<td class="ClassB”> Text Eins A</td>
</tr>
</tr>
<tr class="new"><td class="ClassA">Text A</td>
<td class="ClassB”> Text Eins B</td>
</tr>
Nun kann ich das Script davor nicht nutzen das ClassB öfter vorkommt ich jedoch nur den Text brauche (Text Eins) wenn „Text A“ in dem Feld davor steht.
Wäre es möglich class „new“ zu filtern und sich dann zwei Tags runter zu hangeln?
Habe da leider nichts gefunden
Gruß und Danke
Error1
ich bin recht unerfahren in python und Programmieren allgemein. Für kleinere Scripts reicht es jedoch noch.
Nun stehe ich vor der Aufgabe HTML mittles html.parser zu parsen (Python 3).
Ich schaffe es Text „Text1“ zu Filter bei Tags in der Form von:
<td class="Class1"> Text1 </td>
Indem ich Tags <td> mit class “Class1” filtere und mittels
def handle_data(self, data):
print(data)
rausschreibe
Nun kommt es vor das in der HTML außerdem Sachen in der Form von:
<td class="ClassB”> Some Text</td>
<td class="ClassB”> Some Text1</td>
<td class="ClassB”> Some Text2</td>
.
.
</tr>
<tr class="new"><td class="ClassA">Text A</td>
<td class="ClassB”> Text Eins A</td>
</tr>
</tr>
<tr class="new"><td class="ClassA">Text A</td>
<td class="ClassB”> Text Eins B</td>
</tr>
Nun kann ich das Script davor nicht nutzen das ClassB öfter vorkommt ich jedoch nur den Text brauche (Text Eins) wenn „Text A“ in dem Feld davor steht.
Wäre es möglich class „new“ zu filtern und sich dann zwei Tags runter zu hangeln?
Habe da leider nichts gefunden
Gruß und Danke
Error1