die datei ist recht umfangreich sowie mehrzeilig( teilweise mit vielen \t & \n drin)
100% korrekt ist das html leider auch nicht, stellenweise sehr viel java script drin.
auf den aufbau, syntax usw. habe ich leider keinen einfluss.
ich werd mal beautiful soup antesten thx ^^
Die Suche ergab 2 Treffer
- Freitag 17. November 2006, 16:37
- Forum: Netzwerkprogrammierung
- Thema: HTMLParser.HTMLParseError
- Antworten: 2
- Zugriffe: 806
- Freitag 17. November 2006, 15:57
- Forum: Netzwerkprogrammierung
- Thema: HTMLParser.HTMLParseError
- Antworten: 2
- Zugriffe: 806
HTMLParser.HTMLParseError
hiho,
ich versuche mittels HTMLParser eine Datei zu parsen. bei einfachen Test Werten ala
testData = '<html><body><table>'+\
'<td class="bla">test</td>'+\
'<td class="ausgabe" valign="center" width="159">test2</td>'+\
'</table></body></html>'
kein problem. Versuche ich jetzt allerdings ...
ich versuche mittels HTMLParser eine Datei zu parsen. bei einfachen Test Werten ala
testData = '<html><body><table>'+\
'<td class="bla">test</td>'+\
'<td class="ausgabe" valign="center" width="159">test2</td>'+\
'</table></body></html>'
kein problem. Versuche ich jetzt allerdings ...
