seit 2 Monaten programmiere ich in Python und habe mir ein kleines Programm geschrieben, das von einer Seite der Uni den Stundenplan als html-Seite mit mechanize herunterlädt und dann in eine iCalendar-Datei schreibt.
Ein Beispiel für eine HTML-Datei sieht so aus: http://paste.pocoo.org/show/82872/
Momentan lese ich das ganze sehr umständlich zeilenweise aus, suche nach dem String
Code: Alles auswählen
<td nowrap="nowrap">
Aus dem Code für einen einzelnen Termin muss ich jeweils die Zeilen 3, 4, 8, 9, 12 und 14 (enthält nur ab und zu Text) auslesen und gruppiert an eine Funktion übergeben, die daraus den iCalendar konformen Termin erstellt:
Code: Alles auswählen
<tr>
<td nowrap="nowrap">
Mo, 14.04.2008
<p>08:00 - 10:00</p>
</td>
<td>
7M0608 - Einführung ins Praktikum der Physik für Mediziner II
<p>Gruppe: A</p>
</td>
<td>
Hörsaal LMU-Audimax<br />Hauptgebäude der LMU<br />Geschwister-Scholl-Platz 1<br />80539 München</td>
<td>
</td>
</tr>
<tr>