Als Tabellenkalkulation missbrauchtes Worddokument zu CSV
Verfasst: Donnerstag 5. Februar 2009, 21:53
Ich habe hier ein Worddokument, das als Excelersatz missbraucht wurde. In dem Dokument stehen reihenweise Datensätze der folgenden Form (Tabs werden zur Formatierung genutzt. Für Spalte 1 stehen die Werte zum Beispiel nach einem Tab - bei entsprechender Formatierung in Word stehen die Werte dann auch schön untereinander):
Ich möchte diese Datei nun in eine CSV-Datei überführen. Also konvertiere ich die .doc-Datei per Hand zu einer Textdatei, lese sie zeilenweise ein und trenne dann anhand der Tabs. Gleichzeitig baue ich ein Wörterbuch mit den Spaltennamen als Schlüsseln um dort die Werte einzutragen und schlussendlich wird das ganze als CSV-Datei geschrieben (der Teil fehlt noch - ist mit dem csv-Modul nach flinkem Überfliegen aber wohl nicht das Problem -, genauso wie ich mich bisher nicht um Encodings geschert habe).
Ich habe dazu auch eine selbst gebastelte Lösung, die zumindest mit dem obigen Beispiel funktioniert. Meine Frage ist eigentlich nur, ob da nicht jemand einen eleganteren Ansatz hat?
Code: Alles auswählen
Report
Column 1: Wert_Anfang Report1, Column1 Column 2: Wert_Anfang Report 1 Column 2
R1C1: Zeile 2 R1C2: Zeile2-Ende
R1C1: Zeile 3-Ende
Column 3: mit Zusatznamen: Wert_Anfang R1C3
R1C3: Zeile 2
R1C3: Zeile 3
R1C3: Zeile 4-Ende
Report
Column 1: Wert_Anfang Report2, Column1 Column 2: Wert_Anfang Report 2 Column 2
R2C1: Zeile 2-Ende R2C2: Zeile 2
R2C2: Zeile 3-Ende
Column 3: mit Zusatznamen: Wert_Anfang R2C3
R2C3: Zeile 2-Ende
Ich habe dazu auch eine selbst gebastelte Lösung, die zumindest mit dem obigen Beispiel funktioniert. Meine Frage ist eigentlich nur, ob da nicht jemand einen eleganteren Ansatz hat?