Als Tabellenkalkulation missbrauchtes Worddokument zu CSV

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
pudeldestodes
User
Beiträge: 65
Registriert: Samstag 9. Juni 2007, 23:45

Als Tabellenkalkulation missbrauchtes Worddokument zu CSV

Beitragvon pudeldestodes » Donnerstag 5. Februar 2009, 21:53

Ich habe hier ein Worddokument, das als Excelersatz missbraucht wurde. In dem Dokument stehen reihenweise Datensätze der folgenden Form (Tabs werden zur Formatierung genutzt. Für Spalte 1 stehen die Werte zum Beispiel nach einem Tab - bei entsprechender Formatierung in Word stehen die Werte dann auch schön untereinander):

Code: Alles auswählen

Report

Column 1:   Wert_Anfang Report1, Column1   Column 2:   Wert_Anfang Report 1 Column 2
   R1C1: Zeile 2      R1C2: Zeile2-Ende
   R1C1: Zeile 3-Ende

Column 3:   mit Zusatznamen:   Wert_Anfang R1C3
      R1C3: Zeile 2
      R1C3: Zeile 3
      R1C3: Zeile 4-Ende

Report

Column 1:   Wert_Anfang Report2, Column1   Column 2:   Wert_Anfang Report 2 Column 2
   R2C1: Zeile 2-Ende      R2C2: Zeile 2
         R2C2: Zeile 3-Ende

Column 3:   mit Zusatznamen:   Wert_Anfang R2C3
      R2C3: Zeile 2-Ende


Ich möchte diese Datei nun in eine CSV-Datei überführen. Also konvertiere ich die .doc-Datei per Hand zu einer Textdatei, lese sie zeilenweise ein und trenne dann anhand der Tabs. Gleichzeitig baue ich ein Wörterbuch mit den Spaltennamen als Schlüsseln um dort die Werte einzutragen und schlussendlich wird das ganze als CSV-Datei geschrieben (der Teil fehlt noch - ist mit dem csv-Modul nach flinkem Überfliegen aber wohl nicht das Problem -, genauso wie ich mich bisher nicht um Encodings geschert habe).

Ich habe dazu auch eine selbst gebastelte Lösung, die zumindest mit dem obigen Beispiel funktioniert. Meine Frage ist eigentlich nur, ob da nicht jemand einen eleganteren Ansatz hat?

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder