Als Tabellenkalkulation missbrauchtes Worddokument zu CSV

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
pudeldestodes
User
Beiträge: 65
Registriert: Samstag 9. Juni 2007, 23:45

Donnerstag 5. Februar 2009, 21:53

Ich habe hier ein Worddokument, das als Excelersatz missbraucht wurde. In dem Dokument stehen reihenweise Datensätze der folgenden Form (Tabs werden zur Formatierung genutzt. Für Spalte 1 stehen die Werte zum Beispiel nach einem Tab - bei entsprechender Formatierung in Word stehen die Werte dann auch schön untereinander):

Code: Alles auswählen

Report

Column 1:	Wert_Anfang Report1, Column1	Column 2:	Wert_Anfang Report 1 Column 2
	R1C1: Zeile 2		R1C2: Zeile2-Ende
	R1C1: Zeile 3-Ende

Column 3:	mit Zusatznamen:	Wert_Anfang R1C3
		R1C3: Zeile 2
		R1C3: Zeile 3
		R1C3: Zeile 4-Ende

Report

Column 1:	Wert_Anfang Report2, Column1	Column 2:	Wert_Anfang Report 2 Column 2
	R2C1: Zeile 2-Ende		R2C2: Zeile 2
			R2C2: Zeile 3-Ende

Column 3:	mit Zusatznamen:	Wert_Anfang R2C3
		R2C3: Zeile 2-Ende
Ich möchte diese Datei nun in eine CSV-Datei überführen. Also konvertiere ich die .doc-Datei per Hand zu einer Textdatei, lese sie zeilenweise ein und trenne dann anhand der Tabs. Gleichzeitig baue ich ein Wörterbuch mit den Spaltennamen als Schlüsseln um dort die Werte einzutragen und schlussendlich wird das ganze als CSV-Datei geschrieben (der Teil fehlt noch - ist mit dem csv-Modul nach flinkem Überfliegen aber wohl nicht das Problem -, genauso wie ich mich bisher nicht um Encodings geschert habe).

Ich habe dazu auch eine selbst gebastelte Lösung, die zumindest mit dem obigen Beispiel funktioniert. Meine Frage ist eigentlich nur, ob da nicht jemand einen eleganteren Ansatz hat?
Antworten