bin neu in der Benutzung von Python und möchte mehrzeilige (String-) Daten mit nem regulären Ausdruck auswerten.
Die Daten sehen so aus:
"Nummer","Code","Bez 1","Maße","Gewicht","Warengruppe","EK 1","Ist-Bestand 1","Bestand 2"
"AAA-AAA","AAA-AAA*","18.11.2008.00",,,"500","4","0","0"
"C,,212","31028*01**","Handgriff","29x51x3","5","303","98.969","0","0"
...
Also ein CSV-mäßiger Aufbau. Dabei möchte ich jetzt aus diesen Werten Semikolon-getrennte CSV-Daten machen, also mit o.g. Beispielen:
Nummer;Code;Bez 1;Maße;Gewicht;Warengruppe;EK 1;Ist-Bestand 1;Bestand 2
AAA-AAA;AAA-AAA*;18.11.2008.00;;;500;4;0;0
C,,212;31028*01**;Handgriff;29x51x3;5;303;98.969;0;0
...
Wichtig dabei ist es, dass innerhalb der Quotes die Kommas nicht verändert werden dürfen (siehe letzte Zeile).
Das Ganze wollte ich jetzt mit folgendem Weg angehen (in data stehen oben genannte Daten):
Code: Alles auswählen
import re
m = re.match(r"\"(.*)\"", data)
print "groups: "
print m.groups()
Code: Alles auswählen
('Nummer","Code","Bez 1","Maße","Gewicht","Warengruppe","EK 1","Ist-Bestand 1","Bestand 2')
Wie schaffe ich es, dass ich ein Tupel bekomme, das so aussieht:
Code: Alles auswählen
('Nummer','Code','Bez 1','Maße','Gewicht','Warengruppe','EK 1','Ist-Bestand 1','Bestand 2')
Und wie 'iteriere' ich über die Zeilen?
Danke im voraus, sehe den Wald vor regulären Ausdrücken nicht mehr, hab schon so viel rumprobiert...