Hallo Milan,
gibt es zu diesem Modul eine brauchbare Beschreibung in deutsch?
Stephan
Frage zur Listenverarbeitung
Hi. Auf die schnelle: nein, fällt mir nix ein... aber du kannst ja selber mal suchen bzw dir den Thread durchlesen. Da ist unter anderem ein Anwendungsbeispiel mit drin, vielleicht hilft dir das beim verstehen. Grundprinzip ist, dass ein Fileobj einer Readerklasse übergeben wird. Diese Readerklasse kann als Argument zu for-schleifen genutzt werden, wobei dann immer die einzelnen Werte als Liste genutzt werden können. Eine Datei, in der das hier steht:
kann dann so behandelt werden:
Selbst das Komma in Anführungszeichen wird korrekt geparst, da es als Teil des Strings und nicht als Trennzeichen angesehen wird.
Code: Alles auswählen
1,2,3
4,5,6
"aha, aha","lalala",xyz
Code: Alles auswählen
import csv
f=file(...)
reader=csv.reader(f) # kein Dialekt, wie bei Exel notwendig wäre, hier werden "," verwendet
for werte in reader:
print repr(werte)
f.close()
Bei Stephans ssv-dateien (semicolon separated values) ginge das dann so:Milan hat geschrieben:Code: Alles auswählen
reader=csv.reader(f) # kein Dialekt, wie bei Exel notwendig wäre, hier werden "," verwendet
Code: Alles auswählen
reader = csv.reader(f),delimiter=';')
joe
Hi. Das glaubeich nicht so ganz... ich hab zwar das hier überlesen:
Ansonsten könnte es helfen, die Zeilenumsprünge rauszunehmen und immer neu nach 37 ";" einzusetzen.
Aber das Notepad die Zeilen orginalgetreu einließt gibt mir zu denken:Stephan hat geschrieben:... da liegt der Hase im Pfeffer
In der csv-Datei werden verschiedene Zeilen (die sehr lang sind) gebrochen (mit "\n"). Dadurch ist dann eine Zeile nur 11 Elemente lang (da es nur der Rest der vorhergehenden Zeile ist).
Ist natürlich ziemlich doof von Excel.
Ich vermute, da ist ein Teil der Daten binär gespeichert wurden, sodass da ein Fehler liegt (es wäre sehr nützlich, die Datei mal in binärer Repräsentation ausschnittsweise zu sehen). Selbst wenn das so sein sollte, kann er mit csv aber schon mal den Dialekt genau spezifizieren. Am besten wäre es vielleicht einmal zu testen, was er ohne Dialekt sagt, denn csv verwendet einen Sniffer, der versucht auszukunden, was für ein Dialekt vorliegt. Eventuelle gibt es Probleme mit den Zeilenumsprüngen (binär halt).Stephan hat geschrieben:... mit WordPad oder einem anderen Texteditor öffne, habe ich Zeilenumbrüche. Nur wenn ich die Datei mit NotePad öffne, sind die Zeilen komplett.
Ansonsten könnte es helfen, die Zeilenumsprünge rauszunehmen und immer neu nach 37 ";" einzusetzen.
- Mawilo
- User
- Beiträge: 452
- Registriert: Sonntag 22. Februar 2004, 10:58
- Wohnort: Sachsen
- Kontaktdaten:
Hallo Milan,
ich habe mich mal etwas mit der csv-Datei beschäftigt.
Das Problem ist, dass in der xls-Datei in einigen Zellen Text mit Zeilenumbruch eingegeben ist. Ich kann zwar die Formatierung ändern indem ich in Excel das Häkchen bei Zeilenumbruch entferne, aber in der Bearbeitungsleiste wird der Text immer noch in zwei Zeilen angezeigt. Dieser Zeilenumbruch führt in der csv-Datei zu einer neuen Zeile.
Stephan
ich habe mich mal etwas mit der csv-Datei beschäftigt.
Das Problem ist, dass in der xls-Datei in einigen Zellen Text mit Zeilenumbruch eingegeben ist. Ich kann zwar die Formatierung ändern indem ich in Excel das Häkchen bei Zeilenumbruch entferne, aber in der Bearbeitungsleiste wird der Text immer noch in zwei Zeilen angezeigt. Dieser Zeilenumbruch führt in der csv-Datei zu einer neuen Zeile.
Stephan
Die texte mit zeilenumbrüchen sind dann aber (zumindest bei mir) in anführungsstrichen eingeschlossen. Und damit kommt das csv-modul tatsächlich auch klar.Stephan hat geschrieben: Das Problem ist, dass in der xls-Datei in einigen Zellen Text mit Zeilenumbruch eingegeben ist.
joe
- Mawilo
- User
- Beiträge: 452
- Registriert: Sonntag 22. Februar 2004, 10:58
- Wohnort: Sachsen
- Kontaktdaten:
Hi Joe,
bei mir werden die Zeilenumbrüche auch von Anfürungsstrichen eingeschlossen.
Ist vieleicht der Code fehlerhaft?
Stephan
bei mir werden die Zeilenumbrüche auch von Anfürungsstrichen eingeschlossen.
Ist vieleicht der Code fehlerhaft?
Code: Alles auswählen
import csv
x = file('datei.csv','r')
reader = csv.reader(x)
delimiter=';'
for werte in reader:
print reader
Ja, ist aber mein fehler. Ich hatte da eine verwirrende klammer in dem einen beitrag. Richtig:Stephan hat geschrieben: Ist vieleicht der Code fehlerhaft?
reader = csv.reader(x,delimiter=';')
joe