Daten aus Textdatei in DataFrame importieren
Verfasst: Mittwoch 24. August 2022, 10:31
Hallo,
ich habe eine Textdatei (Beispieldatei: https://www.file-upload.net/download-14 ... e.txt.html), deren Daten ich in Python in ein DataFrame importieren möchte. Leider gibt es keine Separatoren zwischen den einzelnen Daten in der Textdatei. Ich bekomme es deshalb nicht hin, die Daten in Spalten aufzuteilen.
Hier mein Code:
Ich habe es schon mit einem Leerzeichen als Separator versucht: Dann erhalte ich die Fehlermeldung "pandas.errors.ParserError: Error tokenizing data. C error: Expected 485 fields in line 6, saw 496" Ein Leerzeichen als Separator macht eigentlich auch so keinen Sinn, da innerhalb der einzelnen Daten auch Leerzeichen sind.
Und ich habe es mit 5 Leerzeichen als Separator versucht: Dann erhalte ich die Warnung "ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'." und den Fehler "pandas.errors.ParserError: Expected 1 fields in line 2, saw 28. Error could possibly be due to quotes being ignored when a multi-char delimiter is used."
Mit dem Separator, den ich aktuell nutze, erhalte ich ein DataFrame, in dem alle Daten in einer Spalte stehen. Das ist auch nicht das gewünschte Ergebnis, ich erhalte aber zumindest schonmal ein DataFrame.
Ich habe die Beispieldatei etwas verfremdet. Die Fehlermeldungen und Warnungen sind hingegen von der ursprünglichen Datei. Sie werden daher vielleicht nicht die gleichen Werte beinhalten, sind aber vom Prinzip her gleich.
Wie bekomme ich ein DataFrame, in dem die Daten in Spalten aufgeteilt sind?
ich habe eine Textdatei (Beispieldatei: https://www.file-upload.net/download-14 ... e.txt.html), deren Daten ich in Python in ein DataFrame importieren möchte. Leider gibt es keine Separatoren zwischen den einzelnen Daten in der Textdatei. Ich bekomme es deshalb nicht hin, die Daten in Spalten aufzuteilen.
Hier mein Code:
Code: Alles auswählen
data = pd.read_csv(r"C:\Users\User\Desktop\51802.txt", header=None, sep="\t")
Und ich habe es mit 5 Leerzeichen als Separator versucht: Dann erhalte ich die Warnung "ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'." und den Fehler "pandas.errors.ParserError: Expected 1 fields in line 2, saw 28. Error could possibly be due to quotes being ignored when a multi-char delimiter is used."
Mit dem Separator, den ich aktuell nutze, erhalte ich ein DataFrame, in dem alle Daten in einer Spalte stehen. Das ist auch nicht das gewünschte Ergebnis, ich erhalte aber zumindest schonmal ein DataFrame.
Ich habe die Beispieldatei etwas verfremdet. Die Fehlermeldungen und Warnungen sind hingegen von der ursprünglichen Datei. Sie werden daher vielleicht nicht die gleichen Werte beinhalten, sind aber vom Prinzip her gleich.
Wie bekomme ich ein DataFrame, in dem die Daten in Spalten aufgeteilt sind?