ich habe eine .dat-Datei mit Temperatur-Zeitreihen. Die ersten 6 Spalten ergeben die Datums- und Uhrzeitangaben, sind allerdings auf 6 Spalten aufgeteilt. Ich müsste diese zu einer datetime-Spalte zusammenfügen. Nach intensiverer Recherche bin ich auf pandas gestoßen, habe damit allerdings noch gar nicht gearbeitet und bin auch noch relativer Python-Neuling.
Meine Datei sieht wie folgt aus:
Code: Alles auswählen
YYYY MM DD HH MM SS Julday(UTC) Julday(MST) S01 S02 S03
2015 03 23 02 47 30 293.032986 292.741319 12.50 12.76 14.56
2015 03 23 02 50 00 293.034722 292.743056 12.35 12.64 14.83
2015 03 23 02 52 30 293.036458 292.744792 12.11 12.40 14.64
2015 03 23 02 55 00 293.038194 292.746528 12.04 12.18 14.49
Code: Alles auswählen
import numpy as np
import pandas as pd
myfile = np.genfromtxt('C:/.../file.dat',dtype=str,skip_header=1)
df = pd.read_csv(myfile, header=None, index_col='datetime',
parse_dates={'datetime': [0,1,2,3,4,5]},
date_parser=lambda x: pd.datetime.strptime(x, '%Y %m %d %H %M %S'))
Code: Alles auswählen
IOError: Expected file path name or file-like object, got <type 'numpy.ndarray'> type
Code: Alles auswählen
import pandas as pd
df = pd.read_csv('C:/.../file.dat', header=1, sep='\s+\s', parse_dates=([range(6)])
Code: Alles auswählen
ValueError: [0, 1, 2, 3, 4, 5] is not in list