ich versuche einen DataFrame mit ca. 30 Mio Datensätzen in eine CSV zu exportieren. Das funktioniert auch, ist aber extrem langsam.
Die Anwendung selbst läuft in 2 Min durch und bereitet Daten auf, das bringt mir aber wenig wenn der Export danach 30 Minuten dauert.
Ist das richtig so, oder was gäbe es für Alternativen?
Der DataFrame hat 5 Spalten.
Die Funktion für den Export:
Die chunksize habe ich schon variiert, da gibt es jedoch wenig Unterschiede.export_csv = df.to_csv (r'test.csv', index = None, header=True, chunksize = 100000)
Die Anwendung läuft auf meinem Lokalen PC mit 4 CPU und 32 GB Arbeitsspeicher.
Hat da jemand Erfahrungen mit wie ich die Daten aus Python performant herausbekomme?
Vielen Dank!