wie bereits in meinen vorherigen Posts geschrieben, arbeite ich mit großen Ecxel Dateien...
Da ich die Excel Dateien (xls) mit den ganzen Sheets nicht einfach in csv umwandeln kann, da sonst die Informationen verloren gehen, muss ich wohl weiterhin pd.ExcelFile nutzen. Und da diese Funktion bei vielen Dateien unglaublich lange dauert, aber es keine andere Alternative gibt, habe ich mich am Multiprocessing versucht. Erfolglos. Es dauert sehr viel länger als ohne. Allein schon dieses einfache Beispiel:
Code: Alles auswählen
from multiprocessing import Pool
def f(x):
return x*x
if __name__ == '__main__':
p = Pool(4)
print(p.map(f, [1, 2, 3]))
Allerdings verstehe ich das nicht so ganz. Müsste es nicht sogar schneller schneller als ohne Multiprocessing sein? Warum aber kommt in diesem Fall das Programm noch nicht mal zum Ende?