Seite 1 von 1

problem beim einlesen von gzip-files.

Verfasst: Dienstag 23. Juni 2009, 19:36
von Thuught
Hallo,
ich habe eine Dokumentensammlung welche als Ordner in einer tarfile gepackt ist, welche wiederum als gzip gepackt ist. Anfangs dachte ich, dass ich da ne Menge Schleifen machen muss, aber schon die Zeile

Code: Alles auswählen

for i in gzip.open("file.gz"):
            print i
bewirkt die Ausgabe der strings aller Dokumente. Das ist dann ein wenig zu viel des Guten. Mein Ziel ist es über die Dokumente zu iterieren, die ich dann einzeln einlesen kann.

Verfasst: Dienstag 23. Juni 2009, 19:53
von Leonidas
Du solltest dann eher das ``tarfile``-Modul verwenden, das kommt auch mit gzip und bzip2-komplimierten Dokumenten zurecht.

Verfasst: Dienstag 23. Juni 2009, 20:02
von Thuught
mit tarfile bekomm ich tarinfo-Objekte zurück. Gibt es eine Möglichkeit die einzulesen/zu öffnen?

Verfasst: Dienstag 23. Juni 2009, 20:41
von Barabbas