problem beim einlesen von gzip-files.

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Thuught
User
Beiträge: 28
Registriert: Mittwoch 3. Dezember 2008, 12:19

Hallo,
ich habe eine Dokumentensammlung welche als Ordner in einer tarfile gepackt ist, welche wiederum als gzip gepackt ist. Anfangs dachte ich, dass ich da ne Menge Schleifen machen muss, aber schon die Zeile

Code: Alles auswählen

for i in gzip.open("file.gz"):
            print i
bewirkt die Ausgabe der strings aller Dokumente. Das ist dann ein wenig zu viel des Guten. Mein Ziel ist es über die Dokumente zu iterieren, die ich dann einzeln einlesen kann.
Leonidas
Python-Forum Veteran
Beiträge: 16025
Registriert: Freitag 20. Juni 2003, 16:30
Kontaktdaten:

Du solltest dann eher das ``tarfile``-Modul verwenden, das kommt auch mit gzip und bzip2-komplimierten Dokumenten zurecht.
My god, it's full of CARs! | Leonidasvoice vs (former) Modvoice
Thuught
User
Beiträge: 28
Registriert: Mittwoch 3. Dezember 2008, 12:19

mit tarfile bekomm ich tarinfo-Objekte zurück. Gibt es eine Möglichkeit die einzulesen/zu öffnen?
Barabbas
User
Beiträge: 349
Registriert: Dienstag 4. März 2008, 14:47

Antworten