Analyse von Dateitypen in Python

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
akhof
User
Beiträge: 104
Registriert: Mittwoch 11. Mai 2011, 19:07
Kontaktdaten:

Hallo!
Kann mir jemand sagen, wie ich es schaffen kann herauszufinden, um welchen Dateityp es sich bei einer Datei handelt (z.B.: *.ogg oder *.pdf)? - Im Internet habe ich dazu leider nichts gefunden :(, und hab auch keine Ahnung, wie ich soetwas schaffen kann. :K


Vielen Dank schoneinmal im Vorraus!

akhof
lunar

@akhof: Was verstehst Du unter "Dateityp"? Wenn es Dir nur um die Dateiendung geht, dann gibt es "os.path.splitext()". Ansonsten musst Du den Inhalt der analyisieren. Unter Linux kannst Du dazu beispielsweise "libmagic" verwenden (Beispiel).
akhof
User
Beiträge: 104
Registriert: Mittwoch 11. Mai 2011, 19:07
Kontaktdaten:

Dank! :D
Das erste wars...
sma
User
Beiträge: 3018
Registriert: Montag 19. November 2007, 19:57
Wohnort: Kiel

Datei-Endungen sind ziemlich beliebig und daher wenig verlässlich. Die meisten Dateiformate kann man erkennen, wenn man die erste paar Bytes einliest. Eine PDF-Datei muss mit "%PDF-1.x" beginnen wobei x für 0 bis 7 (meine ich) steht. Danach kommt ein Zeilenumbruch `\n`. Eine OGG-Datei scheint mit `OggS` zu beginnen. Danach folgt ein 0-Byte. Will man nur wenige Formate testen, kann man einfach auf diese "magischen" Strings testen.

Stefan
Antworten