Seite 1 von 1

Analyse von Dateitypen in Python

Verfasst: Sonntag 12. Februar 2012, 10:27
von akhof
Hallo!
Kann mir jemand sagen, wie ich es schaffen kann herauszufinden, um welchen Dateityp es sich bei einer Datei handelt (z.B.: *.ogg oder *.pdf)? - Im Internet habe ich dazu leider nichts gefunden :(, und hab auch keine Ahnung, wie ich soetwas schaffen kann. :K


Vielen Dank schoneinmal im Vorraus!

akhof

Re: Analyse von Dateitypen in Python

Verfasst: Sonntag 12. Februar 2012, 10:38
von lunar
@akhof: Was verstehst Du unter "Dateityp"? Wenn es Dir nur um die Dateiendung geht, dann gibt es "os.path.splitext()". Ansonsten musst Du den Inhalt der analyisieren. Unter Linux kannst Du dazu beispielsweise "libmagic" verwenden (Beispiel).

Re: Analyse von Dateitypen in Python

Verfasst: Sonntag 12. Februar 2012, 10:45
von akhof
Dank! :D
Das erste wars...

Re: Analyse von Dateitypen in Python

Verfasst: Sonntag 12. Februar 2012, 12:05
von sma
Datei-Endungen sind ziemlich beliebig und daher wenig verlässlich. Die meisten Dateiformate kann man erkennen, wenn man die erste paar Bytes einliest. Eine PDF-Datei muss mit "%PDF-1.x" beginnen wobei x für 0 bis 7 (meine ich) steht. Danach kommt ein Zeilenumbruch `\n`. Eine OGG-Datei scheint mit `OggS` zu beginnen. Danach folgt ein 0-Byte. Will man nur wenige Formate testen, kann man einfach auf diese "magischen" Strings testen.

Stefan