Dateisystem einer Datei ermitteln?

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Holger Chapman
User
Beiträge: 35
Registriert: Samstag 12. Juli 2014, 01:59

Hallo,

kann ich aus Python heraus erkennen, auf welchem Dateisystem eine Datei liegt?

Hintergrund der Frage: Ich möchte eine Datei auf einem Wechseldatenträger (USB-Stick) wiedererkennen, auch wenn der Wechseldatenträger anders eingehängt ist als zuvor:
Z. B. einmal als "/media/filme" und einmal als "/media/anna/filme" (Linux).
Oder einmal als "E:" und einmal als "F:" (Windows).

Ich möchte also für einen Dateinamen zwei Werte ermitteln:
1. UUID des Dateisystems (https://wiki.ubuntuusers.de/UUID/)
2. Dateiname innerhalb des Dateisystems

Pseudocode:

Code: Alles auswählen

import sys

def get_filesysteminfos(abs_filename):
    # [...]
    return fs_uuid, filesystem_mountpoint, filename_in_fs

filename=sys.argv[1]
fs_uuid, filesystem_mountpoint, filename_in_fs = get_filesysteminfos(filename)
print "File System:            " + fs_uuid
print "mounted at:             " + filesystem_mountpoint
print "filename in filesystem: " + filename_in_fs
print "absolute filename:      " + filesystem_mountpoint + '/' + filename_in_fs
Pseudo-Output 1:

Code: Alles auswählen

$ test.py '/media/filme/Spielfilme/file2.mkv'
File System:            6a12a4d5-e9e6-4568-afcc-34c70b24a668
mounted at:             /media/filme
filename in filesystem: Spielfilme/file1.mkv
absolute filename:      /media/filme/Spielfilme/file1.mkv
Pseudo-Output 2:

Code: Alles auswählen

C:\> test.py 'E:\Spielfilme\file2.mkv'
File System:            6a12a4d5-e9e6-4568-afcc-34c70b24a668
mounted at:             E:
filename in filesystem: Spielfilme\file1.mkv
absolute filename:      E:\Spielfilme/file1.mkv
Hat jemand von euch 'ne Idee, wie ich das realisieren kann?

Vielen Dank!


Holger
__deets__
User
Beiträge: 14539
Registriert: Mittwoch 14. Oktober 2015, 14:29

Ich vermute das geht, aber mir stellt sich die Frage: warum tust du nicht was jeder andere in dieser Situation macht, und hashst den Dateiinhalt? Anders gefragt: wozu brauchst du das genau?
Holger Chapman
User
Beiträge: 35
Registriert: Samstag 12. Juli 2014, 01:59

Der folgende Code macht unter Linux, was ich will:

Code: Alles auswählen

#!/usr/bin/python2

import os
import sys

def fileinfs(filename):
    device = os.lstat(filename).st_dev
    abspath = os.path.realpath(filename)
    mountpoint = abspath
    while not os.path.ismount(mountpoint):
        mountpoint = os.path.dirname(mountpoint)
    nameinfs = os.path.relpath(abspath, mountpoint)
    return device, mountpoint, nameinfs

# main
filename = sys.argv[1]
device, mountpoint, nameinfs = fileinfs(filename)
print 'abs. path: {}'.format(os.path.join(mountpoint, nameinfs))
print 'device {} mounted on {}'.format(device, mountpoint)
print 'name in fs: {}'.format(nameinfs)
Unter Windows scheint es schwieriger zu sein, da liefert os.lstat(filename).st_dev immer "0" zurück.
(Ich hab jetzt die Device-ID genommen, nicht die UUID. Für meine Zwecke reicht das.)
__deets__ hat geschrieben:Ich vermute das geht, aber mir stellt sich die Frage: warum tust du nicht was jeder andere in dieser Situation macht, und hashst den Dateiinhalt? Anders gefragt: wozu brauchst du das genau?
Ich brauche das aus Performancegründen: Um das wiederholte Hashen der immer gleichen (großen) Dateien zu vermeiden. Statt dessen gehe ich davon aus, dass eine Datei mit gleichem Namen (relativ zum Mountpoint), gleicher Größe, gleichem Timestamp (mtime) und im gleichen Dateisystem auch die gleiche Datei ist.

Wo sich eines dieser Daten unterscheidet, vermute ich, dass die Datei eine andere ist (und berechne einen Hashwert, den ich zusammen mit allen anderen Hashwerten in einer Cache-Datei ablege).

Schönen Gruß!


Holger
Antworten