Doppelte Dateien finden!?
Verfasst: Samstag 26. Oktober 2013, 21:18
Hallöle,
angeregt durch einen (uralten) Forenpost hier im Board und weil ich es für mein aktuelles Programm ganz gut gebrauchen kann, möchte ich eine Programm schreiben, welches doppelte Dateien aufspüren kann.
Soweit ist dies auch schon geschehen und ich war mal so frei und hab einige Anregungen und Ideen aus dem verlinkten Forenpost übernommen (das Ergebnis dürft ihr euch auf Github anschauen, falls Interesse besteht. Ihr dürft natürlich auch gern heftig kritisieren
).
Die Frage die für mich bleibt: Aus dem Forenpost habe ich u.a. auch übernommen, dass ich (nachdem ich Dateigröße verglichen hab), den md5-Hashwert der Dateien vergleiche (blockweise). Ich frage mich nur, warum man eigentlich den md5-Hashwert der Dateien vergleicht? Um den md5-Hash zu bekommen, muss ich die Datei ja eh öffnen und wenn ich an diesem Punkt angelangt bin, warum nicht gleich byte für byte vergleichen sondern stattdessen den md5-Wert? Macht das trotzdem irgendwie Sinn?
Gruß, Micha
angeregt durch einen (uralten) Forenpost hier im Board und weil ich es für mein aktuelles Programm ganz gut gebrauchen kann, möchte ich eine Programm schreiben, welches doppelte Dateien aufspüren kann.
Soweit ist dies auch schon geschehen und ich war mal so frei und hab einige Anregungen und Ideen aus dem verlinkten Forenpost übernommen (das Ergebnis dürft ihr euch auf Github anschauen, falls Interesse besteht. Ihr dürft natürlich auch gern heftig kritisieren
Die Frage die für mich bleibt: Aus dem Forenpost habe ich u.a. auch übernommen, dass ich (nachdem ich Dateigröße verglichen hab), den md5-Hashwert der Dateien vergleiche (blockweise). Ich frage mich nur, warum man eigentlich den md5-Hashwert der Dateien vergleicht? Um den md5-Hash zu bekommen, muss ich die Datei ja eh öffnen und wenn ich an diesem Punkt angelangt bin, warum nicht gleich byte für byte vergleichen sondern stattdessen den md5-Wert? Macht das trotzdem irgendwie Sinn?
Gruß, Micha