KurrKurr hat geschrieben:Auch mittels Hashwert bekomme ich Duplikate...
Dann machst du irgendwo einen Fehler. Die selben Daten bekommen immer den selben Hashwert.
KurrKurr hat geschrieben:Die einzige Lösung wäre, den Dateien ein digitales Wasserzeichen mitzugeben, über das ich die Dateien identifiziere...
Gibts da ein Paket dafür in Python?
Dateien sind eigentlich keine magischen Dinge auf die man magische Funktionen anwenden kann

Wasserzeichen betreffen normalerweise den Inhalt der Datei und sind von dessen Format ab, da gibt es keine allgemeinen Lösungen.
Du könntest natürlich einen Blick in das Dateiformat werfen und schauen, ob dort Kommentare möglich sind. Dann könntest du in den Dateien spezielle Kommentare einfügen, welche die Zusatzdaten enthalten. Oder vielleicht ein Objekt, welches keine Änderung an den eigentlichen CAD-Daten durchführt.
Etwas risikoreicher könnte es sein, die Zusatzdaten ans Ende der Datei zu hängen. Mit etwas Glück ist die Anzahl der enthaltenen Daten im Header der CAD-Datei vorgegeben und es wird damit nicht weiter eingelesen.
Das Leben ist wie ein Tennisball.