ich habe ein Dataframe mit Studentenname und Studentenid. Ich würde gerne auf Basis den Studentenname die ID anonymisieren.
Die hash() Funktion eignet sich ja leider nicht dafür. Gibt es irgendeine Methode die Studentenid anonymisieren und eine Methode die die anonymisierte Studentenid wieder zurück bringen?
Es sollte ungefähr so aussehen
Was ich bereits habe:
Code: Alles auswählen
import pandas as pd
d = {'Student': ['abc1', 'abc1'], 'Studendid': ['abc1', 'abc2']}
df = pd.DataFrame(data=d)
d1 = {x: hash(x) for x in df['Student']}
d2 = {v:k for k, v in d1.items()}
df['Studendid']= df['Student'].map(d1)
df['orig']= df['Studendid'].map(d2)
print (df)