auf der suche nach Lösungen bin ich auf dieses Forum gestoßen und hab mir jetzt einfach gedacht es kann nicht schaden zu fragen

Ich erstelle derzeit eine Reddit Meme Analyse.
Im ersten schritt scrape ich Daten von Reddit, sprich ich gebe Subreddits an und hole mir dann von diesen, die 10 am höchsten bewerteten Memes.
Jetzt habe ich die Bilder runtergeladen und die Daten von Reddit(Speicherpfad des Bildes, anzahl upvotes, Kommentare, Author etc.) in einer json abgespeichert.
In meinem zweiten script möchte ich über diese Bilder iterieren und alle miteinander vergleichen, mein erster Ansatz ist das ich die imagehashes miteinander vergleiche.
Nach einigen Lösungsansätzen die ich von freunden, dem Internet und der ein oder anderen KI bekommen habe, habe ich immer noch nicht mein erwartetes Ergebnis. (Es ist scheinbar sehr kompliziert Memes zu vergleichen.)
Da ich mein Projekt bis nächste Woche fertig haben sollte, habe ich nicht die Möglichkeit viel Machinelearning zu betreiben.
Hat jemand Erfahrung mit diesem Thema und kann mir Tipps geben ?
Vielen Dank im Voraus,
Liebe Grüße Philipp
(Ich kann bei Bedarf gerne meinen bisherigen Ansatz posten)