Hallo in die Runde,
ich möchte mich heute mit folgendem Anliegen an euch wenden. Wir sind durch die jüngsten Entwicklungen im Datenschutz, namentlich die Stellungnahme der Landesbehörde BaWü (https://www.baden-wuerttemberg.datensch ... ems-II.pdf), vor die Herausforderung gestellt eine entsprechende Annonymisierung für unseren noch recht jungen Chatbot vorzunehmen.
Die Skripte sind soweit erstellt (auf RegEx und Spacy Basis), jedoch mangelt es uns an einem brauchbaren Testdatensatz um diese zu Beurteilen. Nun wollte ich fragen, ob dort eventuell jemand etwas für die deutsche Sprache kennt, da mir Google nur Seiten vorschlägt, die mich darauf hinweisen das ich Produktivdaten nicht als Testdaten verwenden darf.
Für jede hilfe wäre ich dankbar.
Cheers und einen schönen Tag
BossBolognese