Ich möchte mir gern selbst eine Art Wörterbuch bauen. Dieses Wörterbuch soll mit Wörtern aus Texten automatisch gefüllt werden (die Übersetzungen würde ich dann selbst einfügen mit der Zeit). Mir geht es jetzt darum, dass ich gern aus eBooks (im pdf-Format) alle Wörter auslesen möchte, um diese automatisch einer Liste hinzuzufügen (entsprechend Dopplungen vermeiden und so weiter).
Ist das überhaupt möglich? Ich weiß, dass pdfs eigentlich nicht darauf ausgelegt sind, dass man mit Ihnen arbeitet, aber ich möchte ja nichts an der pdf selbst ändern. Wenn es möglich ist, welches Modul ist dann dafür an besten geeignet? Also ich brauche echt keine langen Erklärungen, wie welche Befehle funktionieren. Mir reicht die Info, welches Modul ich mir dazu ansehen muss (falls es etwas passendes gibt).
Vielen Dank schon mal
