Captcha lösen / tesseract

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
MotDy2k
User
Beiträge: 1
Registriert: Samstag 28. Oktober 2017, 19:36

Moin,
ich hoffe ich bin hier richtig, da ich gerade erst mit Python anfange wollte ich ein kleines Tool schreiben.
Es sollen Eingaben auf einer Webseite gemacht werden, nein kein Spam-Bot o.ä. sondern ein Spiel, die Captchas verwendet.
Und genau da scheitere ich, das Image habe ich per Irfanview schon in schwarz / weiß konvertiert usw. aber egal es ich mache bzw. bei tesseract einstelle kommt leider nicht das gewünschte Ergebnis raus.

Hier mal ein paar Beispiele:
http://www.bilder-upload.eu/show.php?fi ... 216190.png
http://www.bilder-upload.eu/show.php?fi ... 216235.png
http://www.bilder-upload.eu/show.php?fi ... 216263.png

Ich hoffe mir kann jemand helfen.
THX
__deets__
User
Beiträge: 14542
Registriert: Mittwoch 14. Oktober 2015, 14:29

Ich glaube nicht, dass du tesseract dazu bekommst.

Größere Chancen hast du ggf mit opencv. Mittels contours kannst du die Buchstaben extrahieren. Danach könntest du sie zb um verschiedene Grade drehen, und schauen, ob tesseract anspringt. Oder eine HOG-classifier selbst trainieren. Oder ein CNN benutzen.

Alles in allem eine sehr anspruchsvolle Geschichte. Als Einsteigerprojekt vielleicht etwas ambitioniert.
heiner88
User
Beiträge: 65
Registriert: Donnerstag 20. Oktober 2016, 07:29

Das ist der Sinn von Captchas, dass man die nicht so einfach mit den üblichen Mitteln wie tesseract lösen kann.
Antworten