Seite 1 von 1

Captcha lösen / tesseract

Verfasst: Samstag 28. Oktober 2017, 19:45
von MotDy2k
Moin,
ich hoffe ich bin hier richtig, da ich gerade erst mit Python anfange wollte ich ein kleines Tool schreiben.
Es sollen Eingaben auf einer Webseite gemacht werden, nein kein Spam-Bot o.ä. sondern ein Spiel, die Captchas verwendet.
Und genau da scheitere ich, das Image habe ich per Irfanview schon in schwarz / weiß konvertiert usw. aber egal es ich mache bzw. bei tesseract einstelle kommt leider nicht das gewünschte Ergebnis raus.

Hier mal ein paar Beispiele:
http://www.bilder-upload.eu/show.php?fi ... 216190.png
http://www.bilder-upload.eu/show.php?fi ... 216235.png
http://www.bilder-upload.eu/show.php?fi ... 216263.png

Ich hoffe mir kann jemand helfen.
THX

Re: Captcha lösen / tesseract

Verfasst: Samstag 28. Oktober 2017, 20:39
von __deets__
Ich glaube nicht, dass du tesseract dazu bekommst.

Größere Chancen hast du ggf mit opencv. Mittels contours kannst du die Buchstaben extrahieren. Danach könntest du sie zb um verschiedene Grade drehen, und schauen, ob tesseract anspringt. Oder eine HOG-classifier selbst trainieren. Oder ein CNN benutzen.

Alles in allem eine sehr anspruchsvolle Geschichte. Als Einsteigerprojekt vielleicht etwas ambitioniert.

Re: Captcha lösen / tesseract

Verfasst: Dienstag 31. Oktober 2017, 09:32
von heiner88
Das ist der Sinn von Captchas, dass man die nicht so einfach mit den üblichen Mitteln wie tesseract lösen kann.