Rand von gescannten Bücher wegbekommen

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Lordbenz
User
Beiträge: 1
Registriert: Montag 28. November 2016, 11:26

Hallo Forum, ich habe da eine Frage und zwar Scanne ich Bücher ein im tiff Format. Leider entsteht dabei ein dunkler bis schwarzer Rand um die Seiten, den ich wegbekommen möchte.
Gibt es da ein Framework oder kann man das an sich einfach mit Python realisieren?
Es geht um 10000 Scans

Würde mich über Vorschläge freuen :)

Liebe Grüße

Carl
__deets__
User
Beiträge: 14545
Registriert: Mittwoch 14. Oktober 2015, 14:29

Wie immer bei CV Themen: konkrete Beispiele (also Bilder) helfen enorm. Und was die Zeile sind - Textextraktion, visuell ansprechendes Layout? Bildverarbeitung mit dazugehörigen Algorithmen bis hin zu ML geht mit OpenCV.
nezzcarth
User
Beiträge: 1638
Registriert: Samstag 16. April 2011, 12:47

Ich habe früher für so etwas unpaper benutzt. Ist halt nicht Python.
rogerb
User
Beiträge: 878
Registriert: Dienstag 26. November 2019, 23:24

Wenn der Textbereich immer in einem bestimmten Bereich liegt und der schwarze Rand immer außerhalb dieses Bereichs liegt, kann man mit numpy einfach die Pixel des Randbereichs auf die gewünschte Hintergrundfarbe setzen.

Wenn das nicht möglich ist, muss man (wahrscheinlich mit opencv) die Bereiche erkennen die dunkler als ein bestimmter Schwellwert sind. Zusätzlich gäbe es noch die Bedingung, dass diese Bereiche eine bestimme Zahl an Pixel umfassen müssen um nicht mit den dunklen Buchstaben verwechselt zu werden.
Dann kann man diese Flächen mit der Hintergrundfarbe einfärben. Es kann aber vielleicht noch vorkommen, dass auch dunkle Bilder im Text enthalten sind. Dann muss man auch die Position der dunklen Bereiche berücksichtigen. Ich habe schon lange nichts mehr mit opencv gemacht, aber es sollte eigentlich mit Standardfunktionen möglich sein.
Antworten