Hallo Forum, ich habe da eine Frage und zwar Scanne ich Bücher ein im tiff Format. Leider entsteht dabei ein dunkler bis schwarzer Rand um die Seiten, den ich wegbekommen möchte.
Gibt es da ein Framework oder kann man das an sich einfach mit Python realisieren?
Es geht um 10000 Scans
Würde mich über Vorschläge freuen
Liebe Grüße
Carl
Rand von gescannten Bücher wegbekommen
Wie immer bei CV Themen: konkrete Beispiele (also Bilder) helfen enorm. Und was die Zeile sind - Textextraktion, visuell ansprechendes Layout? Bildverarbeitung mit dazugehörigen Algorithmen bis hin zu ML geht mit OpenCV.
Wenn der Textbereich immer in einem bestimmten Bereich liegt und der schwarze Rand immer außerhalb dieses Bereichs liegt, kann man mit numpy einfach die Pixel des Randbereichs auf die gewünschte Hintergrundfarbe setzen.
Wenn das nicht möglich ist, muss man (wahrscheinlich mit opencv) die Bereiche erkennen die dunkler als ein bestimmter Schwellwert sind. Zusätzlich gäbe es noch die Bedingung, dass diese Bereiche eine bestimme Zahl an Pixel umfassen müssen um nicht mit den dunklen Buchstaben verwechselt zu werden.
Dann kann man diese Flächen mit der Hintergrundfarbe einfärben. Es kann aber vielleicht noch vorkommen, dass auch dunkle Bilder im Text enthalten sind. Dann muss man auch die Position der dunklen Bereiche berücksichtigen. Ich habe schon lange nichts mehr mit opencv gemacht, aber es sollte eigentlich mit Standardfunktionen möglich sein.
Wenn das nicht möglich ist, muss man (wahrscheinlich mit opencv) die Bereiche erkennen die dunkler als ein bestimmter Schwellwert sind. Zusätzlich gäbe es noch die Bedingung, dass diese Bereiche eine bestimme Zahl an Pixel umfassen müssen um nicht mit den dunklen Buchstaben verwechselt zu werden.
Dann kann man diese Flächen mit der Hintergrundfarbe einfärben. Es kann aber vielleicht noch vorkommen, dass auch dunkle Bilder im Text enthalten sind. Dann muss man auch die Position der dunklen Bereiche berücksichtigen. Ich habe schon lange nichts mehr mit opencv gemacht, aber es sollte eigentlich mit Standardfunktionen möglich sein.