@pillmuncher
Hast du https://pypi.org/project/intervaltree/ verwendet ? ich schaue mir das morgen mal genauer an danke erstmal
Ein kleines Beispiel mit deiner Lib wäre trotzdem cool einfach um es schneller testen zu können
PS: dort kann wirklich alles reinkommen also auch unterschiedliche Ausrichtungen der Dokumente / Bilder / Flyer oder was auch immer Ansonsten falls du diesen Part übernehmen wollen würdest als Support mit deiner Lib natürlich auch sehr gerne dann würde ich das HOCR-Zeug hinterher schieben sag mir ...
@__deets__ ich werde mir das Paper heute abend mal genauer zu Gemüt führen danke :) @pillmuncher super das schaue ich mir morgen mal genauer an hast du da mit deiner Lib vlt. ein kleines Beispiel parat um in Blöcke und Linien zu gruppieren ? Als Hintergrund: Ziel des Ganzen ist es die https ...
@pillmuncher du hast Recht ich war (passend zu deiner Probleminterpretation) etwas "festgefahren" auf den centroids ^^ Die Blöcke habe ich jetzt: https://i.ibb.co/PGRTVhT/z.jpg Über die Linien muss ich mir jetzt nochmal Gedanken machen, falls du einen Vorschlag hast immer gerne gesehen :D
@__deets__ 1. eher nicht und selbst wenn würde es da vermutlich Probleme geben, da die "Dokumente" alles mögliche sein können Handyfotos mit Hintergrund, Flyer, Poster, irgendetwas fotografiertes (die Erkennung funktioniert super mit https://arxiv.org/abs/1911.08947 nur die Sortierung halt nicht ...
Ich kann halt wirklich nur mit den Koordinaten der Boxen bzw. Berechnungen auf/von diesen Arbeiten ... ich hatte auch schon überlegt eine bitmap der Boxen zu erstellen um darauf mit erode irgendwie eine sinnvolle Maske zu erstellen .. allerdings wird das nicht funktionieren, da die Punkte zu sehr ...
@pillmuncher Das wäre zumindest ein guter Ansatz um "Textblöcke" zu clustern :) Aber hier geht es eigentlich mehr darum die roten "Punkte" korrekt von links nach rechts und oben nach unten zu sortieren halt wie man einen Text liest (leichte Verschiebungen auf der y-Achse müssten halt mit abgefangen ...
ich habe gerade folgendes Problem: Und zwar bekomme ich die bounding boxen im post processing meiner Texterkennung nicht korrekt sortiert (von links nach rechts und oben nach unten) Die Möglichkeit der Gruppierung in Bereiche/ Konturfindung, etc. anhand des Eingabebildes besteht nicht und ...
Huhu __deets__, danke für deine Antwort.
Habe ich gerade mal ausprobiert das Ergebnis sieht leider nicht viel besser aus als bisher.
Vlt. noch weitere Ideen ?
Huhu, und zwar habe ich gerade folgendes Problem, um Informationen aus Rezepten zuverlässiger zu extrahieren müsste ich bestmöglich den kompletten Hintergrund entfernen, damit nur noch die gedruckte (schwarz/graue) Schrift über bleibt. Das funktioniert mit dem aktuellen Code auch gut wenn die ...
Huhu,
ich hoffe das ich deine Frage richtig verstanden habe
Wenn du Bilder an deinen Server schicken möchtest mach das mit request.post() und die Bilder kannst du in base64 dekodieren und somit per json versenden sowie den Dateinamen.
LG Felix
ist es mit der APScheduler library möglich Tasks (async) priorisiert abzuarbeiten ?
Als jobstore dient eine MySQL Datenbank.
Ansonsten gerne Alternativen falls bekannt !?
Einzigste Voraussetzung ist MySQL als jobstore.
Sowie keine Message Broker (RabbitMQ,..), Celery Lösungen.
Huhu, ich habe gerade folgende Probleme mit meiner API: Derzeit läuft die Zuweisung der Jobs über eine andere API dieser Prozess soll nun in meiner API integriert werden, damit diese komplett unabhängig ist. Dabei wird folgendes benötigt: - ablegen/abspeichern aller requests bis verarbeitet wurden ...
Huhu, und zwar habe ich gerade folgendes Problem: Ich bekomme von einer externen API eine URL für den Callback und möchte dort nun per Response auch meine Ergebnisse hinsenden wenn die Bearbeitung fertig ist. Funktioniert bisher auch alles soweit allerdings kommt der Response nicht bei der Callback ...