was und wie installieren?

Probleme bei der Installation?
Antworten
Benutzeravatar
Togijak
User
Beiträge: 24
Registriert: Donnerstag 27. November 2014, 16:35
Kontaktdaten:

Hi

Ich hab zwar Python 3.4.2 auf einem Win 7 x64 Rechner installiert, aber nur, weil es eine Anwendung gibt, die es verlangt = ich bin also 100%Pythonblond

Ich hab vor einiger Zeit ein Buch von http://gen.lib.rus.ec/ runter geladen (200 MB), dass miserabel gescannt war also hab ich versucht die 1013 exportierten Bilder so weit als möglich zu optimieren. Zum Einsatz kam dabei Lightroom und Photoshop mit einem Plugin für den schnellen Weißabgleich. Beides hat keine optimalen Resultate erbracht. Bei der Suche nach einer besseren Lösung bin ich dann auf den Beitrag "Convert scans of handwritten notes to beautiful, compact PDFs" https://mzucker.github.io/2016/09/20/noteshrink.html gestoßen. Die dort gezeigten Resultate sind genau das was all die Menschen brauchen die sich mit solcher Problematik (Verbesserung schlechter Scanns) beschäftigen. Leider ist der Autor ein typischer Coder der dabei
noteshrink

Convert scans of handwritten notes to beautiful, compact PDFs -- see full writeup at https://mzucker.github.io/2016/09/20/noteshrink.html
Requirements

Python 2 or 3
NumPy 1.10 or later
SciPy
ImageMagick
Image module from PIL or Pillow

Usage

./noteshrink.py IMAGE1 [IMAGE2 ...]

Building the examples (already in example_output):

make
nicht an Menschen gedacht hat, die keine Coder sind denn es gibt auf der Projektseite https://github.com/mzucker/noteshrink keine Links zu den Requirements. Gefunden habe ich zwar die Seite http://www.lfd.uci.edu/~gohlke/pythonlibs/ aber weder ist mir klar, was ich nun genau davon runter laden soll geschweige denn wie ich was zu installieren habe.

Irgend welche Hilfe Bild
Was wir an Niedern rühmen als Geduld, ist blasse Feigheit in der Brust - William Shakespeare
BlackJack

@Togijak: Bei http://www.lfd.uci.edu/~gohlke/pythonlibs/ gibt's ja Dateien im Wheel-Format. Die lassen sich mit `pip` installieren. Dokumentation dafür ist relativ am Anfang auf der Seite verlinkt.

Bei der Auswahl der Datei musst Du auf die (C)Python-Version achten (cp34 für Python 3.4.x) und auf 32 vs. 64 Bit. Letzteres muss zu Deinem Python passen.

ImageMagick, das bei den Abhängigkeiten gelistet ist, ist kein Python-Modul sondern ein eigenes Programm beziehungsweise eine Bibliothek mit ein paar Kommandozeilenprogrammen. Das ``convert``-Programm von ImageMagick wird von note-shrink aufgerufen um das Ergebnis von einem Bild in ein PDF zu wandeln.
Benutzeravatar
Togijak
User
Beiträge: 24
Registriert: Donnerstag 27. November 2014, 16:35
Kontaktdaten:

@BlackJack

1. Bild
2. kann man das ImageMagick weglassen bzw. wenn nicht so einfach den Aufruf aus noteshrink entfernen, denn mir wäre es viel lieber, wenn das Resultat einfach nur korrigierte / optimierte Bilder wären, denn in manchen Fällen muss man an solchen Bildern noch mehr tun als das was noteshrink tut / kann und die Bilder aus einem erstellten PDF wieder exportieren verschlechtert meist nur die Qualität.
Was wir an Niedern rühmen als Geduld, ist blasse Feigheit in der Brust - William Shakespeare
BlackJack

@Togijak: ImageMagick kann man weglassen soweit ich das sehe. Dann sollte das Programm am Ende einfach eine Warnung ausgeben, dass die Umwandlung in ein PDF nicht funktioniert hat.

Bilder lassen sich aus PDFs verlustfrei exportieren. In der Regel sind das eingebettete JPEGs, PNGs, oder Tiffs die 1:1 rauskopiert werden können, oder Bitmaps die sich verlustfrei beispielsweise in PNG umwandeln lassen.
Benutzeravatar
Togijak
User
Beiträge: 24
Registriert: Donnerstag 27. November 2014, 16:35
Kontaktdaten:

BlackJack hat geschrieben:Bilder lassen sich aus PDFs verlustfrei exportieren
stimmt nur werden die Bilder meistens bei der PDF Erstellung verschlimmbessert, denn die wenigsten Menschen können mit den dazu gehörenden Einstellungen etwas anfangen. Ob das bei ImageMagick der Fall wäre kann ich nicht beurteilen aber eine der sinnlose Zeitaufwand (um bei dem Beispiel zu bleiben - Anabole Steroide - das schwarze Buch 2010 http://gen.lib.rus.ec/book/index.php?md ... 521EE5801D - erst 1013 Bilder in ein PDF umwandeln um dann wieder 1013 Bilder zu extrahieren ist nicht unerheblich.
Was wir an Niedern rühmen als Geduld, ist blasse Feigheit in der Brust - William Shakespeare
BlackJack

@Togijak: Ich verstehe die Argumentation nicht so wirklich. Bei dem Beispiel muss man ja 1013 Bilder extrahieren, denn das liegt bereits als PDF vor. Und man möchte am Ende in der Regel die Einzelbilder in ein PDF umwandeln, weil es sich so besser lesen und als eine Datei weitergeben lässt. Mit Metainformationen und eventuell auch noch mit dem per OCR erkannten Text. Das heisst durchsuchbar wäre es dann auch und man kann auch Texte heraus kopieren statt es nur als eine Ansammlung von Bildern zu sehen. Das Beispielbuch enthält laut Beschreibung auf der Seite ja sogar den Text *als Text*. Das heisst diese Information geht verloren wenn man einfach nur die Bilder extrahiert und grafisch besser aufbereitet.
Benutzeravatar
Togijak
User
Beiträge: 24
Registriert: Donnerstag 27. November 2014, 16:35
Kontaktdaten:

@BlackJack

Bildda es ich um ein Nachschlagewerk und nicht nur um ein Buch handelt, dass man einmal lesen will und es sich dann erledigt hat, versuche ich das Optimum herauszuholen. Das Buch war nur ein Beispiel für den Anwendungsfall von noteshrink, denn ein guter Scann sieht anders aus. Da gibt es dann natürlich noch Schritte wie deskrew, dewarping und despreckling (sofern davon was erforderlich ist) und wenn das optische Maximum erreicht ist wandert das Ganze in Abbyy (zur Zeit immer noch die besten OCR Resultate) um dann ein PDF daraus zu machen. Dann müssen noch die Lesezeichen erstellt werden und zum Schluss kommt preflight. Auf all das bin ich nur nicht eingegangen, weil es 1. nix mit Python zu tun hat und 2. für alle anderen Schritte Windows Anwendungen gibt.

Das Einzige was interessant sein könnte ist herauszufinden, ob man den noteshrink algo in ScanTailor (http://scantailor.org/) als optionalen Schritt integrieren könnte, doch darum kümmere ich mich erst, wenn ich fit in noteshrink bin.
Was wir an Niedern rühmen als Geduld, ist blasse Feigheit in der Brust - William Shakespeare
Antworten