Installieren des PDFMiner
Verfasst: Montag 2. März 2015, 13:53
Hallo,
ich möchte für ein Projekt plain text aus PDF-Dateien extrahieren. Dafür gibt es das Modul PDFMiner.
http://www.unixuser.org/~euske/python/p ... ml#pdf2txt
Leider schaffe ich es nicht dieses Modul zu installieren.
Ich bin noch ziemlich neu auf dem Gebiet und nutze Python bisher zur Textanalyse und Textverarbeitung.
Mit der Kommandozeilen-Nutzung kenne ich mich nicht aus.
Ich habe Python 2.7 - (Windows 7 Nutzer) - direkt unter C installiert. Das Modul PDFMiner habe ich entzipt und bei
C:\Python27\pdf2text-1.0.0 abgelegt.
Jetzt steht in der Anleitung (auf der Seite des o.a. Links):
"How to Install
Install Python 2.4 or newer. (Python 3 is not supported.)
Download the PDFMiner source.
Unpack it.
Run setup.py to install:
# python setup.py install
Do the following test:
$ pdf2txt.py samples/simple1.pdf
Hello
World
Hello
World
H e l l o
W o r l d
H e l l o
W o r l d
Done!"
Zunächst habe ich die setup.py als Modul via Python IDLE aufgerufen und nach "Run Module" eine Fehlermeldung erhalten.
Aber das ist eigentlich auch kein Installationsweg.
Dann habe ich über Windows PowerShell versucht die setup.py aufzurufen, aber ich bekomme immer Fehlermeldungen.
Kann mir jemand weiterhelfen?
ich möchte für ein Projekt plain text aus PDF-Dateien extrahieren. Dafür gibt es das Modul PDFMiner.
http://www.unixuser.org/~euske/python/p ... ml#pdf2txt
Leider schaffe ich es nicht dieses Modul zu installieren.
Ich bin noch ziemlich neu auf dem Gebiet und nutze Python bisher zur Textanalyse und Textverarbeitung.
Mit der Kommandozeilen-Nutzung kenne ich mich nicht aus.
Ich habe Python 2.7 - (Windows 7 Nutzer) - direkt unter C installiert. Das Modul PDFMiner habe ich entzipt und bei
C:\Python27\pdf2text-1.0.0 abgelegt.
Jetzt steht in der Anleitung (auf der Seite des o.a. Links):
"How to Install
Install Python 2.4 or newer. (Python 3 is not supported.)
Download the PDFMiner source.
Unpack it.
Run setup.py to install:
# python setup.py install
Do the following test:
$ pdf2txt.py samples/simple1.pdf
Hello
World
Hello
World
H e l l o
W o r l d
H e l l o
W o r l d
Done!"
Zunächst habe ich die setup.py als Modul via Python IDLE aufgerufen und nach "Run Module" eine Fehlermeldung erhalten.
Aber das ist eigentlich auch kein Installationsweg.
Dann habe ich über Windows PowerShell versucht die setup.py aufzurufen, aber ich bekomme immer Fehlermeldungen.
Kann mir jemand weiterhelfen?