Installieren des PDFMiner

Probleme bei der Installation?
Antworten
Kawasiki
User
Beiträge: 3
Registriert: Montag 2. März 2015, 12:49

Hallo,

ich möchte für ein Projekt plain text aus PDF-Dateien extrahieren. Dafür gibt es das Modul PDFMiner.
http://www.unixuser.org/~euske/python/p ... ml#pdf2txt

Leider schaffe ich es nicht dieses Modul zu installieren.
Ich bin noch ziemlich neu auf dem Gebiet und nutze Python bisher zur Textanalyse und Textverarbeitung.
Mit der Kommandozeilen-Nutzung kenne ich mich nicht aus.

Ich habe Python 2.7 - (Windows 7 Nutzer) - direkt unter C installiert. Das Modul PDFMiner habe ich entzipt und bei
C:\Python27\pdf2text-1.0.0 abgelegt.

Jetzt steht in der Anleitung (auf der Seite des o.a. Links):
"How to Install

Install Python 2.4 or newer. (Python 3 is not supported.)
Download the PDFMiner source.
Unpack it.
Run setup.py to install:

# python setup.py install

Do the following test:

$ pdf2txt.py samples/simple1.pdf
Hello

World

Hello

World

H e l l o

W o r l d

H e l l o

W o r l d

Done!"

Zunächst habe ich die setup.py als Modul via Python IDLE aufgerufen und nach "Run Module" eine Fehlermeldung erhalten.
Aber das ist eigentlich auch kein Installationsweg.
Dann habe ich über Windows PowerShell versucht die setup.py aufzurufen, aber ich bekomme immer Fehlermeldungen.
Kann mir jemand weiterhelfen?
BlackJack

@Kawasiki: Welche Fehlermeldungen bekommst Du denn wenn Du die `setup.py` mit den entsprechenden Argumenten in der Powershell ausführst?
Kawasiki
User
Beiträge: 3
Registriert: Montag 2. März 2015, 12:49

Folgende Befehle habe ich eingegeben:

cd C:\Python27\pdf2text-1.0.0
C:\Python27\python.exe setup.py install

Fehlermeldung
python.exe : Traceback (most recent call last):
Bei Zeile:1 Zeichen:23
+ C:\Python27\python.exe <<<< setup.py install
+ CategoryInfo : NotSpecified: (Traceback (most recent call last)::String) [], RemoteException
+ FullyQualifiedErrorId : NativeCommandError

File "setup.py", line 5, in <module>
from setuptools import setup
ImportError: No module named setuptools
BlackJack

@Kawasiki: Die `setup.py` möchte also das Modul `setuptools` verwenden. Das gehört nicht zur Standardbibliothek, müsste also vorher installiert werden.

Anmerkung am Rande: Es sieht so aus als wenn Du das Quelltextarchiv von `pdf2text` im Verzeichnis von der Python-Installation entpackt hast — da würde ich als Benutzer nichts verändern. Da können Installer und Installationsskripte etwas ablegen/verändern oder Benutzer die wissen was sie tun.
Kawasiki
User
Beiträge: 3
Registriert: Montag 2. März 2015, 12:49

Hallo BlackJack,

ich habe das setuptool installiert und damit hat auch die Installation des PDFMiner funktioniert :D .
Vielen Dank, besonders auch für die Anmerkung.
Antworten