pyPDF
Verfasst: Freitag 2. September 2011, 17:08
Hallo, ich habe folgendes Problem und bitte um Hilfe.
Ich möchte ganz einfach mit pyPDF arbeiten und versuche jetzt schon seit einiger Zeit, die einfachsten ersten Schritte zu meistern. Ich habe schon eine Weile gegoogelt, aber keine Lösung gefunden, deshalb meine Frage an euch.
Also,
in pyPdf ist es möglich, einfach nur die Pdfs zu lesen und dann die Infos, wie Autor, Titel etc., zurück zu bekommen.
Doch da scheitert es bei mir schon.
Ich gebe ein:
>>> from pyPdf import Pd
>>> p = r 'myfile.pdf'
>>> pdf = PdfFileReader(file(p, 'r'))
Dann kommt folgende Fehlermeldung.
Traceback (most recent call last):
File "<pyshell#6>", line 1, in <module>
pdf = PdfFileReader(file(p, 'r'))
File "C:\Python26\lib\site-packages\pyPdf\pdf.py", line 374, in __init__
self.read(stream)
File "C:\Python26\lib\site-packages\pyPdf\pdf.py", line 707, in read
raise utils.PdfReadError, "EOF marker not found"
PdfReadError: EOF marker not foundfFileReader
Das konnte ich fixen, indem ich den EOF marker hinzugefügt habe, wie hier beschrieben: http://lindaocta.com/?p=114
Aber dann bekomme ich folgende Fehlermeldung:
>>> pdf = PdfFileReader(file(p, 'r'))
Traceback (most recent call last):
File "<pyshell#8>", line 1, in <module>
pdf = PdfFileReader(file(p, 'r'))
File "C:\Python26\lib\site-packages\pyPdf\pdf.py", line 374, in __init__
self.read(stream)
File "C:\Python26\lib\site-packages\pyPdf\pdf.py", line 711, in read
startxref = int(line)
ValueError: invalid literal for int() with base 10: '%O'
Ich habe mir den Code entsprechend angeschaut, aber nichts finden können.
Es würde mir sehr sehr helfen, wenn ihr eine Lösung hättet.
Vielen Dank!
Ich möchte ganz einfach mit pyPDF arbeiten und versuche jetzt schon seit einiger Zeit, die einfachsten ersten Schritte zu meistern. Ich habe schon eine Weile gegoogelt, aber keine Lösung gefunden, deshalb meine Frage an euch.
Also,
in pyPdf ist es möglich, einfach nur die Pdfs zu lesen und dann die Infos, wie Autor, Titel etc., zurück zu bekommen.
Doch da scheitert es bei mir schon.
Ich gebe ein:
>>> from pyPdf import Pd
>>> p = r 'myfile.pdf'
>>> pdf = PdfFileReader(file(p, 'r'))
Dann kommt folgende Fehlermeldung.
Traceback (most recent call last):
File "<pyshell#6>", line 1, in <module>
pdf = PdfFileReader(file(p, 'r'))
File "C:\Python26\lib\site-packages\pyPdf\pdf.py", line 374, in __init__
self.read(stream)
File "C:\Python26\lib\site-packages\pyPdf\pdf.py", line 707, in read
raise utils.PdfReadError, "EOF marker not found"
PdfReadError: EOF marker not foundfFileReader
Das konnte ich fixen, indem ich den EOF marker hinzugefügt habe, wie hier beschrieben: http://lindaocta.com/?p=114
Aber dann bekomme ich folgende Fehlermeldung:
>>> pdf = PdfFileReader(file(p, 'r'))
Traceback (most recent call last):
File "<pyshell#8>", line 1, in <module>
pdf = PdfFileReader(file(p, 'r'))
File "C:\Python26\lib\site-packages\pyPdf\pdf.py", line 374, in __init__
self.read(stream)
File "C:\Python26\lib\site-packages\pyPdf\pdf.py", line 711, in read
startxref = int(line)
ValueError: invalid literal for int() with base 10: '%O'
Ich habe mir den Code entsprechend angeschaut, aber nichts finden können.
Es würde mir sehr sehr helfen, wenn ihr eine Lösung hättet.
Vielen Dank!