Re: Auslesen von Metadaten aus pdf-Dateien
Verfasst: Sonntag 17. September 2017, 08:41
Entstehen diese Fehler bei verschlüsselten PDF-Dateien?
Seit 2002 Diskussionen rund um die Programmiersprache Python
https://www.python-forum.de/
Verschlüsselte PDFs habe ich nicht zu liegen, da kann ich nichts zu sagen. Doch was liefert Dein Script für Pfade und was ist in "gespfad" enthalten. Danach wurde bereits gefragt und eine Antwort hast Du nicht geliefert.TuXX hat geschrieben:Mittlerweile bin ich einen kleinen Schritt vorangekommen. Wenn ich einen festen Pfad eingebe kann ich die Anzahl der Seiten auslesen:
pdf_file = open(r'C:\Users\rogbet\Desktop\Problembeschreibung.pdf', 'rb')
read_pdf = PyPDF2.PdfFileReader(pdf_file)
number_of_pages = read_pdf.getNumPages()
print(number_of_pages)
Was nachwievor nicht funktioniert ist das Zählen von Seiten für mittels Skript ermittelte Pfade. Der bisherige Code sieht wie folgt aus:
gespfad = os.path.join(folderName,filename)
pdf_file = open(gespfad, 'rb')
read_pdf = PyPDF2.PdfFileReader(pdf_file)
number_of_pages = read_pdf.getNumPages()
print(number_of_pages)
Bei der Kompilierung werden Fehler angezeigt. Weiss jemand was hier schief läuft?
Code: Alles auswählen
from PyPDF2 import PdfFileReader
import os
pdf_file = os.path.normcase("C:/.../datei.pdf")
read_pdf = PdfFileReader(pdf_file)
number_of_pages = read_pdf.getNumPages()
print(number_of_pages)
Code: Alles auswählen
from PyPDF2 import PdfFileReader
import os
# Ab der Verzeichnisebene auf dem das Script liegt
def liefere_seitenzahlen():
endungen = [".pdf",".PDF"]
for root, dirs, files in os.walk("."):
for name in files:
extension = os.path.splitext(name)[1]
if extension in endungen:
read_pdf = PdfFileReader(os.path.join(root, name))
number_of_pages = read_pdf.getNumPages()
print("Datei: {} - Seiten: {}".format(name, number_of_pages))
if __name__ == "__main__":
liefere_seitenzahlen()
Code: Alles auswählen
from PyPDF2 import PdfFileReader
import os
# Ab der Verzeichnisebene auf dem das Script liegt mit kompletten Pfaden.
def liefere_seitenzahlen():
pfad = os.path.abspath(".")
endungen = [".pdf",".PDF"]
for root, dirs, files in os.walk("."):
for name in files:
extension = os.path.splitext(name)[1]
if extension in endungen:
komplett = os.path.join(pfad, os.path.relpath(root), name)
read_pdf = PdfFileReader(komplett)
number_of_pages = read_pdf.getNumPages()
print("Kompletter Pfad: {} - Seiten: {}"
.format(komplett, number_of_pages))
if __name__ == "__main__":
liefere_seitenzahlen()
Code: Alles auswählen
extension = os.path.splitext(filename)[1]
if extension.lower() == 'pdf':
# ...
Code: Alles auswählen
import os
pdf_file = os.path.normcase("C:/verzeichnis/verzeichnis/datei.pdf")
print(pdf_file)
# Ausgabe:
# c:\verzeichnis\verzeichnis\datei.pdf