Ich bin gerade am Versuch, dass mir ein Python code PDF Dateien öffnet und diesen je nach Inhalt einen neuen Dateinamen gibt. Dabei habe ich folgenden code geschrieben:
Code: Alles auswählen
import os
import PyPDF2
path = r'C:\Users\Startklar\Desktop\CFDS\TEST'
for filename in os.listdir(path):
if filename.endswith('.pdf'):
pdf_file = open(os.path.join(path, filename), 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
found = False
for page_num in range(pdf_reader.numPages):
page = pdf_reader.getPage(page_num)
text = page.extractText()
if 'credit' in text:
found = True
break
pdf_file.close()
new_name = 'Sven' if found else 'Roger'
os.rename(os.path.join(path, filename), os.path.join(path, new_name + '.pdf'))
[\code]
Bitte beachtet, dass ist erst der theoretische code, ich konnte ihn noch nicht ausprobieren, da ich zuerst an einem für Euch wohl undenkbaren Problem leide. Nach der erstmaligen Ausführung des codes teilt mir Python, folgendes mit:
"PyPDF2.errors.DeprecationError: reader.numPages is deprecated and was removed in PyPDF2 3.0.0. Use len(reader.pages) instead."
Mit dem Hinweis, dass ich jetzt len(reader.pages) verwenden soll bin ich irgendwie total überfordert. Ist das eine zusätzliche Bibliothek welche es einzufügen gibt oder handelt es sich um etwas anderes?
Danke