dies ist mein erster Beitrag, ich bitte eventuelle Fehler oder undeutliche Beschreibungen zu entschuldigen.
Erstmal die Grundanforderung:
Es soll eine PDF-Datei (später mehrere Datei) in Excel gewandelt werden, bestimmte Daten rausgefiltert werden und in einer Excelsammelliste erfasst werden.
Soweit bin ich bisher auch (fast) mit Hilfe von openpyxl und xlrd gekommen. Die PDF-Dateien werden (noch) von einer bereits vorgandenden Programm (nicht mein Werk) in Exceldateien gewandelt.
Bisher kann ich die Daten an Zellen fest machen, filtern und in die neue Liste entsprechen eintragen.
Ich bin blutigster Anfänger, was die Programmierung angeht (erstes Projekt). Entrechend simpel ist mein Text aufgebaut.
Ich bitte um Nachsicht.
Meine zwei Probleme:
1. wie erkläre ich meinem Programm, dass es zuerst prüfen soll ob die angesteuerte Zelle bereits beschrieben ist und ggfls. eine Zelle weiter geht?
2. aktuell geb ich als Quelle die Grunddatei fest an. Die Finale Anforderung soll aber eigenständig mehre Dateien durchlaufen lassen.
Würde sich ein ORdnersystem hier anbieten? Alle Exceldateien in Order Xyz werden beim start angesteuert?
Vielen Dank vorab
MFG
rottyger
Code: Alles auswählen
import xlrd
import openpyxl
workbook = xlrd.open_workbook("Test.xlsx")
worksheet = workbook.sheet_by_index(0)
a = format(worksheet.cell (6,1).value)
b = a.split(':')
#print (b)
Lieferant = b[1]
c = format(worksheet.cell (7,1).value)
d = c.split(':')
#print (d)
Lieferantennr = d[1]
Bestellnummer = d[3]
e = format(worksheet.cell (8,1).value)
f = e.split(':')
#print (f)
Lieferschein = f[3]
excelDatei = openpyxl.load_workbook('Mappe2.xlsx')
sheetNamen = excelDatei['2018']
sheetNamen.cell(row=2, column=3).value = (Lieferant)
sheetNamen.cell(row=2, column=5).value = (Bestellnummer)
sheetNamen.cell(row=2, column=10).value = (Lieferantennr)
sheetNamen.cell(row=2, column=11).value = (Lieferschein)
excelDatei.save("Mappe2.xlsx")