Hab mich jetzt eintschlosse Python zu lernen. Hab dafür ein kleines Lernprojekt am laufen, das aus einer .txt Datei über eine RegEx bestimme Strings ausgelesen und in eine csv Datei gespeichert wird. Das funktioniert soweit auch schon wunderbar.
Zum Erweitern des Projekts, hab ich mir gedacht möchte ich jetzt von einer Internetseite eine PDF Datei herunterladen und diese zuerst speichern. Im nächsten Schritt möchte ich dann den Inhalt dieser Datei in eine txt Datei kopieren und dort wieder alle Strings die mir die RegEx zurückgibt in eine csv Datei speichern.
Bis jetzt schaut es so aus, das ich beim Download der Datei mit dem Modul urllib.request die Verbindung zur Url herstelle und mit readlines() den Inhalt des zurückgegebenen Wertes in einem Objekt gespeichert habe. Gibt es da eine etwas elegantere Lösung, mit der ich evtl gleich die Rückgabe als Datei speichern kann?
Hier ist der Code:
Code: Alles auswählen
while(success == False):
try:
url = urllib.request.urlopen(newURL,)
success = True
except:
print('Die angegebene URL konnte nicht gefunden werden.')
newURL = input('Bitte gib einen neuen Pfad ein. Zum Abbrechen gib "A" ein\n')
if(newURL == 'A'):
sys.exit(0)
wtPdf = url.readlines()
url.close()
pfad = '/home/user/Dokumente/'
try:
pdf = open(pfad+'wt.txt','w')
success = True
#pdf Datei die im gedownloaded wird Zeiel für Zeile in Datei speichern
pickle.dump(wtPdf, pdf)
except:
print('WARNUNG: Kann die Datei nicht speichern.\n Bitte versuchen sie es später noch mal')
so long
choallin