Die Suche ergab 14 Treffer

von moinmoin
Donnerstag 9. Dezember 2010, 14:17
Forum: Allgemeine Fragen
Thema: subprocess.Popen debuggen
Antworten: 19
Zugriffe: 2216

Re: subprocess.Popen debuggen

Danke Leonidas, habe Deinen post erst jetzt gesehen (Seite 2...)

Werde ich mir merken... da es sich um ein perönliches Projekt handelt, brauche ich den utf-8 check und ggf. codecs.open derzeit nicht. Aber immer gut eine Referenz zu haben...
von moinmoin
Freitag 3. Dezember 2010, 20:32
Forum: Allgemeine Fragen
Thema: subprocess.Popen debuggen
Antworten: 19
Zugriffe: 2216

Re: subprocess.Popen debuggen

Hehe, ich bin halt auch sehr neugierig und meine Augen sind schnell, da ist der spoiler garantiert!

Ärgerlich: Ich habe die Datei von einem windows-user erhalten, sein Texteditor hat den BOM gesetzt. Mein geliebter GNU Emacs würde so etwas nie tun...

Die Ironie ist, dass ich dadurch einiges über ...
von moinmoin
Freitag 3. Dezember 2010, 20:01
Forum: Allgemeine Fragen
Thema: subprocess.Popen debuggen
Antworten: 19
Zugriffe: 2216

Re: subprocess.Popen debuggen

obwohl ich es gerne selber versuche, weil ich diese Lernmethode am besten finde, danke für deinen code...

Das liefert mir wie im Kommentar beschrieben aber "nur" einen unicode string. Was ich brauche, ist ein file, das keinen BOM mehr enthält, auf das ich dann ein `readlines()` laufen lassen will ...
von moinmoin
Freitag 3. Dezember 2010, 19:40
Forum: Allgemeine Fragen
Thema: subprocess.Popen debuggen
Antworten: 19
Zugriffe: 2216

Re: subprocess.Popen debuggen

@syntor:
Danke für Deinen Beitrag. Das ist richtig, wird aus einem file gelesen, welches utf-8 encoded ist. Durch googlen bin ich auch auf dieses BOM gestossen. Dazu habe ich auch das `codecs` modul gefunden. mal sehen was es da so gibt...
von moinmoin
Freitag 3. Dezember 2010, 18:56
Forum: Allgemeine Fragen
Thema: subprocess.Popen debuggen
Antworten: 19
Zugriffe: 2216

Re: subprocess.Popen debuggen

Haha! Danke ersteinmal auch an die Veteranen lunar und Leonidas!

Ich habe einen Fall aufgeklärt...

Kleiner Erfahrungsbericht:

Nach dem Tip von lunar habe ich folgendes wiederum versucht:
Popen(['wget', '-np', '-U', agent, '-O', 'tmp_source', springer_source])

Da das nicht funktioniert hat ...
von moinmoin
Donnerstag 2. Dezember 2010, 20:12
Forum: Allgemeine Fragen
Thema: subprocess.Popen debuggen
Antworten: 19
Zugriffe: 2216

Re: subprocess.Popen debuggen

Danke ichisich!

Durch den Versuch den string vorher zusammenszustellen, habe ich folgendes entdeckt:

'\\"Mozilla/5.0 ... Firefox/3.6.12\\"'
wird zu
'\\"Mozilla/5.0 ... Firefox/3.6.12\\"'

und:
'\"Mozilla/5.0 ... Firefox/3.6.12\"'
wird zu
'"Mozilla/5.0 ... Firefox/3.6.12"'

Wie erhalte ...
von moinmoin
Donnerstag 2. Dezember 2010, 19:05
Forum: Allgemeine Fragen
Thema: subprocess.Popen debuggen
Antworten: 19
Zugriffe: 2216

subprocess.Popen debuggen

Hallo!

Folgender code steht zur Debatte:
Popen(['wget', '-np', '-U', agent, '-O', 'tmp_source', springer_source]).wait()

`springer_source` ist ein Argument, das die übergeordnete Funktion als Argument bekommt. `agent` ist ein String in einem String (weil die strings aus der obigen Liste einmal ...
von moinmoin
Donnerstag 2. Dezember 2010, 14:13
Forum: Allgemeine Fragen
Thema: Liste aus Klartext auslesen
Antworten: 11
Zugriffe: 1309

Re: Liste aus Klartext auslesen

Nice! "Fühlt" sich auch irgendwie richtiger an, ausserdem lesbarer.

Macht halt doch viel mehr Spass sich das alles hobbymäßig reinzuziehen - da ist der Lerneffekt viel größer...

Danke nochmal BlackJack, so gibt man richtig Nachhilfe!
von moinmoin
Donnerstag 2. Dezember 2010, 13:03
Forum: Allgemeine Fragen
Thema: Liste aus Klartext auslesen
Antworten: 11
Zugriffe: 1309

Re: Liste aus Klartext auslesen

@BlackJack: Nach ein wenig Stöbern in der re Dokumentation bin ich auf folgendes gekommen:

Code: Alles auswählen

ast.literal_eval(re.search(r'documentPdfDownloadUrls : (\[.*?\])', source).group(1))
jetzt besser?
von moinmoin
Mittwoch 1. Dezember 2010, 12:50
Forum: Allgemeine Fragen
Thema: Liste aus Klartext auslesen
Antworten: 11
Zugriffe: 1309

Re: Liste aus Klartext auslesen

Danke BlackJack für Deinen Kommentar!

Der part
re.findall(r'documentPdfDownloadUrls : (\[.*?\])', source)
gibt mir eine Liste zurück, in der die gewünschte(n) Liste(n) als string(s) enthalten ist (sind).

Falls mehrere Listen durch findall gefunden werden, dann sind also mehrere strings in ...
von moinmoin
Dienstag 30. November 2010, 12:07
Forum: Allgemeine Fragen
Thema: Liste aus Klartext auslesen
Antworten: 11
Zugriffe: 1309

Re: Liste aus Klartext auslesen

So. Nach ein paar Tagen habe ich mich vorhin wieder an die Lösung gemacht.

Dank sma's code funktioniert das ganze nun! Danke nocheinmal!

Mein Problem war, dass ich durch das Öffnen per
source = open('tmp_source', 'r')
das file als ein Objekt bekommen habe, auf das ich dann in einer for-Schleife ...
von moinmoin
Samstag 27. November 2010, 13:20
Forum: Allgemeine Fragen
Thema: Liste aus Klartext auslesen
Antworten: 11
Zugriffe: 1309

Re: Liste aus Klartext auslesen

Danke für Deinen Kommentar Barabbas.

Muss jetzt weg, werde mir das nochmal in Ruhe ansehen, vielleicht pack ich es von hier aus alleine...
von moinmoin
Samstag 27. November 2010, 13:05
Forum: Allgemeine Fragen
Thema: Liste aus Klartext auslesen
Antworten: 11
Zugriffe: 1309

Re: Liste aus Klartext auslesen

Danke für Deine Antwort Stefan.

Meine Imports:
import os
import sys
from subprocess import Popen, call, PIPE
from re import compile as Pattern
from pyPdf import PdfFileWriter, PdfFileReader
import wx

Also zunächst habe ich die html Quelldatei mit
source = open('bla.html', 'r')
geöffnet.

Dann ...
von moinmoin
Samstag 27. November 2010, 12:33
Forum: Allgemeine Fragen
Thema: Liste aus Klartext auslesen
Antworten: 11
Zugriffe: 1309

Liste aus Klartext auslesen

Hallo Allerseits,

Ich nutze Python 2.6.5

Ich habe ein html Klartextfile, in dem es folgene Zeilen gibt:

...
zeichenfolge : ["","/link/zu/pdf/file.pdf","/link/zu/pdf/file2.pdf","/link/zu/pdf/file3.pdf"]
...

Die Punkte bezeichnen beliebiges html-generiertes markup.

Kurz zum Ziel: Ich will die ...