Seite 1 von 1

HTML-Seite holen und zerlegen

Verfasst: Mittwoch 2. November 2005, 17:49
von lakeck
Hallo,

ich hole mir HTML-Quelltext und suche nach einer bestimmten
Sequenz darin.
Ich weiss nicht, wie diese Sequenz lautet, aber ich weiss, das diese
Sequenz 60 Zeichen nach einem Schlüsselwort auftritt und
5 Zeichen lang ist.

Code: Alles auswählen

adresse = ("http://www.eineSeiteimNetz.de")
fp = urllib.urlopen(adresse)
einlesen = fp.read() 

# Nun habe ich die Seite (Quelltext)

# suchen des Schlüsselwortes:
such = "schluesselwort"
anfpos = find(einlesen, such)
# das gibt mir die Position zurück (6513)

# jetzt 60 Zeichen weiter nach rechts
nextpos = anfpos + 60

# und die nächsten 5 Zeichen holen
nextpos.read(5)
Fehlermeldung:
AttributeError: 'int' object has no attribute 'read'

Konvertiere ich nextpos = str(nextpos) kommt:
AttributeError: 'str' object has no attribute 'read'


Ich komme hier einfach nicht weiter.
Weiss da jemand Rat ???


Munter bleiben,
Lakeck

Verfasst: Mittwoch 2. November 2005, 17:59
von rayo
Hi

ungetestet

Code: Alles auswählen

adresse = ("http://www.eineSeiteimNetz.de")
fp = urllib.urlopen(adresse)
data = fp.read()
fp.close()


such = "schluesselwort"
anfpos = data.find(such)

nextpos = anfpos + 60

print data[nextpos:nextpos+5]
Gruss

Ich werd bekloppt !!

Verfasst: Mittwoch 2. November 2005, 18:24
von lakeck
DAS KLAPPT !!!


1000 Dank !!

Munter bleiben,
Lakeck