HTML-Seite holen und zerlegen

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
lakeck
User
Beiträge: 25
Registriert: Dienstag 20. April 2004, 16:19

Hallo,

ich hole mir HTML-Quelltext und suche nach einer bestimmten
Sequenz darin.
Ich weiss nicht, wie diese Sequenz lautet, aber ich weiss, das diese
Sequenz 60 Zeichen nach einem Schlüsselwort auftritt und
5 Zeichen lang ist.

Code: Alles auswählen

adresse = ("http://www.eineSeiteimNetz.de")
fp = urllib.urlopen(adresse)
einlesen = fp.read() 

# Nun habe ich die Seite (Quelltext)

# suchen des Schlüsselwortes:
such = "schluesselwort"
anfpos = find(einlesen, such)
# das gibt mir die Position zurück (6513)

# jetzt 60 Zeichen weiter nach rechts
nextpos = anfpos + 60

# und die nächsten 5 Zeichen holen
nextpos.read(5)
Fehlermeldung:
AttributeError: 'int' object has no attribute 'read'

Konvertiere ich nextpos = str(nextpos) kommt:
AttributeError: 'str' object has no attribute 'read'


Ich komme hier einfach nicht weiter.
Weiss da jemand Rat ???


Munter bleiben,
Lakeck
rayo
User
Beiträge: 773
Registriert: Mittwoch 5. November 2003, 18:06
Wohnort: Schweiz
Kontaktdaten:

Hi

ungetestet

Code: Alles auswählen

adresse = ("http://www.eineSeiteimNetz.de")
fp = urllib.urlopen(adresse)
data = fp.read()
fp.close()


such = "schluesselwort"
anfpos = data.find(such)

nextpos = anfpos + 60

print data[nextpos:nextpos+5]
Gruss
lakeck
User
Beiträge: 25
Registriert: Dienstag 20. April 2004, 16:19

DAS KLAPPT !!!


1000 Dank !!

Munter bleiben,
Lakeck
Antworten