Html downloaden und durchsuchen
Verfasst: Samstag 5. November 2011, 19:54
Hallo,
ich benutze Python 3.2 und versuche gerade eine HTMl herunterzuladen, diese dann nach einem String zu durchsuchen welcher zwischen zwei mir bekannten strings steht.
Beispiel:
DIe HTML file enthält den text:
test1_test2_test=asdfg-xyz
Herausfiltern muss ich das "asdfg", das steht immer zwischen _test= und -xyz und dieses asdfg will ich dann in eine zeile einer datei schreiben(append) sodass ich später die einträge in einem anderen script durchgehen kann
Soweit bin ich:
import urllib.request
import string
html_content = urllib.request.urlopen('http://wwww.test_url.de/index.php')
string_to_search = html_content.read()
wie bekomme ich nun den substring gefunden und in eine datei geschrieben? Ich wollte es mit find machen der jeweils bekannten strings, dadurch erhalte ich die indizes und kann dann den string zwischen den indizes machen, aber ich bekomm immer den fehler expected an object with the buffer interface
Vielen dank im Vorraus
ich benutze Python 3.2 und versuche gerade eine HTMl herunterzuladen, diese dann nach einem String zu durchsuchen welcher zwischen zwei mir bekannten strings steht.
Beispiel:
DIe HTML file enthält den text:
test1_test2_test=asdfg-xyz
Herausfiltern muss ich das "asdfg", das steht immer zwischen _test= und -xyz und dieses asdfg will ich dann in eine zeile einer datei schreiben(append) sodass ich später die einträge in einem anderen script durchgehen kann
Soweit bin ich:
import urllib.request
import string
html_content = urllib.request.urlopen('http://wwww.test_url.de/index.php')
string_to_search = html_content.read()
wie bekomme ich nun den substring gefunden und in eine datei geschrieben? Ich wollte es mit find machen der jeweils bekannten strings, dadurch erhalte ich die indizes und kann dann den string zwischen den indizes machen, aber ich bekomm immer den fehler expected an object with the buffer interface
Vielen dank im Vorraus