Ich beschäftige mich erst seit ein paar Wochen mit Python, habe also noch nicht soviel Ahnung.
Eigentlich google ich mir immer alles zusammen, aber an diesem Punkt komm ich einfach nicht weiter.
Ich möchte von einer Website bestimmte urls auslesen, diese in einer txt Datei speichern, und anschließen jede einzelne öffnen um einige Werte auszulesen.
Urls auslesen und speichern funktioniert.
Die Werte aus den einzelnen Seite auslesen auch, aber nur wenn ich die Adressen direkt eingebe, also nicht aus der txt Datei auslese.
Hier ist mein code, alles für die Frage "unwichtige" schmeiß ich mal raus, der übersichtlichbarkeit halber:
Code: Alles auswählen
sfile = open("urltest.txt")
slist = sfile.read()
newslist = slist.split("\n")
def t_s():
i=0
while i< len(newslist):
index_url = newslist[i]
htmlfile = urllib.urlopen(index_url)
htmltext = htmlfile.read()
doc = lxml.html.fromstring(htmltext)
result = doc.xpath("//li[@class='price']")
result2 = doc.xpath("//*|//text()")
result3 = doc.xpath("//span[@class='titel']")
for i in range(0,1):
isbn = (lxml.html.tostring(result2[0]))
sep = '</title>'
.....
isbn4 = isbn3.rsplit(' ',3)
price = (lxml.html.tostring(result[0]))
sep = '&'
.....
price3 = price2.rsplit(' ',2)
title = (lxml.html.tostring(result3[0]))
sep = '</span>'
.....
title5 = title4.replace('ö', 'oe')
print isbn4[1] ,title5 ,price3[2]
i+=1
t_s()
Werte aus Url1
Werte aus Url2
Werte aus Url2
Werte aus Url2
...
Also die ersten beiden Ausgaben sind korrekt, und danach wird die zweite einfach nur ständig widerholt.
Hoffenlich kann mir hier jemand weiterhelfen