Seite 1 von 1

re.compile filter syntax

Verfasst: Donnerstag 14. Oktober 2010, 08:59
von taake
Moin,

ich hab nen kleines Problem beim filter syntax um genau zu sein, ich bekomm es einfach nicht gebacken nur die daten zu bekommen die ich haben will.

Hoffe das mir nen pro mal kurz auf die Sprünge helfen kann.

Das ganze sieht folgend aus:

Code: Alles auswählen

find_artnr = re.compile('[0-9{5,}]*-[0-9{3,}]*')
artnr_match = find_artnr.findall(str(rawdata))
print( artnr_match )
Das script läd ne website und durchsucht den src nach artikelnummern, so wie es jetzt ist spuckt es diese zwar auch aus aber halt noch ne menge anderen müll.

Die Artikelnummern sehen alle gleich aus z.B. '15878-000' - also 5 nummern ein bindestrich 3 nummern.
Wie genau muss der Filterausdruck aussehen um nur die angezeigt zu bekommen?

Vielen dank schon mal im Vorraus.

Re: re.compile filter syntax

Verfasst: Donnerstag 14. Oktober 2010, 09:10
von sma

Code: Alles auswählen

r"\d{5}-\d{3}"
Stefan

Re: re.compile filter syntax

Verfasst: Donnerstag 14. Oktober 2010, 09:14
von taake
Besten Dank =)