Probleme beim nutzen von Regex und Replace
Verfasst: Sonntag 3. Januar 2021, 20:57
Hallo zusammen
Ich bedanke mich schon mal für die Hilfe von euch.
Ich bin gerade dran python zu lernen und wollte paar infos von einer website scrapen.
Und zwar dieser:
https://www.footlocker.de/INTERSHOP/web ... ductDetail
Ich habe mit beautiful soup versucht den Code bis zu meinem nutzen zu minimalisieren.
Dazu habe ich diesen code benutzt:
url = 'https://www.footlocker.de/INTERSHOP/web ... ductDetail'
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
containers = soup.find_all('div')[15]
output:
<div 08.01.21="" 09:00","sizevalue":"40","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704075":{"quantitymessage":"dieses="" 09:00","sizevalue":"40.5","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704080":{"quantitymessage":"dieses="" 09:00","sizevalue":"41","quantitywarning":"","quantityoptions":[],"inventorylevel":"yellow"},"314102895704085":{"quantitymessage":"dieses="" 09:00","sizevalue":"42","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704090":{"quantitymessage":"dieses="" 09:00","sizevalue":"42.5","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704095":{"quantitymessage":"dieses="" 09:00","sizevalue":"43","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704100":{"quantitymessage":"dieses="" 09:00","sizevalue":"44","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704105":{"quantitymessage":"dieses="" 09:00","sizevalue":"44.5","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704110":{"quantitymessage":"dieses="" 09:00","sizevalue":"45","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704120":{"quantitymessage":"dieses="" 09:00","sizevalue":"46","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704130":{"quantitymessage":"dieses="" 09:00","sizevalue":"47.5","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"}}'\ndata-ajaxcontent='\"product-variation-314102895704\"' \ndata-ajaxcontent-source='\"product-variation-314102895704\"' ab="" erhältlich="" ist="" produkt="" style="\"display:none;\"\ndata-product-variation-info=\"314102895704\"\ndata-product-variation-info-json='{"314102895704070":{"quantityMessage":"Dieses"></div>
Nun wenn man den string """ mit einem " ersetzen würde sieht man dass das ein json text ist. Deshalb wollte ich diesen string mit einem " ersetzen und den text als json zu lesen und dann weiter zu arbeiten. Nun sobald ich probiere mit regex oder replace dies zu machen gibt er mir errors oder ein leeres [ ] heraus.
Ich habe gemerkt wenn ich am anfang und am ende drei mal diese Zeichen " einsetzte (Beispielt: """ Der gewünschte text """) dann ist es mir möglich mit regex oder replace dies zu ersetzen welches ich aber so im moment nicht machen kann.
Hätte da jemand eine Idee oder kann mir helfen da weiter zu arbeiten?
Vielen Dank!
Ich bedanke mich schon mal für die Hilfe von euch.
Ich bin gerade dran python zu lernen und wollte paar infos von einer website scrapen.
Und zwar dieser:
https://www.footlocker.de/INTERSHOP/web ... ductDetail
Ich habe mit beautiful soup versucht den Code bis zu meinem nutzen zu minimalisieren.
Dazu habe ich diesen code benutzt:
url = 'https://www.footlocker.de/INTERSHOP/web ... ductDetail'
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
containers = soup.find_all('div')[15]
output:
<div 08.01.21="" 09:00","sizevalue":"40","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704075":{"quantitymessage":"dieses="" 09:00","sizevalue":"40.5","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704080":{"quantitymessage":"dieses="" 09:00","sizevalue":"41","quantitywarning":"","quantityoptions":[],"inventorylevel":"yellow"},"314102895704085":{"quantitymessage":"dieses="" 09:00","sizevalue":"42","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704090":{"quantitymessage":"dieses="" 09:00","sizevalue":"42.5","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704095":{"quantitymessage":"dieses="" 09:00","sizevalue":"43","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704100":{"quantitymessage":"dieses="" 09:00","sizevalue":"44","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704105":{"quantitymessage":"dieses="" 09:00","sizevalue":"44.5","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704110":{"quantitymessage":"dieses="" 09:00","sizevalue":"45","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704120":{"quantitymessage":"dieses="" 09:00","sizevalue":"46","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"},"314102895704130":{"quantitymessage":"dieses="" 09:00","sizevalue":"47.5","quantitywarning":"","quantityoptions":[],"inventorylevel":"green"}}'\ndata-ajaxcontent='\"product-variation-314102895704\"' \ndata-ajaxcontent-source='\"product-variation-314102895704\"' ab="" erhältlich="" ist="" produkt="" style="\"display:none;\"\ndata-product-variation-info=\"314102895704\"\ndata-product-variation-info-json='{"314102895704070":{"quantityMessage":"Dieses"></div>
Nun wenn man den string """ mit einem " ersetzen würde sieht man dass das ein json text ist. Deshalb wollte ich diesen string mit einem " ersetzen und den text als json zu lesen und dann weiter zu arbeiten. Nun sobald ich probiere mit regex oder replace dies zu machen gibt er mir errors oder ein leeres [ ] heraus.
Ich habe gemerkt wenn ich am anfang und am ende drei mal diese Zeichen " einsetzte (Beispielt: """ Der gewünschte text """) dann ist es mir möglich mit regex oder replace dies zu ersetzen welches ich aber so im moment nicht machen kann.
Hätte da jemand eine Idee oder kann mir helfen da weiter zu arbeiten?
Vielen Dank!