Seite 1 von 1

Falsche Formatierung beim scrappen

Verfasst: Samstag 5. September 2020, 10:30
von nexuz89
Hi zusammen

Ich hab da ein kleines Problem das ich leider zu spät bemerkt habe. Ich habe eine Homepage ausgelesen.
und habe eine Falsche Formatierung ausgespuckt bekommen die ich leider so nicht gebrauchen kann.


Ausgespuckte datei in Exel:

(1,2,3) sind die Exel Tabellen/Zeilen


(1)2,BALDRIPARAN Zur Beruhigung überzogene Tabletten,`1 Pack,,"27,69",Tabletten & Kapseln,https://www.apo-rot.de/details/baldripa ... ttel,"<img alt=""BALDRIPARAN Zur Beruhigung überzogene Tabletten"" class=""img-responsive"" name=""/mproducts.own/baldriparan-zur-beruhigung-ueberzogene-tabletten-120-st.png"" src=""https://bilder.apo-rot.de/mproducts.own ... 120-st.png"" title=""BALDRIPARAN Zur Beruhigung überzogene Tabletten"">

(2)<span class=""glyphicon glyphicon-zoom-in icon-grey float-right"" style=""font-size:1.25rem

(3)</img>",10124803



Gewünschte Formatierung:

(1) 2,BALDRIPARAN Zur Beruhigung überzogene Tabletten,`1 Pack,,"27,69",Tabletten & Kapseln,https://www.apo-rot.de/details/baldripa ... hlafmittel, https://bilder.apo-rot.de/mproducts.own ... 120-st.png,
10124803

sind leider über 100.000 tausend daten also die Option den Python Code umzuschreiben und nochmal neu zuscrappen kommt nicht in frage.

Wäre echt um eine Hilfe sehr dankbar.

Vielen dank schon mal im Voraus.

Re: Falsche Formatierung beim scrappen

Verfasst: Samstag 5. September 2020, 12:49
von pillmuncher
Was du hast scheint HTML zu sein. Da musst du halt deine Daten rauslesen und in dem Format abspeichern, das du haben willst. Schau dir mal BeautifulSoup an.