Seite 1 von 1
grab json von webside
Verfasst: Montag 23. Mai 2022, 01:56
von Ernie1412
Code: Alles auswählen
script id="__NEXT_DATA__" type="application/json">{"props":{"pageProps":{"structur .... usw.
sieht es am ende der seitenquelltext aus.
wie kann ich die json datei downloaden, grabben ?
im browser ist die ja auch zu finden unter Netzwerkanalyse.
wie kann ich evtl mittels selenium die json datei downloaden ?
Re: grab json von webside
Verfasst: Montag 23. Mai 2022, 02:19
von __blackjack__
@Ernie1412: Man hat ein HTML-Element mit einer ID, wo ist das Problem?
Re: grab json von webside
Verfasst: Montag 23. Mai 2022, 02:34
von Ernie1412
ich weiss nicht wie man es runterladet. ich hab einiges im netz gefunden aber nichts funktionierte
info=driver.find_element_by_xpath("//script[@type='application/json']")
und dann ... ?
Re: grab json von webside
Verfasst: Montag 23. Mai 2022, 06:11
von sparrow
Welchen Wert hat denn dann "info"?
Wobei man über die immer eindeutige ID wohl einfacher an den Tag kommt.
Re: grab json von webside
Verfasst: Montag 23. Mai 2022, 20:06
von Ernie1412
info is None als ergebnis
bei xpather.com im test erhalte ich die json daten.
gibts sowas wie Info.json ?
da meckert er selbstverständlich auch weils ein object ist kein text
Re: grab json von webside
Verfasst: Montag 23. Mai 2022, 20:12
von sparrow
Dann wird es Zeit, etwas mehr als Häppchen zu zeigen.
Wie sieht der Tag in der Webseite aus?
Wie rufst du die Seite auf, etc.
Ich habe auch keine Ahnung, was du mit "Info.json" meinst.
Re: grab json von webside
Verfasst: Montag 23. Mai 2022, 21:13
von Ernie1412
Code: Alles auswählen
.... </main><div class="LazyFooter__LoadingFooter-sc-1exrclf-0 iXjJWh"></div></div><script id="__NEXT_DATA__" type="application/json">{"props":{"pageProps":{"structuredData":{"@type":"VideoObject","name":"Wild .... usw.
aufrufe:
Code: Alles auswählen
driver = webdriver.Chrome(r"E:\Python\Python3-9-13\Lib\site-packages\selenium\webdriver\chrome\chromedriver.exe",options=options)
driver.get(Url)
info=driver.find_element_by_xpath("//script[@type='application/json']")
bzw.
Code: Alles auswählen
info=driver.find_element_by_xpath("//script[@id='__NEXT_DATA__']")
print(info.text)
Ausgabe: "nichts" also ""
print(info.json)
Error: "webelement hat kein text"
wie kriege ich die daten als json datei die hinter den .../json"> steht ?