Seite 1 von 1

grab json von webside

Verfasst: Montag 23. Mai 2022, 01:56
von Ernie1412

Code: Alles auswählen

script id="__NEXT_DATA__" type="application/json">{"props":{"pageProps":{"structur .... usw.
sieht es am ende der seitenquelltext aus.
wie kann ich die json datei downloaden, grabben ?
im browser ist die ja auch zu finden unter Netzwerkanalyse.
wie kann ich evtl mittels selenium die json datei downloaden ?

Re: grab json von webside

Verfasst: Montag 23. Mai 2022, 02:19
von __blackjack__
@Ernie1412: Man hat ein HTML-Element mit einer ID, wo ist das Problem?

Re: grab json von webside

Verfasst: Montag 23. Mai 2022, 02:34
von Ernie1412
ich weiss nicht wie man es runterladet. ich hab einiges im netz gefunden aber nichts funktionierte
info=driver.find_element_by_xpath("//script[@type='application/json']")
und dann ... ?

Re: grab json von webside

Verfasst: Montag 23. Mai 2022, 06:11
von sparrow
Welchen Wert hat denn dann "info"?
Wobei man über die immer eindeutige ID wohl einfacher an den Tag kommt.

Re: grab json von webside

Verfasst: Montag 23. Mai 2022, 20:06
von Ernie1412
info is None als ergebnis
bei xpather.com im test erhalte ich die json daten.
gibts sowas wie Info.json ?
da meckert er selbstverständlich auch weils ein object ist kein text

Re: grab json von webside

Verfasst: Montag 23. Mai 2022, 20:12
von sparrow
Dann wird es Zeit, etwas mehr als Häppchen zu zeigen.
Wie sieht der Tag in der Webseite aus?
Wie rufst du die Seite auf, etc.

Ich habe auch keine Ahnung, was du mit "Info.json" meinst.

Re: grab json von webside

Verfasst: Montag 23. Mai 2022, 21:13
von Ernie1412

Code: Alles auswählen

....    </main><div class="LazyFooter__LoadingFooter-sc-1exrclf-0 iXjJWh"></div></div><script id="__NEXT_DATA__" type="application/json">{"props":{"pageProps":{"structuredData":{"@type":"VideoObject","name":"Wild .... usw.
aufrufe:

Code: Alles auswählen

driver = webdriver.Chrome(r"E:\Python\Python3-9-13\Lib\site-packages\selenium\webdriver\chrome\chromedriver.exe",options=options)
        driver.get(Url)
        info=driver.find_element_by_xpath("//script[@type='application/json']")
bzw.

Code: Alles auswählen

info=driver.find_element_by_xpath("//script[@id='__NEXT_DATA__']")
print(info.text)
Ausgabe: "nichts" also ""
print(info.json)
Error: "webelement hat kein text"

wie kriege ich die daten als json datei die hinter den .../json"> steht ?