Den Text eines html anchor tag extrahieren
Verfasst: Montag 10. Juli 2017, 20:27
Hallo,
aus einer Psi Probe Site möchte ich gerne sie Sessions auslesen oder anders ausgedrückt, aus einem html Ancor Tag den Text extrahieren.
Ich habe es mit BeautifulSoup4 versucht. Aber mit .get_text() komme ich nicht weiter.
Wie würde denn ne gute Lösung meines Problems aussehen?
aus einer Psi Probe Site möchte ich gerne sie Sessions auslesen oder anders ausgedrückt, aus einem html Ancor Tag den Text extrahieren.
Ich habe es mit BeautifulSoup4 versucht. Aber mit .get_text() komme ich nicht weiter.
Wie würde denn ne gute Lösung meines Problems aussehen?
Code: Alles auswählen
from bs4 import BeautifulSoup as bs
# Ausschnitt des Psi Probe Quelltextes
probe = '''
<td>
<a href="/probe/servlets.htm?webapp=%2fserver">
200052
</a>
</td>
<td>
<a href="/probe/sessions.htm?webapp=%2fserver&size=">
149
</a>
</td>
<td>3620</td>
<td>
<a href="/probe/appattributes.htm?webapp=%2fserver">
49
</a>
</td>
'''
soup = bs(probe, 'html.parser')
links = soup.find_all("a", class_="")
print(links)