aus einer Psi Probe Site möchte ich gerne sie Sessions auslesen oder anders ausgedrückt, aus einem html Ancor Tag den Text extrahieren.
Ich habe es mit BeautifulSoup4 versucht. Aber mit .get_text() komme ich nicht weiter.
Wie würde denn ne gute Lösung meines Problems aussehen?
Code: Alles auswählen
from bs4 import BeautifulSoup as bs
# Ausschnitt des Psi Probe Quelltextes
probe = '''
<td>
<a href="/probe/servlets.htm?webapp=%2fserver">
200052
</a>
</td>
<td>
<a href="/probe/sessions.htm?webapp=%2fserver&size=">
149
</a>
</td>
<td>3620</td>
<td>
<a href="/probe/appattributes.htm?webapp=%2fserver">
49
</a>
</td>
'''
soup = bs(probe, 'html.parser')
links = soup.find_all("a", class_="")
print(links)