Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
ich habe in einem String eine beliebige Webseite eingelesen und möchte daraus nun die Ergebnisse filtern. In dem Fall alle enthaltenen Links extrahieren. Ich mache das mit:
Olliminatore hat geschrieben:Vieleicht weil manche Seiten mit ".htm" enden!?
Das wird erkannt. re matched auf alle Strings mit html inklusive htm. Es gibt eher Schwierigkeiten mit den Seiten die keine Endung haben oder in href eingebetet sind.
Wenn man mal fragen darf...
Wozu brauch man soetwas?
Ich hab von regexp nicht so die Ahung, aber wieso verzichtest du nicht einfach mal auf html und beziehst dich stattdessen auf das href. Denn Links sind doch generell in href="".
Gruß
ello
[i]Losing my passport was the least of my worries,
losing a notebook was a catastrophe[/i]
[b]--Bruce Chatwin[/b]