Regex mit Tabs und Zeilenumbrüchen
Verfasst: Montag 15. Dezember 2008, 00:34
Hallo meine Lieben,
ich habe mal wieder ein Regular-Expressions Problem
Ich versuche eine HTML Seite zu parsen, im Detail die Passage: "Langer Text" WIe man sieht beinhaltet die HTML Seite viele Tabs und Zeilenumbrüche und ich ich bekomme es irgendwie nicht hin den Text daraus zu parsen
Bedingungen für die Regex
Start: <li class="c5b"><h2>
Ende:</a></li>
Ausgabe: "Langer Text"
Hoffe mal wieder auf eure Hilfe
Danke schon mal
D
PS: Hatte erst versucht die HTMLSeite komplett von Tabs und LineFeeds zu befreien, was der Performance allerdings einen sehr großen Abbruch getan hat (immens lange HTML Seite, aus der ich mehrer Elemente per Regex hole)
ich habe mal wieder ein Regular-Expressions Problem

Ich versuche eine HTML Seite zu parsen, im Detail die Passage: "Langer Text" WIe man sieht beinhaltet die HTML Seite viele Tabs und Zeilenumbrüche und ich ich bekomme es irgendwie nicht hin den Text daraus zu parsen

Code: Alles auswählen
<li class="c5b"><h2><span class="orange_dfett">|</span> KURZINHALT</h2></li>
<li class="c1">Langer Text </li>
<li class="c1 rechts"><img src="/image/pfeile/orange_klein.gif" alt="" height="6" width="3" border="0"/>
<a href="URL">mehr</a></li>
Start: <li class="c5b"><h2>
Ende:</a></li>
Ausgabe: "Langer Text"
Hoffe mal wieder auf eure Hilfe

Danke schon mal
D
PS: Hatte erst versucht die HTMLSeite komplett von Tabs und LineFeeds zu befreien, was der Performance allerdings einen sehr großen Abbruch getan hat (immens lange HTML Seite, aus der ich mehrer Elemente per Regex hole)