unbekannten Text in einer eMail finden
Verfasst: Samstag 5. Januar 2019, 18:14
Guten Abend,
zuerst wünsche ich ein gesundes neues Jahr und hoffe, dass Ihr alle eine guten Start in 2019 hattet!
Ich schreibe gerade an einem Programm, welches regelmäßig in einen Mail-Account per imap einwählt und eine Mail von einem bestimmten Absender sucht.
Das Programm sucht dann in der Mail nach einem bestimmten Stichwort. Wenn es dieses findet kopiert es das Wort plus eine ganze Zeile mit Zeichen in einen String. Am Ende der Zeile stehen dann ein paar Wörter, die ich mir herauskopieren will. Es kommt einzig auf diese an. Das erste Stichwort ist nur um die Textstelle in der eMail zu finden. Die Wörter, am Ende dieser Textstelle können aber varierien, so dass die Suche so wie eben beschrieben durchführen muss. Zwischen dem Suchwort und den "Nutz"-Wörtern stehen einige html-Tags. Diese würde ich gerne verwerfen.
Bisher suche ich nach regulären Ausdrücken.
Das funktioniert bisher recht gut. Das Ergebnis lasse ich mir probeweise ausdrucken:
Nun zu meinem Problem: Ich will die Tags sowie die Steuerzeichen verwerfen um nur den Text - in diesem Fall brk - Brand klein zu behalten. Ich hab dazu mit strip und split experimentiert. Aber eine gescheite Lösung bekomme ich bisher nicht hin. Vielleicht sehe ich auch den Wald vor lauter Bäumen nicht.
Ich hoffe auf einen Denkanstoß und bedanke mich schon an dieser Stelle
Viele Grüße, René
zuerst wünsche ich ein gesundes neues Jahr und hoffe, dass Ihr alle eine guten Start in 2019 hattet!
Ich schreibe gerade an einem Programm, welches regelmäßig in einen Mail-Account per imap einwählt und eine Mail von einem bestimmten Absender sucht.
Das Programm sucht dann in der Mail nach einem bestimmten Stichwort. Wenn es dieses findet kopiert es das Wort plus eine ganze Zeile mit Zeichen in einen String. Am Ende der Zeile stehen dann ein paar Wörter, die ich mir herauskopieren will. Es kommt einzig auf diese an. Das erste Stichwort ist nur um die Textstelle in der eMail zu finden. Die Wörter, am Ende dieser Textstelle können aber varierien, so dass die Suche so wie eben beschrieben durchführen muss. Zwischen dem Suchwort und den "Nutz"-Wörtern stehen einige html-Tags. Diese würde ich gerne verwerfen.
Bisher suche ich nach regulären Ausdrücken.
Code: Alles auswählen
Einsatzstichwort:\s>/td>.+?<td width="auto" valign="top" align="left" style="?s+?font-familiy:arial;font-size:12pt;color:black;font-weight:bold;word-break:break-all;">.{45}
Code: Alles auswählen
['Einsatzstichwort: </td>\\r\\n <td width="auto" valign="top" align="left" style=" font-family:arial;font-size:12pt;color:black;font-weight:bold;word-break:break-all;">brk\\xc2\\xa0(Brand klein\\xc2\\xa0</td>\\r\\n ']
Ich hoffe auf einen Denkanstoß und bedanke mich schon an dieser Stelle
Viele Grüße, René