vorab möchte ich mich bei allen beteiligten Bedanken, die hier eine Anlaufstelle für Fragen und Probleme bieten. Ebenso natürlich auch den Leuten die sich hier Tag täglich an den Diskussionen beteiligen.
Zu meinem Problem: Ich habe einen Code geschrieben, der sich einen bestimmten Entry eines RSS Feeds besorgt und in einem String für die Weiterverarbeitung speichert. Jedoch sind die Umlaute und Zeichen in dem RSS Feed sehr ungünstig.
So sieht aktuell ein String aus:
Code: Alles auswählen
Heute vor 155 Jahren  a; Mit der Emanzipations­proklamation erklärt die Regierung Abraham Lincolns die Abschaffung der Sklaverei in den Süd­staaten – ein entscheidender Schritt zur voll­ständigen Beendigung der Sklaverei in den USA.
Code: Alles auswählen
Heute vor 155 Jahren – Mit der Emanzipationsproklamation erklärt die Regierung Abraham Lincolns die Abschaffung der Sklaverei in den Südstaaten – ein entscheidender Schritt zur vollständigen Beendigung der Sklaverei in den USA.
Daher habe ich mit folgendem Code versucht, die Codes durch die Umlaute und Zeichen zu ersetzen.
Code: Alles auswählen
import re
text = <RSSFEED>
wordDic = {
'­' : '', #Zeichen wird durch nichts ersetzt
' ' : '', #Zeichen wird durch nichts ersetzt
}
str2 = multiwordReplace(text, wordDic)
print (str2)
Folglich wirft der Code Fehler da für Python in den beiden Zeilen nur '& existiert.
Leider reichen meine Kenntnisse nicht um das zu beheben. Könnt ihr mir eventuell über die Schultern schauen?
Viele Grüße und ein schönes Wochende euch