Word-Dokumente einlesen

Alles, was nicht direkt mit Python-Problemen zu tun hat. Dies ist auch der perfekte Platz für Jobangebote.
Barcellona
User
Beiträge: 74
Registriert: Dienstag 25. Mai 2010, 12:10

Ok, danke!
Benutzeravatar
Hyperion
Moderator
Beiträge: 7478
Registriert: Freitag 4. August 2006, 14:56
Wohnort: Hamburg
Kontaktdaten:

Barcellona hat geschrieben:Vielen Dank für das Beispiel! :D

Klappt wunderbar, verstehe nur nicht alles im Code.
Du willst Dich in diesem Zusammenhang doch dringend mit einem XML-Parser auseinandersetzen! ;-) Ich hatte Dir ja lxml genannt; das Modul ist zwar nicht in der Standard-Lib bietet aber einige hilfreiche Sachen, die der reine ElementTree-Parser aus der Standard-Lib nicht kann. Letzterer wäre aber imho das "Minimum", was man hier einsetzen sollte.

Solche stumpfes "Suchen & Ersetzen" wird nur bei kleinsten Dingen sinnvoll anzuwenden sein - und dafür könnte man dann die Benutzung von ODT in Frage stellen ;-)
encoding_kapiert = all(verstehen(lesen(info)) for info in (Leonidas Folien, Blog, Folien & Text inkl. Python3, utf-8 everywhere))
assert encoding_kapiert
Antworten