Hi,
Ich habe hier ein kleines Tool mit GUI (wxPython) das word Dokumente als Input bekommt und diese dann auf bestimmte Sachen, wie Formatvorlagen usw. prüft. Nun haben die user ständig Probleme mit Word bzw mit der COM-Schnittstelle die total random sind und auch nur bei manchen, manchmal auftreten.
Nun habe ich mir den HTML output von Word angesehen und glaube das ich den auch locker für die Überprüfungen verwenden kann. Ich muss also jetzt automatisiert, ohne die COM-Schnittstelle bzw pywin32 worddokumente nach html konvertieren.
Es handelt sich um Word 2007 und 2010.
Vorschläge ?
MSWord - oh joy -.-
@patmaster Pech.
Es gibt keine Python-Bibliothek, die DOC verarbeiten kann. Es gibt überhaupt nur eine einzige Bibliothek, die DOC ohne Office lesen und schreiben kann, die Java-Bibliothek Apache POI. Die ließe sich aus Python heraus mit Py4J oder Jython verwenden, wobei letzteres eine alternative Python-Implementierung ist, in welcher Du wiederum auf Wx verzichten musst. Wenn Du keine Eile hast, und von Deinem Arbeitgeber gut bezahlt wirst, kannst Du auch versuchen, POI nach Python zu portieren. Die Bibliothek ist frei, gut dokumentiert, und hat irgendwo auch eine recht gute Dokumentation des DOC-Formats.
Es gibt keine Python-Bibliothek, die DOC verarbeiten kann. Es gibt überhaupt nur eine einzige Bibliothek, die DOC ohne Office lesen und schreiben kann, die Java-Bibliothek Apache POI. Die ließe sich aus Python heraus mit Py4J oder Jython verwenden, wobei letzteres eine alternative Python-Implementierung ist, in welcher Du wiederum auf Wx verzichten musst. Wenn Du keine Eile hast, und von Deinem Arbeitgeber gut bezahlt wirst, kannst Du auch versuchen, POI nach Python zu portieren. Die Bibliothek ist frei, gut dokumentiert, und hat irgendwo auch eine recht gute Dokumentation des DOC-Formats.
Keine Eile und gut bezahlt...der war gutlunar hat geschrieben:@patmaster Pech.
Es gibt keine Python-Bibliothek, die DOC verarbeiten kann. Es gibt überhaupt nur eine einzige Bibliothek, die DOC ohne Office lesen und schreiben kann, die Java-Bibliothek Apache POI. Die ließe sich aus Python heraus mit Py4J oder Jython verwenden, wobei letzteres eine alternative Python-Implementierung ist, in welcher Du wiederum auf Wx verzichten musst. Wenn Du keine Eile hast, und von Deinem Arbeitgeber gut bezahlt wirst, kannst Du auch versuchen, POI nach Python zu portieren. Die Bibliothek ist frei, gut dokumentiert, und hat irgendwo auch eine recht gute Dokumentation des DOC-Formats.
Hmm....evtl. such ich mir ein tool, das ich dann einfach per Systemcall öffne.
Gute Idee oder Pfusch ?
@patmaster Wenn es denn ein solches Tool gibt, dass ohne Microsoft Office oder LibreOffice funktioniert…