Hallo zusammen,
ich benutze erst seit einer kurzen Zeit Python für ein Uni-Projekt und bin daher nicht ganz in der Materie drin und würde gerne wissen, ob folgendes möglich ist.
Ich würde gerne aus einem Geschäftsbericht bzw. Jahresabschluss eines Unternehmens die Bilanz entfernen, sodass ich nur noch den reinen Text zur Verfügung stehen habe, da ich mit diesem weiter arbeiten muss. Diesen Vorgang muss ich für ca. 800 Abschlüsse machen, sodass die manuelle Bearbeitung zu viel Zeit beanspruchen würde. Die Abschlüsse stehen mir sowohl als PDF- sowie Text-Datei zur Verfügung.
Würde mich über eure Antworten freuen.
LG,
Yas
Löschen einer Bilanz aus einem Jahresabschluss/Geschäftsbericht
Vielleicht. Vielleicht auch nicht. Ohne mehrere solcher Texte zu sehen kann man nicht beurteilen, ob es ein ausreichend gut definiertes Kriterium gibt, anhand dessen man das ausfiltern kann. Wenn ist es einfacher mit Text als mit PDF.
@Yas25: Du brauchst ein Kriterium, anhand dessen die gewünschten Zeilen ausfiltern kannst. Das kann anhand von Überschriften, oder sonstigen eindeutigen Kennzeichen passieren, falls diese existieren. Falls es soetwas nicht gibt, kann man einen Filter auch deutlich komplizierter programmieren. Ob es letztendlich mehr oder weniger Aufwand ist, als das händisch zu machen, kommt auf die Texte und Dein Können/Willen an.
Ohne mehr Informationen läßt sich auch nicht mehr helfen.
Ohne mehr Informationen läßt sich auch nicht mehr helfen.