Die Suche ergab 4 Treffer

von Accounting_Research
Mittwoch 19. November 2014, 01:35
Forum: Allgemeine Fragen
Thema: Data Scraping von PDF
Antworten: 10
Zugriffe: 3010

Re: Data Scraping von PDF

Vielen Dank für deine Unterstützung. Am besten ich teste das ganze mal... Allerdings habe ich noch Bedenken was die Laufzeit angeht. Hast du eine Idee, wie ich die in etwa schätzen kann (3-5 keywords bzw. Wortgruppen, 300 PDF Dateien a ca. 500 Seiten bzw. ca. 60 Seiten gekürzt)
von Accounting_Research
Mittwoch 19. November 2014, 01:21
Forum: Allgemeine Fragen
Thema: Data Scraping von PDF
Antworten: 10
Zugriffe: 3010

Re: Data Scraping von PDF

@BlackJack: möchtest du mir damit sagen, dass mein Plan durchaus größere Probleme bereithält? Ich hatte gehofft, dass es recht simpel sein würde eine solche Routine zu erstellen. Ich möchte ja nicht mehr, als eine Übersicht wie häufig gewisse "Keywords" in einer umfangreichen Sammlung von PDF ...
von Accounting_Research
Mittwoch 19. November 2014, 00:51
Forum: Allgemeine Fragen
Thema: Data Scraping von PDF
Antworten: 10
Zugriffe: 3010

Re: Data Scraping von PDF

Vielen Dank für dein Feedback. Mein Gedankengang war der, dass eine Suche in der PDF "in live" weniger Zeit braucht als wenn man zuerst die PDF komplett in Text umwandeln lässt. Das könnte zudem problematisch sein, weil die zu untersuchenden PDF Dateien komplexe Dokumente (Geschäftsberichte von ...
von Accounting_Research
Dienstag 18. November 2014, 17:50
Forum: Allgemeine Fragen
Thema: Data Scraping von PDF
Antworten: 10
Zugriffe: 3010

Data Scraping von PDF

Hallo Community,

z. Z. sitze ich an einer kleinen Projektidee und hoffe ich kann hier von den Erfahrungen einiger User profitieren. Zur Idee:

Ich möchte aus einer großen Menge PDF Dateien diejenigen herausfiltern, die eine nähere Betrachtung erfordern. Dazu sollen die PDF-Dateien mit einer ...