Indexer
Verfasst: Mittwoch 19. September 2007, 20:20
Hallo!
Da ich in naher Zukunft vermutlich vor dem Problem stehen werde, Datenbestände zu durchsuchen habe ich etwas im Internet geschaut und Lucene gefunden, was wohl der populärste Indexer bei Ohloh ist. Da es in Java geschrieben ist scheitet es mehr oder weniger aus, jedoch gibt es mit Lucy einen C und mit Clucene einen C++-Port (und einen toten C-Port namens Lucene4c).
Dann habe ich noch Hyper Estraier, den Nachfolger von Estraier dem Nachfolger von Snatcher gefunden. Der ist wohl in C oder C++ geschrieben und hat mit hyperestraier und estraiernative gleich zwei Python-Bindings. Die Railser scheinen ihn gegenüber Lucene stark zu bevorzugen, was man als Orientierung nehmen kann.
Zuletzt bin ich durch Pocoo auf das in C++ geschriebene Xapian aufmerksam geworden, welches ein SWIG-Binding hat und ein abgestorbenen Wrapper, Xapwrap drumrum.
Hat jemand Erfahrung mit der Software und kann die Vor- und Nachteile beleuchten?
Da ich in naher Zukunft vermutlich vor dem Problem stehen werde, Datenbestände zu durchsuchen habe ich etwas im Internet geschaut und Lucene gefunden, was wohl der populärste Indexer bei Ohloh ist. Da es in Java geschrieben ist scheitet es mehr oder weniger aus, jedoch gibt es mit Lucy einen C und mit Clucene einen C++-Port (und einen toten C-Port namens Lucene4c).
Dann habe ich noch Hyper Estraier, den Nachfolger von Estraier dem Nachfolger von Snatcher gefunden. Der ist wohl in C oder C++ geschrieben und hat mit hyperestraier und estraiernative gleich zwei Python-Bindings. Die Railser scheinen ihn gegenüber Lucene stark zu bevorzugen, was man als Orientierung nehmen kann.
Zuletzt bin ich durch Pocoo auf das in C++ geschriebene Xapian aufmerksam geworden, welches ein SWIG-Binding hat und ein abgestorbenen Wrapper, Xapwrap drumrum.
Hat jemand Erfahrung mit der Software und kann die Vor- und Nachteile beleuchten?