3. Nov 2008, 14:15
Lucene ist eine Open-Source-Java-Bibliothek zum Erzeugen und Durchsuchen von Text-Indizes. Mit ihrer Hilfe lassen sich Volltextsuchen für beliebige Textinhalte implementieren. Lucene wurde auf viele Programmiersprachen portiert, darunter Perl, C#, C++, Python, Ruby und PHP. Lucene ist Teil des Apache Software Foundation-Projekts.
Die Bibliothek setzt sich aus zwei Hauptbestandteilen zusammen:
- Eine Komponente erzeugt den Index, wobei diesem beliebige Textdokumente hinzugefügt werden.
- Eine Query Engine durchsucht diesen Index.
Neben diesen grundlegenden Eigenschaften verfügt Lucene über eine reichhaltige Auswahl zusätzlicher Funktionen und Tools, welche durch die Open-Source-Community aktiv weiterentwickelt werden.
Durch die hohe Performanz und Skalierbarkeit kann Lucene für beliebige Projektgrößen und Anforderungen eingesetzt werden.
[Bearbeiten] Projekte, die Lucene einsetzen
[Bearbeiten] Software, die Lucene einsetzt
- Intrexx Xtreme, eine Standard-Software zur Erstellung von Enterprise-Portalen und Webapplikationen, nutzt Lucene für die Volltextsuche in Datensätzen und Dateien.
- das Desktop-Suchprogramm Beagle benutzt eine Übersetzung von Lucene nach C#, welche DotLucene genannt wird, als Indexer.
- das Desktop-Suchprogramm Strigi benutzt eine C++-Portierung namens CLucene
- Nutch ist eine vollständige Suchmaschine, welche Lucene verwendet.
- Red-Piranha ist eine weitere auf Lucene basierende Suchmaschine. Sie ist sofort einsetzbar und über eine grafische Benutzeroberfläche, per Kommandozeile oder als Tomcat-Web-Applikation verfügbar. Zudem besitzt sie die Fähigkeit zu "lernen", wonach der Benutzer sucht.
- regain gibt es in zwei Versionen: die Desktop-Suche und die Server-Suche.
- GLScube bzw. GLS³, ein semantisches Dateisystem, nutzt eine C++-Konversion von Lucene für die Indexierung.
- WebGate Anywhere ist ein Content-Management-System der Firma Innovationgate, das Lucene als Indexer benutzt.
- IES2, der CMS-Server von Sitepark generiert Lucene-Indices, die unter anderem von Lösungen für kommunale Callcenter (siehe auch Einheitliche Behördenrufnummer) ausgelesen werden.
- DataObjects.NET ist ein Object-Relational-Mapping-Framework der Firma X-Tensive, das Lucene als Volltextsuchmaschine benutzt.
- Scalix ist eine E-Mail Collaboration Suite mit Weboberfläche unter Tomcat und seit Version 11 Lucene als Suchmaschine verwendet
- Nuxeo EP ist ein Enterprise Content Management System das Lucene als Indexer benutzt.
- ScandioLucene ist eine Suchmaschinen-Implementierung auf der Basis von Apache Lucene bestehend aus IndexServer, SearchServer und diversen ClientBibliotheken
- panFMP ist ein Framework für die Erstellung von Metadaten-Portalen. Lucene wird für die Suche in geharvesteten Metadaten verwendet. panFMP wurde besonders für Geodateninfrastrukturen entwickelt, weshalb Lucene durch besonders performante Trie-basierte Range-Queries erweitert wurde.
- Apache Jackrabbit ist die Referenzimplementierung des Java Content Repository (Java Specification Request 170)
- OSS/32 ist Objekt Orientiertes Dokument Management System der Firma UniCom die eine Lucene.NET Anbindung zwecks Volltextsuche implementiert hat
- Zend Framework ist ein MVC Framework für PHP welches mit Zend_Search_Lucene eine Klasse zur Implementierung der Lucene-Suche bietet.