Registrieren Passwort vergessen?

Lucene

3. Nov 2008, 14:15
Lucene
Lucene logo
Basisdaten
Entwickler: Apache Software Foundation
Aktuelle Version: 2.4.0
(8. Oktober 2008)
Betriebssystem: Cross-platform
Kategorie: Such und Index API.
Lizenz: Apache Software License
Deutschsprachig: Nein
lucene.apache.org

Lucene ist eine Open-Source-Java-Bibliothek zum Erzeugen und Durchsuchen von Text-Indizes. Mit ihrer Hilfe lassen sich Volltextsuchen für beliebige Textinhalte implementieren. Lucene wurde auf viele Programmiersprachen portiert, darunter Perl, C#, C++, Python, Ruby und PHP. Lucene ist Teil des Apache Software Foundation-Projekts.

Die Bibliothek setzt sich aus zwei Hauptbestandteilen zusammen:

  1. Eine Komponente erzeugt den Index, wobei diesem beliebige Textdokumente hinzugefügt werden.
  2. Eine Query Engine durchsucht diesen Index.

Neben diesen grundlegenden Eigenschaften verfügt Lucene über eine reichhaltige Auswahl zusätzlicher Funktionen und Tools, welche durch die Open-Source-Community aktiv weiterentwickelt werden.

Durch die hohe Performanz und Skalierbarkeit kann Lucene für beliebige Projektgrößen und Anforderungen eingesetzt werden.

[Bearbeiten] Projekte, die Lucene einsetzen

[Bearbeiten] Software, die Lucene einsetzt

  • Intrexx Xtreme, eine Standard-Software zur Erstellung von Enterprise-Portalen und Webapplikationen, nutzt Lucene für die Volltextsuche in Datensätzen und Dateien.
  • das Desktop-Suchprogramm Beagle benutzt eine Übersetzung von Lucene nach C#, welche DotLucene genannt wird, als Indexer.
  • das Desktop-Suchprogramm Strigi benutzt eine C++-Portierung namens CLucene
  • Nutch ist eine vollständige Suchmaschine, welche Lucene verwendet.
  • Red-Piranha ist eine weitere auf Lucene basierende Suchmaschine. Sie ist sofort einsetzbar und über eine grafische Benutzeroberfläche, per Kommandozeile oder als Tomcat-Web-Applikation verfügbar. Zudem besitzt sie die Fähigkeit zu "lernen", wonach der Benutzer sucht.
  • regain gibt es in zwei Versionen: die Desktop-Suche und die Server-Suche.
  • GLScube bzw. GLS³, ein semantisches Dateisystem, nutzt eine C++-Konversion von Lucene für die Indexierung.
  • WebGate Anywhere ist ein Content-Management-System der Firma Innovationgate, das Lucene als Indexer benutzt.
  • IES2, der CMS-Server von Sitepark generiert Lucene-Indices, die unter anderem von Lösungen für kommunale Callcenter (siehe auch Einheitliche Behördenrufnummer) ausgelesen werden.
  • DataObjects.NET ist ein Object-Relational-Mapping-Framework der Firma X-Tensive, das Lucene als Volltextsuchmaschine benutzt.
  • Scalix ist eine E-Mail Collaboration Suite mit Weboberfläche unter Tomcat und seit Version 11 Lucene als Suchmaschine verwendet
  • Nuxeo EP ist ein Enterprise Content Management System das Lucene als Indexer benutzt.
  • ScandioLucene ist eine Suchmaschinen-Implementierung auf der Basis von Apache Lucene bestehend aus IndexServer, SearchServer und diversen ClientBibliotheken
  • panFMP ist ein Framework für die Erstellung von Metadaten-Portalen. Lucene wird für die Suche in geharvesteten Metadaten verwendet. panFMP wurde besonders für Geodateninfrastrukturen entwickelt, weshalb Lucene durch besonders performante Trie-basierte Range-Queries erweitert wurde.
  • Apache Jackrabbit ist die Referenzimplementierung des Java Content Repository (Java Specification Request 170)
  • OSS/32 ist Objekt Orientiertes Dokument Management System der Firma UniCom die eine Lucene.NET Anbindung zwecks Volltextsuche implementiert hat
  • Zend Framework ist ein MVC Framework für PHP welches mit Zend_Search_Lucene eine Klasse zur Implementierung der Lucene-Suche bietet.

[Bearbeiten] Weblinks

Dieser Artikel ist eine Kopie aus der freien Enzyklopädie Wikipedia. Am Originalartikel kann jeder Korrekturen und Ergänzungen vornehmen. Zudem kann man frühere Versionen einsehen.
In Kooperation mit Lycos Europe Network