déc 11 2007

Présentation de Apache Lucene

Tag: Architecture, Développement, Idéeskarl verger @ 21:59

Présentation

Dans de nombreux systèmes d’informations, le SGBDR est utilisée comme moteur de recherche grâce à ses fonctions d’indexation. Cependant, cette technologie n’est pas à l’aise dès qu’il s’agit de faire des recherches partielles (un mot dans un titre), ses performances chutent et doivent être compensées par du matériel plus puissant. De plus, les possibilités fonctionnelles des SGBDR en terme de recherche sont très limitées : pas de recherche approximative ou phonétique, ou pas de tri des résultats par pertinence.
 

Lucene est un moteur de recherche Open-Source dont la première version publique en Java date de Mars 2000. Lucene a été originellement développé par Dough Cunning, spécialiste des technologies de recherche textuelle chez Xerox puis Apple. Depuis, Lucene a été developpé et largement adopté comme l’API standard pour les moteurs de recherche textuelle. Il a été porté dans une dizaine de langages et est utilisé dans des centaines de projets commerciaux et de sites web, parmi lesquels :

monster.fr
societe.com
wikipedia.com
sourceforge.net
et d’autre….

Lucene est basé sur une technologie d’indexation des contenus textuels similaire à Google ou d’autres moteurs de recherche. D’ailleurs, un sous-projet de Lucene, Nutch, offre les fonctionnalités de Google et permet de faire de la recherche sur des millions de pages web.

Lucene offre des performances inégalées et est scalable quelle que soit la volumétrie en terme de contenu ou de nombre de recherches. Lucene offre de nombreuses possibilités que l’on vas survoler ci-dessous :

Continue reading “Présentation de Apache Lucene”