Moteur de recherche Archive
Cet article décrit une installation simple et rapide d’un serveur elasticsearch ou plusieurs qui forment un cluster. Le seul pré-requis est de disposer d’une JVM Oracle ou OpenJDK de version 1.7u55 ou > ou 1.8u20 ou > La distribution est …
Solr et elasticsearch sont deux solutions d’indexation et de recherche plein-texte (full-text). Ces outils présentent les mêmes caractéristiques de bases pour répondre aux mêmes besoins. Bien sur, ils se distinguent par certains fonctionnalités et choix technologiques qui font que l’on …
Suite à l’article Solr 4.0 et jointures cross-index, voici ce qu’il en est dans un environnement SolrCloud. Donc, les nouvelles sont plutôt mauvaises. Car, comme l’explique le ticket SOLR-4905, les recherches de type join cross-collection ne sont pas supportées avec …
Afin de s’initier à SolrCloud ou disposer d’un environnement minimal de test la meilleur solution est d’utiliser Jetty et le Zookeeper interne de Solr. Voici un exemple d’installation d’un environnent à 2 noeuds.
Après avoir détaillé dans l’article « Mise en oeuvre de SolrCloud (Solr 4.0)« , l’installation d’un cloud constitué de 4 noeud Solr, je présente maintenant quelques cas courants d’administration de SolrCloud, à savoir : charger des configurations créer des collections modifier la configuration d’une collection redimensionner …
Objectifs Après avoir présenté les principes de SolrCloud dans l’article « Présentation de SolrCloud« , dans cet article nous procéderons à l’installation d’un cluster SolrCloud avec 4 noeuds et un ensemble Zookeeper de 3 éléments. Pour l’exercice, nous installons tout sur un serveur physique unique, mais dans …
Cet article a pour but de présenter SolrCloud disponible depuis Solr 4.0 et couvre les aspects suivants : Décrire le principe de SolrCloud En quoi il permet d’atteindre des objectifs de haute disponibilité L’intégration d’une application avec SolrCloud Dans un …
Dans cet article, je présente une solution afin de générer un nuage de tags (ou nuage de mots clefs) à partir d’un flux de données textuelles. Pour l’exemple, il s’agit de titres d’articles stockés dans un fichier texte. Le but …
Dans cet article, nous allons expliquer le principe de fonctionnement d’un moteur de recherche. Pour la plupart des internautes, « moteur de recherche » est synonyme de Google ou Bing. En fait, je les appellerais plutôt « sites de recherche ». Un moteur de …
Lucene est une librairie open source en Java permettant d’ajouter des fonctionnalités de recherche plein-texte à vos applications. Le projet Lucene est chapeauté par « The Apache Software Foundation ». D’autres projets très connus et de grande qualité de la fondation sont …