Archives des elasticsearch

Extraction d’entités nommées pour une indexation dans elasticsearch ou Solr

dominique 7 juillet 2025 elasticsearch, Lucene / Solr, Technique

Dans un précédent article, j’ai présenté l’Elastic Open Web Crawler et montré comment collecter des publications issues de sites de presse. J’ai proposé quelques post-traitements simples avant l’indexation dans elasticsearch afin d’extraire un contenu plus propre et des informations comme …

[Lire la suite...]

Elastic Open WEB Crawler

dominique 18 juin 2025 elasticsearch, Technique

Elastic Open Web Crawler est le nouveau Crawler en version Beta proposé par Elastic et dont le code et la documentation sont disponibles sous Github. Dans cet article, je vais décrire les étapes de mise en œuvre de Elastic Open …

[Lire la suite...]

Installation d’un cluster elasticsearch 8.x (et son piège)

dominique 22 novembre 2023 elasticsearch, Technique

Dans cet article nous abordons l’installation sous Linux d’un cluster elasticsearch et non pas d’une infrastructure ELK complète. L’installation de Kibana qui est néanmoins indispensable pour à minima l’administration du cluster sera décrite dans un autre article. La procédure d’installation …

[Lire la suite...]

Développer et intégrer un Token Filter dans elasticsearch

dominique 13 janvier 2017 elasticsearch, Lucene / Solr, Moteur de recherche

Dans cet article, je vais aborder un sujet qui est bien documenté pour Solr, mais moins pour elasticsearch : le développement et l’installation d’un token filter. La structure du projet Maven doit permettre de packager le token filter aussi bien pour Lucene …

[Lire la suite...]

Configuration de la JVM pour Solr et elasticsearch

dominique 13 février 2015 elasticsearch, Lucene / Solr, Moteur de recherche, Technique

Dans cet article, je décris la configuration de la JVM pour Solr et elasticsearch. Les paramètres conseillés sont les mêmes pour Solr et elasticsearch car bien que fournissant des fonctionnalités pas strictement identiques, ils s’appuient sur le même socle Lucene. Chaque cas …

[Lire la suite...]

elasticsearch – Installation rapide

dominique 25 décembre 2014 elasticsearch, Moteur de recherche, Technique

Cet article décrit une installation simple et rapide d’un serveur elasticsearch ou plusieurs qui forment un cluster. Le seul pré-requis est de disposer d’une JVM Oracle ou OpenJDK de version 1.7u55 ou > ou 1.8u20 ou > La distribution est …

[Lire la suite...]

Présentation de Solr et elasticsearch

dominique 23 décembre 2014 elasticsearch, Lucene / Solr, Moteur de recherche, Technique

Solr et elasticsearch sont deux solutions d’indexation et de recherche plein-texte (full-text). Ces outils présentent les mêmes caractéristiques de bases pour répondre aux mêmes besoins. Bien sur, ils se distinguent par certains fonctionnalités et choix technologiques qui font que l’on …

[Lire la suite...]

elasticsearch Archive