Services

Expertise Solr, elasticsearch et OpenSearch

Lucene est un moteur de recherche qui se présente sous la forme d’une librairie Java et qui permet d’indexer et de rechercher du texte. Lucene est la brique de base des moteurs d’indexation et de recherche Solr, elasticsearch et OpenSearch. Alors que Lucene se présente sous la forme d’une API Java, Solr et elasticsearch fournissent une API XML et JSON via HTTP (RESTFull) et incluent des fonctionnalités telles que :

Indexation dans un grand nombre de langues avec le support du stemming
Recherche booléenne et floue
Mise en évidence des termes recherchés
Navigations par facettes
Corrections orthographiques et suggestions (did you mean ?)
Cache
Réplication
Administration web
…

Eolya contribue à vos projets Solr, elasticsearch et OpenSearch sur les aspects suivants :

Infrastructure, architecture, dimensionnement, optimisations et sécurité
Installation, configuration et optimisation (système d’exploitation, JVM, Solr et Zookeeper)
Intégration avec des solutions tierces (Java, PHP, mise en place de middlewares métiers)
Gestion de gros volumes (collections en milliards de documents, plusieurs centaines de requêtes à la seconde)
Chaînes et workflows d’indexation (connexion à des sources de données, enrichissement des données, indexation temps réel)
Qualité des résultats de recherche : pertinence, bruit, silence
Développements Solr et elasticsearch (filtre, tokenizer, analyzer)
Définitions des besoins fonctionnels et mise en œuvre (facettes, suggestions, stratégies de calcul de pertinence, …)
Migration
Montée de version
Monitoring

Moteurs de recherche verticaux

Un moteur de recherche vertical est un moteur de recherche de type Google mais spécialisé dans un domaine particulier (droits de l’Homme, médical, tourisme, emplois, …). Lors de la mise en place d’un moteur vertical, on a parfois un accès privilégié aux sources d’informations indexées (base de données, référentiel de sites web enrichi de meta-données, …). On dispose donc d’informations très précises et qualifiées sur les données à indexer (titre, auteur, date de publication, prix, évaluations, …) et on peut ainsi mettre en place une interface de recherche très poussée qui fournie des résultats très pertinents.

Les étapes de la mise en place d’une solution de recherche verticale sont :

Crawl des sites web ou autres sources d’information à indexer
Enrichissement des données
Gestion de la sécurité
Indexation initiale et incrémentale
Recherche

Les problématiques à résoudre peuvent être :

Complexité des sites web à crawler (liens javascript, ajax, authentification, nettoyage des pages, stratégie d’inclusion et d’exclusion de pages, …)
Connexion aux sources de données
Sécurité
Détection et traitement de la langue
Intégration à une application web existants
Maintenance (évolution des sources à indexer)

Moteurs de recherche d’entreprise

Un moteur de recherche d’entreprise a pour but d’indexer des données de l’entreprise. Il peut s’agir d’une ou plusieurs sources d’informations afin de fournir une fonctionnalité de recherche fédérée dans un intranet par exemple. Les problématiques à résoudre sont entre autres la connexion aux sources d’informations et la gestion de la sécurité.

Vous souhaitez bénéficier d’une expertise Solr ou intégrer une ressource ponctuelle à vos projets ? Rendez vous sur la page Contact