Prise en main de Solr

Avec cette Formation Solr, vous comprendrez l’architecture d’Apache Solr et maîtriserez son utilisation pour indexer et rechercher efficacement des données et documents. Cette formation Solr aborde l’installation, la configuration, la modélisation de schémas, l’analyse de texte et les techniques de requêtage avancées.

Durée : 2 jours (14 heures)

Nombre d’étudiants : 6 maximum

Objectifs pédagogiques

À l’issue de cette formation Solr, les participants seront capables de :

  • Comprendre les fondements de la recherche d’information 
  • Comprendre l’architecture d’Apache Solr et notamment l’architecture mono-serveur et l’architecture distribuée SolrCloud avec Zookeeper
  • Installer et configurer un serveur Solr
  • Maîtriser les techniques d’indexation et de définitions de schémas pour différents types de données
  • Administrer un serveur Solr (gestion des cores/collections, monitoring, maintenance)
  • Interroger Solr avec les différents parseurs de requêtes, leurs syntaxes et leurs cas d’usage 
  • Optimiser la pertinence et les performances des résultats de recherche grâce aux paramétrages avancés (analyse de texte, scoring)
  • Implémenter les fonctionnalités principales de Solr : autocomplétion, surbrillance, facettes, synonymes
  • Comprendre les API Solr et leurs rôles

Le formateur

Expert Apache Solr avec plus de 10 années d’expérience en architecture  et implémentation de moteurs de recherche en environnement de production.

Programme détaillé

  • Introduction à la Recherche d’Information (RI)
  • Présentation d’Apache Solr
  • Architecture distribuée avec SolrCloud et Zookeeper
  • Installation et configuration de Solr
  • Configuration d’une collection Solr 
  • Modélisation des données et analyse de texte : le schéma (schema.xml)
  • Indexation de données
  • Rôle des commits et des searchers
  • Opérations sur les documents
  • Recherche avec le parser Lucene (standard)
  • Recherche avec le parser eDismax
  • Recherche avancées
  • Optimisation des recherches : performance et pertinence
  • Facettes (Faceting) et statistiques
  • Tri et Function Queries
  • Debug et analyse des résultats

Méthode pédagogique

  • Présentation
  • Exercices
  • Tests 
  • Q&A

Ressources

  • Le support de cours est fourni à l’issue de la formation
  • Un environnement de travail dans le cloud est mis à disposition pour les manipulations et les exercices. Il reste disponible une semaine à l’issue de la formation
  • Le formateur reste disponible par mail à l’issue de la formation pour répondre aux questions et préciser certains points abordés.

Public cible

Développeurs, architectes, chefs de projets techniques et administrateurs impliqués dans des projets de recherche documentaire qui nécessitent des solutions de recherche performantes et évolutives dans des sources de données volumineuses.

Pré-requis

  • Connaissances
    • Notions de recherche d’informations
    • Connaissances de base en XML et JSON
  • Le jour de la formation 
    • Un ordinateur portable sous Windows, MacOS ou Linux avec :
      • Navigateur web récent
      • Éditeur de texte
      • Client SSH (ex: Putty sous Windows, Terminal sous MacOS/Linux)
      • Client SCP/SFTP (ex: WinSCP, FileZilla)
      • Curl ou outil équivalent (wget, Postman)

Modalités

  • Inter-entreprises : dans nos locaux parisiens ou à distance
  • Intra-entreprise : dans vos locaux partout en France, dans nos locaux parisiens ou à distance
    Dans le cadre d’une formation intra-entreprise, un échange préalable nous permettra de cadrer les attentes et adapter le contenu à votre contexte

Tarif

Formation de 2 jours dans nos locaux parisiens : 2 000 € HT par personne

Ce tarif de référence peut varier selon la modalité choisie (intra-entreprise, à distance). Nous consulter pour un devis personnalisé.