• Contact
  • A propos
  • Mentions Légales
Eolya Consulting
  • Menu
  • Services
  • Clients et partenaires
  • Blog

Extraction d’entités nommées pour une indexation dans elasticsearch ou Solr

dominique 7 juillet 2025 elasticsearch, Lucene / Solr, Technique
Dans un précédent article, j’ai présenté l’Elastic Open Web Crawler et montré comment collecter des publications issues de sites de presse. J’ai proposé quelques post-traitements simples avant l’indexation dans elasticsearch afin d’extraire un contenu plus propre et des informations comme …
[Lire la suite...]

Elastic Open WEB Crawler

dominique 18 juin 2025 elasticsearch, Technique
Elastic Open Web Crawler est le nouveau Crawler en version Beta proposé par Elastic et dont le code et la documentation sont disponibles sous Github. Dans cet article, je vais décrire les étapes de mise en œuvre de Elastic Open …
[Lire la suite...]

Solr – Request Rate Limiters et Circuit Breakers

dominique 25 avril 2024 Lucene / Solr, Moteur de recherche, Technique
Dans un environnement de production, Solr peut être soumis à des charges de requêtes concurrentes intenses, d’autant plus lorsque des opérations d’indexation et de recherche sont réalisées simultanément. Sans mécanisme de contrôle, ces situations peuvent entraîner une saturation critique des …
[Lire la suite...]

Installation d’un cluster elasticsearch 8.x (et son piège)

dominique 22 novembre 2023 elasticsearch, Technique
Dans cet article nous abordons l’installation sous Linux d’un cluster elasticsearch et non pas d’une infrastructure ELK complète. L’installation de Kibana qui est néanmoins indispensable pour à minima l’administration du cluster sera décrite dans un autre article. La procédure d’installation …
[Lire la suite...]

ZooKeeper pour Solr : principes, installation et supervision

dominique 20 novembre 2023 Non classé
Lors de la mise en place d’un cluster SolrCloud, la présence d’un ensemble Zookeeper fonctionnel est indispensable. Un ensemble Zookeeper désigne un groupe de serveurs coordonnés assurant ensemble la gestion de la configuration distribuée et la coordination des nœuds Solr. …
[Lire la suite...]

Export Solr avec les streaming expressions

dominique 22 novembre 2020 Lucene / Solr, Moteur de recherche, Technique
Un de nos clients manipule des collections de plus ou moins 1 milliards de documents. Ces documents sont constitués principalement de méta-données. Ces volumes commencent à devenir conséquents pour des recherches et du facetting mais également pour des exports massifs …
[Lire la suite...]

SolrCloud – Recherches NRT avec des replicas TLOG

dominique 16 novembre 2020 Lucene / Solr, Moteur de recherche, Technique, Zookeeper
Réaliser des recherches NRT (Near Real Time Search) dans une collection SolrCloud constituée uniquement de replicas TLOG
[Lire la suite...]

Solrcloud Disaster Recovery – Alternative à CDCR

dominique 16 novembre 2020 Lucene / Solr, Moteur de recherche, Technique
Le CDCR disparaît dans la version 9 de Solr. Dans cet article, nous proposons une solution alternative afin de permettre la gestion des Disaster Recovery
[Lire la suite...]

Gestion des documents supprimés dans Solr

dominique 12 novembre 2019 Lucene / Solr, Moteur de recherche, Technique
Une des questions les plus fréquentes concernant la gestion au quotidien des index Solr est le traitement des documents supprimés. En effet, certains cas d’usages qui nécessitent des suppressions ou des modifications régulières ou massives de documents peuvent amener à …
[Lire la suite...]

Monitoring SolrCloud avec Prometheus et Grafana

dominique 7 novembre 2019 Lucene / Solr, Moteur de recherche, Technique, Zookeeper
Le monitoring d’un environnement SolrCloud en production est essentiel afin d’anticiper les problèmes de performances et le cas échéant en comprendre l’origine. Cet article décrit comment mettre en place un monitoring de SolrCloud au moyen de Prometheus et Grafana.  Principe …
[Lire la suite...]
  • ← Articles précédents

    Vous souhaitez bénéficier d’une expertise Solr ou intégrer une ressource ponctuelle à vos projets ? Rendez vous sur la page Contact

    Catégories

    • elasticsearch
    • Hadoop
    • Lucene / Solr
    • Moteur de recherche
    • Non classé
    • Technique
    • Web 2.0
    • Zookeeper

    Archives

    • juillet 2025
    • juin 2025
    • avril 2024
    • novembre 2023
    • novembre 2020
    • novembre 2019
    • avril 2019
    • juillet 2018
    • janvier 2017
    • août 2015
    • mars 2015
    • février 2015
    • décembre 2014
    • août 2013
    • juin 2013
    • mai 2013
    • décembre 2008
    • août 2008

Articles récents

  • Extraction d’entités nommées pour une indexation dans elasticsearch ou Solr
  • Elastic Open WEB Crawler
  • Solr – Request Rate Limiters et Circuit Breakers
  • Installation d’un cluster elasticsearch 8.x (et son piège)
  • ZooKeeper pour Solr : principes, installation et supervision
Eolya Consulting Copyright © 2025.
Theme by MyThemeShop