Formation Elasticsearch

Formation Elasticsearch

Savoir utiliser et configurer Elasticsearch, le moteur de recherche seconde génération

Durée : 3 jour(s) En partenariat avec ZENIKA
Référence : ELASTICSEARCH-03

Présentation

ElasticSearch est un moteur de recherche et d’indexation Open Source nouvelle génération. Basé sur la librairie Apache Lucene, ce moteur de recherche offre des fonctionnalités avancées telles que les recherches par coordonnées géographiques, l’analyse et la catégorisation par facettes, le filtrage de résultats ou encore la recherche sur plusieurs index et types de documents différents. Taillé pour le Cloud, ElasticSearch a été spécialement conçu pour indexer de très gros volumes de données tout en assurant une montée en charge performante et une forte tolérance aux pannes.

 

Cette formation aborde les concepts clés des moteurs de recherche avant de détailler les fonctionnalités de base d’ElasticSearch et ses principes d’architecture. En s’appuyant sur des exemples concrets et des cas réels d’utilisation, la formation apporte toutes les connaissances nécessaires pour utiliser et exploiter ElasticSearch de façon efficace et résoudre les problématiques les plus souvent rencontrées.

Objectifs

  • Identifier les enjeux et les clés de succès d’un moteur de recherche
  • Apprendre à utiliser l’API d’elasticsearch pour indexer et rechercher des documents
  • Savoir installer elasticsearch et effectuer sa configuration en cluster
  • Intégrer elasticsearch dans une application existante
  • Comprendre comment elasticsearch simplifie l’utilisation d’Apache Lucene
  • Utiliser le client et l’API Java d’elasticsearch pour indexer et rechercher des documents
  • Monitorer elasticsearch et comprendre les statistiques d’utilisation

Pédagogie :

60% Théorie, 40% Pratique

Public :

Architecte, Développeur, Chef de projet

Pré-requis :

Connaissance de Java

Programme

Introduction aux moteurs de recherche

  • Généralités
  • Panorama des solutions de recherche Open Source
  • Intégrer un moteur de recherche dans une application
  • Enjeux et clés de succès

Introduction à elasticsearch

  • Historique du projet
  • Lucene, à la base d’elasticsearch
  • Ce qu’apporte elasticsearch par rapport à Lucene

Les bases d’elasticsearch

  • Principes de fonctionnement
  • Vue générale de l’API Rest
  • Installation
  • Configuration
  • Notion de Node
  • Notion d’Index
  • Partitionnement de données
  • Notion de Type

Indexation de documents

  • Conception de l’index et de ses documents
  • Indexer des documents avec l’API Rest
  • Version
  • Pondération
  • Mise à jour et suppression d’un document indexé

Mapping

  • Définition et rôle du mapping
  • Types de champs
  • Champs prédéfinis
  • Méta données d’un Index

Analyse et extraction de texte

  • La base de l’extraction et analyse de texte: les objets Analyzers, Tokenizers et Token Filters
  • Cas d’utilisation
    • Analyse de texte en plusieurs langues
    • Suppression de mots
    • Extraction d’adresses email et d’urls
    • Suppression de balises HTML dans du texte
    • Mise en place de la correction orthographique
  • Indexation de fichiers binaires (utilisation d’Apache Tika)

Recherche de documents

  • Rechercher des documents avec l’API Rest
  • Types de requêtes
    • Requête de type query_string
    • Requête de type match (et dérivées)
    • Requête de type range
    • Requête de type term et terms
    • Requête de type bool
    • Requête de type fuzzy
    • Requête de type wildcard
  • Différentier requêtes et filtres
  • Types de filtres
  • Combiner efficacement les filtres
  • Pertinence

Fonctionnalités avancées de recherche

  • Suggestions
  • Utiliser les agrégations
    • Agrégations de type terms
    • Agrégations de type range
    • Agrégations de type histogram/date histogram
    • Agrégations métriques simples (min/max/avg…)
    • Agrégations statistiques
    • Agrégations géographiques
  • Accéder aux documents agrégés avec l’agrégation top_hits
  • Les catégories d’agrégations et comment les combiner efficacement
  • Impact des agrégation sur les performances
  • Recherche géospatiale

Java et elasticsearch

  • Types de clients disponibles
  • Intégrer elasticsearch dans une application Java
  • Utilisation de l’API Java
    • Indexer et recherche des documents
    • Gérer les index
    • Gérer les mappings

Cloud et Clusterisation

  • Principe de fonctionnement d’un cluster elasticsearch
  • Configurer un cluster elasticsearch
  • Scalabilité et volumétrie de données
  • Sauvegarder et restaurer un cluster elasticsearch
  • Monitorer un cluster elasticsearch :
    • l’API _cat
    • les API de statistiques
    • Les plugins de monitoring

Fonctionnalités avancées

  • Autres types de plugins elasticsearch
  • River: définition
  • Scripting
  • Pré-chauffer son cluster
  • La percolation
  • Maintenance des nodes
    • Repartition des indexs sur différents nodes
    • Requêtes et statistiques
Nous
rejoindre
DAVIDSON Level Up
0
Connecting
Please wait...
Send a message

Sorry, we aren't online at the moment. Leave a message.

Your name
* Email
* Describe your issue
Login now

Need more help? Save time by starting your support request online.

Your name
* Email
* Describe your issue
We're online!
Feedback

Help us help you better! Feel free to leave us any additional feedback.

How do you rate our support?