Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris...

23
Université de La Rochelle 28 Mars 2018

Transcript of Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris...

Page 1: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Université de La Rochelle

28 Mars 2018

Page 2: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

2

Sommaire

Présentation

Présentation et contexte de l’étude> Gallica> Introduction au CBIR

Les différentes approches> Indexation par le contenu visuel> Indexation par le contenu sémantique> Prétraitement

Outils disponibles / En développement

Conclusion et Perspectives

Page 3: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

3

Introduction et contexte de l’étude

Présentation

Page 4: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Contexte

Gallica : > 4 348 725 documents en ligne (livres numérisés, revues, cartes,

enluminures…)Outils d’aide à la consultation d’images > une recherche indexée par des métadonnées textuelles « manuelles »

Présentation5

Page 5: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Fouille d’images par le contenu

Pour une meilleure expérience utilisateur> nécessité d’implémenter de nouveaux outils d’indexation et de fouilles

d’images.

Recherche d’images> Navigation libre dans le corpus> Recherche par mots-clefs> Recherche par le contenu

Etat de l’art coordonné par Valconum> 4 laboratoires partenaires:

– LIPADE, Université Paris Descartes– L3i, Rochelle– CVC, Barcelone– IRISA, Rennes

Présentation6

Page 6: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Recherche d’images similaires

28/03/2018 Présentation8

Page 7: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Navigation dans le corpus

28/03/2018 Présentation9

Page 8: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Schéma général d’un système d’indexation et de moteur de fouille d’images

1 phase d’indexation> Hors ligne> Extraction des vecteurs de caractéristiques> Stockage1 phase de recherche> Extraction de caractéristiques> Comparaison

Présentation10 28/03/2018

Page 9: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Les différentes approches

Présentation28/03/2018

Page 10: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Indexation par le contenu visuel

Objectif :> Extraire un ensemble d’indices visuels qui vont

caractériser une image

3 catégories de caractéristiques> Globale> Spatiale> Locale

Selection, Combinaison de ces caractéristiques

28/03/2018 Présentation12

Page 11: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Indexation par le contenu visuel

28/03/2018 Présentation13

Page 12: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Indexation par le contenu visuel

Approches par descriptionglobale> Caractéristiques Couleur> Caractéristiques Texture> Caractéristiques Forme

28/03/2018 Présentation14

Page 13: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Indexation par le contenu visuel

Approches par descriptionglobale> Caractéristiques Couleur> Caractéristiques Texture> Caractéristiques Forme

Approches par descriptionspatiale> Signature de l’agencement des

composantes d’un document

28/03/2018 Présentation15

Page 14: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Indexation par le contenu visuel

Approches par descriptionglobale> Caractéristiques Couleur> Caractéristiques Texture> Caractéristiques Forme

Approches par descriptionspatiale> Signature de l’agencement des

composantes d’un document

Approches par description locale> Utilisation de descripteurs sur des

zones locales d’intérêt

28/03/2018 Présentation16

Page 15: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Indexation par le contenu sémantique

Détection automatique de concepts> Création d’un index sémantique> Facile à comprendre et à interpréter

Permettre la labellisation> d’une image> de zones dans une image

Ces labels peuvent être inclus dans une ontologie> Permet un raisonnement (inférences)

Présentation17 28/03/2018

Page 16: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Application images naturelles> ImageNet : images annotées à partir de 80 000 concepts

28/03/2018 Présentation18

Indexation par le contenu sémantique

Page 17: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Expérimentation

28/03/2018 Présentation19

Indexation par le contenu sémantique

Page 18: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Identification et localisation d’objets

28/03/2018 Présentation20

Indexation par le contenu sémantique

Page 19: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Identification et localisation d’objets> Application aux visages

28/03/2018 Présentation21

Indexation par le contenu sémantique

Page 20: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Légende automatique

28/03/2018 Présentation22

Indexation par le contenu sémantique

Page 21: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Prétraitement et Segmentation

Necessité d’appliquer un prétraitement

Améliorer le document dans le but d’optimiser son analyse> Suppression de distorsions> Augmentation des contrastes> Suppression de bruits de numérisation

Segmentation> Extraction des régions d’intérêts> Extraction du Layout Physique ou Logique

Présentation23 28/03/2018

Page 22: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Quelques outils

GAFA> Google Vision API> IBM Watson / Cloud Visual Recognition> Amazon Rekognition

Start-Up / Spin-Off Laboratoires> Lamark> NeoVision> Videntifier> OddConcepts

Frameworks et Librairies> Deep Learning : Caffe, TensorFlow> Analyse Traitement Image : OpenCV> Indexation : FLANN, Faiss

Présentation24 28/03/2018

Page 23: Université de LaRochelle - Hypotheses.org · 2018-04-16 · – LIPADE, Université Paris Descartes – L3i, Rochelle – CVC, Barcelone – IRISA, Rennes 6 Présentation. Recherche

Conclusion de l’étude

Présentation28/03/201825

2 verrous> Corpus très hétérogènes

> Contenu (différentes époques, différents supports, …)> Support Image (qualité de numérisation, compressions, …)

Une multitude d’outils :> Disponibles :

– Mise en place directe mais avec des contraintes (coûts, droits, performance)

> En développement – Collaboration avec les laboratoires– Meilleure Adéquation, spécialisation sur les documents

Différentes hypothèses de travail> A partir des corpus ? Des outils ? Des 2 ?