Documation 2011 : de la recherche fédérée à l'accès unifié

45
De la « recherche fédérée de documents » au véritable « accès unifié à l’information » Documation 2011 - Paris

description

Toute organisation subit les limites de son système d’information : entrepôts de données cloisonnés, données hétérogènes, documents non structurés, thésaurus incomplets, taxonomies incohérentes… Les utilisateurs en souffrent et attendent un véritable « accès unifié à l’information » : trouver l’information par les concepts plutôt que la chercher par les mots, naviguer aisément dans l’information, mieux l’exploiter en collaborant. L’entreprise doit évoluer vers un « espace informationnel enrichi », servant différents usages selon le profil ou la mission de chaque collaborateur. La vision innovante d'Antidot permet d’aller bien au-delà de ce que permettent les approchent traditionnelles comme la « recherche fédérée » ou encore les « search based applications » car Antidot Information Factory et Antidot Finder Suite permettent de modéliser l’information, de capter, normaliser, décrire et agréger des données puis d’en inférer des informations nouvelles, facilement accessibles. Intégrant nativement les technologies du web sémantique, Antidot apporte les solutions les plus en pointe dans le domaine et démontre à travers une réalisation emblématique - le projet ISIDORE du CNRS TGE Adonis - comment remodeler et diffuser une information à forte valeur ajoutée.

Transcript of Documation 2011 : de la recherche fédérée à l'accès unifié

Page 1: Documation 2011 : de la recherche fédérée à l'accès unifié

De la « recherche fédérée de documents » au véritable « accès unifié à l’information »

Documation 2011 - Paris

Page 2: Documation 2011 : de la recherche fédérée à l'accès unifié

2

SOCIÉTÉ ANTIDOT

Editeur logiciel depuis 1999 | Paris, Lyon, Aix-en-Provence

Solution de recherche et d’accès à l’information eCommerce | Portails | Média | Entreprises

Produits (SaaS ou licence) AIF : workflow de valorisation des données AFS : moteur de recherche CKS : services collaboratifs

Page 4: Documation 2011 : de la recherche fédérée à l'accès unifié

4

PLAN

Le problème

Les limites de la « recherche fédérée » de documents

La réponse La solution Un exemple

Penser l’accès à l’information dans un espace unifié

Capter, Penser, Valoriser, Exposer l’information

Le projet Isidore

(TGE AdonisCNRS)

Page 5: Documation 2011 : de la recherche fédérée à l'accès unifié

LE PROBLÈMELes limites de la recherche fédérée de documents

Page 6: Documation 2011 : de la recherche fédérée à l'accès unifié

6

LES DIFFICULTÉS DE « LA RECHERCHE FÉDÉRÉE DE DOCUMENTS »

Des données hétérogènesDes silos de

données cloisonnés

Des référentielsépars et incomplets

Une terminologiesubjective

Page 7: Documation 2011 : de la recherche fédérée à l'accès unifié

7

LE MOTEUR DE RECHERCHE : UN OUTIL MIRACLE ?

Page 8: Documation 2011 : de la recherche fédérée à l'accès unifié

8

LES LIMITES DE « LA RECHERCHE FÉDÉRÉE DE DOCUMENTS »

Recette de cuisine de la recherche fédérée

Indexez ServezCollectez

Page 9: Documation 2011 : de la recherche fédérée à l'accès unifié

9

AU MIEUX, UNE JUXTAPOSITION DE DOCUMENTS

L’utilisateur n’est pas acteur de sa recherche.

Page 10: Documation 2011 : de la recherche fédérée à l'accès unifié

LA REPONSEPenser l’accès à l’information dans un espace unifié et enrichie

Page 11: Documation 2011 : de la recherche fédérée à l'accès unifié

11

MODÉLISER, LIER ET ANNOTER LES INFORMATIONS

Créer la cohérence et lier les données par l’utilisation de référentiels

Traces, annotations,

sélectiondes utilisateurs

Référentielsterminologiques

Annuaired’entreprise

Page 12: Documation 2011 : de la recherche fédérée à l'accès unifié

12

MODÉLISER, LIER ET ANNOTER LES INFORMATIONS

Créer une cohérence et de l’informationpar la mise en relation des différents silos

Page 13: Documation 2011 : de la recherche fédérée à l'accès unifié

13

MODÉLISER, LIER ET ANNOTER LES INFORMATIONS

Utiliser la nature des données sources

a pour sujetfait référence à

a pour sujet

auteurparticipant

auteur émet

teur

desti

nata

ire

fait référence à

une personne

Fiche produit

CR de réunion

Courriel page Web

cite inclut

Page 14: Documation 2011 : de la recherche fédérée à l'accès unifié

14

PENSER UN WORKFLOW DE TRAITEMENT DES DONNÉES

Processus d’enrichissement adapté aux données s’appuyant sur les référentiels

Enrichissement

Captation

Classification

Sémantisation

NormalisationAnnotation

Indexation Moteur de recherche AFS

Entrepôt RDF (Linked Data)

Content Repository

Page 15: Documation 2011 : de la recherche fédérée à l'accès unifié

15

S’APPUYER SUR LES TECHNOLOGIES DU WEB SÉMANTIQUE

Un cadre d’interopérabilité pour mettre à disposition,consulter, lier et partager des données

Un protocole Un « langage »Un principeUn mécanisme d’identification

HTTP RDFL’hypertexteURL/URI

Page 16: Documation 2011 : de la recherche fédérée à l'accès unifié

16

LE MOTEUR DE RECHERCHE : HUB DE L’ACCÈS UNIFIÉ À L’INFORMATION

Page 17: Documation 2011 : de la recherche fédérée à l'accès unifié

17

CRÉER DE LA VALEUR POUR LES UTILISATEURS

Page 18: Documation 2011 : de la recherche fédérée à l'accès unifié

LA SOLUTIONCapter, penser, valoriser, exposer l’information

Page 19: Documation 2011 : de la recherche fédérée à l'accès unifié

ANTIDOT INFORMATION FACTORYCapter, valoriser et traiter l’information

Page 20: Documation 2011 : de la recherche fédérée à l'accès unifié

20

ANTIDOT INFORMATION FACTORY

Antidot Information Factory : un outilindustriel et évolutif

Une chaîne de captation

et de traitement

Un cadre de développement

Un modèle d’Unité Documentaire

Page 21: Documation 2011 : de la recherche fédérée à l'accès unifié

21

AIF : UNE CHAÎNE DE TRAITEMENT

Créer des chaînes de traitement de données par assemblage de modules

Sources de données

Module connecteur

Modules de transformation et enrichissement

Page 22: Documation 2011 : de la recherche fédérée à l'accès unifié

22

AIF : UN CADRE DE DÉVELOPPEMENT

Un cadre de développement pour construire des modules50+ filtres prêts à l’emploi + Un environnement d’exécution

Page 23: Documation 2011 : de la recherche fédérée à l'accès unifié

23

AIF : UN MODÈLE D’UNITÉ DOCUMENTAIRE

Le document est composite est dynamique évolue dans le temps est un objet géré

de façon unifiée

Page 24: Documation 2011 : de la recherche fédérée à l'accès unifié

24

AIF ET LE WEB SÉMANTIQUE

Support des standards SKOS, OWL, RDF, SparQL dans AIFIndexation du RDFIntégration native : Thésaurus Taxonomies Règles d’inférence

antidot a :publisher ;:loves w3c:RDF .

antidot

Software Publisher

type

w3c:RDFloveslabel

Antidot

AIF met le Web sémantique au service de la gestion de l’information en entreprise

Page 25: Documation 2011 : de la recherche fédérée à l'accès unifié

ANTIDOT FINDER SUITERechercher l’information

Page 26: Documation 2011 : de la recherche fédérée à l'accès unifié

26

AFS V7 QUERY ENGINE

Recherche plein texte avec fonctions linguistiques : extension automatique suggestion orthographique expressions contextuelles

Page 27: Documation 2011 : de la recherche fédérée à l'accès unifié

27

AFS V7 QUERY ENGINE

Recherche phonétique

Page 28: Documation 2011 : de la recherche fédérée à l'accès unifié

28

AFS V7 QUERY ENGINE

Autocomplétion intelligente pendant la saisie de la requête

Page 29: Documation 2011 : de la recherche fédérée à l'accès unifié

29

AFS V7 QUERY ENGINE

Recherche multicritères avancée

Page 30: Documation 2011 : de la recherche fédérée à l'accès unifié

30

AFS V7 QUERY ENGINE

Recherche à facettes

Page 31: Documation 2011 : de la recherche fédérée à l'accès unifié

31

AFS V7 QUERY ENGINE

Tag clouds : nuage de mots-clés les plus utilisés dans le corpus

Page 32: Documation 2011 : de la recherche fédérée à l'accès unifié

32

AFS V7 QUERY ENGINE

Construction de requêtes à partir des métadonnées d’une fiche

Page 33: Documation 2011 : de la recherche fédérée à l'accès unifié

33

AFS V7 QUERY ENGINE

Catégorisation : classification automatique desdocuments selon une taxonomie donnée

Page 34: Documation 2011 : de la recherche fédérée à l'accès unifié

COLLABORATIVE KNOWLEDGE SUITEAnnoter et partager l’information

Page 35: Documation 2011 : de la recherche fédérée à l'accès unifié

35

CKS : RECHERCHE COLLABORATIVE

CapitaliserEnregistrer Requêtes Réponses

Organiser Dossiers Tags

Page 36: Documation 2011 : de la recherche fédérée à l'accès unifié

ANTIDOT CONTENT REPOSITORYExposer l’information

Page 37: Documation 2011 : de la recherche fédérée à l'accès unifié

37

RENDRE ACCESSIBLE LES CONTENUS ENRICHIS PAR AIF

API Web

Linked Data

Page 38: Documation 2011 : de la recherche fédérée à l'accès unifié

UN EXEMPLELe projet Isidore

Stéphane Pouyllau, TGE Adonis (CNRS)@spouyllau

http://www.lespetitescases.net

Page 39: Documation 2011 : de la recherche fédérée à l'accès unifié

39

LE TRÈS GRAND ÉQUIPEMENT ADONIS (CNRS)

Le Très grand équipement du CNRS pour les sciences humaines et sociales

Adonis : Accès unifié aux données et documents numériques des sciences humaines et sociales

www.tge-adonis.fr

Page 40: Documation 2011 : de la recherche fédérée à l'accès unifié

40

LES OBJECTIFS DU TGE ADONIS

3 axes : Accès aux données :

ISIDORE Accompagnement des

communautés scientifiques en matière de numériques : données > publications

Stockage et archivage à long terme des données numériques

Page 41: Documation 2011 : de la recherche fédérée à l'accès unifié

41

LES BESOINS D’ISIDORE

Donner accès à des données numériques réparties Des données structurées pour qualifier du texte intégral En entrée : utilisation de standards internationaux En sortie : données enrichies et normalisées (RDF + Sparql)

Enrichissement : plusieurs traitements/multiples référentiels entrant plusieurs couches de traitements

Construire un « hub » pour les métadonnées et les données des SHS

Proposer des services d'accès aux données multiples : • IHM Web• API • Triple store RDF

Page 42: Documation 2011 : de la recherche fédérée à l'accès unifié

42

LES ENJEUX D’ISIDORE

Valoriser le travail de structuration scientifique (humains) sur les méta-données pour qualifier les données non structurées

Replacer l'expertise humaines et le savoir scientifique dans les données en ligne

Enrichir les méta-données et les donnéesVers de nouveaux champs de recherche

Les ré-exposer selon les principes du linked data dans le web de données

Ouverture des données publiques de la recherche en sciences humaines et sociales

Page 43: Documation 2011 : de la recherche fédérée à l'accès unifié

EN GUISE DE CONCLUSIONPerspectives au contexte des entreprises

Page 44: Documation 2011 : de la recherche fédérée à l'accès unifié

44

PERSPECTIVES : DANS TOUT CONTEXTE D’ENTREPRISE

Entrepôts RDFSPARQL endpoint

Service de recherche

AFS

Indexation

générationdu RDF

ExportDocument Manager

Content repository

Page 45: Documation 2011 : de la recherche fédérée à l'accès unifié

Merci pour votre attention

Venez échanger avec nous et découvrez AIF, AFS et CKS

sur le stand E 16