Post on 20-Dec-2014
description
De la « recherche fédérée de documents » au véritable « accès unifié à l’information »
Documation 2011 - Paris
2
SOCIÉTÉ ANTIDOT
Editeur logiciel depuis 1999 | Paris, Lyon, Aix-en-Provence
Solution de recherche et d’accès à l’information eCommerce | Portails | Média | Entreprises
Produits (SaaS ou licence) AIF : workflow de valorisation des données AFS : moteur de recherche CKS : services collaboratifs
3
PARMI NOS CLIENTS
Média
Santé
Entreprises eCommerce
Institutions
4
PLAN
Le problème
Les limites de la « recherche fédérée » de documents
La réponse La solution Un exemple
Penser l’accès à l’information dans un espace unifié
Capter, Penser, Valoriser, Exposer l’information
Le projet Isidore
(TGE AdonisCNRS)
LE PROBLÈMELes limites de la recherche fédérée de documents
6
LES DIFFICULTÉS DE « LA RECHERCHE FÉDÉRÉE DE DOCUMENTS »
Des données hétérogènesDes silos de
données cloisonnés
Des référentielsépars et incomplets
Une terminologiesubjective
7
LE MOTEUR DE RECHERCHE : UN OUTIL MIRACLE ?
8
LES LIMITES DE « LA RECHERCHE FÉDÉRÉE DE DOCUMENTS »
Recette de cuisine de la recherche fédérée
Indexez ServezCollectez
9
AU MIEUX, UNE JUXTAPOSITION DE DOCUMENTS
L’utilisateur n’est pas acteur de sa recherche.
LA REPONSEPenser l’accès à l’information dans un espace unifié et enrichie
11
MODÉLISER, LIER ET ANNOTER LES INFORMATIONS
Créer la cohérence et lier les données par l’utilisation de référentiels
Traces, annotations,
sélectiondes utilisateurs
Référentielsterminologiques
Annuaired’entreprise
12
MODÉLISER, LIER ET ANNOTER LES INFORMATIONS
Créer une cohérence et de l’informationpar la mise en relation des différents silos
13
MODÉLISER, LIER ET ANNOTER LES INFORMATIONS
Utiliser la nature des données sources
a pour sujetfait référence à
a pour sujet
auteurparticipant
auteur émet
teur
desti
nata
ire
fait référence à
une personne
Fiche produit
CR de réunion
Courriel page Web
cite inclut
14
PENSER UN WORKFLOW DE TRAITEMENT DES DONNÉES
Processus d’enrichissement adapté aux données s’appuyant sur les référentiels
Enrichissement
Captation
Classification
Sémantisation
NormalisationAnnotation
Indexation Moteur de recherche AFS
Entrepôt RDF (Linked Data)
Content Repository
15
S’APPUYER SUR LES TECHNOLOGIES DU WEB SÉMANTIQUE
Un cadre d’interopérabilité pour mettre à disposition,consulter, lier et partager des données
Un protocole Un « langage »Un principeUn mécanisme d’identification
HTTP RDFL’hypertexteURL/URI
16
LE MOTEUR DE RECHERCHE : HUB DE L’ACCÈS UNIFIÉ À L’INFORMATION
17
CRÉER DE LA VALEUR POUR LES UTILISATEURS
LA SOLUTIONCapter, penser, valoriser, exposer l’information
ANTIDOT INFORMATION FACTORYCapter, valoriser et traiter l’information
20
ANTIDOT INFORMATION FACTORY
Antidot Information Factory : un outilindustriel et évolutif
Une chaîne de captation
et de traitement
Un cadre de développement
Un modèle d’Unité Documentaire
21
AIF : UNE CHAÎNE DE TRAITEMENT
Créer des chaînes de traitement de données par assemblage de modules
Sources de données
Module connecteur
Modules de transformation et enrichissement
22
AIF : UN CADRE DE DÉVELOPPEMENT
Un cadre de développement pour construire des modules50+ filtres prêts à l’emploi + Un environnement d’exécution
23
AIF : UN MODÈLE D’UNITÉ DOCUMENTAIRE
Le document est composite est dynamique évolue dans le temps est un objet géré
de façon unifiée
24
AIF ET LE WEB SÉMANTIQUE
Support des standards SKOS, OWL, RDF, SparQL dans AIFIndexation du RDFIntégration native : Thésaurus Taxonomies Règles d’inférence
antidot a :publisher ;:loves w3c:RDF .
antidot
Software Publisher
type
w3c:RDFloveslabel
Antidot
AIF met le Web sémantique au service de la gestion de l’information en entreprise
ANTIDOT FINDER SUITERechercher l’information
26
AFS V7 QUERY ENGINE
Recherche plein texte avec fonctions linguistiques : extension automatique suggestion orthographique expressions contextuelles
27
AFS V7 QUERY ENGINE
Recherche phonétique
28
AFS V7 QUERY ENGINE
Autocomplétion intelligente pendant la saisie de la requête
29
AFS V7 QUERY ENGINE
Recherche multicritères avancée
30
AFS V7 QUERY ENGINE
Recherche à facettes
31
AFS V7 QUERY ENGINE
Tag clouds : nuage de mots-clés les plus utilisés dans le corpus
32
AFS V7 QUERY ENGINE
Construction de requêtes à partir des métadonnées d’une fiche
33
AFS V7 QUERY ENGINE
Catégorisation : classification automatique desdocuments selon une taxonomie donnée
COLLABORATIVE KNOWLEDGE SUITEAnnoter et partager l’information
35
CKS : RECHERCHE COLLABORATIVE
CapitaliserEnregistrer Requêtes Réponses
Organiser Dossiers Tags
ANTIDOT CONTENT REPOSITORYExposer l’information
37
RENDRE ACCESSIBLE LES CONTENUS ENRICHIS PAR AIF
API Web
Linked Data
UN EXEMPLELe projet Isidore
Stéphane Pouyllau, TGE Adonis (CNRS)@spouyllau
http://www.lespetitescases.net
39
LE TRÈS GRAND ÉQUIPEMENT ADONIS (CNRS)
Le Très grand équipement du CNRS pour les sciences humaines et sociales
Adonis : Accès unifié aux données et documents numériques des sciences humaines et sociales
www.tge-adonis.fr
40
LES OBJECTIFS DU TGE ADONIS
3 axes : Accès aux données :
ISIDORE Accompagnement des
communautés scientifiques en matière de numériques : données > publications
Stockage et archivage à long terme des données numériques
41
LES BESOINS D’ISIDORE
Donner accès à des données numériques réparties Des données structurées pour qualifier du texte intégral En entrée : utilisation de standards internationaux En sortie : données enrichies et normalisées (RDF + Sparql)
Enrichissement : plusieurs traitements/multiples référentiels entrant plusieurs couches de traitements
Construire un « hub » pour les métadonnées et les données des SHS
Proposer des services d'accès aux données multiples : • IHM Web• API • Triple store RDF
42
LES ENJEUX D’ISIDORE
Valoriser le travail de structuration scientifique (humains) sur les méta-données pour qualifier les données non structurées
Replacer l'expertise humaines et le savoir scientifique dans les données en ligne
Enrichir les méta-données et les donnéesVers de nouveaux champs de recherche
Les ré-exposer selon les principes du linked data dans le web de données
Ouverture des données publiques de la recherche en sciences humaines et sociales
EN GUISE DE CONCLUSIONPerspectives au contexte des entreprises
44
PERSPECTIVES : DANS TOUT CONTEXTE D’ENTREPRISE
Entrepôts RDFSPARQL endpoint
Service de recherche
AFS
Indexation
générationdu RDF
ExportDocument Manager
Content repository
Merci pour votre attention
Venez échanger avec nous et découvrez AIF, AFS et CKS
sur le stand E 16