Web sémantique et développement durable - Mondeca
-
Upload
thomas-francart -
Category
Technology
-
view
2.336 -
download
1
description
Transcript of Web sémantique et développement durable - Mondeca
01/02/11
Web sémantique et développement durable : approches parallèles, cas
d’usage [email protected]
Web sémantique et développement durable : des parallèles
Axes
Local ou Global ?Cas d’usage : FPNR
Durable ou jetable ?Cas d’usage : Lexis Nexis
Conserver ou consommer ?Cas d’usage : INRA
Ouvrir ou enfermer ?Cas d’usage : DILA & Datalift
Relier et cohabiter ou protéger et concourir ?
Cas d’usage : Eurovoc et TAE
Éduquer ou abêtir ?
Web sémantique et développement durable : des parallèles
Local ou Global ?
• Le web est mondial, n’est-ce pas un paradoxe de dire qu’il peut favoriser le local ?
• Mais les technologies sémantiques permettent aussi la valorisation forte d’un « territoire » local– Un territoire géographique– Un fond documentaire– Une communauté de personnes
• Multiplicité des relations, croisement des axes, découverte de nouveaux liens
• Met en valeur les singularités– Vs. Aplatissement des différences et unification des accès
dans des approches « à la google »
Web sémantique et développement durable : des parallèles
Local ou Global : « mise en tourisme durable du territoire »
• Voir l’animation « Mise en tourisme durable du territoire »
Web sémantique et développement durable : des parallèles
Cas d’usage : FPNR – Objectifs
• Valoriser le savoir-faire des Parcs naturels régionaux.
• Connaître, comparer, positionner les Parcs naturels régionaux.
• Constituer un fonds de référence mutualisé de données territoriales sur les Parcs.
• Unifier et simplifier l’accès aux ressources et données du réseau des Parcs naturels régionaux.
Web sémantique et développement durable : des parallèles
Cas d’usage : FPNR – Contenus
• Accès aux savoir-faire des PNR– des expériences : fiches descriptives de bonnes pratiques, actions
exemplaires, base de données fédérale– des documents : éditions, rapports, études, en téléchargement -
bases de données fédérale et PNR– des organismes ressources, présentation + liens internet– des dispositifs techniques, financiers, juridiques…résumé +liens
internet
• Accès aux données descriptives des PNR– Les données générales sur les PNR : date de création, nb
d’habitants, superficie…– le syndicat mixte : la composition, le budget, l’équipe…– le territoire : données patrimoniales, économiques,
démographiques, accès aux bases de données insee, rga, sinp, diact…
Web sémantique et développement durable : des parallèles
Cas d’usage – FPNR – Portail de recherche
1: Recherche par enjeu
2: Recherche par territoire
4: Recherche de données3: Recherche par « programme » ou projet
5: Recherche par mot-clé
Web sémantique et développement durable : des parallèles
Cas d’usage – FPNR – Portail de recherche
Accès cartographique
Fiche résumée
Possibilité d’aller aux « expériences » et aux « documents » associés au territoire
Web sémantique et développement durable : des parallèles
Durable ou jetable ? Des standards pour la pérennité
Pour rendre l’information « machine-processable » nous avons besoin :
Identifiants non ambigus pour les ressources : URI
Modèle commun de données pour accéder, connecter, décrire les ressources : RDF
Langage d’accès au données : SPARQL
Langage de modélisation : OWL
Normes basées sur RDF : SKOS, DublinCore
Possibilité de décrire des règles de raisonnement : OWL, RIF
Le « Web Sémantique » est une infrastructure d’échange et d’intégration de données (sur le Web)
Comment construire des systèmes d’information durables ? En quoi les technologies sémantiques peuvent y aider ?
Web sémantique et développement durable : des parallèles
Durable ou jetable ? La connaissance plutôt que le document
Vs.
Web sémantique et développement durable : des parallèles
Durable ou jetable ? Des identifiants non ambigus
http://www.mondeca.com
Vs.
Web sémantique et développement durable : des parallèles
Durable ou jetable ? Réutiliser la connaissance et le contenu
• 3R : Réduire / Réutiliser / Recycler
• Réduire : Ne pas recréer le même document s’il existe déjà– Mais comment savoir qu’il existe ? -> parce
qu’il est catégorisé finement
• Réutiliser : Avoir des métadonnées fines sur un contenu permet de le réutiliser– Vers un media / un public différent
• Recycler : Valoriser son stock d’archives (vidéos, audio, papier)
Web sémantique et développement durable : des parallèles
Cas d’usage LNF : vision du système
1313
Gestion des sources
Acquisition Structuration Identification
ExtractionNormalisation
Categorisation/Indexation
Gestion descontributions
Saisie IdentificationStructuration
ExtractionNormalization
Indexation
Gestion des connaissances pour le métier de l’édition
SO
UR
CE
S D
’INF
OR
MA
TIO
N
Gestion desPublications
AgrégationOrganisation
IndexTables
Processus et outils communs pour produire des contenus réutilisables
Gestion de la Fabrication
Conversions XMLImprimerie
PR
OD
UC
T D
ELIV
ER
Y
Web sémantique et développement durable : des parallèles
LNF - Extraction de connaissance : jurisprudence
Web sémantique et développement durable : des parallèles
Conserver plutôt que consommer : des référentiels de classement
• Le web d’aujourd’hui n’est pas de l’ordre de la conservation :– Flux d’informations (vs. « bases » de connaissances)– Instantanéité (vs. « sédimentation » des connaissances)– Documents/pages en constante évolution (vs. URIs
stables)
• Vs. Linking Open Data : constitution de données de références– Pas figées, mais surtout pérennes
• Nécessité de référentiels pour le développement durable :– GEMET– Agrovoc
Web sémantique et développement durable : des parallèles
Conserver plutôt que consommer : capitalisation de connaissances
Grundstein M., BarthèsJ-P.A. ; An Approach to Enterprise Knowledge Capitalization, 1999.
Tro
uve
r
Stocker
Diffu
ser
Main
tenir
IdentifierLocaliser
CaractériserAcquérir
Etc.
FormaliserArchiverImporter
Etc.
AccéderPartagerCombinerExporter
Etc.
ContrôlerMettre à jour
EnrichirStandardiser
Etc.
CONNAISSANCES
Man
ager
VisionPromouvoir
FormerOrganiser
SuivreEtc.
Web sémantique et développement durable : des parallèles
Bibliographie des sources de
l’expertise
Base du réseaud’experts
Ouvrages deréférence del’expertise
Annuaire d’expertssur le thème de
l’expertise
Savoirs tangiblesde l’expertise
Questionsaux experts
Modalités de conduitede l’expertise
ESCo et Pôle IST
Bibliographies thématiques
Études de terrainet données brutes
Rapport del’expertise
Synthèsede l’expertise
Acteurset
méthodes
Produits del’expertise
Analyses etcommentaires liés
à la diffusionde l’expertise
Interaction avec la société:la vie de l’expertise
Prospective autourde l’expertise
Sources del’expertise
Colloque derestitution
Segment based’experts et
méthodologie
Segmentbibliographique
et informationnelde l’expertise
Segment diffusionet mise en débat
de l’expertise
Segmentproduits del’expertise
Glossaire
Exploitation par ledonneur d’ordre
?
Cas d’usage :
INRA
Web sémantique et développement durable : des parallèles
INRA - Formalisation des besoins
Une plateforme largement ouverteUne plateforme largement ouverte… : offrir une solution intégrée, de l’importation des données jusqu’à un accès full web
…de réflexion et de partagede réflexion et de partage: enrichir, par une démarche collaborative de tous les acteurs, les informations recherchées, déposées, rédigées par les experts des différentes tâches par des liens sémantiques entre toutes ces données
Bénéficier de cet enrichissement lors de la recherche et/ou la navigation dans cette base de connaissances
Répondre à ces besoins Par des technologies traditionnelles de l’IST: classification, catégorisation, référentiels, structuration de l’information, analyse de l’information, veille et synthèses stratégiques…
Par la mise en œuvre des technologies du web sémantique basées sur les standard édités par le W3C pour enrichir cette plateforme et garder le maximum d’ouverture et d’interopérabilité
Web sémantique et développement durable : des parallèles
Exemple d’ontologie pour le projet
Guayule améliorée
Parthenium argentatum
Projet de recherche B
Industriel A
Processus de manipulation génétique
Mme C
Laboratoire D
Latex
Dérive de
Doit contenir Permet d’obtenir
Livrable de
intéresse
dirige
participe
Référentiel X (Agrovoc)
Web sémantique et développement durable : des parallèles
VegA Portail : des objets de connaissance
Web sémantique et développement durable : des parallèles
VegA Portail : documents et dires d’experts
Web sémantique et développement durable : des parallèles
Ouvrir ou enfermer ? Multi-*
• Multi-lingue– Les identifiants ne sont pas des labels, ce sont des URIs– Le même concept peut être traduit dans plusieurs
langues en fonction de l’utilisateur
• Multi-sources– Agréger les informations venant de plusieurs canaux pour
les exploiter ensemble et trouver des synergies
• Multi-formats– Encoder les connaissances contenues dans les documents
hétérogènes dans du RDF
• Résultat : multi-points de vue– L’information peut être requêtée en fonction du besoin– Elle peut-être reconfigurée en fonction du public, du
media, de l’instant
Web sémantique et développement durable : des parallèles
Ouvrir ou enfermer ? L’accès à l’information pour les citoyens
• L’ouverture des données publiques ? Un enjeu majeur !– PSI : public sector information
– USA, UK : http://data.gov, http://data.gov.uk
– Europe : http://ec.europa.eu/information_society/policy/psi
– France :
• Projet ANR « datalift » : http://datalift.org• Nos députés : http://nosdeputes.fr• DILA (direction de l’information légale et
administrative) (Journaux officiels + Documentation Française), annuaire de l’administration française http://lannuaire.service-public.fr
Web sémantique et développement durable : des parallèles
Ouvrir ou enfermer ? La transparence
• Problème politique : comment encourager à ouvrir des données – même sensibles ?– Permet de relier et d’apporter de la valeur ajoutée à ses données
– Effet de levier : plus il y aura de données publiées, plus les acteurs publics ou privés seront incités à faire de même
– Demande des citoyens
• A son banquier : que faites-vous de l’argent que je dépose sur votre compte ?
• La crise financière aurait-elle eu lieu si les données de transactions financières étaient publiées en « données ouvertes » sur le web ?
• Quel niveau de confiance peut-on accorder aux données publiées ?– Web of trust
Web sémantique et développement durable : des parallèles
Cas d’usage – DILA
Web sémantique et développement durable : des parallèles
Relier ou protéger ? cohabitation• Les 2 mouvements du web sémantique :
– Donner accès à des données de références, pour éviter de « réinventer la roue »• Ex : Geonames (géographie), Uniprot (protéines), etc.
– Permettre de faire cohabiter des visions du monde différentes• Cohabitation entre des ontologies différentes
– foaf:Person et cyc:Person• Entre des concepts de thesaurus différents
– Eurovoc:biosphere et unesco:biosphere• Entre des instances différentes
– geonames:Berlin et dbpedia:Berlin
• Si ce qui existe déjà ne vous convient pas :– Etendez-le– Ou refaites-le et dites que « c’est à peu près la même chose »
• (oui mais comment ?)• Paradoxalement, ce lien n’est pas de l’ordre de la
dépendance, mais de la libération pour vos données !
Web sémantique et développement durable : des parallèles
Relier + ouvrir = découvrir, l’inférence
• Si : – … j’ai ouvert mes données– … et que je les ai reliées à d’autres– … alors je suis capable d’exploiter ces liens et d’en découvrir de
nouveaux
• L’inférence est la capacité à découvrir de nouvelles informations à partir des informations existantes
• Mise en commun de données hétérogènes :– Consolider les données (recoupement)– Découverte de nouveaux liens– Détection de signaux faibles– Aide à la décision
• => moyen directement applicable au service du développement durable
Web sémantique et développement durable : des parallèles
Relier ou protéger ? Alignement de vocabulaires
ETT
Web sémantique et développement durable : des parallèles
TAE project overview: WHAT?
ETT GEMET
4.2
4.3
Web sémantique et développement durable : des parallèles
New project
Web sémantique et développement durable : des parallèles
Project information
Web sémantique et développement durable : des parallèles
Alignment review
Web sémantique et développement durable : des parallèles
Eduquer ou abêtir ? La participation
• Le web (sémantique) est une infrastructure où chacun peut être producteur d’information– Vs. consommation passive
• En quoi le web sémantique concourre-t-il à la transformation des individus (dans le bon sens ?)– « raise the awareness »
Vs.
Web sémantique et développement durable : des parallèles
Eduquer ou abêtir ? Les risques
• Les technologies sémantiques portent en elles une promesse d’ouverture des données
• Cette ouverture des données va-t-elle servir à :– Faire (encore plus) de profiling des utilisateurs ? (pour leur
vendre de la publicité ciblée)– Continuer à créer des « petits mondes » fermés ? comme dans
les réseaux sociaux qui ne nous relient qu’à des gens que nous connaissons déjà
– Continuer à créer des systèmes d’information centralisés ?– Accentuer la surveillance sur les individus ?
• Ou bien à :– Eveiller la curiosité et augmenter la prise de conscience ?– Trouver des liens nouveaux entre individus et communautés ?– Accélérer le processus de décentralisation ?– Accroitre l’autonomie des individus ?
Web sémantique et développement durable : des parallèles
Conclusion
• « Simplicity, simplicity, simplicity ! » (H. D. Thoreau)
• Les technologies sémantiques : une « couche en plus » au-dessus du système d’information ?
• Ou bien un socle permettant de bâtir des architectures pérennes pour– Valoriser les singularités
– Bâtir des systèmes de connaissances durables
– Capitaliser l’information environnementale, sociale ou économique
– Favoriser la transparence et l’accès citoyen
– Faire cohabiter et se comprendre différentes visions du monde