Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique de LOP Inra

Post on 07-Jul-2015

379 views 1 download

description

Le but de cette présentation est de faire découvrir les plateformes Vitro et VIVO développées par l’université de Cornell. Vitro est une plate-forme d’édition, de navigation, de recherche et de publication de données en RDF. Son interface permet de modifier à la fois l’ontologie et les instances, et peut être customisé (pour la présentation ou la recherche). VIVO quant à lui est une adaptation particulière de Vitro pour les acteurs de la recherche scientifique. À l’Inra, nous avons utilisé VIVO pour proposer une version sémantique des publications scientifiques de l’Inra contenues dans l’archive institutionnelle Prodinra. Le résultat offre des fonctions de recherche/découverte/visualisation des acteurs de la recherche (personnes, structures), de leurs activités et productions, ainsi que des événements auxquels ils participent. Le projet a consisté en une migration des données de ProdInra vers VIVO, un chargement des données dans VIVO, une customisation de l’ontologie utilisée par VIVO ainsi que des templates d’affichage des données.

Transcript of Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique de LOP Inra

VIVO pour une application Web sémantique

Linked Open Publications (LOP)

Esther Dzalé Yeumo Thomas Francart

Objectifs du projet LOP

Objectifs

• Objectif 1 : mettre à disposition le contenu de la base des publications de l’Inra dans le Web de données

Objectifs

• Objectif 2 : lier le contenu de la base des publications à d’autres référentiels Inra décrivant la recherche – Structures de recherche (centres, départements,

unités, etc.)

– Activités de recherche

– Personnes

– Champs thématiques

Objectifs

• Objectif 3 : utiliser les technologies du text-mining pour annoter le contenu et mettre le résultat dans le Web de données – Lier les contenus Inra à des vocabulaires de référence

dans nos domaines (Agrovoc, Gene Ontology, etc.)

– Lier les contenus de l’Inra à des sources de données variées (banques de données génomiques et génétiques, etc.)

– Offrir des fonctions de recherche, de visualisation et d’analyse intelligentes

Choix de VIVO

Pourquoi VIVO

• VIVO nous permet de répondre rapidement aux objectifs 1 et 2 – Intégration et mise à disposition d’informations

actualisées, pertinentes et précises sur les personnes, les structures, leurs activités et leurs réalisations

• VIVO offre des fonctions de recherche et de visualisation clé en main intéressantes

Intégration des données et mise à disposition dans le Web de données

Customisation de l’interface VIVO

Chargement des données dans VIVO

Rapprochement vers des référentiels externes

Transformation au format RDF

Récupération des données à partir des référentiels Inra

Annotation sémantique des contenus

Cust

omis

atio

n de

l’on

tolo

gie

Itér

atio

ns s

ucce

ssiv

es

Résultats

Résultats

• Résultat 1 : synthèse d’informations pertinentes et actualisées sur les personnes (agents Inra), les structures Inra, leurs activités et leurs productions – Mise en réseau de données de « silos » différents

Résultats

• Résultat 2 : identification rapide/facile des experts d’un domaine

Champ thématique Structures/Personnes Map Of Science

Temporal graph

Disciplines dans lesquelles la

structure/personne publie, sur la base des publications

chargées dans VIVO

Comparaison graphique de la prodution des structures et

des personnes

Limites, difficultés

Limites, difficultés • Mise à jour des informations

– Modifications faites par les personnes via l’interface de VIVO vs mises à jour (semi)automatiques à partir des sources

– Doublons avec les mêmes URIs lors de chargements successifs

• Solution de contournement: réinitialisation de la base de données + reconfiguration de l’interface Web à chaque chargement

• Solution à moyen terme: chargement des données dans un triple store Sesame

• Performances : ralentissements observés pour • Le chargement des données via l’interface • La génération des graphiques

VIVO / VITRO

“Plateforme web sémantique et open-source de publication et de découverte

de chercheurs et de leurs travaux de recherche”

Un peu de background

• Cornell University, 2009, puis University of Florida – Suite d’autres projets de publications à Cornell depuis

2003

• Portail officiel (liens vers les déploiements VIVO) – http://vivoweb.org

• WIKI et documentation – https://wiki.duraspace.org/display/VIVO/VIVO

• Introduction – https://wiki.duraspace.org/display/VIVO/Introduction

+to+VIVO+2014+Workshop

(ORCID)

VITRO • Plate-forme « nue » de

recherche, navigation, édition, publication de données RDF

• 90% du code de VIVO

• Permet d’éditer son ontologie et ses données pour prototyper des applications

VIVO • Customisation de VITRO

• Ontologie • Templates de pages

(regroupement, ordre des propriétés)

• Menus de navigation • Visualisations

foaf (personnes, organisations)

bibo (publications)

Skos (classifications)

event

vcard

vivo relationships

Gestion de l’ordre des auteurs

Gestion des personnes inconnues

Extension de l’ontologie

Conserver à la fois la sémantique riche des données et les

fonctionnalités de l’application

.029

A use case of ontology adaptation: the Vivo Ontology adapted to the INRA 25/ 09/ 2014

1st European Ontology Network (EUON) Workshop, Amsterdam, The Netherlands 25 / 09 / 2014

Agent

Organization

Division

Private Sector Actor

Local Government

Specialized Public Institution

Research Center

Research Department

Ministry or Parliament

International Organization

INRA Unit

Experimental Unit

Research Support Unit

Research Unit

Service Unit

Person INRA Staff

Other Person

European Organization

Authorship Information Resource has authorship to an

Geopolitical Entity

Subject Area

has research interest adresses

Dataset

Collection

Document

Software Image Map

Audio Document

Audio-Visual Document

Article

Book

Report

Academic Article

Editorial Article

Review

Research Paper

Interview

Correspondence

Letter to Publisher

Lecture Notes

Critical Review

Full Paper

Short Paper

Extended Abstract

Abstract

Conference Paper

Oral Presentation

Television Broadcast

Conference Poster

Chapter

Thesis

Patent

Proceedings

Working Paper

Research Note Book

Dictionary

Essay

Encyclopedia

Review

Comic Strip

Bibliography

Book Review

State of Art

Collective Scientific Expert Report

Foresight Report

Analysis Report

Outside Duty Report

Technical Report

Working Paper

Literature Review

Contract End Report

Tender Submission

Project Annual Report

Research Report Vision Document

Contract of Agreed Objectives

Directoriales Report

Activity Report

Self Assessment Report

Situation Report

Charter Guide Booklet Quality Plan Certification

Audit Report

Website

Database

Terminology

Ontology

FOAF

VIVINRA VIVO core BIBO

Event

Other Relation Subtype Relation

.030

A use case of ontology adaptation: the Vivo Ontology adapted to the INRA 25/ 09/ 2014

1st European Ontology Network (EUON) Workshop, Amsterdam, The Netherlands 25 / 09 / 2014

Agent

Organization

Division

Private Sector Actor

Local Government

Specialized Public Institution

Research Center

Research Department

Ministry or Parliament

International Organization

INRA Unit

Experimental Unit

Research Support Unit

Research Unit

Service Unit

Person INRA Staff

Other Person

European Organization

Authorship InformationResource has authorship to an

Geopolitical Entity

Subject Area

has research interest

adresses

Dataset

Collection

Document

Software Image

Map

Audio Document

Audio-Visual Document

Article

Book

Report

Conference Paper

Oral Presentation

Conference Poster

Chapter

Thesis

Patent

Proceedings

Working Paper

Event

Colloquium

Congress

Public Debate

Summer School

Exposition

Forum Working Meeting

Open House Event

Study Day

Trade Exhibition

Symposium

Seminar

Round Table

Periodical Journal

Published in

FOAF

VIVINRA VIVO core BIBO

Event

Other Relation Subtype Relation

vivosearch.org • Portail de recherche fédérée sur les données provenant de

plusieurs déploiements VIVO • Possible seulement grâce à des données ouvertes et connectées

Merci!

• Contributeurs au projet – Andro Mathieu – Aubin Sophie – Aventurier Pascal – Cocaud Sylvie – Dedet Fanny – Dzalé Yeumo Esther – Francart Thomas – Lehenaff Diane – Li Linlu – Mader Claudine