Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant...

17
OntoSides: Avancement et Intégration SIDES RAPPEL, ARCHITECTURE, EXEMPLES FABRICE JOUANOT, OLIVIER PALOMBI, MARIE-CHRISTINE ROUSSET, ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0

Transcript of Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant...

Page 1: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

OntoSides: Avancement et Intégration SIDES

RAPPEL, ARCHITECTURE, EXEMPLES

FABRICE JOUANOT, OLIVIER PALOMBI, MARIE-CHRISTINE ROUSSET,ADAM SANCHEZ

MEETING 20 DÉCEMBRE 2017 1

3.0

Page 2: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

• intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES,

les traces d'activités d’étudiants (65K étudiants 2015-2016)

• interrogeable par un langage de requêtes (SPARQL)permettant d'exprimer à l’aide des termes de l’ontologie des questions utiles

pour le suivi (de groupes) d’étudiants

et de préparer des données pour analyse (=> WPs)

• construite en utilisant les standards et les technologies du Web sémantique et du Linked Data (RDF, RDFS, SPARQL)

OntoSides: base de connaissances en RDF

MEETING 20 DÉCEMBRE 2017 2

Page 3: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

Modèle unifié pour données, méta-données, ontologie• Modèle RDF = ensemble de triplets <sujet, propriété, objet/valeur>

<Act1001, réalisé_par, Etu100> signifie que l'action 1001 est réalisée par l'étudiant 100 Schéma extensible à souhait, Pas de réelle différence entre schéma et instances

• Ontologie: un ensemble de contraintes (aussi exprimées en RDF) sur les classes et les propriétés Contraintes de typage sur les sujets et objets reliés par une propriété Contraintes de hiérarchisation entre classes et entre propriétés

sides:correspond_a_questionrdf:type rdf:Property ;rdfs:domain sides:action_de_répondre ;rdfs:range sides:question ;

.

sides:adr1rdf:type sides:action_de_repondre;sides:correspond_a_question

sides:q148 ;sides:a_correctement_coche

sides:prop621 , sides:prop620 ,sides:prop623 , sides:prop622 ;

sides:effectue_durantsides:epreuve861 ;

Triplets décrivant des instances

Triplets décrivant une propriété de l’ontologie

MEETING 20 DÉCEMBRE 2017 3

Page 4: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

Avancement et état actuel• Etat précédent :

936 étudiants, 316.803 actions de répondre près de 15.000 questions faisant partie de près de 1000 dossiers les différents items du programme (référentiel ECN): 1300 environ 6 règles d'inférence Nombre de triplets (version saturée): 5 447 955 triplets

• Etat actuel: 64 957 étudiants inscrits en 2015-2016 avec leur cursus en cours A2 à A6 pour les 948 étudiants Grenoblois, 112 588 190 actions de répondre accessibles pour tout SIDES 590 654 questions faisant partie des épreuves pour tout SIDES les items du programme (référentiel ECN) consolidés et les spécialités Toutes les données sont maintenant horodatées !

MEETING 20 DÉCEMBRE 2017 4

Page 5: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

Architecture Générale: modèle en 3 couches

MEETING 20 DÉCEMBRE 2017 5

Sou

rce

sEx

tern

es

On

tolo

gie

On

tosi

de

sIn

terf

ace

Par

ten

aire

DumpSides

UMLSstandardWiki SidesSides DbmsExtraction

Etudiant Evaluation Question

ECN

Objectif

Sous-objectif

Spécialité

Référentiel

Inscription

Action de répondre

Dossierprogressif

Questionsisolés

QRM QRUA pour inscritRealisé par

Est composant de

Est lié àA pour séquence de question

Correspond à

Est lié à

SPARQL End-pointLangage naturel

guidéFormulaire dynamique

Webservice

QROC

Page 6: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

Zoom sur le liage des données

MEETING 20 DÉCEMBRE 2017 6

etu1001

Spécialité

enrol10502

act918

A pour inscrit

Realisé par

Correspond à

Est lié à

q128

Med_A5

Correspond à

HématologieQuestion

a

a

Spécialité

Est lié à

q128

CardiovasculaireQuestion

a

a

act540

Correspond à

ECN

Objectif d'apprentissage_208…

Est lié à

(Hémogramme …indications et interprétation)

Wiki Sides

See also

a

'1/09/2015'A pour dated'inscription

'#######'A pourtimestamp

Est lié à

Page 7: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

Interrogation de OntoSides (illustration)Nombre de questions et Nombre d’actions de répondre liées, restreint aux questions à réponse unique, pour chaque spécialité médicale

MEETING 20 DÉCEMBRE 2017 7

Page 8: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

MEETING 20 DÉCEMBRE 2017 8

Nombre de questions et Nombre d’actions de répondre liées, restreint aux questions à réponse unique, pour chaque spécialité médicale

Page 9: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

MEETING 20 DÉCEMBRE 2017 9

Pour chaque question à réponse unique reliée à la spécialité des maladies infectieuses, ayant été traitée plus de 100 fois, et au moins 1 fois de façon correcte, donner son titre et le nombre d’actions de répondre effectuées.

Page 10: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

MEETING 20 DÉCEMBRE 2017 10

Pour chaque question à réponse unique reliée à la spécialité des maladies infectieuses, ayant été traitée plus de 100 fois, et au moins 1 fois de façon correcte, donner son titre et le nombre d’actions de répondre effectuées.

Page 11: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

MEETING 20 DÉCEMBRE 2017 11

Pour chaque question à réponse unique reliée à la spécialité des maladies infectieuses, ayant été traitée plus de 100 fois, et au moins 1 fois de façon correcte, donner son niveau de difficulté (nombre d’actions de répondre correctes / nombre d’actions de répondre effectuées)

Page 12: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

MEETING 20 DÉCEMBRE 2017 12

Pour chaque question à réponse unique reliée à la spécialité des maladies infectieuses, ayant été traitée plus de 100 fois, et au moins 1 fois de façon correcte, donner son niveau de difficulté (nombre d’actions de répondre correctes / nombre d’actions de répondre effectuées)

Page 13: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

MEETING 20 DÉCEMBRE 2017 13

Pour chaque question à réponse unique reliée à la spécialité des maladies infectieuses, ayant été traitée plus de 100 fois, et au moins 1 fois de façon correcte, donner son niveau de difficulté (nombre d’actions de répondre correctes / nombre d’actions de répondre effectuées)

Page 14: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

Zoom sur le mapping opérationnel

MEETING 20 DÉCEMBRE 2017 14

On-the-fly Ontology-based Data Accessavant matérialisation dans Virtuoso

• Ontop: pour requêter en SPARQL un SGBDR via un graphe RDF virtuel.

SPARQL / SPARQL end-point Langage de mapping déclaratif Inference (RDFS/OWL) Performance d'accès

• Pro / Cons₊ Matérialisation inutile des instances (triplets) dans l'ontologie₊ Approche très flexible en Amont (et retro_ingineering): Pre-prod₋ Ecriture du mapping₋ Performance réelle sur de très larges jeux de données

Page 15: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

Zoom sur le mapping opérationnel

MEETING 20 DÉCEMBRE 2017 15

Exemple de mapping

Page 16: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

Travaux en cours

MEETING 20 DÉCEMBRE 2017 16

• Intégration SIDES.

Intégrer la population complète dans le temps (gérer plusieurs dumps SIDES)

Intégrer le cursus complet des étudiants (hétérogénéités entre établissement)

Enrichir les liens avec le Wiki Interface d'interrogation en langage naturel guidé par l'ontologie

• En attente de vos besoins Pour enrichir l'ontologie Pour proposer des interfaces d'accès adaptées Pour tester les limites de préparation/analyse des données

au niveau ontologie

Page 17: Avancement et Intégration SIDES · ADAM SANCHEZ MEETING 20 DÉCEMBRE 2017 1 3.0 •intégrant autour d’ une ontologie “métier” le contenu pédagogique de SIDES, les traces

MEETING 20 DÉCEMBRE 2017 17