Post on 03-Apr-2015
1Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
IronWEB : Une architecture distribuéepour la création de bases de connaissances
pédagogiques sur le Web
Gaëtan DUSSAUXJean-Pierre PECUCHET
Laboratoire PSI, INSA de Rouen{dussaux, pecuchet}@insa-rouen.fr
http://ironweb.insa-rouen.fr
2Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Le potentiel du Web ...
• Des sources d’information– sites Web des écoles et universités– des laboratoires de recherche– pages perso– entreprises, organismes, assoc– …
• les problèmes rencontrés– donner accès à cette information– qualifier l’information pertinente
3Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Des sources d’information
• sites Web des écoles et universités
• des laboratoires de recherche• pages perso• entreprises, organismes, assoc• …
4Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
les problèmes rencontrés
• donner accès à cette information• qualifier l’information pertinente
5Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Quelques constats
• Limite des outils de recherche– indexation automatique
• caractère automatique• résultats bruités
– indexation manuelle• information pertinente• information trop générale et silence
– métamoteurs ou agents intelligents• interrogation de plusieurs outils• adaptation au moins puissant
6Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
L’objectif d’IronWEB
• Fournir aux étudiants des "moteurs de recherche" spécialisés dans leur domaine
• Construction automatique de ces moteurs de recherche
• exploiter, factoriser, utiliser les différentes expériences de navigation des enseignants
7Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
IronWEB - côté enseignant (1/2)
• Un serveur de signets– valeur ajoutée pour l’enseignant
(usage nomade de ses signets)– création d’une base de
connaissances avec ces signets, qui sont des pages pertinentes
– catégorisation des signets en fonction du département de l’enseignant
8Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
IronWEB - côté enseignant (2/2)
• Une base de connaissances construite automatiquement– indexation du contenu des pages
pointées par les signets (algorithme de Lamrous)
– regroupement des différentes arborescence de signets
– une base de cas avec les histoires des découvertes des pages pertinentes
9Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
IronWEB - côté étudiant
• Des moteurs de recherche spécialisés pour chaque département– Un moteur de recherche par mots
clés• à partir de l’indexation plein texte
– un annuaire• navigation dans les arborescences de
signets des enseignants regroupées
– Une aide à la recherche• exploitation de la base de cas
10Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Architecture à l’INSA de Rouen
Servlets
ServeurWEB
Serveur d’ObjetsDistribués
RMI
Index
Moteurd’Indexation
Méthode des Barycentres
RMI
Gestionnairede Connexions
CORBA
ProxyAuthentification
Gestionnairede Connexions
CORBA
ProxyAuthentification
Gestionnairede Connexions
CORBA
ProxyAuthentification
Gestionnairede Connexions
CORBA
ProxyAuthentification
Gestionnairede Connexions
CORBA
ProxyAuthentification
Signets
Les bases de connaissances
CFI
ASI
MECA
GM
EPEnseignants
CFI
ASI
MECA
GM
EP
Etudiants
+ Enseignants
à l’I NSA de Rouen
Base de Cas Index
Signets
Base de Cas Index
Signets
Base de Cas Index
Signets
Base de Cas Index
Signets
Base de Cas Index
11Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Choix technologiques (1/3)
• 100% JAVA• Une architecture distribuée
– RMI– CORBA
• Un serveur WEB– Apache + Jserv– Servlets
12Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Choix technologiques (2/3)
• Un SGBD - JDBC– Oracle– Bientôt PostgreSQL (Linux) - Gratuit
• Gestion et consultation des bookmarks– Par applet– Bientôt une version javascript plus
légère pour la consultation
13Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Choix technologiques (3/3)
• L’algorithme d’indexation
CorbaRMI
the
f(27)
f(31)
Zone de pertinence
Déc
rois
sanc
e de
la p
erti
nenc
e
A Detailed Comparison of CORBA, DCOM and J ava/RMIhttp:/ /www.execpc.com/~gopalan/misc/compare.html
Nombre de mots : 5 994Nombre de mots diff érents : 1 068
Occurrences la plus élevée : 411
14Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Capture d’écran - côté enseignant
Alimentation en ligne à l’aide d’une bookmarklet
Importation de signets existants
15Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Capture d’écran - côté enseignant
Applet de consultation / organisation des signets
16Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Capture d’écran - côté étudiant
• Le moteur de recherche
17Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Capture d’écran - côté étudiant
• L’annuaire
18Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Perspectives
• Court terme– Finir expérimentation dép GM
• Implémenter la base de cas• S’affranchir d’Oracle et Windows au
profit de PostgreSQL et Linux
– Etendre à l’INSA Rouen
• Long terme– interconnecter tous les INSA
19Gaëtan DUSSAUX, Jean-Pierre PECUCHET (INSA de Rouen) - IronWEB
Architecture IronWeb distribué
Les bases de connaissances
Signets
Hiérarchies
I ndex
Base de cas
Servlets
ServeurWEB
Serveur d’ObjetsDistribués
RMI
Moteurd’Indexation
Méthode des Barycentres
RMI
Pro
xys
CFIEP
GMMECA
ASIEnseignants
CFIEP
GMMECA
ASIEtudiants
Les bases de connaissances
Signets
Hiérarchies
I ndex
Base de cas
Servlets
ServeurWEB
Serveur d’ObjetsDistribués
RMI
Moteurd’Indexation
Méthode des Barycentres
RMI
Pro
xys
ESCGCU
GEGMA
GPI
ESCGCU
GEGMA
GPI
Enseignants
Etudiants
Les bases de connaissances
Signets
Hiérarchies
I ndex
Base de cas
Servlets
ServeurWEB
Serveur d’ObjetsDistribués
RMI
Moteurd’Indexation
Méthode des Barycentres
RMI
Pro
xysGBAGCUGEI
GMMGMGP
GPI
Enseignants
GBAGCUGEI
GMMGMGP
GPI
Etudiants
Les bases de connaissances
Signets
Hiérarchies
I ndex
Base de cas
Servlets
ServeurWEB
Serveur d’ObjetsDistribués
RMI
Moteurd’Indexation
Méthode des Barycentres
RMI
Pro
xys
BGEE
GPTSUGCUGMC
IGEGM
GMDSGM
Enseignants
BGEE
GPTSUGCUGMC
IGEGM
GMDSGM
Etudiants
Métamoteur GCU Métamoteur GM
fusion des signets fusion des index fusion des arborescences fusion des bases de cas----------------------------------------------------------------- description des moteurs en XML fusion = élimination des doublons + classement moteurs homogènes donc fusion cohérente