L avenir du web au prisme de la resource

265
l’avenir du web au prisme de la ressource Nicolas Delaforge, Fabien Gandon et Alexandre Monnin

Transcript of L avenir du web au prisme de la resource

l’avenir du web au prisme de la ressource

Nicolas Delaforge, Fabien Gandon et Alexandre Monnin

cinq objectifs • présenter

(un web de ressources computationnelles)

• résumer, rappeler (web de données, web sémantique)

• discuter, provoquer (le document n’existe pas)

• orienter (et pour nous alors)

• conclure, ouvrir (ce n’est que le début)

architecture web

trois composants de l’architecture du web

• identification (URI) & adressage (URL) http://www.inria.fr

http://ns.inria.fr/fabien.gandon#me

ldap://[2001:db8::7]/c=GB?objectClass?one

• communication / protocole (HTTP) GET /centre/sophia HTTP/1.1

Host: www.inria.fr

User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de)

AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4

Safari/523.10

Accept-Encoding: gzip

Accept: text/html,application/xhtml+xml,application/xml

Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3

Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7

Referer: http://fabien.info/

• langage de représentation (HTML / RDF) Fabien travaille chez <a href="http://www.inria.fr">Inria</a>

<http://www.inria.fr> foaf:member data:fabien

UR*

pas pour les gens… et pourtant…

URI: identification de n’importe qu’elle ressource

URL=URI + Localisation URL=UR(I+L)

HTTP URI: URI déréférençable selon HTTP « follow your nose » / naviguer au flair

(wikipedia)

la syntaxe des URIS qui et quand ?

URI aux jointures • entre les assertions

même si elles sont distribuées

• entre les couches réseau (Internet, Web, Web sémantique)

1 physique

2 données

3 réseau

4 transport

5 session

6 présentation

7 application

web documentaire « REST in peace » • REST(ful): invocation et composition d’applications

distribuées sur le web

• primitives HTTP, actions sur la ressource GET, HEAD, POST, OPTIONS,

CONNECT, TRACE, PUT, DELETE

• le web ne fut jamais vraiment documentaire

• web…

– application centrée ressources (identifiées par URI)

– architecture orientée ressource (localisables URL)

– toile de calculs liés et non de documents

trois composants de l’architecture du web

• identification de la ressource (URI)

• accès à une représentation (HTTP URI)

• codage de la représentation (HTML , RDF, etc)

ressource

HTTP Range 14

Code HTTP Résultat Indication

200 (OK) Représentation Ressource informationnelle (IR) et

non informationnelle (NIR) ?

303 (voir autre)

URI Tout type de ressource notamment

des NIR

4XX, 5XX (erreur)

Message d’erreur

Aucune déduction possible

« ce n’est peut-être pas le problème de HTTP ou des URI »

ils n’en ont pas parlé ils en ont parlé

uri, ressource, ombre, objet

• identification

• individuation/ objectivation

zèbre (à défaut d’antilope )

ressource • tout ce que l’on sait identifier

• pierre angulaire de l’architecture de tout le web

• concept unificateur de ses facettes

« ressource » HTTP URI requête HTTP

erreur HTTP

représentation

Généalogie : du document (B.B.) à la ressource

Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la longue durée

Ressource : Manipulation indirecte

« … » locus

l’objet

la ressource

l’état de la ressource

l’état représentationnel ou une représentation de la ressource

ressources computationnelles

« … »

règl

es

rappel et parallèle • sans notice pas d’existence dans la collection

• sans ressource pas d’existence sur le web

toile de calculs

appearences database

1991-1993 System 33: un prédécesseur méconnu du conneg + services de rendu

Electronic documents

Rendering service

Computers

Servicing Client

Application

Other encoding formats

RPC

Psychophysically equivalents

client serveur

conneg

http

moteur et CGI

personnalisation, adaptation « Filter Bubble » Eli Pariser

Fabien Gandon: Wed, Jul 18, 2012 at 9:48 AM, Inria, Sophia Antipolis, France, Dell 6200, Windows 7, Anglais

Alexandre Monnin: Alienware, Chromium SRware Iron, Windows 7, Paris

Adrien Basse: 17h57mn à 18h07mn GMT, Dakar/Sénégal, Mac book pro, Mac os X (10.6.8), french

Yves Raimond: Firefox 13.0.1, Ubuntu 12.04, in London

Antoine Isaac: 10h45pm, Amsterdam, Prins Hendrikkade 129, MacBook Pro, English OS: MacOs X 10.6.8, Firefox

Rémi Trichet: 12:41pm 7/18/2012, Los Angeles, Intel Xeon 3,6 Ghz, Windows 7 Professional, English

il cherche « bmw », « mahler » et « gay »

? = ! BMW

« Je m’intéresse aux BMW »

Allo Google ? C’est la Noiraude…

United States Flu Activity - Influenza estimate ● Google Flu Trends ● U.S. Centers for Disease Control.

« document sur lui-même » document vivant, chaque consultation change le document

900 millions

Chine: 1 600 millions

Inde: 1 200 millions

acebook

PORTÉE

externaliser la socialité d’un site intérêt et danger

OGP v2 actions typées

OGP schémas…

code dans votre page

<html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US"

xmlns:fb="https://www.facebook.com/2008/fbml">

<head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns# YOUR_NAMESPACE:

http://ogp.me/ns/apps/YOUR_NAMESPACE#">

<meta property="fb:app_id" content="YOUR_APP_ID" />

<meta property="og:type" content="YOUR_NAMESPACE:recipe" />

<meta property="og:title" content="Stuffed Cookies" />

<meta property="og:image" content="http://example.com/cookie.jpg" />

<meta property="og:description" content="The Turducken of Cookies" />

<meta property="og:url" content="http://example.com/cookie.html">

<script type="text/javascript">

function postCook()

{ FB.api('/me/YOUR_NAMESPACE:cook' +

'?recipe=http://example.com/cookie.html','post', (…) }); }

</script>

</head>

<body>

(…)

<form>

<input type="button" value="Cook" onclick="postCook()" />

</form>

</body>

</html>

Face… it

changing interface…

crowdsourcing crawling & indexing affiliation social sub-networks

analyse réseaux sociaux web 2.0 & dynamique

© FriendViz © Obama’s network, Recorded Future

© Egyptian Revolution on Twitter, A. Panisson, Gephi © Facebook

une représentation est modifiée par un

commentaire contenu essentiel, lié à une

ressource spécifique (un article) vs

contenu accessoire, lié à une règle non-essentielle

(un commentaire)

une ressource change : une question

devient une réponse parfois… ? !

suppression définitive ni ressource, ni représentation

gérér sa bibliographie : Zotero et Coins

extraction de données « page » donnant l’analyse du texte d’une autre « page »

made in web

auteurs?

journal confusion des genres?

permanence/ non permanence

raccourcisseur d’URL et re-captcha…

des jeux utiles au crowdsourcing le web comme une plateforme d’externalisation distribuée de masse.

Fold It

temps facebook 16.2 millions secondes/seconde

x 16 203 703

253

l’utilisateur utilisé

le web comme une machine universelle

de moteurs à pulsions

(méta)-données

application web

jeu HTML5

Mario Kart en HTML5 (ouf !)

jouer dans le navigateur : le cloud

© HTML5Rocks

download

upload

drag & drop

© HTML5Rocks

speech input

geolocation

© HTML5Rocks

html & js html & svg

WebGL

inputs, text, email, number, phone ©HTML5Rocks

HTML pages of specifications

39 pages 963 pages

HTML 1

Ligne de Temps

annotations des éléments multimédia

• description sémantique de ressources multimedia [Media Annotation]

• adressage d’éléments internes aux ressources [Media Fragment]

fragment multimédia • partie fragment de l’URL = après le #

http://www.example.com/example.ogv#track=audio&t=10,20

• dimensions:

– temporelle: t=10,20 / t=npt:,0:02:01.5 / t=clock:2009-07-26T11:19:01Z

– spatiale: xywh=pixel:160,120,320,240 / xywh=percent:25,25,50,50

– track: track=1 / track=video&track=subtitle / track=Wide

– nommée: id=chapter-1

• fragment non transmis par le navigateur: encodage dans la requête HTTP

ontologies des ressources multimédias ontology for Media Resources 1.0 <video.ogv> a ma:MediaResource ;

ma:hasTrack <video.ogv#track=audio>,

<video.ogv#track=subtitle>;

ma:hasSubtitling <video.ogv#track=subtitle> ;

ma:hasSigning <video.ogv#xywh=percent:70,70,90,90> .

<video.ogv#track=audio> a ma:AudioTrack ;

ma:hasLanguage [ rdfs:label "en-GB" ] ;

ma:hasFragment <video.ogv#track=audio&t=10,20> .

<video.ogv#track=audio&t=10,20> a ma:MediaFragment ;

ma:hasLanguage [ rdfs:label "fr" ] .

<video.ogv#track=subtitle> a ma:DataTrack ;

ma:hasLanguage [ rdfs:label "es" ] .

<video.ogv#xywh=percent:70,70,90,90> a ma:MediaFragment ;

ma:hasLanguage [ rdfs:label "bfi" ] .

universelle une interface programmatique

serveur application

HTTP HTTP

application

navigateur

HTTP

design & affordance ceci est un ovetto

affordance sémantique

SAWSDL semantic annotation of WSDL (W3C Rec. 2007)

SAWSDL…

sémantiquement services annotés et recherchés

fournisseur service client demandeur

annuaire

3

1 2

pre-populating…

entrée

sortie

assistant’s phone phone name name phone name

employee assistant

workflows scientifiques

• composer des données et traitements distribués

• échanger et comparer les traitements et leurs compositions

se lier au monde

Le bug de l’an… 2020

( inspiration Gérard Berry)

SSRSSLSSS

SSLSSLSSS

1 sec. battement de cœur

1/2 sec. double click

24 images/sec. film

500 000 décisions / sec. algorithmes boursiers « Aliénation et accélération. » Hartmut Rosa

http://mon.org/ma/ressource

règles négociation calculs composition rendu …

… …

… …

DNS, TCP/IP, Web

http://mon.org/ma/ressource

règles négociation calculs composition rendu …

… …

… …

DNS, TCP/IP, Web GET

30 min…

5 jours…

le livre n’est pas recréé à chaque page

Stéphane Crozat: « le document numérique n'existe pas, ce qui

existe ce sont des constructions numériques dont le traitement calculatoire simule un ordre documentaire. »

Le juridique aussi souffre de l’héritage documentaire des données

nouveaux engagements, contrats • contrats de lecture + computationnel

• contrats d’identification + computationnel

• contrats d’accès + computationnel

• contrats de publication + computationnel

• contrats de stockage + computationnel

• etc.

« il n’y a plus de documents, le besoin de documentariser n’en n’est que plus fort. »

tant à venir

le web entre nous et le monde • documents & données augmentent nos perceptions

• services & applications augmentent nos actions

• incontournable &… ingérable?

réalité augmentée par le web & augmentation du web par le réel

• vers une réalité augmentée par le web

• diversité des ressources web augmentée par diversité des ressources de notre réalité

• « documentarisation non documentaire » de la réalité par le web

• modèle documentaire rendu minoritaire / modèle calculatoire

• limite de la métaphore de la bibliothèque

• une toile de ressources informatiques

google glass project

chaque utilisateur est un détecteur web de « consommacteurs » mobiles, « crawlers » du web & du monde physique ex. Wikimapia, OpenStreetMap , etc.

© Medialab Prado © GeoSensor

Image,T. Berners-Lee, RuleML kickoff, 2005

une toile de données multiples entre différents barreaux de l’échelle des sphères

« small data & big data »

web…devices … Web Phone

… Web TV

… Web Radio

… Web Car

… Web Tablet

… Web eBook

… Web Watch

… Web GPS

[Web of Devices]

cintre Facebook chez C&A Brésil

nouvelles topologies du web ex. « near field communication »

Open Street Map dans le métro

navigateur web = interface universelle ex. domotique

Web 2.0 & Web Physique

RFID&URI ex. Live Social Semantics

fabien

Janet Echelman, “Her Secret is Patience”, Civic Space Park, Phoenix, AZ, USA, 2009

plusieurs évolutions concourantes • explosion multimédia et multi-modalité

• toile de ressources computationnelles liées

• ressources comme locus de calcul

• assimilation de tous les objets à des ressources web

l’effet diligence Jacques Perriault

(méta) web

liens d’association du mémex entre les informations qui nous importent

[Vannevar Bush, 1945]

hypertexte, hypermédia une structure de fichier pour l’information

complexe, changeante et indéterminée

[Ted Nelson, 1965]

à travers le réseau liens utilisant des références

http://www.

[Tim Berners-Lee, 1989]

hypertexte et document sur le Web : de la nécessité de les reconstruire par assemblages

Hypertexte : Google

Document : Scenari

Le Web à la base n’est pas un hypertexte : il ne relie pas des documents. mais il peut le devenir ou accueillir des documents car c’est aussi une plateforme ouverte…

structuré vers un web

séparer forme et contenu

2008 XML a eu dix ans <balise>…</balise>

XML en 10 points http://www.w3.org/XML/1999/XML-in-10-points.fr.html

structurer des données

en utilisant des balises

dans un format textuel

construction modulaire

une famille de langages

un format ouvert non propriétaire

XML bien formé <racine>...</racine>

<x>...</x> ou <x/>

<a><b></a></b>

<x> <X>

<1an> <xmla> <bla bla>

<a b='c'></a> ou <a b='c'/>

de langages

Scalable Vector Graphics (SVG)

XML Topic Maps (XTM)

Synchronized Multimedia Integration Language (SMIL)

eXtensible Access Control Markup Language (XACML)

OpenOffice Schemas

MusicML

MathML

Financial products Markup Language (FpML)

GPS Exchange format (GPX)

NewsML

WSDL

Chemical Markup Language (CML) XHTML

famille

namespace • espaces de nommage

• éviter les collision de noms

• associer un préfixe de balise à un URI

• exemple

• définitions héritées dans l’arbre XML

• namespace par défaut xmlns="…"

<ugb:note xmlns:ugb='http://www.ugb.sn/'>18</ugb:note>

<bla:note xmlns:bla='http://www.ugb.sn/'>18</bla:note>

ontos logos être / êtres discours / science

“Ja

cob

Lo

rha

rd's

"O

gd

oa

s Sc

ho

last

ica

" (1

60

6)

co

nta

ins

the

firs

t o

ccu

rren

ce o

f th

e te

rm

‘on

tolo

gia

’ ” R

aul C

ora

zzo

n o

n f

orm

alo

nto

logy

.it

->

Ontologie ontologie

votre réponse est basée sur une ontologie partagée

je peux comprendre

vous pouvez raisonner

Document

Book

Novel Short story

sous type

sous type

#12

#21

#47 #48

"document"

"book"

"livre"

"novel"

"roman"

"short story"

"nouvelle"

#21 #12

#48 #21 #47 #21

#21 #12

#48 #21 #47 #21

connaissance ontologique formalisée

#12

#21

#47 #48

ontologie n’est pas un synonyme de

taxinomie

la connaissance

taxinomique est une connaissance

ontologique parmi d’autres

partie de

carbone hydrogène oxygène

dioxyde de carbone dioxygène ozone dihydrogène

méthane éthane méthanol éthanol

eau phénol méthyle

combiner différents types de connaissances ontologiques

Hierarchical model of the shape of the human body. D. Marr and H.K. Nishihara, Representation and recognition

of the spatial organization of three-dimensional shapes, Proc. R. Soc. London B 200, 1978, 269-294).

Limb Individual

Cat

Organic object

couverture

dans quelle mesure les primitives mobilisées par les scénarios sont couvertes par l’ontologie

spécificité dans quelle mesure les primitives sont

précisément déclarées dans l’ontologie

granularité dans quelle mesure les primitives

sont détaillées

exemple granularité [Charlet - RFIA 2002]

1. Patient-Masculin

Patient-Féminin

2. [Patient] (chrc) [Masculin]

[Patient] (chrc) [Féminin]

3. [Patient] (attr) [Sexe] (val) [Masculin]

[Patient] (attr) [Sexe] (val) [Féminin]

dans quelle mesure les primitives sont décrites dans un langage formel

formalité

méthodes ex. rigidité dans Onto Clean [Guarino & Welty]

Rigid +R

is a necessary property for all its instances

Anti-Rigid ~R

is an optional property for all its instances

Person is y+R, Student is ~R

Constraint: ~R can't subsume y+R

structurer une “folksonomie”

folksonomies plates web 2.0

pollution

pollution des sols

has narrower

polluant énergie

related related

thesaurus

?

SKOS

combinaison espaces métriques

distances d’édition Monge-Elkan Soundex, JaroWinkler,

asymétrie Monge-Elkan Qgram

métrique contextuelle cosinus vecteur de cooccurrences de tags

métriques sociales inclusion de communautés

d’intérêt

83 027 relations / 9 037 tags

68 633 related

11 254 hyponyms

3 193 spelling variants

ex. ademe TheseNet

recherches & retours

ex. propagation sémantique

sel, eau

poivre, vin

moutarde

rugby, foot

foot, ciné

hockey sport sport

sport

condiment

condiment condiment

from RAK/LP to SemTagP

ex. Ademe 1 pollution ; 2 développent durable ; 3 énergie ; 4 chimie ; 5 pollution de l’air ; 6 métaux ; 7 biomasse ; 8 déchets.

langages de formalisation

d’ontologies

exemple

(define-class humain (?humain)

:def (animal ?humain))

subsomption dans les frames

exemple

(defprimconcept MALE)

(defprimconcept FEMELLE)

(disjoint MALE FEMELLE)

classes disjointes en logiques de description

exemple

[Concept: Directeur]->(Def)->

[LambdaExpression:

[Personne: ]->(Dirige)->[Groupe]]

classe définie en graphes conceptuels

sémantique vers un web

le web originel liens typés…

web sémantique mentionné par Tim BL

en 1994 à WWW

[Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/]

RDF , toute connaissance est décomposée en triplets ( sujet , prédicat , objet ) arcs ( nœud, arête , nœud )

ex : doc.html a pour auteur Fabien et a pour thème la Musique

doc.html a pour auteur Fabien doc.html a pour thème Musique

Fabien

auteur

doc.html

thème

Musique

<RDF/> une syntaxe XML pour mieux échanger ces graphes

<rdf:RDF

xmlns:rdf="http://www.w3.org/1999/02/22-

rdf-syntax-ns#"

xmlns:inria="http://inria.fr/schema#" >

<rdf:Description

rdf:about="http://inria.fr/rr/doc.html">

<inria:author rdf:resource=

"http://inria.fr/~fabien#me" />

<inria:theme>Music</inria:theme>

</rdf:Description>

</rdf:RDF>

nœuds anonymes (blank nodes)

http://bu.ch/l23.html auteur

"Les zélés faons roses"

titre

"Laurent"

nom

"Trichard"

prenom

quantification existentielle il existe une ressource telle que… { r ; …} <rdf:Description rdf:about="http://bu.ch/123.html ">

<auteur>

<rdf:Description>

<nom>Trichard</nom>

<prenom>Laurent</prenom>

</rdf:Description>

</auteur>

<titre>Les zélés faons roses</titre>

</rdf:Description>

x ; auteur(http://bu.ch/123.html,x) nom(x,"Trichard")

prenom(x,"Laurent")

interroger avec SPARQL SPARQL Protocol and RDF Query Language

exemple personne ayant au moins 18 ans

PREFIX ex: <http://inria.fr/schema#>

SELECT ?person ?name

WHERE {

?person rdf:type ex:Person

?person ex:name ?name .

?person ex:age ?age .

FILTER (?age > 17)

}

web de données première vague de déploiement du web sémantique (RDF, SPARQL)

May 2007 April 2008 September 2008

March 2009

September 2010

Linking Open Data

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

September 2011

0

100

200

300

400

10/10/2006 28/04/2007 14/11/2007 01/06/2008 18/12/2008 06/07/2009 22/01/2010 10/08/2010 26/02/2011 14/09/2011 01/04/2012

e.g. DBpedia

CORESE/ KGRAM

contenus et thématiques Domaines Nombre de jeux

de données Triplets % Liens sortants %

Media 25 1 841 852 061 5,82 % 50 440 705 10,01 %

Géographique 31 6145 532 484 19,43 % 35 812 328 7,11 %

Gouvernement 49 13 315 009 400 42,09 % 19 343 519 3,84 %

Publications 87 2 950 720 693 9,33 % 139 925 218 27,76 %

Inter-domaine 41 4 184 635 715 13,23 % 63 183 065 12,54 %

Sciences de la vie 41 3 036 336 004 9,60 % 191 844 090 38,06 %

Contenu utilisateur 20 134 127 413 0,42 % 3 449 143 0,68 %

295 31 634 213 770 503 998 829

42%

20%

13%

10%

9% 6%

0%

Gouvernement

Géographique

Inter-domaine

Sciences de la vie

Publications

Media

Contenu utilisateur

data.ratatouille.com

principes utiliser le format RDF

utiliser des URI pour nommer

utiliser des URI HTTP (URL) pour que l’on puisse les suivre

lorsqu’un URI est suivi donner des informations (HTML, RDF)

inclure dans ces informations des liens vers d’autres données

DNS celui qui contrôle le nom de domaine contrôle le déréférencement.

ex. bit.ly & Lybie

.fr

*

.inria

isicil

(June 2012)

le cas de la France mouvement d'ouverture des données mais…

• redondance des identifiants

• hétérogénéité des formats

• diversité des vocabulaires

• hétérogénéité des accès

publication processus démo

• installation en un click

• import de données trouvées en ligne

• transformation en RDF

• publication sur le web

• interrogation directe

RDFS pour définir les classes de ressources, leurs propriétés, et organiser leur hiérarchie

Document

Rapport

créateur

auteur

Document Personne

OWL in one…

par énumération

par intersection

par union

par complément

la disjonction

par restriction !

par cardinalité 1..1

prop. algébriques

par équivalence

[>18]

union disjointe restrict. valeur

prop. disjointes

cardinalité qualifiée 1..1

!

négation prop. indiv

prop. chainées

clefs …

alignements et liage ontologies et entités nommées

• « Ontology Alignment Evaluation Initiative »

• reconnaissance d’entités nommées

• liage de ressources

OKKAM et owl:sameAs 1

“The logical consequences are the heart of the conceptual problem raised by the use of owl:sameAs. In fact, suppose one wants to answer the query: where does John teach and what? One will make the following query on the merge of the two datasets: < x , y >: http : // U NI1 / resource / John @ : af f iliation x ∧ http : // U NI1 / resource / John @ : teaching y Certainly, if the query is processed on the merge of the two datasets of John’s academic profiles, one would get the expected results, i.e., that John teaches philosophy of language at UNI1 and logic at UNI2. 22 The problem is that one would also get the unwanted results that John teaches logic at UNI1 and philosophy of language at UNI2.” (Web of Data and Web of Entities: Identity and Reference in Interlinked Data in the Semantic Web Paolo Bouquet · Heiko Stoermer · Massimiliano Vignolo)

OKKAM et owl:sameAs 2

« when owl:sameAs is not the same » (H. Halpin, I. Herman, P. Hayes)

des représentations de ressources jugées identiques peuvent néanmoins diverger.

ex. : si ma ressource est l’élément sodium…

• OpenCyc : un élément est l’ensemble de tous les fragments de cet élément à l’état pur

• DBpedia : inclut en outre les isotopes de sodium (nombre de neutrons différent)

deux vue sur la même chose ou deux objets différents ?

chaine GATE : exemple en biologie…

thesaurus,

classifications,

sujets, taxinomies,

folksonomies, ...

vocabulaires

contrôlés

expression naturelle pour dénoter un concept inria:CorporateSemanticWeb

skos:prefLabel "corporate semantic web"@en;

skos:prefLabel "web sémantique d'entreprise"@fr;

skos:altLabel "corporate SW"@en;

skos:altLabel "CSW"@en;

skos:hiddenLabel "web semantique d'entreprise"@fr.

labels

entre concepts

inria:CorporateSemanticWeb

skos:broader w3c:SemanticWeb;

skos:narrower inria:CorporateSemanticWiki;

skos:related inria:KnowledgeManagement.

relations

inria:CorporateSemanticWeb

skos:scopeNote "only within KM community";

skos:definition "a semantic web on an intranet";

skos:example "Nokia's internal use of RDF gateway";

skos:historyNote "semantic intranet until 2006";

skos:editorialNote "keep wikipedia def. uptodate";

skos:changeNote "acronym added by fabien".

beaucoup de données dans beaucoup de pages

R2RML une transformation standard d’une base relationnelle en RDF

schéma

mapping

Triplets produits : • cellules d’une ligne sujet commun

• noms des colonnes prédicats

• une cellule un objet

• liens entre tables

nom prenom age

filar alain 34

seger thomas 45

#s1 :nom "filar" #s1 :prenom "alain" #s1 :age "34" #s2 :nom "seger" #s2 :prenom "thomas" #s2 :age "45" #s3 …

exemple de mapping

ISBN Author Title Year

0006511409X id_xyz The Glass Palace 2000

ID Name Homepage

id_xyz Ghosh, Amitav http://www.amitavghosh.com

http://…isbn/000651409X

Ghosh, Amitav http://www.amitavghosh.com

The Glass Palace

2000

a:name a:homepage

a:author

I. Herman, W3C

(1) transformation

table personnes

ISBN Author Title Year

0006511409X id_xyz The Glass Palace 2000

ID Name Homepage

id_xyz Ghosh, Amitav http://www.amitavghosh.com

http://…isbn/000651409X

Ghosh, Amitav http://www.amitavghosh.com

The Glass Palace

2000

a:name a:homepage

a:author

:P_Table rdf:type rr:TriplesMap ;

rr:subjectMap [

rr:termtype "BlankNode" ; rr:column "ID" ;

] ;

rr:predicateObjectMap [

rr:predicateMap [ rr:predicate a:name

];

rr:objectMap [

rr:column "Name"

] ] ;

rr:predicateObjectMap [

rr:predicateMap [

rr:predicate a:homepage

]; rr:objectMap [

rr:column "Homepage" ;

rr:termtype "IRI"

]

] ;

I. Herman, W3C

(2) transformation

table livres

ISBN Author Title Year

0006511409X id_xyz The Glass Palace 2000

ID Name Homepage

id_xyz Ghosh, Amitav http://www.amitavghosh.com

http://…isbn/000651409X

Ghosh, Amitav http://www.amitavghosh.com

The Glass Palace

2000

a:name a:homepage

a:author

I. Herman, W3C

:B_Table rdf:type rr:TriplesMap ;

rr:subjectMap [

rr:template "http://...isbn/{ISBN}"; ]; rr:predicateObjectMap [

rr:predicateMap [

rr:predicate a:title ];

rr:objectMap [

rr:column "Title"

]

] ; rr:predicateObjectMap [

rr:predicateMap [ rr:predicate a:year

];

rr:objectMap [ rr:column "Year" ;

]

] ;

(3) lier les tables

ISBN Author Title Year

0006511409X id_xyz The Glass Palace 2000

ID Name Homepage

id_xyz Ghosh, Amitav http://www.amitavghosh.com

http://…isbn/000651409X

Ghosh, Amitav http://www.amitavghosh.com

The Glass Palace

2000

a:name a:homepage

a:author

I. Herman, W3C

:B_Table a rr:TriplesMap ; ...

rr:refPredicateObjectMap [ rr:refPredicateMap [ rr:predicate a:author ];

rr:refObjectMap [ rr:parentTriplesMap :P_Table ; rr:joinCondition "{child}.Author = {parent}.ID" ]

] ].

RDFa signifie RDF dans des attributs de HTML <div xmlns:dc="http://purl.org/dc/elements/1.1/">

<h2 property="dc:title">The trouble with Bob</h2>

<h3 property="dc:creator">Alice</h3>

...

</div>

provenance, confiance, explication,

“At the toolbar (menu, whatever) associated with a document there is a button marked "Oh, yeah?". You press it when you loses that feeling of trust. It says to the Web, "so how do I know I can trust this information?". The software then goes directly or indirectly back to metainformation about the document, which suggests a number of reasons.”

Tim Berners-Lee, Consistent User Interface, W3C Design Issues, 1997

Oh,yeah?

en insérant des étiquettes émises par des autorités dans les pages

protéger les enfants

<meta http-equiv="pics-label" content='(PICS-1.1

"http://www.icra.org/ratingsv02.html" labels

for "http://mm.256.com/"

generic true

ratings (cz 1 la 1 lb 1 lc 1 nz 1 oz 1 vz 1)

"http://www.rsac.org/ratingsv01.html" labels

for "http://mm.256.com/"

generic true

ratings (n 0 s 0 v 0 l 4) )' />

VoID: décrire des sources de données schéma pour annoter des jeux de données :DBpedia a void:Dataset .

et des jeux de liens :DBpedia_Geonames a void:Linkset .

:DBpedia a void:Dataset;

void:sparqlEndpoint <http://dbpedia.org/sparql>;

void:feature :RDFXML ;

void:subset :DBpedia2Geonames ;

void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ;

dcterms:modified "2008-11-17"^^xsd:date;

dcterms:title "DBPedia";

dcterms:description "RDF data extracted from Wikipedia";

dcterms:publisher :DBpedia_community;

dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>;

dcterms:source <http://dbpedia.org/resource/Wikipedia>.

:Geonames a void:Dataset;

void:sparqlEndpoint <http://geosparql.appspot.com/query>;

void:triples "107983838"^^xsd:integer ;

dcterms:subject <http://dbpedia.org/resource/Location> .

:DBpedia2Geonames a void:Linkset ;

void:linkPredicate owl:sameAs ;

void:target :DBpedia ;

void:target :Geonames .

ex. DBpedia dataset

provenance & traçabilité [Provenance WG]

PROV-DM & PROV-O OWL2 ontology décrire les entités et activités impliquées dans la production, livraison, etc. d’un objet

ex1:aggregated prov:used ex1:dataSet2, ex1:regionList2 .

ex1:aggregate2 prov:wasGeneratedBy ex1:aggregated .

ex1:illustrated prov:used ex1:aggregate2 .

ex1:chart2 prov:wasGeneratedBy ex1:illustrated .

ex1:aggregated prov:wasControlledBy ex1:derek .

ex1:dataSet2 prov:wasRevisionOf ex1:dataSet1 .

++

description authentifiée

plusieurs ressources

listes

domaines, chemins

expressions régulières

grouping mechanisms...

... list URIs

... domain names, paths

... regular expressions on URIs

exemple de description POWDER « toute ressource dont l’URI commence par http://www-sop.inria.fr/fr/ concerne le centre de recherche de l’INRIA géographiquement situé à Sophia Antipolis et est en français »

certifié par inria.fr

préjugés, fausses idées

boite noire éviter de construire une

explicites rendre les conceptualisations

à base d’ontologie ne signifie pas que l’on a besoin d’un moteur d’inférence.

de l'intérêt d'un à peu près…

ma montre n'a qu'une aiguille

mais elle n'est pas cassée.

sens et position d’une taxonomie à une vue

a r

a=120° 360° 0°

“semantic web” and not

“semantic web”

[C. Welty, ISWC 2007]

“a lightweight ontology allows us to do lightweight reasoning”

[J. Hendler, ISWC 2007]

66 FOAF primitives 3 475 908 348 references (2)

x 52 millions

“a small tree ruling a big graph”(1)

(1) Franck Van Harmelen, ISWC 2011 (2) Libby Miller, 2009

le piège du domaine le domaine d’application n’est pas forcément celui de l’ontologie

universelle je n’ai jamais vu une ontologie

Trouble dans la classification (F. Rastier)

la vache folle ou l’ontologue végétarien

s:MadCow rdfs:subClassOf s:Cow

gestion

besoin

conception

diffusion

utilisation évaluer

évolution

cycle

vie

modèle changeant

brique de construction

vs.

tri sélectif sémantique le web est une poubelle, le web sémantique sera une poubelle sémantique.

et pour nous

hyper-documentaire de l’article scientifique à l’hyper-article multi-public

plus vieille facette, mais encore sous exploitée

donnez des URL aux contenus une URL est un nom, sans URL pas de nom, sans nom je ne peux pas en parler

• référence

• granularité

• vues

nouvelles formes de rédaction… • systématiquement enrichir de liens

• identifier des cibles internes et externes

• identifier les persona de notre public

• permettre des parcours multimédias idoines

« produire une hyper-ressource, c’est hyper long… c’est même jamais vraiment fini. »

forme / fond, structure, sémantique

• jeux de données scientifiques entrées et sorties

• des schémas de données développer http://ns.inria.fr

• Ex en biologie: HCLS IG

• SPARQL: recherche de liens, motifs et chaines

• référentiels métiers et domaines nos termes, nos définitions, nos thésaurus, ... ex. SHOINQ < ALC < Logique de Description < Langage Logique

<XML/>

utilités ? scénarios ? • reproductibilité et comparatifs

• permettre d’autres expérimentations / algo

• ex. OAEI:

– Visibilité et citation

– Alignement de domaines, sources, résultats, etc.

• journalisme de données

• génération de liens, restructuration, ranking

le web comme écriture collective

• ouverture en écriture... collective

– ne plus centraliser la rédaction: distribuer, aider, …

– « utilisacteur »: nos lecteurs peuvent aider à vulgariser, reformuler, enrichir

• ouverture en écriture collective ...

– ne plus centraliser la rédaction: animer, solliciter

– participer à d’autres sites: ex. wikipedia (édition, ref.)

nouvelles formes de publication… • soumissions immédiatement publiques

• revues sollicitées et processus rendus publics

• ouvert aux commentaires et revues spontanés

• éditeur scientifiques vs. web ouvert

• nouveaux modes opératoires, nouveaux critères

nouvelles conférences • suivre l’ensemble de

la conférence

• percevoir les avis, réactions, questions

• interroger, réagir

• compléter, traduire, augmenter

socialité centrée ressource

• objets cristallisant une activité sociale et vice-versa

• bis repetita placent… « online or invisible »

• e.g. médiathèque sociale (vidéos, images, etc.)

– commentaires, tagging, etc. site ouvert à tous

– contributions ouvertes en interne

• e.g. « e-CRDP »

– cartographie intervenants et matériels pédagogiques

– ex. un compte slideshare, service interne… + animation

• interstice socialisé: réactions, tagging, etc.

au-delà du Buzz • orchestrer la communication et sa contagion

• gérer notre présence en ligne

• faire explicitement appel au peuple (sondages, campagnes de test, etc.)

• faire implicitement appel au peuple (tagging, bookmarking, etc.)

• cartographie interne et externe de nos réseaux

nos algorithmes en ligne • fournisseurs de services de haut niveau

(bibliothèque, QoS, certification, etc.)

• démonstrateurs / testeurs ex. traitement d’image

• services, API et widgets

• galerie, maintenance,

serveur application

HTTP HTTP

application

navigateur

HTTP

ex. « pseudo haptic »…

label sur des ressources web • authentifier des ressources

• valider des données

• sécuriser des accès

• certifier des services

interfaces et utilisateurs partout

• HTML5: de la page à l’application nouvelles formes de production et consultation

• consommation opportuniste, contextuelle, etc.

• contenus multi-formats (ex. podcasts interstices)

• Accessibilité ?

• App. INRIA ?

doggy-bags

web 1 , 2

price convert?

person homepage?

more info?

web 1 , 2 , 3

lier le monde

lier les données

web

rec

om

man

dat

ion

s

html

http

url html http url

uri

iri

atag uaag wcag aria

mwbp earl ra cc/pp assx css

ddrsa xml eve. exi geo api dom xform

grddl inkml its cmwww ruby an. xhtml rdfa

ets omr m. ok emma p3p math ml mf

pics qa rif sec cont. sawsdl png powder

sml soap

wsdl

svg awww ttml smile

rdf owl rdfs sparql

etc. woff

webcgm

xbl xkms xlink wscdl wsp

skos

ns canon. x dtxml xproc xfrag xml xbase

xschema xml:id xpath xpointer xquery xsignat. xbop

xslt xslfo

Leçon 1: faire une application web o HTML 5 o CSS 2.1 o CSS 3 Selectors o CSS 3 Media Queries o CSS 3 Text o CSS 3 Backgrounds

and Borders o CSS 3 Colors o CSS 3 2D

Transformations o CSS 3 3D

Transformations o CSS 3 Transitions o CSS 3 Animations o CSS 3 Multi-Columns o CSS Namespaces

o SVG 1.1 o WAI-ARIA 1.0 o MathML 2.0 o ECMAScript 5 o 2D Context o WebGL o Web Storage o Indexed Database o Web Workers o Web Sockets

Protocol/API o Geolocation o Server-Sent Events o Element Traversal o DOM Level 3 Events

o Media Fragments o XMLHttpRequest o Selectors API o CSSOM View Module o File API o RDFa o Microdata o WOFF o HTTP 1.1 o TLS 1.2 (updated) o IRI (updated) o …

W3C

i=j; réplication et bien anti-rival… à l’échelle du monde.

socialisation intensive de nos activités.

WEB science

263

informel

formel

usage représentation

un et un seul web…

données

personnes documents

programmes

un espace unique dans tous les sens du terme, une toile hybride

metadata

gestion-orientée métadonnée • diversité de ressources (données ou non) • métadonnées & schéma pour leur gestion • importance du web sémantique dans ce contexte

demain, celui qui contrôlera les métadonnées,

contrôlera le web.