ZONE présenté au concours BoostYourCode

48
Ze Ontology News Extractor Celui qui contrôle les données contrôle le web Pour le concours BoostYourCode 2012 Christophe DESCLAUX

Transcript of ZONE présenté au concours BoostYourCode

Ze Ontology News Extractor

Celui qui contrôle les données contrôle le web

Pour le concours BoostYourCode 2012

Christophe DESCLAUX

CONTEXTE ZONE(UR) BoostMyZone !

2

Christophe Desclaux

CONTEXTE

Ingénieur Informatique

Knowledge Information Systems

CONTEXTE ZONE(UR) BoostMyZone !

3

Mes engagements

Aide à la mise en place de serveurs

Animation de conférences

vice président

Organisation des « Journées Méditerranéennes du Logiciel Libre » depuis 2009

CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

4

CONTEXTE

Cas d'utilisation

Que se passe-t-il dans l'écosystème de la fondation Apache en ce moment ?

CONTEXTE ZONE(UR) BoostMyZone !

5

Problématique

Agrégation d'informations

Regroupement par catégories

Recherche d'informations efficace

CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

6

Les solutions existantes CONTEXTE

Mémoire de

lectures

installablelibre

Agrégation de

flux RSS

CONTEXTE ZONE(UR) BoostMyZone !

7

Les flux RSS

Contenu produit automatiquement

Sites d'actualité / blogs

Dialecte XML

CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

8

Les solutions existantes CONTEXTE

Multiplicité des

sources

Sémantique

.FR

CONTEXTE ZONE(UR) BoostMyZone !

9

Web sémantique

Contenus accessibles aux ordinateurs

Sources interconnectés

Des vocabulaires partagés

CONTEXTE ZONE(UR) BoostMyZone !

10

Les solutions existantes CONTEXTE

Sémantique

Regroupement

GratuitMultiplatefor

meMultiplicité

des sources

CONTEXTE ZONE(UR) BoostMyZone !

14

Gratuit

Recherchemulti-critères

Mémoire delecture

Libre

Installable

Regroupement

Multi-plateforme

Multiplicitédes sources

Sémantique

CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

15

Ze Ontology News Extractor

Présentation du prototype

ZONE(UR) CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

16

FluxFlux RSS

ZONE(UR) CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

17

Lecteurde flux

Flux RSS

Flux

News

ZONE(UR) CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

18

Lecteurde flux

Flux RSS

Flux

Annotateur

WikiMeta

Organisations

Personnalités

Objets

GeoMeta

OpenCalais

INSEE Geo

Annotation des flux

Entrée : texte de la news

Sortie : annotations

News

ZONE(UR) CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

19

Stockage des

Flux annotésBDD

Flux RSS

Item annoté

Flux Items annotés

News

ZONE(UR) CONTEXTE

Lecteurde flux

AnnotateurAnnotateur

CONTEXTE ZONE(UR) BoostMyZone !

20

Stockage des

Flux annotésBDD

Flux RSS

Item annoté

Flux Items annotés

ZONE

Serveur d'annotation sémantique

News

ZONE(UR) CONTEXTE

Lecteurde flux

AnnotateurAnnotateur

CONTEXTE ZONE(UR) BoostMyZone !

21

besoinutilisa

teur

ZONE(UR) CONTEXTE

Evenements ville Montpellier

CONTEXTE ZONE(UR) BoostMyZone !

22

critèresÉlément deconfiguratio

nbesoin

utilisateur

ZONE(UR) CONTEXTE

Evenements ville Montpellier

CONTEXTE ZONE(UR) BoostMyZone !

23

critèresÉlément deconfiguratio

nbesoin

utilisateur

Créationrequête

ZONE(UR) CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

24

BDD

critèresÉlément deconfiguratio

nbesoin

utilisateur

RéponseCréationrequête

Requête

ZONE(UR) CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

25

BDD

critères

Flux RSS

Élément deconfiguratio

nbesoin

utilisateur Transformatio

n

RéponseCréationrequête

ZONE(UR) CONTEXTE

Requête

CONTEXTE ZONE(UR) BoostMyZone !

26

Clients possibles :

Smartphone

Interface WEB

Plugins

BDD

critères

Flux RSS

Élément deconfiguratio

nbesoin

utilisateur Transformatio

n

RéponseCréationrequête

ZONE(UR) CONTEXTE

ZONEUR Requête

CONTEXTE ZONE(UR) BoostMyZone !

27

Stockage des

Flux annotésBDD

critères

Flux RSS

Flux RSS

Élément deconfiguratio

nbesoin

Item annoté

Flux Items annotés

Annotateur

ZONEUR

utilisateur Transformatio

n

RéponseCréationrequête

ZONE

News

ZONE(UR) CONTEXTE

Lecteurde flux

AnnotateurAnnotateur

Requête

CONTEXTE ZONE(UR) BoostMyZone !

28

État actuel du prototype

Etude du web sémantique

Démarche d'architecture logicielle

Diffusion à la communauté scientifiqueCIEL 2012 : Conférence en IngénieriE du Logiciel

ZONE(UR) CONTEXTE

Proof of concept : http://zone.zouig.orgCode : http://github.com/descl/ZONE

CONTEXTE ZONE(UR) BoostMyZone !

29

Apports communautaires

Publication API Java

Correction de bugs

ZONE(UR) CONTEXTE

Corese

CONTEXTE ZONE(UR) BoostMyZone !

30

Place à la démo

ZONE(UR) CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

31

ZONE(UR) CONTEXTE

http://zone.zouig.org

CONTEXTE ZONE(UR) BoostMyZone !

32

ZONE(UR) CONTEXTE

http://zone.zouig.org

CONTEXTE ZONE(UR) BoostMyZone !

33

ZONE(UR) CONTEXTE

http://zone.zouig.org

CONTEXTE ZONE(UR) BoostMyZone !

34

ZONE(UR) CONTEXTE

http://zone.zouig.org

CONTEXTE ZONE(UR) BoostMyZone !

35

ZONE(UR) CONTEXTE

http://zone.zouig.org

CONTEXTE ZONE(UR) BoostMyZone !

36

BoostMyZONE

Permettez moi de concrétiser mon projet !

BoostMyZone ZONE(UR)

CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

37

Apports du projet BoostMyZone

ZONE(UR) CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

38

Choix de la licence

Serveur : licence GPL v3

Classique

Connue et reconnue

Compatible avec la licence Apache

Client : licence AGPL

Moins permissive

Prise en compte de la distribution sous forme de service

BoostMyZone ZONE(UR)

CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

39

OrganisationWP1 : la communauté

Présentation au public

Appels à contributions

WP2 : le serveur d'annotation

Passage à l'échelle

Ajout de services d'annotations

Data clustering

WP3 : les clients

Amélioration visuelle

Client android

BoostMyZone ZONE(UR)

CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

40

Pourquoi me financer ?

CO

N

C

L

U

S

IO

N

BoostMyZone ZONE(UR)

CONTEXTE

ZONE(UR) CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

41

Merci de votre attention

“J’ai un double rêve pour le Web. D’une part, je le vois devenir un moyen très puissant de coopération entre les êtres humains. Et dans un second temps, j’aimerais que ce soit les ordinateurs qui coopèrent. Quand mon rêve sera réalisé, le Web sera un univers où la fantaisie de l’être humain et la logique de la machine pourront coexister pour former un mélange idéal et puissant.” Tim Berners-Lee

CO

N

C

L

U

S

IO

N

BoostMyZone ZONE(UR)

CONTEXTE

ZONE(UR) CONTEXTE

Merci à Mireille Blay-Fornarino, Christian Brel, Luc Champalle, Patrice Deschaux, Catherine Faron-Zucker, Amélie Gyrard, Romaric Pighetti, Matti Schenider et Simon Urli pour leur aide précieuse

Rédaction d'un article scientifique pour la conférence CIEL

Planning prototype

Octobre / Novembre : découverte du sujet, étude bibliographique et recherche de solutions existantes

Plein temps décembre (2s) : Étude des différents services d'annotation possibles , tests poussés des solutions et rédaction de tests unitaires pour vérifier les problèmes de régression

Janvier : Construction du workflow d'annotation

Février : Spécification concernant la première version du service de filtrage

Plein temps Mars (2s) : Finalisation du service de filtrage et rédaction de l'article scientifique

Valorisation commerciale

Les entreprises on besoin d'installer ce genre d'application sur leurs machine

Fournir des solutions de consulting pour projets de pilotage

Ajout de nouveaux services d'annotation dictés par les besoins d'entreprises

CONTEXTE ZONE(UR) BoostMyZone !

45

Apports communautaires

Projet WikiMeta (annotateur)

Publication API Java

Correction de bugsProjet 4Store (serveur RDF)

Rapport de bugs concernant la suppression d'informations par requêtes Sparql

Projet Corese (Moteur SPARQL)

Rapport de bug concernant des problèmes de performance sur de grands jeux de données

Librairie 4store-ruby

Fork de l'application pour permettre des requêtes

ZONE(UR) CONTEXTE

CONTEXTE ZONE(UR) BoostMyZone !

46

Aspects juridiques

Droit d'auteurs

Droit de citation

Respect de la vie privée

Rester hébergeur et non éditeur de contenu

CONTEXTE ZONE(UR) BoostMyZone !

47

ZONE(UR) CONTEXTE

http://zone.zouig.org

T12T10T8T6T4T2T0T-2

Communauté

Serveur

Client

Présentation au public

Diffusion prototype

Compilation des retours

Appel à contribution

Gestion d'un grand nombre de flux

Ajout de services d'annotation

Agrégation des news similaires

Amélioration visuelle du client web

Doc sur la création de clients

Création d'autres clients

Fourniture d'un client final

Planning