2015 ed spi

download 2015 ed spi

of 26

  • date post

    29-Jul-2015
  • Category

    Internet

  • view

    57
  • download

    1

Embed Size (px)

Transcript of 2015 ed spi

1. 1 www.irstea.fr Pour mieux affirmer ses missions, le Cemagref devient Irstea Catherine ROUSSEY TSCF quipe COPAIN change de donnes sur le web Merci Fabien AMARGER Fabien GANDON Stephan BERNARD 2. 2 Plan change des donnes les problmes lis l'interoprabilit des systmes dinformation les bonnes pratiques mettre en place exemple lIrstea : BDOH site web des donnes de capteur hydro Louverture des donnes et le web de donnes lies Les technologies web smantique Exemple lIrstea: publication de donnes capteurs mto 3. 3 Dfinitions: Donnes, Informations Donne: un lment dinformation, percevable, manipulable Information: donne + sens + contexte type structure de donnes Guide pratique pour la gestion des donnes de la recherche irstea Une donne est une information qui peut tre enregistre, traite, analyse ou communique, quelle que soit sa nature. Lorsque la donne na pas encore t traite ou contextualise, on parle de donne brute. 4. 4 Problme de linteroprabilit lexicale Le mme terme est utilis pour reprsenter diffrents objets Le mme objet est rfrenc par des termes diffrents Credit Fabien GANDON 5. 5 Normaliser le vocabulaire rivire fleuve river rio A relatively large natural stream of water Water course Una corriente relativamente larga corriente de agua natural Cours deau naturel de moyenne ou de faible importance, qui en principe naboutit pas directement la mer Cours deau naturel gnralement important (plus spcialement lorsque ce cours deau se jette dans la mer) 6. 6 Thesaurus: exemple de vocabulaire normalis 7. 7 Problme de linteroprabilit des structures de donnes 8. 8 Global Sensor Network Lorganisation des donnes (schma, structure) est diffrente Credit JP Calbimonte 9. 9 Standard dchange de donnes Le dictionnaire agricole GIEEA en UML 10. 10 Echange de donnes : les bonnes pratiques Normaliser le vocabulaire Choisir un format non propritaire (XML, txt, html, csv) Dfinir un schma de donnes commun Documenter le schma Choisir une licence dusage de ces donnes Rendre accessible les fichiers de donnes sur le web Exemple lIrstea Base de Donnes des Observatoires en Hydrologie BDOH https://bdoh.irstea.fr/ 11. 11 Ouverture des donnes (publiques) Open data is data that can be freely used, reused and redistributed by anyone - subject only, at most, to the requirement to attribute and sharealike. The most important aspects to consider: Availability and Access: the data must be available as a whole and at no more than a reasonable reproduction cost, preferably by downloading over the internet. The data must also be available in a convenient and modifiable form. Reuse and Redistribution: the data must be provided under terms that permit reuse and redistribution including the intermixing with other datasets. Universal Participation: everyone must be able to use, reuse and redistribute - there should be no discrimination against fields of endeavour or against persons or groups. For example, non-commercial restrictions that would prevent commercial use, or restrictions of use for certain purposes (e.g. only in education), are not allowed. Source http://opendatahandbook.org/en/what-is-open-data/ 12. 12 Modle 5 toiles Web de Donnes lies ouvertes source: Tim Berners-Lee, http://5stardata.info/ 13. 13 Exemple de site open data Auvergne http://opendata.auvergne.fr/ France https://www.data.gouv.fr/fr/ Europe http://ec.europa.eu/eurostat/fr Regards citoyens http://www.regardscitoyens.org/ Data Publica le tableau de bord des communes 14. 14 Le web de donnes lies (Linked Open Data) An extension of the current Web where data are given well-defined and explicitly represented meaning, so that it can be shared and used by humans and machines, ... ... better enabling them to work in cooperation And clear principles on how to publish data Video europeana quest ce que le web des donnes https://vimeo.com/49231111 15. 15 Les technologies Web Smantique World Wide Web Consortium (W3C) Credit Benjamin Nowak 16. 16 Syntaxe de base du web smantique RDF: Resource Description Framework is a triple model i.e. every piece of knowledge is broken down into ( subject , predicate , object ) RDF Credit Fabien GANDON 17. 17 http://inria.fr/~fabien#me http://inria.fr/schema#author http://inria.fr/rr/doc.html http://inria.fr/schema#theme "Music" 17 Credit Fabien GANDON 18. 18 Music 18 Credit Fabien GANDON 19. 19 Les ontologies dans le web de donnes Une ontologie contient un vocabulaire et un schma de donnes: consensuels, publis sur le web et documents formaliss avec des standards du web (RDF, OWL, SPARQL) Avec des contraintes en DL (conditions ncessaires et/ou suffisantes) = un schma de donnes pour le web de donnes 20. 20 www.irstea.fr Pour mieux affirmer ses missions, le Cemagref devient Irstea Publication de donnes mto de l'Irstea sur le web de donnes 21. 21 Semantic Sensor Network Ontology Une partie du schema de donnes 22. 22 Description d'une "Observation" Exemple d'un Anmomtre 23. 23 Publication des donnes de la station mto Donnes publies sous la licence open data etalab SPARQL endpoint visible sur datahub http://ontology.irstea.fr/weather/snorql/ 24. 24 Ou trouver des ontologies ? SWOOGLE http://swoogle.umbc.edu/ Watson http://watson.kmi.open.ac.uk/WatsonWUI/ LOV Linked Open Vocabulary http://lov.okfn.org/dataset/lov/ W3C groups http://www.w3.org/Consortium/activities Credit Fabien Gandon 25. 25 Autres exemples de jeux de donnes Dbpedia http://dbpedia.org/snorql/ http://dbpedia.org/fct/ Agrovoc en skos http://aims.fao.org/aos/agrovoc/c_16047.html IGN http://data.ign.fr/endpoint.html Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/ Datahub.io http://datahub.io/ Une liste de sparql end point disponible http://www.w3.org/wiki/SparqlEndpoints 26. 26 Conclusion et Perspectives Publication des donnes de la station mto (2014 jour) pas si simple au dbut Publication dautres donnes capteurs Proposer une interface dinterrogation en franais plus intuitive quune requte SPARQL Lier nos donnes aux donnes de lIGN pour une interrogation spatialise Tester diffrents serveurs RDF (requte avec agrgats) Dcouverte et utilisation de ces donnes ? Utiliser ces donnes dans des modles mtorologiques Conversion au format netcdf?