Standard Occurrence de taxon Formation · producteur Place du standard de données DEE....
Transcript of Standard Occurrence de taxon Formation · producteur Place du standard de données DEE....
1
Standard Occurrence de taxon Formation
J. Chataigner (MNHN/SPN), Chef de projet Standardisation des données SINP
2
Plan
Démarche d'élaboration
Les informations à véhiculer : concepts et attributs
Présentation générale
Présentation détaillée
Le format technique : le GML
Exemple
Démarche d’élaboration
Contexte & Organisation
3
4
http://www.naturefrance.fr/sinp/presentation‐du‐sinp
•Initié par : Ministère en charge de l’écologie en 2005 •Objectifs :
• Diffusion des données publiques (Aarhus, Inspire)• Utilisation de ces données pour le rapportage européen, l’INPN, les décideurs, le grand public …
Le SINP
Organisation du SINP
5 Architecture
Coordination Scientifique et Technique (CST)
SINP
COPIL
Guide et valide
Juridique
QualificationDonnées sensibles
Standard Données
Metadonnées
Equipe projet Secrétariat de la CST
JuridiqueRéférentielRéférentiel
Plateformes
…
Le GT standard de donnéesMandat du groupe de travail standard de données
L'objectif du GT est de définir par grandes thématiques du SINP un format national (tel que prévu dans le projet de protocole en tant que données élémentaires d'échange ou DEE) compatible avec les standards existants au niveau international.
Il traitera en priorité des données espèces.
Pour la thematique ≪biodiversite≫, et en particulier les donnees d'observation, definir un standard minimal (ou coeur commun) en tenant compte de l'existant
6
Qu’est-ce qu’un standard d’échange de données ?
Définition sémantique des information à échanger
- Dictionnaire de données (schéma UML et document pdf)
Format technique pour l’échange :
- Ici : Schéma GML (XSD)
7
Optimisé « humain »
Optimisé « machine »
Qu'est-ce qu'une Donnée Elementaire d'Echange (DEE) ?
Une donnée élémentaire d’échange est une donnée formatée au standard de données SINP et ayant un identifiant pérenne SINP
Format Sémantique Format TechniqueIdentifiant uniqueDictionnaire de données Schéma GMLNote explicative
8
‐ Une élaboration partenariale et basée sur l'existant
Ebauche Construction partagée / test Publication & Validation
Septembre 2012 Décembre 2012 Octobre 2013 Mars 2014
Le GT Standard de données
Mise en place
Avril 2014
Membres du GT : Mnhn, Ministère, OBHN, Maison de l’environnement Franche Comté (PPNMEFC), aires marines protégées, IGN, Sandre (Onema), FCBN, Ifremer, Aten, Parcs Nationaux de France, GBIF, UMS BEBEES (Mnhn/CNRS)
9
Publication V1 Dictionnaire de donnéesDécembre 2013
Publication V1 Schéma GMLAvril 2014
‐ Une élaboration partenariale et basée sur l'existant
Ebauche Construction partagée / test Validation et publication
Septembre 2012 Décembre 2012 Octobre 2013 Mars 2014
Le GT Standard de données
Mise en place
Avril 2014
10
‐ Analyses de standards existants : International : DarwinCore, OBIS, GISIN…National : Australie, UK, Suisse …National France : FCBN, SIE …Régional : Alaska, HauteNormandie , PACA…
‐ Définition des besoins des utilisateurs du SINP
Ebauche : impact de l'annexe C du protocole du SINP
Informations obligatoires Annexe C Implémentation dans le standard
Identifiant unique national IdentifiantPermanent
Traçabilité DS ‐> DEE Identifiant de la DS dans son JDD d’origine
Géolocalisation maximale / géolocalisation pour données d’origine privée
Règles sur la géolocalisation des observations
Auteurs de la donnée source Observateur
Date(s) de collecte Date et période d’imprécision
Producteur de la donnée source Gestionnaire de la donnée source
Statut Privée/publique de la DS DSPublique
Qualification de la DEE Impact des conclusions GT dédié
Sensibilité de la DS Impact des conclusions GT dédié
Informations facultatives : possible mais pas de précisions du protocole
11
Ebauche d’un dictionnaire de données
12
Schéma UML
Document lisible « humain »
‐ Une élaboration partenariale et basée sur l'existant
Ebauche Construction partagée / test Validation et publication
Septembre 2012 Décembre 2012 Octobre 2013 Mars 2014
Le GT Standard de données
Mise en place
Avril 2014
13
‐ 4 réunions avec le GT, nombreuses relectures tant sur les aspects généraux (redondance des informations, flexibilité du standard…) que précis : quels attributs, quelles définitions …
‐ Echanges avec les autres GT du SINP, la CST
‐ Tests sur vrais jeux de données (7 dont des DREALs) ou documentation de standardisation (3)
‐ Une élaboration partenariale et basée sur l'existant
Ebauche Construction partagée / test Validation et publication
Septembre 2012 Décembre 2012 Octobre 2013 Mars 2014
Le GT Standard de données
Mise en place
Avril 2014
14
‐ CST intermédiaire
‐ Publication en décembre 2013
‐ Une élaboration partenariale et basée sur l'existant
Ebauche Construction partagée / test Validation et publication
Septembre 2012 Décembre 2012 Octobre 2013 Mars 2014
Le GT Standard de données
Mise en place
Avril 2014
15
‐ Publication du format d’échange optimisé pour l’échange entre machine
‐ CST final – en cours ‐
‐ Conformité INSPIRE
‐ Accompagnement à l’utilisation
‐ Extension
‐ Identifiant unique‐ Versionnement du standard :‐ V2 pour fin 2014/ début 2015
Présentation générale
16
L’occurrence de taxon est l’observation ou la non-observation d’un taxon à une localisation à une date donnée par un ou plusieurs observateurs selon des méthodes d’observation directes (de visu) ou indirectes (empreintes, fèces, nid…).
Le périmètre ne concerne pas les données de synthèse ou agrégées
L'organisation du standard● Un cœur de données « Occurrence de taxon »
Observation directe de lépidoptère
Observation indirecte de mammifère
17
Exemple d’occurrence de taxon :Le 10 mai 2014, Patrick Haffner du Mnhn a observé des traces de blaireau au point 8 050, 67 523 (Lambert 93)
QuandOù D’où QuiQuoi
L'organisation du standard : les concepts du cœur Occurrence de taxon
Cœur du standard
18
48 attributs dont 13 obligatoires
L'organisation du standard● Un cœur de données Occurrence de taxon
● Des règles à suivre
19
Règlesd’utilisation
Est‐ce que l’attribut doit être renseigné ?Obligatoire : Doit être renseignéObligatoire Conditionnel : la ou les conditions pour lesquelles l’attribut devient obligatoire est précisée dans la section règleFacultatif : peut ne pas être renseigné
L'organisation du standard● Un cœur de données Occurrence de taxon
● Des règles à suivre
20
Règlesd’utilisation
Nombre minimal et maximal de valeur que l’on peut échangerN = plusieursExemple : 0..N : zéro à plusieurs ; 1..N : 1 à plusieurs ; 1 : 1 et un seul
L'organisation du standard● Un cœur de données Occurrence de taxon
● Des règles à suivre
21
Règlesd’utilisation
Text : chaîne de caractères alphanumériquesEntier : format numérique entierDecimal : format numérique avec décimalLogique : format logique booléen (type oui/non)
L'organisation du standard● Un cœur de données Occurrence de taxon
● Des règles à suivre
22
Règlesd’utilisation
Précisions guidant la standardisation afin de limiter l’interprétation ou d’indiquer les conditions pour lesquelles un attribut devient obligatoire
L'organisation du standard● Un cœur de données Occurrence de taxon
● Des règles à suivre
23
Règlesd’utilisation
Référentiel nationaux
Nomenclatures propres au standard SINP : 4
Taxonomique : TAXREFCommune : INSEEAutres : Espaces naturels, Masse d’eau, Maille, Habitat, IDCNP
Référence à une liste de valeur
L'organisation du standard● Un cœur de données Occurrence de taxon
● Des règles à suivre
CoeurAttributs additionnels
Extension
Extension
Extension
24
● Des extensions / nouveaux standards :
● Des attributs à renseigner suivant des règles précises
● Est programmé suivant les besoins
● Attributs additionnels
Coeur
Extension
Extension
Extension
Coeur
Extension
Extension
Extension
Attributs additionnelsCoeur
Extension
Extension
Extension
Exemple : Partage de données sur la présence de taxon
Attributs additionne
ls
Coeur
Extension
Extension
Extension
Exemple : Partage Occurrence et des données sur les conditions climatiques non prévues par le standard
Exemple : Partage de données phytosociologique
Attributs additionnels
Coeur
Végétation
Extension
Extension
Coeur
Extension
Extension
Extension
25
Un compromis entre la diffusion et la réutilisation des données
Moins le standard est contraignant et plus il est facile de diffuser des données….
…. mais moins il est évident de les réutiliser…
Diffusion :– Permettre l’ajout d’attributs additionnels, non prévus par
le standard
Réutilisation :– Mise en place de contraintes sur des attributs
• Attributs obligatoires (13 sur 48)• Définitions, Règles et formats à suivre
26
QuandOù D’où QuiQuoi
Les concepts du standard Occurrence de taxon
Attribut Additionnel
Cœur du standard
Extension à venir
‐ 48 attributs – 13 obligatoires
27
Une DEE
Une donnée élémentaire d’échange est une donnée formatée au standard de données SINP et ayant un identifiant pérenne SINP
Format Sémantique Format TechniqueIdentifiant uniqueDictionnaire de données Schéma GMLNote explicative
28
Aspect technique : le gabarit physique du standard
● GML : Geography Markup Language
● Optimisé pour l’échange de données entre plateformes
● Conseillé par Inspire● Adapté aux tests de conformité des fichiers
29
Schéma GML XSDLe moule
Fichier GMLLes exemplaires
Place du standard de données DEE
Plateforme Régionale Plateforme Thématique
Données Sources DSen formats variésSystème
producteur
Système producteur
Système producteur
Système producteur
Standard Données
DEE
Plateforme Nationale
30
INSPIRE GBIF
Standard Régionaux, Thématiques
Diverses extractions
SINP
Observation & Measurement…
DWC
31
Plateforme Régionale
Plateforme Nationale
Plateforme Thématique
‐ Informations compatibles avec celles du dictionnaire de données
‐ Informations standardisées selon le dictionnaire de données
‐ Dans le format GML‐ DEE avec l’identifiant unique du SINP
Système producteur
DS
DEE
Système producteur
Système producteur
Système producteur
Place du standard de données DEE
Présentation détaillée des attributs
32
D’où
33
Informations relatives à la Donnée Source à l’origine de la Donnée Elementaire d’Echange
StatutSourceTerrain (Te), Collection (Co), Littérature (Li)
34
Collection
Littérature
Terrain
Base de données« Collection »
Les différentes notions de source
Article/ouvrage scientifique
‐ Des données de source littérature peuvent être saisie dans une BD terrain qui est fournie à la plateforme régionale ou thématique ‐
Base de données « Terrain »
Pas carte postale, blog … NSPInconnu
ReferenceBiblio
Norme ISO690 (de préférence)LOMINANDZE, DG. Cyclotron waves in plasma. Traduit par AN. Dellis ; édité par SM. Hamberger. 1re éd. Oxford : Pergamon Press, 1981. 206 p. International series in natural philosophy. Traduction de : Ciklotronnye volny v plazme. ISBN 0-08-021680-3.
WEAVER, William. The Collectors : command performances. Photographies par Robert Emmet Bright. Architectural Digest, décembre 1985, vol. 42, no 12, p. 126-133.
Doit concerner l’observation en elle-même
Obligatoire si la source est littérature
35
jddID / jddCode
Concerne la donnée source : ‐ Où est‐elle gérée ? Dans quelle base de données ? Dans
quelle collection ? ‐ Information potentiellement en métadonnées
jddId : Identifiant codé du jeu de données ou de la collection d’où provient la donnée source
jddCode : Libellé, nom du jeu de données ou de la collection d’où provient la donnée source
36
IdentifiantOrigine- Identifiant fort de l’observation dans la base de données d’origine.- Possible qu’il ne soit pas géré.
Attention : ne pas confondre avec la clé primaire de l'observation
37
Notion d’identifiant versus clé primaire
38
Un identifiant est un attribut.
L’attribut peut :
– Ne pas être un identifiant– Être un identifiant faible (ex nom de famille)– Être un identifiant fort (N° de sécurité social)
Une clé primaire est une contrainte utilisée par un système de base de données relationnelle permettant d’identifier de façon unique chaque enregistrement d’une table. C’est une notion physique et non conceptuelle. Elle peut être modifiée lors d'une fusion de base de donnéesElle peut être soit :
– Un ensemble d’identifiants faibles (Prénom, nom de famille, date de naissance)
– Un identifiant fort (N° de sécurité social)– Un numéro système non significatif (automatique)
IdentifiantOrigine- Identifiant fort de l’observation dans la base de données d’origine.- Possible qu’il ne soit pas géré.
Attention : ne pas confondre avec la clé primaire de l'observation
39
IdentifiantOrigine 732996
A vérifier avec le fournisseur de données si c’est bien un identifiant permanent de la donnée source
Récapitulatif
40
Littérature Terrain Collection Inconnu « Ne sait pas »
statutSource O O O Si connu
referenceBiblio O Si connu
jddId O O Si connu
jddCode O O Si connu
IdentifiantOrigine HR HR Si connu
Mon observation vient de la littérature mais concerne le spécimen d’une collection : comment je le note dans le standard ?
Possibilité 1
statutSource li
referenceBiblio obligatoire
jddId Si retrouvé
jddCode Si retrouvé
IdentifiantOrigine Si retrouvé et existe
Possibilité 2
statutSource co
referenceBiblio Peut être renseigné
jddId obligatoire
jddCode obligatoire
IdentifiantOrigine Si existe : renseigné
Deux possibilités :
Identifiant permanent national : unique et pérenne
● Présentation de l’identifiant unique et pérenne● Permet d’identifier et de tracer la DEE
● Identifiant unique a été défini par le GT Standard de données
Format : http://nomDeLaPlateforme/thematique/UUID
Exemple : http://silene.eu/occtax/a0eebc99-9c0b-4ef8-bb6d-6bb9bd380a11
Domaine pérenne
Liste officielle et partagée des thématiques
Algorithme de création de l’UUID
Plateforme R/T
Plateforme Nationale
41
Recommandé : - Gérer l'identifiant au niveau de la donnée source
42
Identifiant permanent national : unique et pérenne
BD Producteur DS1
DEE1 & idN
DS1 idN
1 Fourniture de la DS au SINP2. Transformation en DEE et attribution d’un identifiant national permanant : idN3 Transfert à la DS de l’ identifiant national (RECOMMANDE)
1 2
3
Plateforme R /T
DSPublique
La DEE est publique mais la Donnée Source peut être :- Publique : Régie ou Acquise- Privée- Inconnu (NSP)
43
DSPublique Pr
CodeIDCNPDispositif• Permettant de faire le lien avec le dispositif de collecte et la méthode • Implique que le dispositif de collecte ai un code , ie qu’il a été déclaré
http://inventaire.naturefrance.fr/presentation/consultation/recherche_fiches_recherche.php?RETOUR=NOLOG
CodeIDCNPDispositif
44CodeDispositifIDCNP ?
A redemander au producteur de données
StatutObservation
J’ai des données de présence et de non observation, est-ce que je peux les mettre dans un seul jeu de données ?
Oui
StatutObservation : Pr
StatutObservation : No
Pas de possibilité de noter « inconnu »
Définit s’il s’agit d’une observation de taxon ou si selon le protocole adéquate et la date adéquate, le taxon n’a pas été observé : il peut être non vu, temporairement absent, réellement absent.
45
StatutObservation Pr
NomCite : nom du taxon inscrit par l’observateur qu'il soit en latin, vernaculaire ou autres …« bufo bufo », « crapaud commun », « crapaud com. » « 259 » …
cdNom et cdRef : code du référentiel taxonomique TaxRef en vigueur au moment de la saisie pour cdRef
Extrait de Taxref v7
46
Les codes taxonomique et le NomCite ne correspondent pas forcément
Les informations sur le taxon
cdNom et cdRefPeuvent être vides si et seulement si le taxon n’est pas présent dans TaxRef (nouvelle espèce par exemple)
Demande à TaxRef
cf présentation Olivier Gargominy
Ne pas échanger si ne correspond pas à un taxon ( poisson jaune, colonie bleue, …)
47
Les informations sur le taxonDoute sur un taxon : plusieurs espèces possibles
Problèmes : ‐ Un code taxon qui n’est pas TaxRef‐ Des doutes sur l’espèce : non échangeable au niveau national ainsi
48
Les informations sur le taxon
Si un code taxon dans un autre référentiel que TAXREF (Worms, …) : - Soit ne pas l'échanger au niveau national - Soit ajouter en attribut additionnel :
- Fortement conseillé si pas de cdNom existantCf partie Attribut Additionnel
49
50
Attribut Valeur
NomCite Eriophyes tiliae
CdNom 221383
CdRef 221383
cdRef non présent dans le jeu de données mais retrouvé dans TaxRef v5 correspondant :
Les informations sur le taxon
http://inpn.mnhn.fr/telechargement/referentielEspece/referentielTaxo/login
Sensible
Définition de la donnée sensible a fait l’objet d’un groupe de travail
‐ Standard V1 : Protocole du SINP indiquait un champ booléen « oui/non » et non : « non sensible» par défaut
‐ Standard V2 : prendra en compte les informations demandées par le GT Sensible une fois validée par la CST
Cf Présentation de Julien Touroult
51
Attribut Valeur
sensible non
Dénombrement (Facultatif)
ObjetDenombrement : Sujet du dénombrement. Liste qui sera ensuite étendue : pour l’instant une seule valeur « Individu »
DenombrementMin – DenombrementMax : fourchette du nombre d'objet du taxon
TypeDenombrement : d’Inspire – Spécification « Species Distribution » : sans objet après analyse – sera probablement retiré en version 2
compté – calculé - estimé
52
Attribut Valeur
DenombrementMin 5
DenombrementMax 5
ObjetDenombrement individu
TypeDenombrement co
53
Un champ vide est un champ interprétable : les limiter
Attribut Valeur
DenombrementMin 0
DenombrementMax 0
ObjetDenombrement individu
TypeDenombrement co
Si AlorsAttribut Valeur
StatutObservation No
Exemple
Autre cas
obligatoirement
Possibilité 1a Possibilité 1b Possibilité 2a Possibilité 2b
DenombrementMin 1 1 25 25
DenombrementMax 1 1 45 45
ObjetDenombrement individu individu Individu Individu
TypeDenombrement co co es es
attributAdditionnel NombreOeuf : 45
‐ ‐ NombreOeuf : 45NombreAdulte: 1
Différentes possibilités
Dépend de l’expertise terrain, du protocole …54
CommentaireChamp informatif complémentaire « texte »N’est pas facilement exploitable – préférer les attributs additionnels
Ne doit pas remettre en cause les informations prévues. Exemple : « la commune est la commune adjacente du lieu
de l’observation »
55
DateDebut / DateFin1. Date au jour
2. Période d’incertitude
Dans les 2 cas, renseigner les 2 attributs : DateDebut et DateFin
Format : norme ISO_8601
1. Date au jour :
DateDebut : 2012-05-26
DateFin : 2012-05-26
Sans les heures : aaaa−mm−jj : 1997−07−16
56
Période d’incertitude :Exemple 1 : campagne en mer du 15 mai au 30 mai 2002DateDebut : 2002‐05‐15DateFin : 2002‐05‐30
Exemple 2 : collectionDateDebut : 1847‐03‐01DateFin : 1847‐03‐31
Exemple 3 : Doute sur des données d’observation aquises dans le cadre d’un programme créé en 2000 et toujours en coursDateDebut : 2000‐01‐01DateFin : 2014‐05‐31
57
DateDebut : 2002DateFin :
DateDebut : 2012‐07DateFin : 2012‐09
Période d'incertitude <> Période d'observation
Nom Cite : petit pingouincdNom : 3388DateDebut : 2011‐06‐01DateFin : 2011‐06‐30
Signifie que le taxon alca torda a été observé une fois dans le mois de juin 2011
Et non qu’alca torda a été observé tous les jours de la période du 1er au 30 juin.
30 observations = 30 DEE
Pas une période d’observation mais bien une période d’incertitude d’une seule observation
Nom Cite : petit pingouincdNom : 3388DateDebut : 2011‐06‐01DateFin : 2011‐06‐01
Nom Cite : petit pingouincdNom : 3388DateDebut : 2011‐06‐02DateFin : 2011‐06‐02
Nom Cite : petit pingouincdNom : 3388DateDebut : 2011‐06‐30DateFin : 2011‐06‐30
…
58
HeureDebut / HeureFin Même attribut que DateDebut ‐ DateFin selon la norme ISO
8601
http://fr.wikipedia.org/wiki/ISO_8601
Peut être dans un champ à part pour les
producteurs de données
Champ date au jour et heure
59
Plateforme R/T
la date complète calendaire avec heures et minutes :format : "aaaa−mm−jjThh:mizzzzzz" (ex : 1997−07−16T19:20+01:00)
DateDetermination : date de la détermination peut être différente de la date de l'observation. Norme ISO 8601.
60
Attribut Valeur
DateDebut 2012‐05‐26
DateFin 2012‐05‐26
HeureDebut
HeureFin
DateDetermination
LocalisationPlusieurs modalités possibles
Attributs communs aux différentes localisations
AltitudeMin ‐ AltitudeMaxProfondeurMin ‐ ProfondeurMax
Habitat (code/refHabitat)
Localisation réelle de l’observation ou de l’aire
d’observation
ObjetGeographique
Territoire de rattachementModalité 1 Modalité 2
61
Modalité 1. Localisation réelle
Géométrie : simple ou multiple
Simple
Multiple
La géométrie est dans un champ GML : ‐ Le point est traité comme un autre objet : pas d’attribut de coordonnées X, Y‐ C’est bien l’objet en lui‐même‐ La projection est comprise dans le champ
Objet géographique
62
NatureObjetGeo
NatureObjetGeoNature de la localisation transmise
Stationnel
Inventoriel
Spartina maritima
« partout »Le taxon observé est présent sur l’ensemble de l’objet
« quelque part »L’objet représente la zone de prospection plus que la localisation précise du taxon
Selon les taxons, plus ou moins pertinent : - Moins nécessaire pour la faune et pour les objets points- Mais intéressant pour les objets linéaire, polygone et certains
taxons de la flore
63
Modalité 1. Localisation réelle
Géométrie : l'objet en lui-même
NatureObjetGeo : stationnel ou inventoriel
Précision : Peut être une précision matérielle (exemple : GPS) et/ou due au protocole d’acquisition. En mètre.
Objet géographique
64
Modalité 2. Territoire de rattachement
Rattachement de l'observation à un élément de référentiel par son code :
- Espace Naturel : espaces naturels protégés, Natura2000, Znieff- Type et code
- Commune- Code et nom (pour éviter des problèmes de codes postaux)
- Maille 10x10- Masse d’eau
- Code
- Secteur marin : – prévu dans le protocole mais pas de référentiel – en attente
Ces référentiels sont nationaux et disponibles aux adresses indiquées dans le dictionnaire de données
65
LocalisationPlusieurs modalités possibles
Attributs communs au localisationAltitudeMin ‐ AltitudeMax
ProfondeurMin ‐ ProfondeurMaxHabitat (code/refHabitat)
Localisation réelle de l’observation ou de l’aire d’observation
ObjetGeographique
Territoire de rattachementPlusieurs possibles
Modalité 1 Modalité 2
Ce qui signifie : ‐ Pas d’échange de l’objet géographique de commune, maille, espace naturel …‐ Pas de centroïde de territoire en objet géographique
code
66
Notion de floutage géographiquehors problématique de donnée sensible
Donnée privée :- Ne pas échanger la donnée
- Echanger de la donnée floutée à la commune et à la maille
Donnée publique : - Pas de floutage
67
68
Autres QuestionsMon observation est localisée à un toponyme : comment dois-je le noter dans le standard ?
Je ne sais pas où a été observé le taxon précisément, je sais juste que c’était en France métropolitaine. Comment la localiser ?
Mon observation est en dehors du territoire français, comment faire ?
J’utilise une autre grille que la 10*10, comment faire ?
Ma donnée est publique, elle est ancienne et la seule localisation de l'observation est à la commune
Renseigner le code Commune, rajouter ou non le toponyme en attribut additionnel
L’information d’observation n’est pas assez précise pour être remontée au niveau national dans le cadre du SINP
Cette observation n’est pas dans le périmètre du SINP : ne pas la remonter au niveau national
Rattacher à un des référentiels permis et rajouter ou non ce code en attribut additionnel
Echanger l’observation et la rattacher au code et au nom de la commune
69
Acteurs et rôles
Observateurs Gestionnaire de la donnée source
OrganismeStandardisateur
Validateursnaturaliste
Déterminateurs
Exemple complexe de diffusion de la données :
données70
Acteurs et rôles
Observateurs Gestionnaire de la donnée source
organismeStandardisateur
Validateurnaturaliste
Déterminateurs
Exemple plus simple :
données
71
Qui : Les acteurs et rôles
O Multiple Organisme Individu Format
Observateur O Oui x x 1 champ pour les personnes1 champ pour les organismes
Déterminateur F Oui x x 1 champ
Validateur F Oui x x 1 champ
Gestionnaire de la donnée source
O 1 x 1 champ
OrganismeStandardisateur
F Oui x 1 champ
Possibilité d’indiquer :Indépendant : si observateur n’est pas rattaché à un organismeAnonyme : si requiert l’anonymatInconnu : si ne sait pas
72
Un champ vide est un champ interprétable : les limiter
73
74
Ajout d’informations non prévues par le standard
Exemple :
Attributs additionnels
Attributs Valeurs
ThématiqueAttribut OccurrenceTaxon
NomAttribut TemperatureAir
Définition Température de l’air relevé au thermomètreélectronique
ValeurAttribut 12
UniteAttribut Degré Celsius
Pas de nombre limité d’ajouts d’attributs additionnels
Ajout d’informations non prévues par le standard
Attributs additionnels
Cas de jeu de données où des relations entre taxons ont été observées :‐ Plusieurs possibilités
Cas 1. Soit ajouter en attributs additionnels les informations plus succinctes d’un des taxonsCas 2. Soit lier 2 observations
75
76
Attributs additionnels
Coeur
Extension
Extension
Extension
Cas 1
Attributs décrivant la fleur de façon succincte :‐ L’observation de la fleur n’est pas traitée comme une observation‐ L’observation peut être partielle
Coeur
Extension
Extension
Extension
77
Coeur
Extension
Extension
Extension
Attribut de l’identifiant de la fleur en attribut additionnel de l’ observation du papillon :
‐ Lien entre l’observation de la fleur et du papillon‐ La fleur est traitée comme une observation à part entière
Observation 1 du papillon Observation 2 de la fleurCas 2
AttributAdditionnelConcrètement : Exemple du Cas 2
78
Attribut Valeur
ThématiqueAttribut Occurrence Taxon
NomAttribut IdentifiantFleur
Définition Identifiant origine de l’observation de la fleur sur laquelle a été observé le taxon de l’observation
ValeurAttribut F_589
UniteAttribut Sans objet
Le schéma GMLLe fichier physique
79
Lecture du Modèle Logique de Données
80
class SINP
«featureType»SujetObserv ation
{root}
+ identifiantPermanent :CharacterString+ statutObservation :StatutObservationValue+ nomCite :CharacterString+ dateDebut :DateTime+ dateFin :DateTime+ observateur :PersonneType
«voidable»+ cdNom :TaxRefValue+ cdRef :TaxRefValue+ dateDetermination :Date+ determinateur :CharacterString+ denombrement :DenombrementType+ objetGeo :ObjetGeographiqueType+ habitat :HabitatType [1..*]+ alti tudeMin :Decimal+ alti tudeMax :Decimal+ profondeurMin :Decimal+ profondeurMax :Decimal+ organismeStandard :NomOrganismeValue+ validateur :CharacterString+ commentaire :CharacterString
«dataType»ObjetGeographiqueType
+ geometrie :GM_Object+ natureObjetGeo :NatureObjetGeoValue«voidable»+ precisionGeometrie :Integer
«enumeration»StatutSourceValue
Te Co Li NSP
«enumeration»DSPubliqueValue
Pu Re Ac Pr NSP
«enumeration»StatutObserv ationValue
Pr No
«codeList»TaxRefValue
«codeList»IDCNPValue
«dataType»Source
+ statutSource :StatutSourceValue+ sensible :boolean«voidable»+ identifiantOrigine :CharacterString+ dSPublique :DSPubliqueValue+ jddCode :CharacterString+ jddId :CharacterString+ organismeGestionnaireDonnee :NomOrganismeValue+ referenceBiblio :CharacterString+ codeIDCNPDispositi f :IDCNPValue
«dataType»EspaceNaturel
+ typeEN :TypeENValue+ codeEN :CodeENValue
«dataType»Commune
+ codeCommune :codeCommuneValue+ nomCommune :NomCommuneValue
«dataType»Maille10x10
+ codeMaille :CodeMailleValue
«dataType»MasseEau
+ codeME :CodeMasseEauValue
«dataType»AttributAdditionel
+ nomAttribut :CharacterString+ definitionAttribut :CharacterString+ valeurAttribut :CharacterString«voidable»+ uniteAttribut :CharacterString+ thematiqueAttribut :CharacterString
«dataType»HabitatType
+ refHabitat :CodeRefHabitatValue+ codeHabitat :CodeHabitatValue
«enumeration»TypeDenombrementValue
Co Es Ca NSP
«codeList»ObjetDenombrementValue
«enumeration»NatureObjetGeoValue
St In NSP
«enumerati...TypeENValue
CNP AAPN RIPN PNM PNR RNN RNC RNR PRN RBD RBI RNCFS RCFS APB MAB SCL RAMSAR ASPIM SCEN ENS OSPAR APIA CARTH ANTAR NAIRO ZHAE BPM N2000 ZNIEFF1 ZNIEFF2
«codeList»CodeMasseEauValue
«codeList»NomOrganismeValue
«codeList»NomCommuneValue
«dataType»DenombrementType
+ denombrementMin :int+ denombrementMax :int+ objetDenombrement :ObjetDenombrementValue
«voidable»+ typeDenombrement :TypeDenombrementValue
«codeList»CodeMailleValue
«codeList»CodeCommuneValue
«codeList»CodeENValue
«enumeration»CodeRefHabitatValue
PVF BRYOSOCIO BBMEDFR PALSPM ANTMER GUYMER REUMER CORINEBIOTOPES PAL EUNIS GMRC CH OSPAR BARC REBENT
«codeList»CodeHabitatValue
«dataType»PersonneType
+ identite :CharacterString+ organisme :NomOrganismeValue
1+attributAdditionel
0..*
+masseEaux 0..*+mail les 0..*+communes 0..*
1
+source
1
+espacesNaturels 0..*
MCDConceptuel
MLDLogique
MPDPhysique
Format
81
+ nomAttribut : format de l’attribut
Format « simple » :CharacterString = texteDateTime = Format ISO 8601Int = integer = nombre entierDecimal = décimale
Référence à une liste de valeur :Ex : statutObservation : StatutObservationValue
Référence à un attribut complexe :Ex : observateur :PersonneType
Enumeration : liste de valeur dans le GML
CodeListe : extérieur GML
82
ObligatoireFichier non valide si null
Facultatif ou Obligatoire selon les conditions (cf dictionnaire de données)
Voidable : stéréotype Inspire
83
<SujetObservation><identifiantPermanent> xxx </identifiantPermanent>
……
<habitat><refHabitat>EUNIS </refHabitat><codeHabitat>A2.4</codeHabitat>
</habitat><habitat>
<refHabitat>EUNIS </refHabitat><codeHabitat>A2.5</codeHabitat>
</habitat>……</SujetObservation>
Notion de balises imbriquéesUn fichier : plusieurs observations
<FeatureMember>
</FeatureMember>
<Member>
</Member>
<FeatureMember>
</FeatureMember>…
Observation
1
Obs.2
Le schéma GML
84
En implémentation par le GT mises en place des plateformes OGAM. Dans ce cadre, un comité d'utilisateurs sera organisé.
Plus en période de tests qu’à implémenter dans une optique d’exploitation (mars 2015)
Le schéma GML XSD
Les fichiers GML
Le moule
Les exemplaires
Un mot au sujet des métadonnées …
Le dictionnaire de données reprend le document du GT Métadonnées avec quelques restrictions listées dans un chapitre.
Pour le format : dépend des livrables du GT Standard Métadonnées
85
86
Plateforme Régionale
Plateforme Nationale
Plateforme Thématique
‐ Informations compatibles avec celles du dictionnaire de données
‐ Informations standardisées selon le dictionnaire de données
‐ Dans le format GML‐ DEE avec l’identifiant unique du SINP
Système producteur
DS
DEE
Système producteur
Système producteur
Système producteur
Récapitulatif
Documentation
87
Site public http://www.naturefrance.fr/actions/groupe-de-travail-standardisation-des-donnees-biodiversite-du-sinp (documents en bas de page)
Dictionnaire de données
Standard occurrence de taxon v1
Identifiant Permanent Identifiant permanent des DEEGML Fichiers GML béta du standard occurrence de taxon (zip)
Schéma XSDExemple d’un GMLDocument de présentation
A venirDocument de mise en correspondance avec le standard International (DarwinCore / Gbif)Document de mise en correspondance avec InspireExtension Végétation
Prochainement sur la plateforme nationale du SINP : INPN Outils/Donnéeshttp://inpn.mnhn.fr/accueil/index
Exercice à partir d’une feuille de terrain
88
Exemple du dispositif :
ChronoventaireLepidoptere
Prise en compte dans la demande des champs du SINP
Exemple Chronoventaire
Lepidoptere
Prise en compte dans la demande des champs du SINP
89
90
En jaune : non prévu dans le standardEn vert Données Obligatoire du standardEn blanc : facultatif dans le standard
AttributAdditionnel si vous le souhaitez
Remarque : Un certain nombre d’information dans les métadonnées :‐ Le nom du jeu de données‐ L’organisme gestionnaire
StatutSource TeReferenceBiblioJddId cf Métadonnées
Chronoventaire2010JddCodeIdentifiantOrigine cf Base de données SourceIdentifiantPermanent Donné par la plateformeDSPublique ReCodeIDCNPDispositifOrganismeStandard MnhnStatutObservation PrNomCite Melanaria galatheaCdNom 53700CdRef 53700Sensible nonDenombrementMinDenombrementMaxTypeDenombrementObjetDenombrementIdentiteObservateur Dupont PascalOrganismeObservateur MnHn‐SPNOrganismeGestionnaireDonnees
MnHn‐SPN
Determinateur Dupont PascalValidateurCommentaireDateDebut 2012‐06‐22 91
LocalisationGeometrie coordonnées du PolygonePrecisionNatureObjetGeo in ‐vérifierCodeCommune 26273NomCommune Rochefort‐SamsonCodeENTypeENCodeMailleCodeME
DateDeterminationObs 2012‐06‐12AltitudeMinAltitudeMaxProfondeurMinProfondeurMaxCodeHabitatRefHabitat
DateFin 2012‐06‐12HeureDebut 11:10:00HeureFin 11:10:05
Merci de votre attention
92