Séance 06, Introduction à la publication des données d'échantillonnage dans la formation GB22...

57
GB22 TRAINING EVENT FOR NODES – 5 OCTOBER 2015 Séance 06: Introduction à la publication des données d’échantillonnage Larissa Smirnova

Transcript of Séance 06, Introduction à la publication des données d'échantillonnage dans la formation GB22...

GB22 TRAINING EVENT FOR NODES – 5 OCTOBER 2015

Séance 06: Introduction à la publication des données d’échantillonnage

Larissa Smirnova

INDEX

IntroductionDéfinition des données d' échantillonnageGEO BON et EBVsApplications des données d' échantillonnageRendre possible la publication des données d' échantillonnageL’importance des métadonnéesUtilisation de « event core » dans l’IPTCas d’utilisation de la publication des données d' échantillonnage

“If a biodiversity datum is produced, and no one can find it,

does it create change?”

Show me the Data: JRS Report on Accessto Biodiversity Data in our Projects

VOS CONTRIBUTIONS AU FORUM

Résumé:• Il-y-a demande de la part des détenteurs des données• Quelques jeux des données déjà publiés en GBIF se placent

mieux dans les données des échantillons• De nouvelles fonctionnalités de l’IPT permettent la publication

de jeux des données plus diversifiés• Un nouveau type des données élargit la diversité des

détenteurs des données• Une bonne documentation technique et un bon système de

soutien sont des conditions importantes pour une mise en œuvre réussite de ce nouveau développement

INDEX

IntroductionDéfinition des données d' échantillonnageGEO BON et EBVsApplications des données d' échantillonnageRendre possible la publication des données d' échantillonnageL’importance des métadonnéesUtilisation de « event core » dans l’IPTCas d’utilisation de la publication des données d' échantillonnage

DONNÉES D’ÉCHANTILLONNAGE: NOTRE DEFINITION

Les données d' échantillonnage sont….« Un type des données disponible à partir des études environnementales, écologiques, et des ressources naturelles ; des études singuliers ou des programme de suivi. Habituellement, ces données sont qualitatives, calibrés, et ils suivent des protocoles fixés pour pouvoir détecter des changements et des tendances dans les populations »

LES DONNÉES D' ÉCHANTILLONNAGE

Résultats des programmes de monitoring (échantillons, recensements, plot)Quantitatifs, calibrésRépétables, comparablesRecueillis en utilisant les protocoles standard

Lien entre l’environnement et la biodiversité

Détection des changements (modèles, procès) et tendances dans les populations

Botanistes, zoologistes Managers des ressources naturelles

Ecologistes et biologistes conservateurs Citoyens scientifiques

Ngo’s, associations, professionels d’autres disciplines (pêche, agriculture…)

DES DONNÉES D' ÉCHANTILLONNAGE SONT RASSEMBLÉES PAR...

Botanistes, zoologistes Managers des ressources naturelles

Ecologistes et biologistes conservateurs Citoyens scientifiques

Preneurs de décisions!

DES DONNÉES D' ÉCHANTILLONNAGE SONT UTILISÉES PAR...

EXEMPLES DES DONNÉES DES ÉCHANTILLONS

Un exercice en groupe!Sont les exemples ci-dessous des jeux des données d’ échantillonnage?

1. Une piège pour des insectes installé dans canopée forestière et ramassé un moins après

2. Un collier GPS attaché à un individu qui envoie des données à une base des données central permanemment.

3. Des image de satellite téléchargés annuellement pour analyser la composition végétal d’un area

4. Suivi des chauve-souris par voiture où des volontaires enregistrent des ultrasons en utilisant des détecteurs d’expansion temporelle

5. Échantillonnage de la végétation (core boring) pour mesurer la pollution sous-surface

INDEX

IntroductionDéfinition des données d' échantillonnageGEO BON et EBVsApplications des données d' échantillonnageRendre possible la publication des données d' échantillonnageL’importance des métadonnéesUtilisation de « event core » dans l’IPTCas d’utilisation de la publication des données d' échantillonnage

Rendre possible la découverte et l’accès aux données des échantillons

GBIF, en collaboration avec les partenaires EU BON, a adapté l’IPT (Integrated Publishing Toolkit) et le standard Darwin Core Archives permettant le flux des données des échantillons (2015)

Un des objectifs est soutenir les Variables Essentielles sur la Biodiversité de GEO BON (Essential Biodiversity Variables - EBVs)

Aussi le soutient à la détection des changements et des tendances dans les populations

EU BON, GBIF ET LES EBV

CE SONT QUOI, LES EBV?

Mesures requises pour l’étude, le rapportage et la gestion des changements dans la biodiversité

Sert de niveau intermédiaire entre les données brutes et les indicateurs (p.e., pour CBD)

CLASSES D’EBV

“Monitoring biodiversity change often requires repeated measures at the same place. This extension will enable data holders publishing through the GBIF network to share population abundance data (including time series population data) and presence/absence data, and also to document the sampling protocol”

Henrique Pereira, chair of GEO BON

INDEX

IntroductionDéfinition des données d' échantillonnageGEO BON et EBVsApplications des données d' échantillonnageRendre possible la publication des données d' échantillonnageL’importance des métadonnéesUtilisation de « event core » dans l’IPTCas d’utilisation de la publication des données d' échantillonnage

Objectifs: Modèles qui appuient la conservation et la gestion de la faune et de la flore

prédiction des distributions Identification des régions importantes (p.ex., des régions plus appropriés

pour une espèce ou où on a une plus grande possibilité de trouver hautes densités)

Méthodes: Caméras-piège Suivi avec appareils GPS Échantillons point-count

Mesures: Abondance Présence / absence

APPLICATIONS DE DES DONNÉES D'ÉCHANTILLONNAGE (1/3)

Objectifs: Modèles qui supportent la conservation de la biodiversité, la surveillance environnementale, de la santé et l’état des écosystèmes et de l'impact du changement climatique

La recherche dur la végétation (phyto sociologie, analyse des tendances) La dégradation des forêts L’utilisation des terrains Contrôle des niveaux de carbone Dynamiques écologiques

Méthodes: Parcelles de végétation Relevés

Mesures: Abondance des espèces Couverture (ex. échelle Braun-Blanquet)

APPLICATION DE DES DONNÉES D'ÉCHANTILLONNAGE (2/3)

APPLICATIONS DE DES DONNÉES D'ÉCHANTILLONNAGE (3/3)

Objectifs: Interactions entre la biodiversité et l’environnementSuivi des espècesModèles temporelsTendance de population trends et réponses aux drivers Indicateurs biologiques dans l’utilisation de terre

Méthodes: Données des suivis a longue-terme (recensements) Donnés des atlas (échantillons)

Mesures: Nombre des individus Abondance relative

INDEX

IntroductionDéfinition des données d' échantillonnageGEO BON et EBVsApplications des données d' échantillonnageRendre possible la publication des données d' échantillonnageL’importance des métadonnéesUtilisation de « event core » dans l’IPTCas d’utilisation de la publication des données d' échantillonnage

RENDRE POSSIBLE L’ÉDITION DES DONNÉES D'ÉCHANTILLONNAGE : SCHÉMA EN ÉTOILE

7 termes essentiels pour coder les données d'échantillonnage :

1. eventID2. parentEventID (nouveau)3. samplingProtocol4. sampleSize (nouveau)5. sampleSizeUnit (nouveau)6. organismQuantity (nouveau)7. organismQuantityType (nouveau)

RENDRE POSSIBLE L’ÉDITION DES DONNÉES D'ÉCHANTILLONNAGE : DWC VOCABULAIRE

NOUVELLES FONCTIONNALITÉS

• Event core et ses extensions• Possibilité d’assigner des identifiants

DOIs aux ressources• Génération automatique d’une citation

pour chaque ressources, comprenant le numéro de version et le DOI

• Licences lisibles automatiquement

RENDRE POSSIBLE L’ÉDITION DES DONNÉES D'ÉCHANTILLONNAGE : IPT V.2.3

INDEX

IntroductionDéfinition des données d' échantillonnageGEO BON et EBVsApplications des données d' échantillonnageRendre possible la publication des données d' échantillonnageL’importance des métadonnéesUtilisation de « event core » dans l’IPTCas d’utilisation de la publication des données d' échantillonnage

Métadonnées sont ESSENTIELS pour les données des échantillons : Pour documenter les données du projet :

description de l’activité de surveillance. Pour documenter les méthodes de surveillance :

les protocoles, la qualité des données et les étapes dans le surveillance.

La documentation du jeu des données permets à l’utilisateur d’évaluer sa aptitude à l’emploi

L’ IMPORTANCE DES MÉTADONNÉES

MÉTADONNÉES: DONNÉES DE PROJET& MÉTHODES DE SURVEILLANCE

• “Seasonal (4 seasons) records of zoobenthic communities across confinement gradient in 5 coastal lagoons (Mazoma, Tsopeli,Tsoukalio, Rodia and Logarou)”

• “The floristic inventories was conducted at the Sierra Nevada (Andalusia, southeast Spain). Forest cover in Sierra Nevada is dominated by pine plantations (Pinus halepensis Mill., Pinus pinaster Ait., Pinus nigra Arnold. subsp. salzmannii (Dunal) Franco, and Pinus sylvestris L.) that covering approximately 40,000 ha…”

• “Transect walks were conducted once in two weeks from the beginning of October to the end of June on the territory of Israel”

EXEMPLE DE MÉTADONNÉES: EXTENSION DE L’ÉTUDE

• “Seasonal (4 seasons) records of zoobenthic communities across confinement gradient in 5 coastal lagoons (Mazoma, Tsopeli,Tsoukalio, Rodia and Logarou)”

• “The floristic inventories was conducted at the Sierra Nevada (Andalusia, southeast Spain). Forest cover in Sierra Nevada is dominated by pine plantations (Pinus halepensis Mill., Pinus pinaster Ait., Pinus nigra Arnold. subsp. salzmannii (Dunal) Franco, and Pinus sylvestris L.) that covering approximately 40,000 ha…”

• “Transect walks were conducted once in two weeks from the beginning of October to the end of June on the territory of Israel.”

EXEMPLE DE MÉTADONNÉES: EXTENSION DE L’ÉTUDE

Région d’échantillonnage + Fréquence de l’échantillonnage

• “Box corer for 0.03 square meters area sampled”• “Transect lengths range between 300 and 600 m in length, and divide into 50

m sections. Transect usually cover a single habitat type. In each visit, transect-walkers count all butterfly species that can be seen within a range of 5 m range. Special behaviours (egg laying or nectaring), as well as butterfly larvae or eggs, can be registered as well.”

• “The dataset includes data from 1,879 sites, collected using standard RLS survey methods, described in detail in an online methods manual. Surveys involve underwater visual census by SCUBA divers along a 50 m transect line, laid along a depth contour on hard substrate. All fish species observed within 5 m of the transect line were recorded on a waterproof datasheet as the diver swam slowly along the line (at approximately 2 m/min)…”

EXEMPLE DE MÉTADONNÉES: DESCRIPTION DE L'ÉCHANTILLONNAGE

• “Box corer for 0.03 square meters area sampled”• “Transect lengths range between 300 and 600 m in length, and divide into 50

m sections. Transect usually cover a single habitat type. In each visit, transect-walkers count all butterfly species that can be seen within a range of 5 m range. Special behaviours (egg laying or nectaring), as well as butterfly larvae or eggs, can be registered as well.”

• “The dataset includes data from 1,879 sites, collected using standard RLS survey methods, described in detail in an online methods manual. Surveys involve underwater visual census by SCUBA divers along a 50 m transect line, laid along a depth contour on hard substrate. All fish species observed within 5 m of the transect line were recorded on a waterproof datasheet as the diver swam slowly along the line (at approximately 2 m/min)…”

Description des procédures d’échantillonnage

EXEMPLE DE MÉTADONNÉES: DESCRIPTION DE L'ÉCHANTILLONNAGE

• “Record validation and cleaning was incorporated at several steps of the documentation process: the scientific names on labels were checked with a taxonomic thesaurus…. We assigned scientific names in accordance to current taxonomy trends. Geographic coordinates were verified using the “Check Coordinates” function in DIVA-GIS”

• “Every reported record is flagged ‘for Approval’. Record status is changed to "Approved" upon and by expert only“

• “Each sampling plot was checked to ensure whether the geographical coordinates were correct. The databases of International Plant Names Index (IPNI, 2013) and Catalogue of Life/Species 2000 to verify the taxonomical classification”

EXEMPLE DE MÉTADONNÉES: CONTRÔLE DE LA QUALITÉ

• “Record validation and cleaning was incorporated at several steps of the documentation process: the scientific names on labels were checked with a taxonomic thesaurus…. We assigned scientific names in accordance to current taxonomy trends. Geographic coordinates were verified using the “Check Coordinates” function in DIVA-GIS”

• “Every reported record is flagged ‘forApproval’. Record status is changed to "Approved" upon and by expert only“

• “Each sampling plot was checked to ensure whether the geographical coordinates were correct. The databases of International Plant Names Index (IPNI, 2013) and Catalogue of Life/Species 2000 to verify the taxonomical classification”

Actions de contrôle de la qualité

EXEMPLE DE MÉTADONNÉES: CONTRÔLE DE LA QUALITÉ

• “Replicates were collected at two stations, one inside and one outside the lagoon, using a box corer (0.03 m2 sampling surface). The samples were sieved through a 0.5 mm mesh sieve, stained with Rose Bengal and preserved in 4% formalin. All benthic organisms were sorted in the lab and identified and counted using stereo- and microscopes”

• “1. Selection and rout of transect is accompanied by an scientific/principal investigator. 2. Identification of the capabilities of the observer are verified tested along timeline 3. Time start and weather condition are recorded first. 4. During transect walk, the number seen of every species is counted….”

• “This dataset was compiled from data collected in a combination of collaborative surveys with scientific colleagues worldwide, targeted RLS field campaigns and ad-hoc local surveys by trained RLS divers at their regular dive sites or when on holidays. Field campaigns involved small groups of divers (usually 4 to 8) undertaking survey dives over a period of four days to two weeks under the direction and supervision of a scientist or experienced survey diver“

EXEMPLE DE MÉTADONNÉES: DESCRIPTION DE L’ÉTAPE

• “Replicates were collected at two stations, one inside and one outside the lagoon, using a box corer (0.03 m2 sampling surface). The samples were sieved through a 0.5 mm mesh sieve, stained with Rose Bengal and preserved in 4% formalin. All benthic organisms were sorted in the lab and identified and counted using stereo- and microscopes”

• “1. Selection and rout of transect is accompanied by an scientific/principal investigator. 2. Identification of the capabilities of the observer are verified tested along timeline 3. Time start and weather condition are recorded first. 4. During transect walk, the number seen of every species is counted….”

• “This dataset was compiled from data collected in a combination of collaborative surveys with scientific colleagues worldwide, targeted RLS field campaigns and ad-hoc local surveys by trained RLS divers at their regular dive sites or when on holidays. Field campaigns involved small groups of divers (usually 4 to 8) undertaking survey dives over a period of four days to two weeks under the direction and supervision of a scientist or experienced survey diver“

EXEMPLE DE MÉTADONNÉES: DESCRIPTION DE L’ÉTAPE

Méthodes, procédures, étapes de traitement

MÉTADONNÉES ET LES “DATA PAPERS”

INDEX

IntroductionDéfinition des données d' échantillonnageGEO BON et EBVsApplications des données d' échantillonnageRendre possible la publication des données d' échantillonnageL’importance des métadonnéesUtilisation de « event core » dans l’IPTCas d’utilisation de la publication des données d' échantillonnage

LE NOUVEL EVENT CORE (CŒUR ÉVÉNEMENT )

En IPT 2.3, vous pouvez sélectionner le nouvel event core:

• En créant de nouvelles ressources• En connectant les termes

Trois classes sont disponibles: • Event (événement)• Location• GeologicalContext

(contexte géologique)

EVENT CORE : TERMES FONDAMENTALES

NOUVEAUX TERMES DWC

eventID et parentEventID• Les événements d’échantillonnage peuvent être liés entre eux (ex.,

échantillonnages emboîtés) a travers d’un identifiant parent commun• L’information sur la nature de la relation (ex. part d’une séries de suivi)

peut être décrit dans la section lié au projet dans les métadonnées.

Une parcelle Whittaker avec des sub-parcelles de différent taille

NOUVEAUX TERMES DWC

sampleSize

sampleSizeUnit

Un valeur numérique pour la duration temporelle, le longueur, l’area ou le volume lié a l’événement d’échantillonnage.

L’unité de mesure utilisé dans le événement d’échantillonnage, ex., minute, heure, jour, mètre, mètre carré, mètre cubique.

sampleSize sampleSizeUnit

2 hour

6 m2

1 litre

3 km

EXTENSION D’OCCURRENCES : TERMES

DONNEES: NOUVEAUX TERMES DWCorganismQuantity

organismQuantityType

Le valeur d’un numéro ou d’une énumération pour la quantité des organismes. Utilisez-le avec organismQuantityType pour indiquer le type d’entité qui est quantifié.

Le type d’entité à lequel le valeur du numéro ou de l’énumeration pour la quantité des organismes dans organismQuantity réfère.

organismQuantity organismQuantityType

14 Individuals

r BraunBlanquetScale

31 %Biomass

0.4 %Species

INDEX

IntroductionDéfinition des données d' échantillonnageGEO BON et EBVsApplications des données d' échantillonnageRendre possible la publication des données d' échantillonnageL’importance des métadonnéesUtilisation de « event core » dans l’IPTCas d’utilisation de la publication des données d' échantillonnage

UC1 – INVERTÉBRÉS AQUATIQUES

Groupe Bleu

UC1 – INVERTÉBRÉS AQUATIQUES

• Comparaison de l’abondance/ biomasse, distribution des espèces dans des classes d’abondance géométrique et taille géométrique

• Structure et dynamique des communautés• Évaluation de l’impact humain

• Étude saisonnier des invertébrés des eaux saumâtres

• 7 stations• Grappin Van Veen, utilisé à la main• Abondance, biomasse, variables

environnementales

UC1 - INVERTÉBRÉS AQUATIQUES - DONNÉES

UC2 - LÉPIDOPTÈRES

Groupe Vert

Groupe Rouge

Israel Systematic Butterflies Monitoring Scheme (BMS-IL ) • Protocole des transects “Pollard” : observations le long des transects fixés. • Longueur des transects entre 300 et 600 m, divisé en sections de 50 m. • Pour chaque espèce : enregistrement du nombre des individus vues dans chaque section

Transect map

UC2 - LÉPIDOPTÈRES

UC2 - LÉPIDOPTÈRES - DONNÉES

Données originales - http://www.gluecad.com/buttdb/hompage.asp?lng=eng

UC3 - MACROPHYTES

Yellow Group

Diversité des macrophytes par le Rhine-Main-Observatory (RMO)• Pourcentage de couverture des espèces de plantes vasculaires dans 21 sections des ruisseaux de la

rivière Kinzig.• Relevés de végétation Braun-Blanquet; définis annuellement (printemps pour ceux que fleurit tôt, et

été pour le reste des plantes)• Échantillons réalisés annuellement.

UC3 - MACROPHYTES

Composants abiotiquesUtilisation du terrain Données de la météoDonnées hydrologiques Données physico-chimiques

Composants biotiques :Couverture végétale, Grandeur moyen per biotype Information d’abondance d’espècesInformation utilisant l’échelle Braun-Blanquet

UC3 - MACROPHYTES - DONNÉES

UC4 – ÉTUDES DES RÉCIFS DE CORAIL

Groupe Violet

• 2006-2013• 1,879 sites dans des récifs de corail et

rocailleux par toute le monde• Changement dans les écosystèmes,

effets du changement climatique et de l’acidification des océans

• Recensement visuel par des plongeurs au long des transects immergés de 50 m

• Les espèces de poisson et des invertébrés son enregistrés avec des estimation de l’abondance pour les espèces plus rares

• Ils prennent des photos aussi des coraux et de la couverture des algues

• Paramètres environnementales: température de l’eau, pH et salinité.

UC4 – ÉTUDES DES RÉCIFS DE CORAIL

UC4 – ÉTUDES DES RÉCIFS DE CORAIL – DONNÉES

“What we’ve got today is a lot of data records but probably not yet enough modeling on top of it to understand the significance”

“We are now in a transitional period in which the challenges are less about gathering data than

understanding what to do with it”

Ruby Russell: Big data brings new possibilities to biodiversity science. 2014.

GB22 TRAINING EVENT FOR NODES – 5 OCTOBER 2015

Séance 06: Introduction à la publication des données d’échantillonnage

Larissa Smirnova