LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE...

15
– 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André Francoeur Centre de données sur la biodiversité du Québec, Université du Québec à Chicoutimi RÉSUMÉ La biodiversité des milieux naturels représente maintenant pour la plupart des pays une ressource à sauvegarder, voire essentielle. Celle du Québec se compose de quelque 40 000 espèces dont 30 000 Animaux invertébrés, dominés par 25 000 espèces d'Insectes. Les données d’échantillonnage sur leurs populations demeurent fragmentaires et dispersées tous azimuts. En fonction du temps, ces données subissent plusieurs types d'avatar: matériel pour les spécimens, documentaire, taxinomique, toponymique, et contextuel pour les données elles-mêmes. De plus, il n'existe aucun système global pour colliger et stocker ces données scientifiques, ce qui occasionne des pertes considérables en temps et en renseignements détenus en particulier par diverses institutions ou individus. Une telle situation constitue une entrave majeure non seulement au développement des connaissances fondamentales, mais aussi à la production de diverses analyses scientifiques et socio-économiques dans les domaines touchant directement ou indirectement la biodiversité: biosystématique, faunistique, biogéographie, environnement, foresterie, agriculture et santé publique. On ne peut penser gérer l'environnement en général, et la biodiversité en particulier, de façon dynamique et efficace dans le temps, sans tenir compte des composantes essentielles des écosystèmes et sans les instruments scientifiques adéquats pour ce faire. Ce contexte, vécu en recherche, a incité un groupe de biologistes du réseau de l'Université du Québec à concevoir, dans une optique généraliste et globale, un outil nouveau et standardisé pour stocker et analyser les données d'échantillonnage et supporter leur exploitation. Bien qu'orienté vers les Insectes au départ, il s'agit d'un modèle universel pouvant gérer l'échantillon et ses données descriptives, taxinomiques, écologiques et bibliographiques pour tout groupe d'organisme de n’importe quel milieu. Il devient ainsi possible de rassembler, de standardiser et de valider les données fondamentales qui permettent divers types d'analyse et d’études sur la biodiversité. Cet exposé résume les étapes de développement d’une puissante base relationnelle de données, l’état actuel de notre entrepôt de données et les usages possibles de ces outils à la fois scientifiques et informatiques.

Transcript of LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE...

Page 1: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 1 –

LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES

POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ

André Francoeur

Centre de données sur la biodiversité du Québec, Université du Québec à Chicoutimi

RÉSUMÉ

La biodiversité des milieux naturels représente maintenant pour la plupartdes pays une ressource à sauvegarder, voire essentielle. Celle du Québec se composede quelque 40 000 espèces dont 30 000 Animaux invertébrés, dominés par 25 000espèces d'Insectes. Les données d’échantillonnage sur leurs populations demeurentfragmentaires et dispersées tous azimuts. En fonction du temps, ces donnéessubissent plusieurs types d'avatar: matériel pour les spécimens, documentaire,taxinomique, toponymique, et contextuel pour les données elles-mêmes.

De plus, il n'existe aucun système global pour colliger et stocker ces donnéesscientifiques, ce qui occasionne des pertes considérables en temps et enrenseignements détenus en particulier par diverses institutions ou individus. Unetelle situation constitue une entrave majeure non seulement au développement desconnaissances fondamentales, mais aussi à la production de diverses analysesscientifiques et socio-économiques dans les domaines touchant directement ouindirectement la biodiversité: biosystématique, faunistique, biogéographie,environnement, foresterie, agriculture et santé publique. On ne peut penser gérerl'environnement en général, et la biodiversité en particulier, de façon dynamique etefficace dans le temps, sans tenir compte des composantes essentielles desécosystèmes et sans les instruments scientifiques adéquats pour ce faire.

Ce contexte, vécu en recherche, a incité un groupe de biologistes du réseau del'Université du Québec à concevoir, dans une optique généraliste et globale, un outilnouveau et standardisé pour stocker et analyser les données d'échantillonnage etsupporter leur exploitation. Bien qu'orienté vers les Insectes au départ, il s'agit d'unmodèle universel pouvant gérer l'échantillon et ses données descriptives,taxinomiques, écologiques et bibliographiques pour tout groupe d'organisme den’importe quel milieu. Il devient ainsi possible de rassembler, de standardiser etde valider les données fondamentales qui permettent divers types d'analyse etd’études sur la biodiversité.

Cet exposé résume les étapes de développement d’une puissante baserelationnelle de données, l’état actuel de notre entrepôt de données et les usagespossibles de ces outils à la fois scientifiques et informatiques.

Page 2: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 2 –

INTRODUCTION

Les travaux des chercheurs aussi bien que ceux des gestionnaires dépendent desinformations scientifiques générées principalement par des programmes d'échantillonnage en ce quiregarde la connaissance ou l'exploitation des espèces composant les biocénoses des écosystèmes oudes paysages. Il s'ensuit que les outils d’analyse et de gestion seront d'autant plus pertinents etefficaces que les données scientifiques fondamentales deviendront plus adéquates, plus complètes,validées et intégrées.

Mais, au fait, qu'advient-il des données d'échantillonnage sur les populations des espèces?Sont-elles directement accessibles? Comment sont-elles validées, gérées et utilisées? Qu'elles sontleur valeur et leur signification en fonction du temps? Est-il possible de les intégrer dans uneapproche écosystémique? Quels liens sont maintenus entre les connaissances fondamentales etappliquées? Voilà autant de questions ou problèmes qui surgissent lorsque l'on veut dresser unportrait général de la biodiversité des écosystèmes. Elles se révèlent particulièrement difficiles dansle cas des Animaux invertébrés, en particulier des Insectes et autres Arthropodes, dont le rôle, à lafois positif et négatif, n'est pas négligeable dans tous les types de milieux.

L’informatique permet de se doter d’outils pour affronter cette situation, c'est-à-dire pourpouvoir informatiser, accumuler, conserver, gérer et exploiter les données d’échantillonnage sur labiodiversité. L’objectif initial de notre groupe était d'implanter un système souple et extensiblepermettant de supporter des inventaires et divers types d'analyse scientifique pour les domaines dela faunistique, de la biosystématique, de la biogéographie, de l'écologie générale ou de l'écologieappliquée comme dans les domaines de la foresterie, de l'agriculture et de la santé publique. Aprèsune revue de la situation et des outils alors disponibles, il a fallu s'orienter vers la conception d'unenouvelle base relationnelle de données pour atteindre l'objectif de développer une banque dedonnées d'échantillonnage. Les questions et problèmes que nous avons rencontrés sontprobablement communs ou familiers à tous ceux qui veulent se doter de ce genre d'outils, devenusindispensables pour œuvrer à l’échelle des écosystèmes et des paysages.

Ce bref exposé vise moins à présenter les détails techniques du système que notre équipe adéveloppé que la démarche qui a conduit à concevoir un modèle général et polyvalent de banque dedonnées pour l’étude de la biodiversité des écosystèmes. C'est le fruit de trois années de réflexion etd'analyse et de trois ans de développement qui n’est pas complètement terminé. Comme on pourrale constater, plusieurs des problèmes qui seront soulevés rejoignent des préoccupations actuelleslorsque que l’on veut créer un entrepôt de données, peu importe le domaine.

Après une analyse de la problématique générale, suivra un résumé de la démarche suivie etune présentation des caractéristiques principales de la base relationnelle de données. Quelquesstatistiques suivront sur l’état actuel de l’entrepôt de données en termes de banques de données quis’articulent dans un Système incluant la géomatique. Je terminerai par des exemples et desperspectives possibles d’utilisation.

Page 3: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 3 –

PROBLÉMATIQUE GÉNÉRALE

Envergure de la tâche

La faune québécoise recèlerait quelque 30 000 espèces d'Animaux invertébrés (Insectes,Arachnides, Crustacés, Annélides (vers), etc.) dont 25 000 Insectes sur près de 40 000 organismesvivants (Danks 1979, Francoeur 1995, Loiselle 1988). On estime en général que 10 % sonteffectivement ou potentiellement nuisibles. On imagine la masse énorme de données qui lesconcerne.

Dispersion et conservation des données

Il existe dans les universités, les ministères et autres organismes publiques et privés desactivités de recherche et d'inventaire dont l'une des facettes est d'accumuler des données àcaractères faunistique, biogéographique, taxinomique et économique. Ces renseignements sur lesespèces, détenus aussi par des individus, demeurent fragmentaires et dispersés tous azimuts. Cesinformations demeurent sous-exploitées et souvent disparaissent avec le temps faute d'un systèmecapable de rassembler, de conserver et de gérer les données recueillies sur eux.

Accessibilité à obstacles

Cette dispersion, de même que la variété des enregistrements et des moyens de conservationet de représentation rendent impossible l'accès direct aux données d'échantillonnage. Il fauttoujours procéder au cas par cas dans l'étude des sources de données. Il apparaît alors desobstacles insidieux: absence de standards dans l'identification des variables, des concepts et destermes, en particulier pour la description du milieu d'origine des échantillons.

Spécialisation des banques

En outre, nous avons constaté assez rapidement que tous les types de banques actuelles dedonnées se caractérisent soit par une spécialisation rigide, soit par des limites sectorielles comme ilen existe dans la plupart des pays développés. Ces instruments présentent donc des capacitésrestreintes d'analyse et de recherche par rapport à une perspective générale ou écosystémique.

Érosion et difficulté de l'identification

Le phénomène de l'érosion constante de l'identité ou de la classification des espèces, sinonl'absence ou l'impossibilité d'utiliser un nom spécifique élèvent souvent des obstacles à laconservation et à l'utilisation de données écologiques. Quoique de moindre envergure et plus lente,ce genre d'érosion affecte aussi la reconnaissance des lieux d'échantillonnage (changements dans lestoponymes).

Imprécision et babélisme

Malgré l'image stéréotypée de précision et de rigueur de la science, il faut bien constater queles données associées aux échantillons comportent très souvent des niveaux importantsd'imprécision, ce qui limite ou compromet leur signification et leur utilisation.

Enfin, l'usage des termes et des concepts pour véhiculer les informations varie avec lesgroupes d'organismes et les auteurs. Par exemple, la notion même d'échantillon varie d'un groupe àl'autre.

Page 4: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 4 –

Conclusion

Cette situation globale constitue donc une entrave majeure non seulement audéveloppement des connaissances fondamentales sur les espèces et à leur conservation, mais aussià la production de diverses analyses scientifiques pouvant avoir une portée écosystémique ou socio-économique.

ÉTAPES DE LA DÉMARCHE

Principes directeurs

Trois principes directeurs ont guidé la démarche. Nous avons opté pour une approchegénéraliste et globale malgré les embûches fondamentales qu'elle comportait au niveau de larationalisation et de la standardisation des données scientifiques. En ne considérant aucunecontrainte préalable, il devenait possible de repartir à zéro en redéfinissant les besoins, les conceptset les outils.

Nous recherchions une polyvalence maximale dans l'utilisation des données en éliminanttoute forme de synthèse et d'interprétation, ce qui oblige à revenir aux données brutes ou primaires.Cette exigence fut particulièrement difficile à atteindre, car il a fallu remettre en question, sinondémonter, nos modes de penser traditionnels ou automatiques.

Pour des raisons évidentes, il fut convenu d'un alignement systématique sur les standardsinternationaux lorsqu'ils existent, en ce qui concerne l'expression des informations. Un exemplesimple de tracasserie: les différentes façons d'écrire l'heure et la date.

Identification des besoins

Dans les domaines de l'écologie et de la systématique des espèces, notre groupe dechercheurs a reconnu un certain nombre de besoins fondamentaux communs.

– Nécessité d'associer dans une seule base relationnelle toutes informations concernantl'échantillon, les spécimens et le milieu d'origine, quel que soit le type d'organisme.

– Possibilité de valider, conserver et bonifier les données à travers le temps. Il s'agit d'unecondition essentielle pour la surveillance et l'évaluation de l'état des espèces et desécosystèmes.

– Validation automatique des données nominatives (toponymes, taxons, etc.) par l’usage derépertoires appropriés pour ne pas devoir gérer les erreurs de frappe et les optionsdivergentes des différentes classifications.

– Capacité d'interrogation générale ou spécialisée dans une grille entièrement relationnelle devariables pour pouvoir dépasser le simple niveau du listage des informations.

– Possibilité de gérer l'évolution des identifications des espèces et des lieux.

– Enregistrement de toutes interactions entre les espèces.

– Élaboration d'un système général de standards pour tous les données afin de pouvoir intégrerles données de diverses sources et faciliter leur utilisation et leur circulation.

– Séparation des fonctions de conservation et de gestion des fonctions d'analyse et de synthèsedes données.

Page 5: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 5 –

Étapes de développement

La stratégie de développement, conseillée par les informaticiens de l’UQAC, fut fondée surles méthodes Merise et DMR (Ducros, Meilleur et Roy). Bien que partagés en deux rubriques,plusieurs des travaux effectués se sont chevauchés ou bien ont été accomplis en parallèle dans letemps.

– Travaux scientifiques

• Analyse préliminaire pour préciser les orientations et la sélection des données à utiliserpour supporter le développement des connaissances taxinomiques, biogéographiques et écologiquessur les espèces.

•Construction d'un répertoire de toutes les espèces vivant au Québec, actuellement complétéà 55 %. Cet outil est nécessaire pour enregistrer les interactions entre les espèces.

• Conception d'un système d'encodage, de gestion et d'interrogation taxinomique.

• Inventaire illustré des méthodes et des moyens d'échantillonnage en milieu terrestre etaquatique.

• Développement d'un thesaurus de descripteurs hiérarchisés et univoques, à croissancepotentielle illimitée ou adaptable selon les besoins.

• Adoption de la banque TOPOS comme standard de référence pour la toponymie et lerepérage géographique par coordonnées.

• Identification et structuration des opérations et des actions à intégrer en un système, avecesquisses des flux des informations et des procédures opérationnelles.

• Élaboration d'un code de déontologie pour la gestion et l'utilisation des données.

Base de données

Logiciel d'application

Modélisationrelationnelle

et fonctionnelle

Conceptualisationdes données:identification,définition,formatage

ÉCHANTILLONNAGE:spécimensdonnées

INFORMATISATION:stockagegestion

DÉMARCHE

ACTIONS

OBJETS

NIVEAU 1

ESPÈCES DESÉCOSYSTÈMES

NIVEAU 2 NIVEAU 3

SYSTÈMESD'INFORMATIONET D'ANALYSE

MATÉTIELSINFORMATIQUES

ET LOGICIELS

EXPLOITATION:compilationstatistiquessynthèse

PRODUITS DIVERS:

Organisationet

Structuration

• analyse spatiale• atlas• catalogues• études d'impact• faunes, flores• rapports divers• etc.

Conceptualisationdes données:

identification,définition,formatage

Figure 1. Contexte et étapes de développementde la base relationnelle de données.

Page 6: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 6 –

– Travaux informatiques

• Production d'un “Modèle conceptuel” de l'outil désiré et d'un “Dictionnaire des entités et des relations”.

• Analyse opérationnelle du modèle conceptuel et production d'un “Modèle fonctionnel”.

• Construction des tables de données dont le nombre dépasse la centaine.

• Structuration des écrans et de leurs fonctions.

• Programmation des fonctions et production de l'application.

En résumé, les efforts de notre groupe ont porté (1) sur l'identification et la description, lastandardisation et la modélisation des données (le contenu), (2) sur la structuration d'une baserelationnelle de variables (le contenant), (3) sur la production d'un logiciel d'application (lefonctionnement) dans un contexte d'informatisation de données sur les espèces des écosystèmes.La figure 1 situe cette démarche par rapport à trois niveaux d'action.

Le développement de l'application informatique s’est fait en utilisant un progiciel de typeSGBD, en l’occurrence INGRES, sur une station VAX. En outre, l'outil est transposé pour la micro-informatique en utilisant le progiciel 4e Dimension afin d’offrir un outil convivial et adaptable auxusagers individuels.

LA BASE RELATIONNELLE DE DONNÉES

Catégories de variables

La base comprend deux sous-ensembles de variables: les données de l'échantillon et lesdonnées complémentaires (associées aux répertoires). Les principales catégories concernent desdonnées d'échantillonnage, des données taxinomiques, bio-écologiques, de collection,bibliographiques. Autrement dit, cette base permet de gérer toutes les données concernant unéchantillon et la description de son contenu, le système de classification biologique, la descriptiondes milieux et la documentation bibliographique. La figure 2 indique, en partie, la nature desdonnées qu'elles regroupent.

Ces catégories peuvent inclure un nombre très inégal de variables, les nombres les plusélevés concernent la description des milieux et des spécimens. Sur l'ensemble des variables de labase, seulement deux sont de nature synthétique: le statut biogéographique et le rôle trophique,lesquels sont associées logiquement à l'espèce.

Polyvalence maximale

Il s'agit donc d'une base relationnelle structurant des variables universelles, sansspécialisation par rapport aux organismes ou aux milieux. La séparation des données primairesdes informations résultant de compilation et de synthèse, ainsi que des informations sectorielles(orientées vers un domaine spécialisé) permet une polyvalence maximale dans la combinaison desrenseignements pour l'interrogation.

La spécialisation par rapport aux espèces ou aux milieux est reportée au niveau desdescripteurs identifiant l'information dans les variables. Une telle base relationnelle peut donc êtreutilisée pour développer une banque de données sur n'importe quel groupe d'organismes. Il s'agitd'avoir la batterie de descripteurs qui convient au groupe visé.

Page 7: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 7 –

On peut alors gérer la biodiversité en fonction des renseignements primaires obtenus pardes échantillonnages. Ces données peuvent alors s'accumuler et se bonifier en fonction du temps etde l'espace, sans contrainte d'échelle de grandeur: au choix, de l'écosystème à la station, d'une heureà un siècle.

Fonctions et capacités principales

Le modèle a été conçu pour assurer les fonctions suivantes.

– Accumuler et gérer des données primaires standardisées d'échantillonnage sans limite detemps, ni d'espace, en rapport avec la systématique, l'écologie et la répartition des espèces.

– Interrogation par n'importe quelle combinaison de variables composant la base relationnellede données.

– Extraire et compiler les relations et les interactions entre les organismes (arthropodes-plantes,plantes-invertébrés, arthropodes-vertébrés, etc.).

– Gérer la synonymie au niveau des genres et des espèces.

Figure 2. Répartition thématique des données et liens générauxdans la base relationnelle.

données de l'échantil lon

données complémentaires

R É P ER TOIR ES• des collections• des notices bibliographiques• des personnes• des programmes d'inventaire

R É P E R TOI R E DE S TA XONS

• r ègne• phy lum• classe• or dr e• famille• genr e• espèce• sous-espèce• statut bio géogr aphique• r ôles tr ophique s des espèces

R É P E R TOI R EDE S TOP ONYM E S

• toponymes offic iels• entités et codes• coor données géogr ap hique s• unit és administ r atives

SOUS-É CH ANTI LLON–SPÉ CI M ENS • source des données • description et nombre • conservation des spécimens • valeur taxinomique des spécimens

COMPORTEMENTS• type d'action• type d'interaction• individus et éléments en cause• notes comportementales

ÉCHAN TI LLON• no de référence de l'échanti l lon• méthode d'échantillonnage• contexte de l 'échantillonnage• nom de l'échantil lonneur

ENVI RON NEM ENT• descr iption de l 'habitat• paramètr es bio-physico-chimi ques• perturbati ons connues• posi tionnement de l 'échanti l lon

I DENTI F I CATION• nom de l'organisme (un taxon)• identificateurs ou vérificateurs• année d'identification• discernements

Page 8: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 8 –

– Accéder aux données des échantillons par les principales catégories du système de classification.

– Gérer une collection en fonction des échantillons, des spécimens, des identifications ou desdonnées associées.

– Présenter et évaluer l'état, la valeur, l'utilité, la signification des collections de spécimens et deleurs données en fonction du temps et de l'espace.

– Déterminer les sources de données en fonction de n'importe quelle combinaison de variables.

– Déterminer et évaluer la nature et l'importance qualitative et quantitative de la contributiondes personnes et des programmes d'inventaire en fonction du temps et de l'espace.

– Associer les échantillons et leurs renseignements à des publications.

– Établir l'état des renseignements sur les taxons en fonction du temps.

– Expansion et spécialisation possible du thesaurus des descripteurs en fonction des espèces etdes milieux.

– Supporter l'extraction et l'édition des données sous forme de document ou de carte.

L’ENTREPÔT ACTUEL DES DONNÉES

Cet entrepôt de données loge présentement au Centre de données sur la biodiversité del'UQAC et est développé en partenariat avec la corporation Entomofaune du Québec et le Centre deforesterie des Laurentides du ministère fédéral des forêts. Voici quelques statistiques sur lasituation actuelle des banques de données.

La banque de données d’échantillonnage

Le territoire couvert

La Banque permet le stockage, la gestion et l'exploitation des données primaires reliéesaux échantillons de populations prélevés ou observés sur le territoire de la péninsule québécoise(Québec — Labrador). ). Elle permet également de préciser les interactions observées entre lesespèces rencontrées sur ce territoire (relations plante-hôte, prédateur-proie, parasitisme, etc.).

Le nombre d’échantillons

Plus de 10 000 échantillons et leur cortège de données sont versées ou en attente deversement. Ils concernent essentiellement des Insectes et autres Arthropodes, des Oiseaux et desPlantes vasculaires. Les échantillons totalisent plus de 13 000 sous-échantillons.

Notons ici qu’un échantillon comprend un ensemble d'individus observés ou de spécimensrécoltés par une ou plusieurs personnes, dans un même milieu, à un moment (ou à une période)précis(e), grâce à une même méthode d'échantillonnage.

Le thesaurus

Le thesaurus comprend un ensemble de 3 500 descripteurs univoques qui supportent: lalocalisation de l'échantillon, la description de l'échantillon et des sous-échantillons, la description del'environnement, le développement des divers répertoires

Les sept répertoires. La banque comprend les répertoires suivants:

Page 9: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 9 –

des personnes physiques ou morales >500

des collections (insectiers, herbiers) >130

des notices bibliographiques >310

des toponymes >106 000

des taxons >40 000

des rôles trophiques à venir

des statuts des organismes à venir

Le répertoire des toponymes

TOPOS, une banque informatisée de données développée par la Commission de toponymiedu Québec renferme plus de 108 000 toponymes officiels:

• identifiés par un numéro séquentiel unique,

• regroupés selon les MRC,

• identifiés par un code géographique (entité-MRC-Québec),

• localisés par latitudes et longitudes,

• référencés à une carte topographique à l’échelle 1/50 000.

Avant de les verser dans le répertoire, les circonscriptions électorales et les archidiocèses ontété éliminés. Ensuite, les 106 000 toponymes restant furent répartis en trois groupes:

lieux aquatiques (potamonymes) 82 300

lieux terrestres 16 000

territoires administratifs 7 800

Le répertoire des taxons comprend présentement:

SECTIONS 7

phylums 61

classes 168

ordres 732

familles 1 600

genres 10 300

organismes (genre + épithète) 26 750

Les diverses classifications sélectionnées pour construire le Répertoire sont toujoursréférencées, de sorte que l'utilisateur peut en tout temps vérifier la source d'une classificationdonnée. Il est important de préciser que tout changement dans la nature des taxons supérieursn'affecte en rien les données d'échantillonnage.

Page 10: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 10 –

Le SIGEB

Cette Banque de données d’échantillonnage est associée à d’autres banques et diversesressources informatiques, en particulier de géomatique, pour constituer un système fonctionnel deressources appelé “ Système d’information et de gestion des échantillonnages sur labiodiversité ” ou SIGEB. Ces ressources forment deux ensembles illustrés par la figure 3.

Le premier ensemble forme une unité de stockage et de gestion constituée de la puissantebase relationnelle de variables, des sept répertoires spécialisés, du thesaurus de descripteursunivoques, d'applications de saisie et d'interrogation. Les données de cette première unité étantobligatoirement géoréférencées à un nom officiel du Répertoire des toponymes, elles peuvent êtreassociées à celles de la deuxième unité.

Le deuxième ensemble de ressources comprend des banques de données écologiques etgéophysiques, et les limites des entités municipales et des MRC du Québec. Ainsi, les donnéesd'échantillonnage peuvent être couplées à ces dernières pour effectuer une cartographie numérique etdes analyses spatiales à l'aide de logiciels de géomatique. D’autres banques, comme celles serapportant à l’usage des territoires pourraient s’y greffer.

Les banques de données géomorphologiques et écologiques comprennent des fonds de cartesdu système Jurdant (figure 4), des bassins hydrographiques, des unités géomorphologiques etpédologiques, des unités climatiques et végétales, etc. Une carte des écosections de la Sagamie(Saguenay–Lac-Saint-Jean) a été produite à l'échelle de 1 ⁄ 125 000. En outre, les limites desterritoires municipaux et des MRC du Québec furent numérisées pour usage sur les micro-ordinateurs. Un catalogue énumère et présente sommairement l’ensemble de ces éléments.

On notera ici que seuls la base relationnelle de données, le thesaurus et certains desrépertoires s'avèrent des oeuvres originales, fruits d'un type peu reconnu de recherche. Ledéveloppement du thesaurus demeure sans limite et adaptable aux besoins. Ces éléments doiventêtre conçus au départ sans dépendance à l'égard des outils informatiques.

Figure 3. Éléments du Système d’information et de gestiondes échantillonnages sur la biodiversité (SIGEB).

ARC

INFO

°La°La tt++

°Lon°Lon gg

UNI TÉDE STOCKAGE ET DE GESTION

DE DONNÉES P R IM AIR ES

BASERELAT I ONNELLE

DE DONNÉESPR I MAI RES

UNI TÉDE DONN ÉES ÉC OPHY SIQUES

ET DE GÉ OM ATIQUE

UNTHÉSAUR US

SEPTR ÉPER TOIR ES

AP P LI CATI O ND'I NTE RRO G ATI O N

(G QL)

AP P LI CATI O NSDE SAI SI E

(MicroS I G EB)

BANQU EDE DONNÉES

G ÉOPHYS I QU ES

BANQU EDE DONNÉES

ÉCOLOG I QU ES

MMP

INFO

Page 11: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 11 –

DIVISIONS ÉCOLOGIQUES

DIVISIONS TERRITORIALES

QUÉBEC — LABRADOR

Point géographique (coordonnées, toponyme, centroïde)Zone administrative (municipale, fédérale , cadastrale)Itinéraire-échantillonParcelle-échantillon

HydrographieRéseau routierBarrages & lignes de transmission

DIVISIONS HYDROGRAPHIQUES

Répartition des taxons

Repères cartographiques

SYSTÈME DES ÉCOZONES

Écozones

Écorégions

Écodistricts

Écosections

Écosites

Divisions hiérarchiques de référence

Bassins continentaux

Bassins r égionaux

S. -bassins r égionaux

Bassins locaux

S. -bassins locaux

CCDDBBQQ--11999988

FrontièresRégions

MRC

Municipalités

Sites

Figure 4. Cadre cartographique du SIGEB.

DIVERSES POSSIBILITÉS D’UTILISATION

Banque pour les écosystèmes

Imaginons une équipe de spécialistes qui vont échantillonner les Plantes, les Champignons,les Oiseaux et les Animaux invertébrés d'une Sapinière à Bouleau jaune. Dans le cas desArthropodes, tour à tour seront visés les mineuses des feuilles, les insectes de l'écorce, les parasitesdes oiseaux ou des mammifères, la pédofaune (acariens, araignées, etc.), les fourmis, lesmoustiques, etc. Tous ces échantillonneurs ont en commun le même milieu ou écosystème, mais ilsse distinguent à la fois par le type d'organisme recueilli et leur situation ou relation dansl'écosystème. Notre base relationnelle tient compte de ces différences et ressemblances pour unmême milieu d'échantillonnage et peut recueillir toutes les données générées par leséchantillonneurs. Il en va de même pour les milieux aquatiques. Des analyses et études à l’échellede l’écosystème sont alors possibles à partir d’une banque qui intègre toutes les données. C’est legenre de banque que le Centre de données sur la biodiversité du Québec développe actuellement.

Des outils individualisés

Grâce à la micro-informatique, l’application MicroSIGEB permettra à un usager depersonnaliser le SIGEB selon ses besoins pour créer sa propre banque sur la base des standards dusystème.

Page 12: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 12 –

Fournir des informations spécialisées sur les espèces

Une Banque de données d’échantillonnage peut répondre à des questions pointues ougénérales comme les suivantes et à bien d'autres…

• Un étudiant de cycle supérieur qui veut étudier les Fourmis de l'Estrie se pose les questionssuivantes.

- Quelles sont les espèces recensées dans la région?- Quelle est la répartition géographique de ces espèces au Québec? Des cartes sont-elles

disponibles?- Existe-t-il des travaux sur les Fourmis du Québec?- Où trouver des spécimens? Qui peut les identifier?

• Un forestier veut savoir quelles sont les espèces d'insectes qui attaquent les espèces de Bouleaux(Betula sp.) dans la réserve faunique des Laurentides?…récoltées de 1960 à 1980?…déposéesdans telle et telle collections?

• Quelles sont les proies des Hiboux dans la MRC du Fjord?

• Un vétérinaire veut savoir quels sont les parasites des chiens à Chicoutimi?

• Existe-t-il une espèce Z représentée par des spécimens mâles, dans tel échantillon, de telle année,dans la collection X, identifiée par Y, en 1967?

• Quelle est la période de vol de tel papillon dans les champs de maïs du Lac-Saint-Jean ?

• Quelle est la répartition du Sabot de la vierge dans Charlevoix?

Ces questions élaborées selon le langage courant et en partie synthétique devront êtrereformulées selon les standards du système pour pouvoir extraire de la banque les renseignementsrecherchés. Ces derniers peuvent ensuite être analysés, synthétisés et cartographiés selon lesbesoins ou objectifs visés.

Production de listes générales ou spécialisées d’espèces

Le développement d’un Répertoire général des espèces et la gestion du système declassification permet de produire à la demande des listes d’espèces en fonction des territoires ouautres paramètres. Ainsi, le CDBQ fut le premier à produire une “ Liste des plantes vasculaires duQuébec ” comprenant espèces, sous-espèces, variétés et synonymes, codification et index divers.

Inventaire des toponymes des territoires

Le Répertoire des toponymes peut être exploité de diverses façons, seul ou en rapport avecles éléments du SIGEB.

Outil pour l’aménagement des territoires

Le SIGEB peut contribuer à la conception de plan d’aménagement des territoires en fournissant desconnaissances appropriées sur des espèces, des écosystèmes ou des paysages. On peut produire defaçon dynamique (à partir des données d’échantillonnage) des cartes de répartition des espèces enrapport avec différents paramètres, des cartes donnant les habitats potentiels des espèces, etc. Lesfigures 5 et 6, 8 et 9 présentent des exemples pour deux types d’espèces.

Page 13: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 13 –

Figure 5. Analyse centrographique de la répartition de deux espèces de fourmis au Québec. Lecarton présente une station d’échantillonnage d’un hectare dans une tourbière en afforestation,

où la distribution des nids de fourmi est associée à la densité du couvert forestier.

Figure 6. Carte des zones potentielles d’habitat pour le Merle bleuautour du lac Saint-Jean et de la rivière Saguenay.

Page 14: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 14 –

Outils pour études scientifiques, environnementales, économiques

Le développement de banques de données standardisées et intégrées concernant lesPlantes, les Mammifères, les Oiseaux ou les Poissons devient possible à partir du modèle que notregroupe a conçu en regroupant les données du plus grand nombre possible de sources: chercheurs,collectionneurs, musées, universités, ministères, industries, etc. La concentration des donnéesprimaires concernant les espèces permettrait aux différents utilisateurs un meilleur accès àl'information, une standardisation améliorée du type de données recueillies et une assurance de leurconservation. En retour, elle permettrait à un ensemble important d'usagers (étudiants, chercheurs,professionnels, amateurs, gestionnaires) d'avoir accès à une mine formidable de donnéesactuellement inaccessibles et dispersées, et ainsi de produire des travaux d'une précision ou d'uneenvergure nouvelle ou bien impensables autrement.

En s'accumulant, le capital statistique permettrait de faire périodiquement le point sur lesconnaissances disponibles. Par exemple, divers intervenants tels que groupes de conservation,organismes publics ou privés, conseillers en environnement, pourraient étudier l'extension ou larégression d’espèces déterminées, etc. Ces données seraient précieuses pour toute étude d'impact.

Les États ont jugé essentiel de se doter d'offices ou bureaux de la statistique pour gérerl’économie et la société. Pour gérer réellement les écosystèmes, il faut l'équivalent sur les espècesqui les composent.

Un centre régional de données

Les municipalités et les MRC ont des responsabilités légales en ce qui concerne l’inventairedu capital nature et sa biodiversité, l’aménagement des territoires. Au lieu d’y répondre de façonisolée, en mode dispersé, ce qui s’oppose à la globalité de la réalité naturelle et au développementdurable, avec chacun des ressources incomplètes, pourquoi ne pas s’unir pour créer un Centrerégional de données dont les possibilités dépasseraient largement les capacités de support d’uneseule entité municipale. Associé à l’Université et aux Cégeps, ce Centre auraient alors accès àdiverses ressources comme l’illustre la figure 7. La formule et les outils du SIGEB, associés àd’autres outils, permettent d’envisager la création d’un tel Centre.

MRC

MINISTÈRES

MUSÉUMS

CENTRE

RÉGIONAL

DE DONNÉES

MUNICIPALITÉS

CÉGEPS

UNIVERSITÉS

Figure 7. Relations possibles (scientifiques et financières) d’un Centre régionalde données pour la gestion durable du territoire.

Page 15: LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR … · 2016. 9. 1. · – 1 – LE DÉVELOPPEMENT D'UN ENTREPÔT DE DONNÉES POUR L’ÉTUDE ET LA GESTION DE LA BIODIVERSITÉ André

– 15 –

FRANCOEUR, A. 1999. Le développement d'un entrepôt de données pour l'étude etla gestion de la biodiversité. Colloque «Les entrepôts de données à la croisée desautoroutes de l'information». Centre de géomatique du Québec, Chicoutimi, le 30Avril. Document du CDBQ, UQAC, Chicoutimi. 14 p.