Post on 18-Feb-2022
Mesures de laBiodiversiteacute
Eric Marcon
26012022
Ce document est reacutealiseacute de faccedilon dynamique et reproductible gracircce agrave
bull LATEX dans sa distribution Miktex (httpmiktexorg) et la classe memoir(httpwwwctanorgpkgmemoir)
bull R (httpwwwr-projectorg) et RStudio (httpwwwrstudiocom)
bull bookdown (httpbookdownorg)
Son code source est sur GitHub httpsgithubcomEricMarconMesuresBioDiv2Le texte mis agrave jour en continu peut ecirctre lu sur httpsericmarcongithubioMesuresBioDiv2 Les versions drsquoeacutetape sont deacuteposeacutees sur HAL httpshal-agroparistecharchives-ouvertesfrcel-01205813
Uniteacute Mixte de Recherche
ECOlogie
des
FOrecircts
de
Guyane
Photographie en couverture Hadrien Lalaguumle
Table des matiegraveres
Table des matiegraveres iii
Motivation ix
Calculs et donneacutees xi
Notations xiii
I mdash Notions 1
1 Notions de Diversiteacute 311 Composantes 3
Richesse 3Eacutequitabiliteacute 4Dispariteacute 4Agreacutegation 5
12 Niveaux de lrsquoeacutetude 5Diversiteacute 120572 120573 et 120574 5Deacutecomposition 6
13 Le problegraveme de lrsquoespegravece 7
2 Outils 921 Courbes drsquoaccumulation 922 Diversiteacute asymptotique 1023 Taux de couverture 11
Formule des freacutequences de Good-Turing 11Taux de couverture et deacuteficit de couverture 12Compleacutetude 14
24 Distribution de lrsquoabondance des espegraveces (SAD) 15La distribution en log-seacuteries 16La distribution Broken Stick 16La distribution log-normale 17La distribution geacuteomeacutetrique 18Synthegravese 18
iii
iv Table des matiegraveres
II mdash Diversiteacute neutre drsquoune communauteacute 23
3 Mesures neutres de la diversiteacute 120572 ou 120574 2531 Richesse speacutecifique 26
Techniques drsquoestimation non parameacutetrique 26Infeacuterence du nombre drsquoespegraveces agrave partir de la SAD 39Infeacuterence du nombre drsquoespegraveces agrave partir de
courbes drsquoaccumulation 41Diversiteacute geacuteneacuterique 45Combien y a-t-il drsquoespegraveces diffeacuterentes sur Terre 46
32 Indice de Simpson 47Deacutefinition 47Estimation 48
33 Indice de Shannon 49Deacutefinition 49Estimation 51
34 Indice de Hurlbert 57Deacutefinition 57Estimation 58
4 Entropie 6141 Deacutefinition de lrsquoentropie 6142 Entropie relative 6343 Lrsquoappropriation de lrsquoentropie par la biodiversiteacute 6444 Entropie HCDT 67
Logarithmes deacuteformeacutes 67Entropie et diversiteacute 69Synthegravese 71
45 Profils de diversiteacute 7146 Estimation de lrsquoentropie 73
Zhang et Grabchak 73Chao et Jost 74Autres meacutethodes 76Biais des estimateurs 77Intervalle de confiance des estimateurs 78Pratique de lrsquoestimation 79MSOM et MSAM 81Rareacutefaction et extrapolation 81
47 Autres approches 81Lrsquoentropie de Reacutenyi 81Lrsquoentropie geacuteneacuteraliseacutee des mesures drsquoineacutegaliteacute 82Lrsquoentropie de Simpson geacuteneacuteraliseacutee 83Lrsquoentropie par cas 86
5 Eacutequitabiliteacute 8951 Approche axiomatique 8952 Indice classiques 91
Indice de Bulla 91Indice de Gini 91
Table des matiegraveres v
Rapports de moyennes 91Ratios de Hill 91Synthegravese 91
53 Indice alternatifs 92Variance de la rareteacute 92Non-speacutecificiteacute 92
54 Indice de Pielou 9255 Geacuteneacuteralisation de lrsquoindice de Pielou 93
Mendes et al 93Tuomisto 93Jost 93Synthegravese 94
56 Relations empiriques entre richesse et eacutequitabiliteacute 95
III mdash Diversiteacute fonctionnelle et phylogeacuteneacute-tique 99
6 Cadre 10161 Dissimilariteacute et distance 10262 Distance phylogeacuteneacutetique 10363 Distance fonctionnelle 10364 Eacutequivalence des deux diversiteacutes 10565 Typologie des mesures 106
7 Mesures particuliegraveres 10971 Richesse eacutequitabiliteacute et divergence fonctionnelle 109
Richesse fonctionnelle 110Equitabiliteacute fonctionnelle 111Divergence fonctionnelle 112
72 Originaliteacute richesse et eacutequitabiliteacute phylogeacuteneacute-tique 114Mesures speacutecifiques drsquooriginaliteacute 114Originaliteacute taxonomique de Ricotta 115Richesse phylogeacuteneacutetique 116Indices de Cadotte 117
73 Diversiteacute de Scheiner 11974 Diversiteacute de Solow et Polasky 12275 FD et PD 12376 Indice de Rao 125
Principe 125Formalisation 125Proprieacuteteacutes 125Calcul sous R 126Maximum theacuteorique 127
77 Diversiteacute et moyenne 13078 Variations sur lrsquoentropie quadratique 13079 Diversiteacute fonctionnelle de Chiu et Chao 131710 119867119901 et 1198681 132
vi Table des matiegraveres
8 Entropie phylogeacuteneacutetique 13381 Geacuteneacuteralisation de lrsquoentropie HCDT 13382 Estimation 13483 Entropie et diversiteacute 13584 Diversiteacute individuelle 13785 Arbres non ultrameacutetriques 137
9 Diversiteacute de Leinster et Cobbold 13991 Deacutefinitions 13992 Diversiteacute neutre 14193 Diversiteacute non neutre 14194 Entropie de Ricotta et Szeidl 14295 Deacutefinition de la similariteacute 14396 Estimation 14597 Diversiteacute phylogeacuteneacutetique 14798 Diversiteacute individuelle 14899 Diversiteacute des valeurs propres 151910 Synthegravese 154
IV mdash Diversiteacute beta et deacutecomposition 157
10 Cadre 159101 Deacutefinition de la diversiteacute 120573 par objectifs 160102 Typologie des mesures 163103 Deacutecomposition de la diversiteacute 163
Deacutefinitions de la diversiteacute 120573 mesure deacuteriveacutee 163Le deacutebat sur la deacutecomposition 164Deacutecomposition multiplicative de la diversiteacute 165Deacutefinitions de la diversiteacute 120572 165
11 Diversiteacute de diffeacuterentiation 169111 Donneacutees de preacutesence-absence 169
Indices de similariteacute 169Biais drsquoestimation 171Repreacutesentation graphique 173
112 Donneacutees drsquoabondance 174113 Emboicirctement et substitution 175114 Donneacutees drsquoabondance et similariteacute des espegraveces 177
Dissimilariteacute minimale moyenne 177Similariteacute moyenne entre individus 178
115 Distance entre paires de communauteacutes et diver-siteacute 120573 proportionnelle 180Diversiteacute de Simpson 180Geacuteneacuteralisation 182
116 Tests de significativiteacute 184Test de non-nulliteacute 184Analyse de la variabiliteacute 185
Table des matiegraveres vii
12 Deacutecomposition de lrsquoentropie HCDT 187121 Deacutecomposition de lrsquoindice de Shannon 187
Deacutefinition 187Biais drsquoestimation 189
122 Deacutecomposition de lrsquoentropie geacuteneacuteraliseacutee 191123 Deacutecomposition du nombre drsquoespegraveces 193124 Deacutecomposition de lrsquoindice de Gini-Simpson 194125 Deacutecomposition de lrsquoindice de Rao 196126 Synthegravese 199127 Normalisation 200
Neacutecessiteacute de normaliser la diversiteacute 120573 200Lrsquoindice de chevauchement 119862119902119873 202
13 Deacutecomposition de la diversiteacute phylogeacuteneacutetiqueet fonctionnelle 203131 Deacutecomposition de la diversiteacute phylogeacuteneacutetique 203132 Partitionnement de la diversiteacute de Leinster et
Cobbold 205
14 Tests de significativiteacute 209141 Test de non-nulliteacute 209
Intervalle de confiance 210Correction des biais 211
142 Analyse de la variabiliteacute 211
15 Autres approches 213151 Le partitionnement de la diversiteacute selon Peacutelis-
sier et Couteron 213Cadre 213Deacutecomposition 214
152 Diversiteacute de Kosman 215
V mdash Diversiteacute jointe diversiteacute structurelle 217
16 Cadre 219
17 Information mutuelle 221171 Reacutecursiviteacute de lrsquoentropie 221
Entropie de Shannon 221Entropie HCDT 222Inteacuterecirct de lrsquoinformation mutuelle 223
172 Taille de niche 223
18 Deacutecomposition de la diversiteacute jointe 225181 Deacutefinitions 225182 Relations avec drsquoautres mesures de diversiteacute 229
viii Table des matiegraveres
VI mdash Diversiteacute spatialement explicite 231
19 Cadre 233
20 Indice 120572 de Fisher 235201 Construction 235202 Variantes 239
21 Accumulation de la diversiteacute locale 243211 Courbes drsquoaccumulation 243212 Extrapolation 246213 Influence de la structure spatiale 250
22 Diversiteacute reacutegionale 253221 La relation drsquoArrhenius 254
Loi de puissance 254Le modegravele de Plotkin 255
222 Le modegravele de Gleason 257223 Le modegravele de placement aleacuteatoire 258224 Synthegravese 259225 Estimation de la richesse agrave partir de placettes
distantes 261
23 Diversiteacute 120573 spatialement explicite 263231 Lrsquoindice de Simpson spatialement explicite 263232 Le variogramme de compleacutementariteacute 264
VII mdash Conclusion 267
24 Synthegravese 269241 Entropie et diversiteacute 269242 Ordres particuliers de diversiteacute 270
Estimation 270Partition 271Eacutegaliteacute des diversiteacutes 271
243 Limites 271
Bibliographie 273
1C Meine et al laquo rdquoA Mission-Driven Disciplinerdquo The Growth ofConservation Biology raquo In Conser-vation Biology 203 (2006) p 631-651 doi 101111j1523-1739200600449x
2E O Wilson et F M Peter eacutedBiodiversity Washington DC TheNational Academies Press 1988
3P Blandin laquo La Diversiteacute DuVivant Avant (et Apregraves) La Biodi-versiteacute Repegraveres Historiques et Eacutepis-teacutemologiques raquo In La Biodiversi-teacute En Question Enjeux Philoso-phiques Eacutethiques et ScientifiquesSous la dir drsquoE Casetta et J De-lord Paris Editions Mateacuteriologiques2014 p 31-68
4J Delord laquo La Biodiversiteacute Imposture Scientifique Ou Ruse Eacutepis-teacutemologique raquo In La Biodiversi-teacute En Question Enjeux Philoso-phiques Eacutethiques et ScientifiquesSous la dir drsquoE Casetta et J De-lord Paris Editions Mateacuteriologiques2014 p 83-118 doi 103917edmatdelor2014010083
5D C J DeLong laquo Defining Bio-diversity raquo In Wildlife Society Bul-letin 244 (1996) p 738-749 JSTOR 3783168
6J G Speth et al laquo Foreword raquoIn Global Biodiversity StrategySous la dir de K Courrier Washing-ton DC WRI IUCN UNEP 1992p v-vi
7M Loreau laquo Discours de Clocirc-ture raquo In Actes de La ConfeacuterenceInternationale Biodiversiteacute Scienceet Gouvernance Sous la dir deR Barbault et J-P Le Duc ParisFrance IRD Editions 2005 p 254-256
Motivation
Le terme biodiversity est attribueacute1 agrave Walter Rosen unmembre du National Research Council ameacutericain qui a com-menceacute agrave contracter les termes biological diversity pendant lapreacuteparation drsquoun colloque dont les actes seront publieacutes sousle titre laquo Biodiversity raquo2 La question de la diversiteacute biologiqueinteacuteressait les eacutecologues bien avant lrsquoinvention de la biodiversi-teacute mais le neacuteologisme a connu un succegraves fulgurant3 en mecircmetemps qursquoil devenait une notion floue dans lequel chacun peutplacer ce qursquoil souhaite y trouver au point de lui retirer soncaractegravere scientifique4 Une cause de ce glissement est que labiodiversiteacute a eacuteteacute nommeacutee pour attirer lrsquoattention sur son eacutero-sion en lien avec la biologie de la conservation Cette eacuterosionconcernant potentiellement de nombreux aspects du monde vi-vant la deacutefinition de la biodiversiteacute fluctue selon les besoins DeLong5 en recense 85 dans les dix premiegraveres anneacutees de lit-teacuterature Les indicateurs de la biodiversiteacute peuvent engloberbien drsquoautres choses que la diversiteacute du vivant le nombredrsquoespegraveces menaceacutees (par exemple la liste rouge de lrsquoIUCN) lataille des populations ou la surface des eacutecosystegravemes preacuteserveacutesla deacutegradation des habitats la menace pesant sur des espegravecesembleacutematiqueshellip Une mesure rigoureuse et coheacuterente de la di-versiteacute peut pourtant ecirctre construite pour clarifier beaucoup(mais pas tous) des concepts qui constituent la biodiversiteacute
Dans lrsquointroduction du premier chapitre des actes de cequi eacutetait devenu le laquo Forum sur la Biodiversiteacute raquo Wilson uti-lise le mot dans le sens eacutetroit de nombres drsquoespegraveces Lrsquoeacutelargis-sement de la notion aux laquo systegravemes naturels raquo et agrave lrsquoopposeacute agravela diversiteacute geacuteneacutetique intraspeacutecifique est venu du monde de laconservation6 La deacuteclaration de Michel Loreau preacutesident dudu comiteacute scientifique de la confeacuterence de Paris en 20057 endonne une deacutefinition aboutie
La Terre abrite une extraordinaire diversiteacutebiologique qui inclut non seulement les espegravecesqui habitent notre planegravete mais aussi la diversiteacutede leurs gegravenes la multitude des interactionseacutecologiques entre elles et avec leur environnementphysique et la varieacuteteacute des eacutecosystegravemes complexes
ix
x Table des matiegraveres
8autre concept flou J Heylaquo The Mind of the Species Problem raquoIn Trends in Ecology amp Evolution167 (2001) p 326-329 doi 101016S0169-5347(01)02145-0
9Z Jizhong et al laquo An Index ofEcosystem Diversity raquo In EcologicalModelling 59 (1991) p 151-163 doi 1010160304-3800(91)90176-2
10F S I Chapin et al laquo Conse-quences of Changing Biodiversity raquoIn Nature 4056783 (2000) p 234-242 doi 10103835012241
11B J Cardinale et al laquo Biodi-versity Loss and Its Impact on Hu-manity raquo In Nature 4867401 (2012)p 59-67 doi 101038nature11148
12G Ceballos et al laquo BiologicalAnnihilation via the Ongoing SixthMass Extinction Signaled by Ver-tebrate Population Losses and De-clines raquo In Proceedings of the Na-tional Academy of Sciences (2017)p 201704949 doi 10 1073 pnas 1704949114
13A Purvis et A Hector laquo Get-ting the Measure of Biodiversity raquoIn Nature 4056783 (2000) p 212-9doi 10103835012221
14C Ricotta laquo Through theJungle of Biological Diversity raquo In Acta Biotheoretica 531 (2005) p 29-38 doi 101007s10441-005-7001-6
qursquoelles constituent Cette biodiversiteacute qui est leproduit de plus de 3 milliards drsquoanneacutees drsquoeacutevolutionconstitue un patrimoine naturel et une ressourcevitale dont lrsquohumaniteacute deacutepend de multiples faccedilons
Aujourdrsquohui encore le terme biodiversiteacute concerne le plussouvent la richesse en espegraveces drsquoun eacutecosystegraveme Pour simplifierla preacutesentation le niveau drsquoeacutetude dans ce document sera engeacuteneacuteral celui des espegraveces8 La prise en compte de la totaliteacutedes ecirctres vivants est geacuteneacuteralement hors de porteacutee La mesurede diversiteacute est alors limiteacutee agrave un taxocegravene crsquoest-agrave-dire unsous-ensemble des espegraveces drsquoune communauteacute relieacutees taxono-miquement les papillons les mammifegraveres les arbres (la deacute-limitation du sous-ensemble nrsquoest pas forceacutement strictementtaxonomique)hellip
Un objet privileacutegieacute des eacutetudes sur la biodiversiteacute est depuisle Forum la forecirct tropicale parce qursquoelle est tregraves diverse et unenjeu pour la conservation La plupart des exemples concer-neront ici les arbres de la forecirct tropicale qui ont lrsquoavantagedrsquoecirctre clairement deacutefinis en tant qursquoindividus (donc simplesagrave compter) et posent des problegravemes meacutethodologiques consideacute-rables pour lrsquoestimation de leur diversiteacute agrave partir de donneacuteesreacuteelles
On peut bien eacutevidemment srsquointeacuteresser agrave drsquoautres niveaux etdrsquoautres objets par exemple la diversiteacute geacuteneacutetique (en termesdrsquoallegraveles diffeacuterents pour certains gegravenes ou marqueurs) agrave lrsquointeacute-rieur drsquoune population ou mecircme la diversiteacute des interactionsentre espegraveces drsquoune communauteacute9 On gardera toujours agrave lrsquoes-prit que la prise en compte de la diversiteacute speacutecifique nrsquoest pasla seule approche les meacutethodes preacutesenteacutees ici srsquoappliquent agravela mesure de la diversiteacute en geacuteneacuteral pas mecircme neacutecessairementbiologique
Lrsquoobjectif de ce document est de traiter la mesure de labiodiversiteacute pas son importance en tant que telle On se reacutefeacute-rera par exemple agrave Chapin et al10 pour une revue sur cettequestion Cardinale et al11 pour les conseacutequences de lrsquoeacuterosionde la biodiversiteacute sur les services eacutecosysteacutemiques ou Ceballoset al12 pour les proprieacuteteacutes autocatalytiques de la biodiversiteacute
La mesure de la diversiteacute est un sujet important en tantque tel13 pour permettre de formaliser les concepts et de lesappliquer agrave la reacutealiteacute La question est loin drsquoecirctre eacutepuiseacutee et faittoujours lrsquoobjet drsquoune recherche active et de controverses14
15R Core Team R A Lan-guage and Environment for Statis-tical Computing Vienna Austria R Foundation for Statistical Compu-ting 2021
16E Marcon et B Heacuterault laquo En-tropart an r Package to Measure andPartition Diversity raquo In Journal ofStatistical Software 678 (2015) p 1-26 doi 1018637jssv067i08
17httpsgithubcomEricMarconMesuresBioDiv2
18httpsericmarcongithubioMesuresBioDiv2
19S Gourlet-Fleury et al Ecolo-gy amp Management of a Neotropi-cal Rainforest Lessons Drawn fromParacou a Long-Term ExperimentalResearch Site in French Guiana Pa-ris Elsevier 2004
20R Condit et al laquo Thirty Yearsof Forest Census at Barro Coloradoand the Importance of Immigrationin Maintaining Diversity raquo In PLoSONE 711 (2012) e49826 doi 10 1371journalpone0049826
21J Oksanen et al laquo Vegan Community Ecology Package raquo In (2012)
Calculs et donneacutees
La preacutesentation des mesures de diversiteacute est donneacutee avecun usage intensif du formalisme matheacutematique La liste desnotations est fournie ci-dessous on srsquoy reacutefeacuterera autant queneacutecessaire
Les calculs sont reacutealiseacutes dans R15 essentiellement avec lepackage entropart16 Lrsquoensemble du code est disponible surGitHub17 ougrave se trouvent les mises agrave jour de ce document18
Les donneacutees sont souvent celles de la parcelle 6 de la forecirctde Paracou (figure 1 en Guyane franccedilaise19 drsquoune surface de625 ha Tous les arbres de plus de 10 cm de diamegravetre agrave hau-teur de poitrine (DBH Diameter at Breast Height) y ont eacuteteacuteinventorieacutes en 2016 La position de chaque arbre son espegraveceet sa surface terriegravere sont fournis dans le package SpatDiv
Drsquoautres exemples utilisent la parcelle forestiegravere perma-nente de Barro Colorado Island souvent abreacutegeacutee BCI 20 50 hade forecirct tropicale dont les arbres de plus de 1 cm de diamegravetreagrave hauteur de poitrine (DBH Diameter at Breast Height) onteacuteteacute inventorieacutes Le jeu de donneacutees utiliseacute pour les exemplesest une version reacuteduite aux arbres de plus de 10 cm disponibledans le package vegan21 soient 21457 arbres dans 225 espegraveces
Enfin les donneacutees fournies par le package entropart sousle nom laquo Paracou618 raquo sont deux inventaires de lrsquoanneacutee 2012limiteacutes agrave un hectare chacun dans les parcelles 6 et 18 de laforecirct de Paracou soient 1124 arbres dans 229 espegraveces
Le code R pour reacutealiser la figure est le suivant
library(dbmss)library(SpatDiv)autoplot(Paracou6 labelSize = expression(paste(Surface terriegravere (
cm^2 ))) labelColor = Espegravece)
xi
xii Table des matiegraveres
Fig 1 Carte de la parcelle 6 deParacou Les points repreacutesentent
les arbres Leur taille estproportionnelle agrave leur surface
terriegravere Seules les espegraveces les plusfreacutequentes sont identifieacutees sur la
carte
0
50
100
150
200
250
0 50 100 150 200 250
Espegravece
Annonaceae_Oxandra_asbeckii
Chrysobalanaceae_Licania_alba
Euphorbiaceae_Sandwithia_guyanensis
Fabaceae_Eperua_falcata
Lecythidaceae_Eschweilera_sagotiana
Lecythidaceae_Lecythis_persistens
Other
Surface terriegravere (cm2)
2000
4000
6000
8000
Notations
Les notations matheacutematiques peuvent diffeacuterer de celles dela litteacuterature citeacutee pour lrsquohomogeacuteneacuteiteacute de ce document
Les matrices sont noteacutees en caractegraveres gras et majuscules X Les eacuteleacutements de la matrice X sont noteacutes 119909119894119895
Les vecteurs sont noteacutes en gras minuscule p Les nombressont noteacutes en minuscules 119899 et les variables aleacuteatoires en ma-juscules 119873 Les valeurs maximales des eacutenumeacuterations fontexception elles sont noteacutees en majuscules pour les distinguerdes indices sum119878
119904=1 119901119904 = 1Le produit matriciel de X et Y est noteacute XY Dans les
scripts R lrsquoopeacuterateur est Le produit de Hadamard (termeagrave terme) est noteacute X ∘ Y (opeacuterateur dans R) De mecircme X119899
indique la puissance 119899 au sens du produit matriciel drsquoune ma-trice carreacutee (opeacuterateur ^ du package expm) alors que X∘119899
est la matrice dont chaque terme est celui de X agrave la puissance119899 (opeacuterateur ^ de R) La matrice transposeacutee de X est noteacuteeXprime
Les notations sont les suivantes 1(sdot) la fonction indicatrice qui vaut 1 si la condition dans laparenthegravese est vraie 0 sinon1119904 le vecteur de longueur 119904 composeacute uniquement de 1 11199041prime
119904 =J119904 ougrave J119904 est la matrice carreacute de taille 119904 ne contenant que des1119860 lrsquoaire drsquoeacutetude et selon le contexte sa surface120572120584 la probabiliteacute moyenne des espegraveces repreacutesenteacutees par 120584individus119862 le taux de couverture de lrsquoeacutechantillon crsquoest-agrave-dire la pro-babiliteacute qursquoun individu de la communauteacute appartienne agrave unedes espegraveces eacutechantillonneacutees 119862119899 est le taux de couverture cor-respondant agrave un eacutechantillon de taille 119899119902119863 la diversiteacute vraie (nombre de Hill pour les diversiteacutes 120572et 120574) nombre eacutequivalent de communauteacutes pour la diversiteacute 120573119902119894119863120572 est la diversiteacute 120572 mesureacutee dans la communauteacute 119894 119902 (119879 )est la diversiteacute phylogeacuteneacutetiqueΔ la matrice de dissimilariteacute dont les eacuteleacutements sont 120575119904119905 ladissimilariteacute entre lrsquoespegravece 119904 et lrsquoespegravece 119905
xiii
xiv Table des matiegraveres
120124 (119883) lrsquoespeacuterance de la variable aleacuteatoire 119883119902119867 lrsquoentropie de Tsallis (ou HCDT) 119902
119894119867120572 est lrsquoentropie 120572mesureacutee dans la communauteacute 119894 Si neacutecessaire le vecteur desprobabiliteacutes servant au calcul est preacuteciseacute sous la forme 119902119867(p)119902(119879 ) est lrsquoentropie phylogeacuteneacutetique119868 le nombre de communauteacutes qui constituent une partitionde la meacuteta-communauteacute dans le cadre de la deacutecomposition dela diversiteacute Les communauteacutes sont indexeacutees par 119894119868(119901119904) lrsquoinformation apporteacutee par lrsquoobservation drsquoun eacutevegravene-ment de probabiliteacute 119901119904 119868(119902119904 119901119904) est le gain drsquoinformation ap-porteacute par lrsquoexpeacuterience (119902119904 est observeacute) par rapport aux proba-biliteacutes 119901119904 attenduesI119904 la matrice identiteacute de rang 119904 matrice carreacutee de taille 119904times119904dont la diagonale ne comporte que des 1 et les autres eacutelementssont nuls119873 le nombre (aleacuteatoire) drsquoindividus se trouvant dans lrsquoairedrsquoeacutetude 119873119904 est la mecircme variable aleacuteatoire mais restreinte auxindividus de lrsquoespegravece 119904119899 le nombre drsquoindividus eacutechantillonneacutes 119899119904119894 est le nombredrsquoindividus de lrsquoespegravece 119904 dans la communauteacute 119894 Les effectifstotaux sont 119899119904+ (pour lrsquoespegravece 119904) 119899+119894 pour la communauteacute 119894et 119899 le total geacuteneacuteral Srsquoil nrsquoy a qursquoune communauteacute le nombredrsquoindividus par espegravece est 119899119904119901119904 la probabiliteacute qursquoun individu tireacute au hasard appartienneagrave lrsquoespegravece 119904 Son estimateur 119901119904 est la freacutequence observeacutee 119901119904|119894est la mecircme probabiliteacute dans la communauteacute 119894p = (1199011 1199012 hellip 119901119904 hellip 119901119878) le vecteur deacutecrivant la distributiondes probabiliteacutes 119901119904 appeleacute simplexe en reacutefeacuterence agrave sa repreacute-sentation dans lrsquoespace agrave 119878 dimensions120587120584 la probabiliteacute qursquoune espegravece choisie au hasard soit re-preacutesenteacutee par 120584 individus sum119899
120584=1 120587120584=1 Si lrsquoespegravece est choisieexplicitement la probabiliteacute est noteacutee 120587119899119904
119902119877 lrsquoentropie de Reacutenyi drsquoordre 119902119878 le nombre drsquoespegraveces consideacutereacute comme une variable aleacutea-toire estimeacute par 119878119878119899
120584 le nombre drsquoespegraveces consideacutereacute comme une variable aleacutea-toire observeacutees 120584 fois dans lrsquoeacutechantillonnage Lrsquoindice est lenombre de fois ougrave lrsquoespegravece est deacutetecteacutee par exemple 1198781 ou119878ne0 Lrsquoexposant est la taille de lrsquoeacutechantillon 119878119860 pour la sur-face 119860 ou 119878119899 pour un eacutechantillon de 119899 individus 119878119860
0 est lenombre drsquoespegraveces non rencontreacutees dans la surface 119860 Pour al-leacuteger les notations srsquoil nrsquoy a pas drsquoambiguiumlteacute lrsquoindice est omispour les espegraveces preacutesentes 119878119860
ne0 est noteacute 119878119860 Si lrsquoexposant nrsquoestpas noteacute lrsquoeacutechantillon nrsquoest pas preacuteciseacute et peut ecirctre aussi bienun nombre drsquoindividus qursquoune surface
Table des matiegraveres xv
119904119899120584 le nombre drsquoespegraveces observeacutees avec les mecircmes notations
que ci-dessus 119904119899120584 peut ecirctre consideacutereacute comme une reacutealisation
de 119878119899120584
1199051198991minus1205722 le quantile drsquoune loi de Student agrave 119899 degreacutes de liberteacute au
seuil de risque 120572 classiquement 196 pour 119899 grand et 120572 = 5Z la matrice de similariteacute entre espegraveces dont les eacuteleacutementssont 119911119904119905 la similariteacute entre lrsquoespegravece 119904 et lrsquoespegravece 119905(sdot) la fonction gamma(sdot) la fonction digamma(119899
119896) le nombre de combinaisons de 119896 eacuteleacutements parmi 119899
(119899119896) = 119899
119896 (119899 minus 119896)
Premiegravere partie
Notions
1
1R H Whittaker laquo Dominanceand Diversity in Land Plant Commu-nities raquo In Science 1473655 (1965)p 250-260 doi 101126science1473655250
2terme introduit par R P Mcin-tosh laquo An Index of Diversity and theRelation of Certain Concepts to Di-versity raquo In Ecology 483 (1967)p 392-404 doi 1023071932674
Chapitre 1
Notions de Diversiteacute
11 Composantes
2 espegraveces
7 espegraveces
4 espegraveces
4 espegraveces
Fig 11 Importance de larichesse (en haut) et delrsquoeacutequitabiliteacute (en bas) pour ladeacutefinition de la diversiteacute Ligne duhaut toutes choses eacutegales parailleurs une communauteacute de 7espegraveces semble plus diverse qursquounecommunauteacute de 2 espegraveces Lignedu bas agrave richesse eacutegale unecommunauteacute moins eacutequitable (agravegauche) semble moins diverseColonne de gauche unecommunauteacute moins riche (en haut)peut sembler plus diverse si elle estplus eacutequitable Colonne de droite idem pour la communauteacute du bas
Une communauteacute comprenant beaucoup drsquoespegraveces maisavec une espegravece dominante nrsquoest pas perccedilue intuitivementcomme plus diverse qursquoune communauteacute avec moins drsquoespegravecesmais dont les effectifs sont proches (figure 11 colonne degauche) La prise en compte de deux composantes de la di-versiteacute appeleacutees richesse et eacutequitabiliteacute est neacutecessaire1
RichesseLa richesse2 est le nombre (ou une fonction croissante du
nombre) de classes diffeacuterentes preacutesentes dans le systegraveme eacutetudieacutepar exemple le nombre drsquoespegraveces drsquoarbres dans une forecirct
Un certain nombre drsquohypothegraveses sont assumeacutees plus oumoins explicitement
bull Les classes sont bien connues compter le nombre drsquoes-pegraveces a peu de sens si la taxonomie nrsquoest pas bien eacutetablie
3
4 Notions de Diversiteacute
3D Mouillot et al laquo Niche Over-lap Estimates Based on QuantitativeFunctional Traits A New Family ofNon-Parametric Indices raquo In Oeco-logia 1453 (2005) p 345-353 doi 101007s00442- 005- 0151- z C Ri-cotta laquo A Semantic Taxonomy for Di-versity Measures raquo In Acta Biotheo-retica 551 (2007) p 23-33 doi 101007s10441-007-9008-7
4S Pavoine et M B Bonsalllaquo Measuring Biodiversity to ExplainCommunity Assembly A Unified Ap-proach raquo In Biological Reviews 864(2011) p 792-812 doi 101111j1469-185X201000171x
Crsquoest parfois une difficulteacute majeure quand on travaillesur les microorganismes
bull Les classes sont eacutequidistantes la richesse augmentedrsquoune uniteacute quand on rajoute une espegravece que cetteespegravece soit proche des preacuteceacutedentes ou extrecircmementoriginale
Lrsquoindice de richesse le plus simple et le plus utiliseacute est toutsimplement le nombre drsquoespegraveces 119878
EacutequitabiliteacuteLa reacutegulariteacute de la distribution des espegraveces (eacutequitabiliteacute en
Franccedilais evenness ou equitability en anglais) est un eacuteleacutementimportant de la diversiteacute Une espegravece repreacutesenteacutee abondam-ment ou par un seul individu nrsquoapporte pas la mecircme contribu-tion agrave lrsquoeacutecosystegraveme Sur la figure 11 la ligne du bas preacutesentedeux communauteacutes de 4 espegraveces mais celle de droite est beau-coup plus eacutequitable de celle de gauche et semble intuitivementplus diverse Agrave nombre drsquoespegraveces eacutegal la preacutesence drsquoespegravecestregraves dominantes entraicircne matheacutematiquement la rareteacute de cer-taines autres on comprend donc assez intuitivement que lemaximum de diversiteacute sera atteint quand les espegraveces aurontune reacutepartition tregraves reacuteguliegravere
Un indice drsquoeacutequitabiliteacute est indeacutependant du nombre drsquoes-pegraveces (donc de la richesse)
La plupart des indices courants comme ceux de Simpsonou de Shannon eacutevaluent agrave la fois la richesse et lrsquoeacutequitabiliteacute
DispariteacuteLes mesures classiques de la diversiteacute dites mesures de
diversiteacute neutre (species-neutral diversity) ou taxonomique neprennent pas en compte une quelconque distance entre classesPourtant deux espegraveces du mecircme genre sont de toute eacutevi-dence plus proches que deux espegraveces de familles diffeacuterentesLes mesures de diversiteacute non neutres (chapitre 6) prennent encompte cette notion qui neacutecessite quelques deacutefinitions suppleacute-mentaires3
La mesure de la diffeacuterence entre deux classes est souventune distance mais parfois une mesure qui nrsquoa pas toutes lesproprieacuteteacutes drsquoune distance une dissimilariteacute Les mesures dedivergence4 sont construites agrave partir de la dissimilariteacute entreles classes avec ou sans pondeacuteration par la freacutequence
Si la divergence entre espegraveces est une distance eacutevolutivecomme lrsquoacircge du plus reacutecent ancecirctre commun la diversiteacute seradite phylogeacuteneacutetique Si crsquoest une distance fonctionnelle deacutefiniepar exemple dans lrsquoespace des traits fonctionnels la diversiteacutesera dite fonctionnelle
12 Niveaux de lrsquoeacutetude 5
5B Runnegar laquo Rates andModes of Evolution in the Mollusca raquoIn Rates of Evolution Sous ladir de M Campbell et M F DayLondon Allen amp Unwin 1987p 39-60
6A Stirling laquo A General Fra-mework for Analysing Diversity inScience Technology and Society raquoIn Journal of the Royal Society In-terface 415 (2007) p 707-719 doi 101098rsif20070213
7L Jost laquo The Relation betweenEvenness and Diversity raquo In Diver-sity 22 (2010) p 207-232 doi 103390d2020207
8R H Whittaker laquo Vegetationof the Siskiyou Mountains Oregonand California raquo In Ecological Mo-nographs 303 (1960) p 279-338 doi 1023071943563 JSTOR 1943563page 320
9K J Gaston laquo Global Patternsin Biodiversity raquo In Nature 4056783(2000) p 220-227 doi 10 1038 35012228
10Ibid figure 111A Miraldo et al laquo An Anthro-
pocene Map of Genetic Diversity raquoIn Science 3536307 (2016) p 1532-1535 doi 101126scienceaaf4381
La dispariteacute5 divergence moyenne entre deux espegraveces (in-deacutependamment des freacutequences) ou de faccedilon eacutequivalente la lon-gueur totale des branches drsquoun arbre phylogeacuteneacutetique est lacomposante qui deacutecrit agrave quel point les espegraveces sont diffeacuterentesles unes des autres
Les mesures de reacutegulariteacute deacutecrivent la faccedilon dont les es-pegraveces occupent lrsquoespace des niches (reacutegulariteacute fonctionnelle)ou la reacutegulariteacute dans le temps et entre les clades des eacutevegravene-ments de speacuteciation repreacutesenteacutes par un arbre phylogeacuteneacutetiqueCe concept complegravete celui drsquoeacutequitabiliteacute dans les mesures clas-siques la diversiteacute augmente avec la richesse la divergenceentre espegraveces et la reacutegulariteacute (qui se reacuteduit agrave lrsquoeacutequitabili-teacute quand toutes les espegraveces sont eacutegalement divergentes entreelles)
Agreacutegation
Agrave partir drsquoune large revue de la litteacuterature dans plusieursdisciplines scientifiques srsquointeacuteressant agrave la diversiteacute (au-delagrave dela biodiversiteacute) A Stirling6 estime que les trois composantesqursquoil nomme varieacuteteacute (richesse) eacutequilibre (eacutequitabiliteacute) et dis-pariteacute recouvrent tous les aspects de la diversiteacute
Stirling deacutefinit la proprieacuteteacute drsquoagreacutegation comme la capaciteacutedrsquoune mesure de diversiteacute agrave combiner explicitement les troiscomposantes preacuteceacutedentes Cela ne signifie pas que les compo-santes contribuent indeacutependamment les unes des autres agrave ladiversiteacute7
12 Niveaux de lrsquoeacutetudeLa diversiteacute est classiquement estimeacutee agrave plusieurs niveaux
emboicircteacutes nommeacutes 120572 120573 et 120574 par Whittaker8 qui a nommeacute 120572 ladiversiteacute locale qursquoil mesurait avec lrsquoindice 120572 de Fisher (voir lechapitre 20) et a utiliseacute les lettres suivantes selon ses besoins
Diversiteacute 120572 120573 et 120574La diversiteacute 120572 est la diversiteacute locale mesureacutee agrave lrsquointeacuterieur
drsquoun systegraveme deacutelimiteacute Plus preacuteciseacutement il srsquoagit de la diver-siteacute dans un habitat uniforme de taille fixe
De faccedilon geacuteneacuterale9 la richesse speacutecifique diminue avec lalatitude (la diversiteacute est plus grande dans les zones tropicaleset au sein de celles-ci quand on se rapproche de lrsquoeacutequateur)voir figure 1210 La tendance est la mecircme pour la diversiteacutegeacuteneacutetique intraspeacutecifique11 La richesse diminue avec lrsquoaltitudeElle est geacuteneacuteralement plus faible sur les icircles ougrave elle deacutecroicirct avecla distance au continent source de migrations
6 Notions de Diversiteacute
Fig 12 Patrons de biodiversiteacute(a) Le nombre drsquoespegraveces de vers de
terre augmente en fonction de lasurface eacutechantillonneacutee de 100 msup2 agrave
plus de 500000 kmsup2 selon larelation drsquoArrhenius) (b) Nombredrsquoespegraveces drsquooiseaux en fonction de
la latitude (c) Relation entre larichesse reacutegionale et la richesse
locale (d) Nombre drsquoespegraveces dechauves-souris en fonction delrsquoaltitude dans une reacuteserve au
Peacuterou (e) Nombre drsquoespegraveces deveacutegeacutetaux ligneux en fonction des
preacutecipitations en Afrique du Sudhistory of biodiversity56 In the marine environment open-oceanpelagic and deep-sea taxa also show broad latitudinal gradients inspecies richness but some debate continues to surround evidence forshallow-water systems particularly for non-calcareous taxa7
The growing number of increasingly refined analyses of latitudi-nal gradients in species richness has begun to suggest some impor-tant nuances to this pattern although the extent of their generalityremains uncertain Thus it seems that declines in richness with latitude may be faster in the Northern than in the Southern Hemisphere89 and that peaks in richness may not lie actually at theEquator itself but some distance away1011 Although poorly docu-mented such latitudinal asymmetries would be unsurprising giventhat these exist also in contemporary climate in historical climaticevents and in the latitudinal complexities of the geometry and area ofland and ocean
Indeed the latitudinal gradient in species richness is a grossabstraction Any underlying pattern is disrupted sometimesmarkedly by variation in species richness with other positional variables (for example longitude elevation and depth) and environmental ones (for example topography and aridity) Thusthe detailed pattern of change with latitude depends on where onelooks reflecting the generally complex patterns of spatial variation inspecies richness This indicates that consideration of latitudinal gradients in richness in isolation from other gradients might not bethe most profitable way forward In as much as latitude per se (andlikewise other positional variables) cannot be a determinant ofspecies richness but only a correlate of numbers of potentially causalenvironmental factors this is doubtless correct Nonetheless morethan any other pattern the latitudinal gradient in species richness has
held an enduring fascination for biologists particularly because ofthe obviously striking diversity of many tropical floras and faunaswhen contrasted with their counterparts at high latitudes
The latitudinal gradient in species richness however complex itmight be is a consequence of systematic spatial variation in the balance of speciation and the immigration of species which addspecies to an area and of the extinction and emigration of specieswhich take them away For very large areas the effects of speciationand regional or global extinction will predominate and immigrationand emigration will be less important More than 25 different mecha-nisms have been suggested for generating systematic latitudinal variation in these processes2 commonly emphasizing reasons as towhy the tropics are highly speciose (although there is no a prioriexpectation that either tropical or temperate zones in any sense represent an lsquounusualrsquo condition12) These include explanationsbased on chance historical perturbation environmental stabilityhabitat heterogeneity productivity and interspecific interactions
Many of these mechanisms are not mutually exclusive and othersmerely offer different levels of explanation Nonetheless to some enmasse they have been perceived to constitute a gordian knot Tworecent attempts to cut it concern the importance of the physical struc-ture of the Earth First null models that assume no environmentalgradients but merely a random latitudinal association between thesize and placement (midpoint) of the geographical ranges of speciespredict a peak of species richness at tropical latitudes13 This occursbecause when the latitudinal extents of species in a given taxonomicgroup are bounded to north and south mdash perhaps by a physical con-straint such as a continental edge or perhaps by a climatic constraintsuch as a critical temperature or precipitation threshold mdash then the
insight review articles
NATURE | VOL 405 | 11 MAY 2000 | wwwnaturecom 221
Figure 1 Spatial patterns in species richness a Speciesndasharea relationshipearthworms in areas ranging from 100 m2 togt500000 km2 acrossEurope76 b Speciesndashlatituderelationship birds in grid cells(~ 611000 km2) across theNew World44 c Relationshipbetween local and regionalrichness lacustrine fish inNorth America (orange circleslarge lakes blue circles smalllakes)61 d Speciesndashelevationrelationship bats in ManuNational Park amp BiosphereReserve Peru77 e Speciesndashprecipitationrelationship woody plants ingrid cells (20000 km2) insouthern Africa78
Num
ber
of s
pec
ies
Num
ber
of s
pec
ies
Num
ber
of s
pec
ies
Log
loca
l num
ber
of s
pec
ies
Log
(num
ber
of s
pec
ies
+1)
18
14
10
06
02
ndash02
1400
1200
1000
800
600
400
200
0
600
500
400
300
200
100
0
ndash5 ndash3 ndash1 1 3 5 08 10 12 14 16 18 20 22
ndash80 ndash60 ndash40 ndash20 0 20 40 60 0
0 200 400 600 800 1000 1200 1400
500 1000 1500 2000 2500 3000 3500
Log area Log regional number of species
Latitude
Annual precipitation (mm)
Elevation (m)degN degS
14
12
10
08
06
04
02
00
120
100
80
60
40
20
0
a c
b d
e
copy 2000 Macmillan Magazines Ltd
12C E Moreno et P Rodriacute-guez laquo A Consistent Terminology forQuantifying Species Diversity raquo In Oecologia 1632 (2010) p 279-82doi 101007s00442-010-1591-7
13R H Whittaker laquo Evolution ofSpecies Diversity in Land Communi-ties raquo In Evolutionary Biology 10(1977) Sous la dir de M K Hechtet al p 1-67
La diversiteacute 120573 mesure agrave quel point les systegravemes locaux sontdiffeacuterents Cette deacutefinition assez vague fait toujours lrsquoobjet dedeacutebats12
Enfin la diversiteacute 120574 est similaire agrave la diversiteacute 120572 prise encompte sur lrsquoensemble du systegraveme eacutetudieacute Les diversiteacutes 120572 et120574 se mesurent donc de la mecircme faccedilon
Deacutecomposition
Whittaker13 a proposeacute sans succegraves une normalisation deseacutechelles drsquoeacutevaluation de la biodiversiteacute en introduisant la di-versiteacute reacutegionale 120576 (120574 eacutetant reacuteserveacute au paysage et 120572 agrave lrsquohabitat)et la diversiteacute 120575 entre les paysages Seuls les trois niveaux origi-naux ont eacuteteacute conserveacutes par la litteacuterature sans deacutefinition strictedes eacutechelles drsquoobservation
La distinction entre les diversiteacutes 120572 et 120573 deacutepend de la fi-nesse de la deacutefinition de lrsquohabitat La distinction de nombreuxhabitats diminue la diversiteacute 120572 au profit de la 120573 Il est donc im-portant de deacutefinir une mesure qui ne deacutepende pas de ce deacutecou-page donc une mesure cumulative (additive ou multiplicative)deacutecrivant la diversiteacute totale deacutecomposable en la somme ou leproduit convenablement pondeacutereacutes de toutes les diversiteacutes 120572des habitats (diversiteacute intra) et de la diversiteacute 120573 inter-habitat
Nous appellerons communauteacute le niveau de deacutecoupageconcernant la diversiteacute 120572 et meacuteta-communauteacute le niveau de
13 Le problegraveme de lrsquoespegravece 7
14E Casetta laquo Eacutevaluer et Conser-ver La Biodiversiteacute Face Au Pro-blegraveme Des Espegraveces raquo In La Biodi-versiteacute En Question Enjeux Philo-sophiques Eacutethiques et ScientifiquesSous la dir drsquoE Casetta et J De-lord Paris Editions Mateacuteriologiques2014 p 139-154
15R A Richards The SpeciesProblem A Philosophical AnalysisCambridge Cambridge UniversityPress 2010
16R L Mayden laquo A Hierarchy ofSpecies Concepts The Denouementin the Saga of the Species Problem raquoIn Species The Units of Biodiver-sity Sous la dir de M F Claridge etal London Chapman and Hall 1997p 381-424
17J S Wilkins laquo Philosophical-ly Speaking How Many SpeciesConcepts Are There raquo In Zootaxa27651 (15 feacutev 2011) p 58-60 doi 1011646zootaxa276515
18T Dobzhansky Genetics andthe Origin of Species New York Co-lumbia University Press 1937
19E Mayr Systematics and theOrigin of Species from the Viewpointof a Zoologist New York ColumbiaUniversity Press 1942
20J Cracraft laquo Species Conceptsand Speciation Analysis raquo In Cur-rent Ornithology Volume 1 Sous ladir de R F Johnston T 1 Cur-rent Ornithology Springer US 1983p 159-187 doi 101007978-1-4615-6781-3_6
21J Sukumaran et L L Knowleslaquo Multispecies Coalescent DelimitsStructure Not Species raquo In Pro-ceedings of the National Academyof Sciences of the United States ofAmerica in press (2017) doi 10 1073PNAS1607921114
22L Van Valen laquo Ecological Spe-cies Multispecies and Oaks raquo In Taxon 2523 (1976) p 233-239 doi 1023071219444
23ensemble drsquoespegraveces voisineseacutechangeant des gegravenes J Pernegraves eacutedGestion Des Ressources GeacuteneacutetiquesDes Plantes Tome 2 ManuelParis Agence de Coopeacuterationculturelle et technique 1984
24P M Agapow et al laquo The Im-pact of Species Concept on Biodiver-sity Studies raquo In The Quarterly Re-view of Biology 792 (2004) p 161-179 doi 101086383542
25Hey laquo The Mind of the SpeciesProblem raquo cf note 8 p x
26A Barberousse et S Samadilaquo La Taxonomie et Les Collectionsdrsquohistoire Naturelle agrave lrsquoheure de LaSixiegraveme Extinction raquo In La Biodi-versiteacute En Question Enjeux Philo-sophiques Eacutethiques et ScientifiquesSous la dir drsquoE Casetta et J De-lord Paris Editions Mateacuteriologiques2014 p 155-182
regroupement pour lrsquoestimation de la diversiteacute 120574
13 Le problegraveme de lrsquoespegraveceEacutevaluer la richesse speacutecifique suppose que les espegraveces soient
deacutefinies clairement ce qui nrsquoest de toute eacutevidence pas le cas14
Le premier aspect du problegraveme concerne la nature des es-pegraveces reacutealiteacute naturelle ou seulement repreacutesentation simplifi-catrice Une analyse historique et philosophique en est faitepar Richards15 Lrsquoautre aspect avec des conseacutequences pra-tiques plus immeacutediates concerne leur deacutelimitation Mayden16
recense vingt-deux deacutefinitions diffeacuterentes du concept drsquoespegraveceWilkins17 estime qursquoil nrsquoy a qursquoun seul concept drsquoespegravece maissept deacutefinitions crsquoest-agrave-dire sept faccedilons de les identifier etvingt-sept variations ou meacutelanges de ces deacutefinitions
La deacutefinition historique est celle de morphoespegravece quiclasse les espegraveces selon leurs formes supposeacutees drsquoabordimmuables La deacutefinition moderne la plus reacutepandue est celledrsquoespegravece biologique 18 un laquo groupe de populations naturellesisoleacutees reproductivement les unes des autres raquo19 Lorsqueles populations drsquoune espegravece sont isoleacutees geacuteographiquementleur capaciteacute agrave se reproduire ensemble est toute theacuteorique(et rarement veacuterifieacutee expeacuterimentalement) Des populationsallopatriques nrsquoont pas de flux de gegravenes reacuteels entre elles etpeuvent ecirctre consideacutereacutees comme des espegraveces distinctes selonla deacutefinition drsquoespegravece phylogeacuteneacutetique laquo le plus petit groupeidentifiable drsquoindividus avec un pattern commun drsquoancecirctreset de descendants raquo20 Crsquoest lrsquouniteacute geacuteneacutetique deacutetecteacutee par lameacutethode du coalescent pour la deacutelimitation des espegraveces21
Le nombre drsquoespegraveces phylogeacuteneacutetiques est bien supeacuterieur aunombre drsquoespegraveces biologiques Enfin Van Valen22 deacutefinit lesespegraveces par la niche eacutecologique qursquoelles occupent (agrave partirde lrsquoexemple des checircnes blancs europeacuteens) plutocirct que parles flux de gegravenes (permanents entre les espegraveces distinctes) la deacutefinition eacutecologique drsquoespegravece est proche du concept decomplexe drsquoespegraveces23
Le choix de la deacutefinition modifie consideacuterablement surla quantification de la richesse24 Des problegravemes meacutethodolo-giques srsquoajoutent aux problegravemes conceptuels 25 la seacuteparationou le regroupement de plusieurs populations ou morphotypesen un nombre plus ou moins grand drsquoespegraveces est un choix quireflegravete les connaissances du moment et peut eacutevoluer26
Lrsquoimpact du problegraveme de lrsquoespegravece sur la mesure de la di-versiteacute reste sans solution agrave ce stade si ce nrsquoest drsquoutiliser lesmecircmes deacutefinitions si des communauteacutes diffeacuterentes doivent ecirctrecompareacutees Lrsquoapproche phylogeacuteneacutetique (chapitre 8) permet decontourner le problegraveme si deux taxons tregraves semblables ap-portent agrave peine plus de diversiteacute qursquoun seul taxon le choix de
8 Notions de Diversiteacute
les distinguer ou non nrsquoest pas critique
Chapitre 2
Outils
La diversiteacute peut ecirctre deacutecrite localement par une courbe drsquoaccumulation(SAC) qui repreacutesente le nombre drsquoespegraveces eacutechantillonneacutees en fonctionde lrsquoeffort Agrave une eacutechelle plus large cette courbe srsquoappelle relation aire-espegraveces (SAR)La distribution des abondances des espegraveces (SAD) est repreacutesenteacutee parune histogramme des freacutequences ou un diagramme rang-abondanceLe taux de couverture est la somme des probabiliteacutes des espegraveces observeacuteeseacutetant donneacute lrsquoeffort drsquoeacutechantillonnage Il peut ecirctre estimeacute preacuteciseacutement agravepartir des donneacutees drsquoinventaire Le taux de compleacutetude est la proportion(en nombre) des espegraveces observeacutees
Lrsquoessentiel
Quelques outils sont neacutecessaires avant drsquoentrer dans lecoeur du sujet Les relations deacutecrivant le nombre drsquoespegravecesen fonction de la taille de lrsquoeacutechantillon (relations aire-espegraveces)et la distribution de lrsquoabondance des espegraveces sont importantspour les eacutecologues La mesure de lrsquoexhaustiviteacute de lrsquoeacutechan-tillonnage par le taux de couverture sera la base de lrsquoestima-tion de la diversiteacute agrave partir de donneacutees reacuteelles
21 Courbes drsquoaccumulation
0
50
100
150
200
0 10 20 30 40 50Surface (ha)
S
Fig 21 Courbe drsquoaccumulationdes espegraveces drsquoarbres du dispositifde Barro Colorado Island Lenombre drsquoespegraveces est cumuleacute danslrsquoordre des carreacutes drsquoun hectare dudispositif
9
10 Outils
1S M Scheiner laquo Six Typesof Species-Area Curves raquo In Glo-bal Ecology and Biogeography 126(2003) p 441-447 doi 101046j1466-822X200300061x
2J Dengler laquo Which FunctionDescribes the Species-Area Relation-ship Best A Review and EmpiricalEvaluation raquo In Journal of Biogeo-graphy 364 (2009) p 728-744 doi 101111j1365-2699200802038x
Evaluer la diversiteacute drsquoune communauteacute neacutecessite en pra-tique de lrsquoinventorier Le nombre drsquoespegraveces deacutecouvertes enfonction de lrsquoeffort drsquoeacutechantillonnage permet de tracer unecourbe drsquoaccumulation (SAC Species Acumulation Curve)Une courbe de rareacutefaction (Rarefaction Curve) peut ecirctre cal-culeacutee en reacuteduisant par des outils statistiques lrsquoeffort drsquoeacutechan-tillonnage reacuteel pour obtenir une SAC theacuteorique libeacutereacutee desaleacuteas de lrsquoordre de prise en compte des donneacutees
La figure 21 montre lrsquoaccumulation des espegraveces pour lesdonneacutees de BCI Une SAC peut ecirctre traceacutee en fonction de lasurface du nombre drsquoindividus ou du nombres de placettesdrsquoeacutechantillonnage selon les besoins
Code R pour reacutealiser la figure 21
library(vegan)data(BCI)Cumul lt- apply(BCI 2 cumsum)Richesse lt- apply(Cumul 1 function(x) sum(x gt 0))SARplot lt- ggplot(dataframe(A = 050
S = c(0 Richesse))) +aes(A S) +geom_line() +labs(x = Surface (ha))
SARplot
Les courbes drsquoaccumulation peuvent aussi concerner la di-versiteacute (voir le chapitre 21) mesureacutee au-delagrave du nombre drsquoes-pegraveces
Plus geacuteneacuteralement une courbe aire-espegraveces (SAR SpeciesArea Relationship) repreacutesente le nombre drsquoespegraveces observeacutees enfonction de la surface eacutechantillonneacutee (figure 221) Il existe plu-sieurs faccedilons de prendre en compte cette relation1 classablesen deux grandes familles 2
bull Dans une SAR au sens strict chaque point repreacute-sente une communauteacute La question traiteacutee est larelation entre le nombre drsquoespegraveces et la taille de chaquecommunauteacute en lien avec des processus eacutecologiques
bull Une courbe drsquoaccumulation (SAC) ne repreacutesente que lrsquoef-fet statistique de lrsquoeacutechantillonnage Pour eacuteviter touteconfusion le terme SAR ne doit pas ecirctre utiliseacute pourdeacutecrire une SAC
22 Diversiteacute asymptotiqueAugmenter lrsquoeffort drsquoeacutechantillonnage peut permettre drsquoat-
teindre un stade ougrave la diversiteacute nrsquoaugmente plus sa valeur estappeleacutee diversiteacute asymptotique Dans des communauteacutes tregraves di-verses comme les forecircts tropicales la diversiteacute asymptotiquene peut en geacuteneacuteral pas ecirctre observeacutee sur le terrain agrave cause de
23 Taux de couverture 11
3I J Good laquo The PopulationFrequency of Species and the Estima-tion of Population Parameters raquo In Biometrika 4034 (1953) p 237-264doi 101093biomet403-4237
4C-H Chiu et al laquo An ImprovedNonparametric Lower Bound of Spe-cies Richness via a Modified Good-Turing Frequency Formula raquo In Biometrics 703 (2014) p 671-682doi 10 1111 biom 12200 PMID 24945937 eq 6 et 7a
la variabiliteacute de lrsquoenvironnement lrsquoaugmentation de la sur-face inventorieacutee amegravene agrave eacutechantillonner dans des communau-teacutes diffeacuterentes avant drsquoatteindre la diversiteacute asymptotique dela communauteacute eacutetudieacutee La diversiteacute asymptotique est donccelle drsquoune communauteacute theacuteorique qui nrsquoexiste geacuteneacuteralementpas En drsquoautres termes crsquoest la diversiteacute drsquoune communauteacutedont lrsquoinventaire disponible serait un eacutechantillon repreacutesentatif
Evaluer la diversiteacute asymptotique neacutecessite drsquoutiliser desestimateurs de diversiteacute dont la preacutecision deacutepend de lrsquoexhaus-tiviteacute de lrsquoeacutechantillonnage La diversiteacute peut aussi ecirctre estimeacuteepour un effort donneacute un hectare de forecirct ou 5000 arbres parexemple ou encore un taux de couverture choisi qui deacutecritmieux la qualiteacute de lrsquoeacutechantillonnage
23 Taux de couverture
Formule des freacutequences de Good-TuringLa relation fondamentale entre les freacutequences des espegraveces
dans un eacutechantillon est due agrave Turing et a eacuteteacute publieacutee parGood3 En absence de toute information sur la loi de distri-bution des espegraveces en supposant seulement que les individussont tireacutes indeacutependamment les uns des autres selon une loimultinomiale respectant ces probabiliteacutes la formule de Good-Turing relie la probabiliteacute moyenne 120572120584 drsquoune espegravece repreacutesen-teacutee 120584 fois (crsquoest-agrave-dire par 120584 individus) au rapport entre lesnombres drsquoespegraveces repreacutesenteacutees 120584 + 1 fois et 120584 fois
120572120584 asymp (120584 + 1)119899
119904119899120584+1119904119899120584
(21)
Les singletons (1199041198991 le nombre drsquoespegraveces observeacutees une
seule fois) et les doubletons (1199041198992 le nombre drsquoespegraveces obser-
veacutees deux fois) ont une importance centrale Pour 120584 = 1 ona 1205721 = 2119904119899
2 (1198991199041198991 ) la freacutequence drsquoune espegravece typiquement
repreacutesenteacutee par un singleton est proportionnelle au rapportentre le nombre des doubletons et des singletons Pour 120584 = 0lrsquoignorance du nombre drsquoespegraveces non eacutechantillonneacutees 119904119899
0 poseproblegraveme mais le produit 1205720times119904119899
0 = 1205870 la probabiliteacute totale desespegraveces non repreacutesenteacutees peut ecirctre estimeacutee par 119904119899
1 119899 Ces re-lations sont le fondement des estimateurs de richesse de Chaopreacutesenteacutees ci-dessous
La relation a eacuteteacute preacuteciseacutee4 en limitant les approximationsdans les calculs La seule neacutecessaire est que les probabiliteacutesdes espegraveces repreacutesenteacutees le mecircme nombre de fois 120584 varient peuet puissent ecirctre consideacutereacutees toutes eacutegales agrave 120572120584 Alors 120572120584 estestimeacute par
120572120584 = (120584 + 1) 119904119899120584+1
(119899 minus 120584) 119904119899120584 + (120584 + 1) 119904119899120584+1
(22)
12 Outils
5Good laquo The Population Fre-quency of Species and the Estima-tion of Population Parameters raquo cfnote 3 p 11
6A Chao et L Jost laquo Coverage-Based Rarefaction and Extrapola-tion Standardizing Samples by Com-pleteness Rather than Size raquo In Eco-logy 9312 (2012) p 2533-2547 doi 10189011-19521
7G Dauby et O J Hardylaquo Sampled-Based Estimation of Di-versity Sensu Stricto by Transfor-ming Hurlbert Diversities into Effec-tive Number of Species raquo In Eco-graphy 357 (2012) p 661-672 doi 101111j1600-0587201106860x
8Z Zhang et H Huang laquo Tu-ringrsquos Formula Revisited raquo In Jour-nal of Quantitative Linguistics 142-3 (2007) p 222-241 doi 10108009296170701514189
9A Chao et al laquo A GeneralizedGoodrsquos Nonparametric Coverage Es-timator raquo In Chinese Journal ofMathematics 16 (1988) p 189-199JSTOR 43836340
10Z Zhang et Huang cf note 8
11W W Esty laquo A Normal Li-mit Law for a Nonparametric Esti-mator of the Coverage of a RandomSample raquo In The Annals of Statis-tics 113 (1983) p 905-912 doi 1023072240652 JSTOR 2240652
12C-H Zhang et Z Zhanglaquo Asymptotic Normality of a Nonpa-rametric Estimator of Sample Cove-rage raquo In Annals of Statistics 37 (5A2009) p 2582-2595 doi 10121408-aos658
Ce nouvel estimateur est agrave la base de lrsquoestimateur de Chaoameacutelioreacute et des estimateurs drsquoentropie de Chao et Jost (sec-tions 33 et 46)
Taux de couverture et deacuteficit de couverture
Good5 deacutefinit le taux de couverture (sample coverage)de lrsquoeacutechantillonnage comme la proportion des espegravecesdeacutecouvertes
119862 =119878
sum119904=1
1 (119899119904 gt 0) 119901119904 (23)
ougrave 1(sdot) est la fonction indicatrice Son compleacutement agrave 1 estappeleacute deacuteficit de couverture (coverage deficit)
Le taux de couverture augmente avec lrsquoeffort drsquoeacutechantillon-nage Plus il est eacuteleveacute meilleures seront les estimations de ladiversiteacute Pour comparer deux communauteacutes par des courbesde rareacutefaction Chao et Jost6 montrent que le taux de couver-ture plutocirct que la taille de lrsquoeacutechantillon doit ecirctre identique Lesestimateurs de la diversiteacute deacuteveloppeacutes plus loin reposent large-ment sur cette notion pour la correction du biais drsquoeacutechantillon-nage7 (la sous-estimation systeacutematique de la diversiteacute due auxespegraveces non observeacutees un des eacuteleacutements du biais drsquoestimation)
Lrsquoestimateur du taux de couverture que Good attribue agraveTuring est selon la relation des freacutequences vues plus haut
119862 = 1 minus 1199041198991119899 (24)
Cet estimateur est biaiseacute8 En reacutealiteacute
119862 = 1 minus 120124(1198781198991 ) minus 1205871119899 (25)
Lrsquoestimateur de Good neacuteglige le terme 1205871 la somme desprobabiliteacutes des espegraveces observeacutees une fois Ce terme peut ecirctreestimeacute avec un biais plus petit Chao et al9 puis Z Zhanget Huang10 proposent lrsquoestimateur suivant qui utilise toutelrsquoinformation disponible et a le plus petit biais possible
119862 = 1 minus119899
sum120584=1
(minus1)120584+1(119899120584)
minus1119904119899
120584 (26)
Les termes de la somme deacutecroissent tregraves vite avec 120584 En selimitant agrave 120584 = 1 lrsquoestimateur se reacuteduit agrave celui de Good
Esty11 compleacuteteacute par C-H Zhang et Z Zhang12 a montreacuteque lrsquoestimateur eacutetait asymptotiquement normal et a calculeacutelrsquointervalle de confiance de 119862
23 Taux de couverture 13
13A Chao et T-J Shen laquo Pro-gram SPADE Species Prediction andDiversity Estimation Program andUserrsquos Guide raquo In (2010)
14A Chao et al laquo SpadeR Spe-cies Prediction and Diversity Estima-tion with R raquo In (2016)
15Chao et Jost cf note 6
119862 = 119862 plusmn 1199051198991minus1205722
radic1199041198991 (1 minus 119904119899
1119899 ) + 2119904119899
2119899 (27)
Ougrave 1199051198991minus1205722 est le quantile drsquoune loi de Student agrave 119899 degreacutes de
liberteacutes au seuil de risque 120572 classiquement 196 pour 119899 grandet 120572 = 5
Un autre estimateur est utiliseacute dans le logiciel SPADE13 etson portage sous R le package spadeR14 Il est la base des esti-mateurs drsquoentropie de Chao et Jost (section 46) Lrsquoestimationde lrsquoeacutequation (25) donne la relation
119862 = 1 minus 1199041198991 minus 1205871
119899 (28)
Or 1205871 = 1199041198991 1205721 1205721 peut ecirctre estimeacute par la relation de Good-
Turing (22) en remplaccedilant 1199041198990 par lrsquoestimateur Chao1 (35)
Alors
119862 = 1 minus 1199041198991119899 (1 minus 1205721) = 1 minus 119904119899
1119899 [ (119899 minus 1) 119904119899
1(119899 minus 1) 119904119899
1 + 21199041198992
] (29)
Dans le package entropart la fonction Coverage calculeles trois estimateurs (celui de Zhang et Huang par deacutefaut)
library(entropart)Ns lt- colSums(BCI)Coverage(Ns)
ZhangHuang 09991146
Le taux de couverture de BCI est proche de 1 parce quelrsquoinventaire couvre 50 ha Il est moindre sur les 625 ha de laparcelle 6 de Paracou
library(SpatDiv)Coverage(asAbdVector(Paracou6))
ZhangHuang 09723258
Chao et Jost15 montrent que la pente de la courbe drsquoaccu-mulation donnant lrsquoespeacuterance du nombre drsquoespegraveces en fonctiondu nombre drsquoindividus (courbe de rareacutefaction de la figure 211)est eacutegale au deacuteficit de couverture
1 minus 120124 (119862119899) = 120124 (119878119899+1) minus 120124 (119878119899) (210)
ougrave 119862119899 est le taux de couverture drsquoun eacutechantillon de taille119899 et 119878119899 le nombre drsquoespegraveces deacutecouvertes dans cet eacutechantillon
14 Outils
16A Chao et C-W Lin laquo Non-parametric Lower Bounds for SpeciesRichness and Shared Species Rich-ness under Sampling without Repla-cement raquo In Biometrics 683 (2012)p 912-921 doi 101111j1541-0420201101739x
17W-H Hwang et al laquo Good-Turing Frequency Estimation in a Fi-nite Population raquo In Biometricaljournal 572 (2014) p 321-339 doi 101002bimj201300168
Les estimateurs preacutesenteacutes ici supposent une population detaille infinie (de faccedilon eacutequivalente les individus sont tireacutes avecremise) Le cas des populations de taille finie est traiteacute parChao et C-W Lin16 et Hwang et al17
CompleacutetudeLa compleacutetude de lrsquoeacutechantillonnage est la proportion du
nombre drsquoespegraveces observeacutees 119904119899ne0119878 Elle compte simplement
les espegraveces et ne doit pas ecirctre confondue avec la couverture quisomme leurs probabiliteacutes le taux de compleacutetude est toujourstregraves infeacuterieur au taux de couverture parce que les espegraveces noneacutechantillonneacutees sont les plus rares
La compleacutetude du mecircme eacutechantillon drsquoarbres de forecirct tro-picale que dans lrsquoexemple preacuteceacutedent peut ecirctre estimeacutee en di-visant le nombre drsquoespegraveces observeacutees par le nombre drsquoespegravecesestimeacutees (voir section 31) Agrave BCI
Espegraveces observeacutees(Obs lt- Richness(Ns Correction = None))
None 225
Richesse estimeacutee(Est lt- Richness(Ns Correction = Jackknife))
Jackknife 1 244
Compleacutetudeasnumeric(ObsEst)
[1] 09221311
Agrave Paracou
Espegraveces observeacutees(Obs lt- Richness(Paracou6 Correction = None))
None 334
Richesse estimeacutee(Est lt- Richness(Paracou6 Correction = Jackknife))
Jackknife 2 471
Compleacutetudeasnumeric(ObsEst)
[1] 07091295
24 Distribution de lrsquoabondance des espegraveces (SAD) 15
18F W Preston laquo The Common-ness and Rarity of Species raquo In Ecology 293 (1948) p 254-283 doi 1023071930989
19Whittaker laquo Dominance andDiversity in Land Plant Communi-ties raquo cf note 1 p 3
20J Izsaacutek et S Pavoine laquo Linksbetween the Species Abundance Dis-tribution and the Shape of the Cor-responding Rank Abundance Curve raquoIn Ecological Indicators 141 (2012)p 1-6 doi 101016jecolind201106030
24 Distribution de lrsquoabondance desespegraveces (SAD)
La distribution de lrsquoabondance des espegraveces (SAD Spe-cies Abundance Distribution) est la loi statistique qui donnelrsquoabondance attendue de chaque espegravece drsquoune communauteacuteLes espegraveces ne sont pas identifieacutees individuellement mais parle nombre drsquoindividus leur appartenant
0
10
20
30
40
1 10 100 1000Effectifs (eacutechelle logarithmique)
Nom
bre
des
pegravece
s
Fig 22 Histogramme desfreacutequences (diagramme dePreston) des arbres du dispositifde Barro Colorado Island Enabscisse le nombre drsquoarbres dechaque espegravece (en logarithme) enordonneacutee le nombre drsquoespegraveces
Elle peut ecirctre repreacutesenteacutee sous la forme drsquoun histogrammedes freacutequences (diagramme de Preston18 figure 22) ou biendrsquoun diagramme rang-abondance (RAC Rank AbundanceCurve ou diagramme de Whittaker19 figure 23) Le RACest souvent utiliseacute pour reconnaicirctre des distributions connuesIzsaacutek et Pavoine20 ont eacutetudieacute les proprieacuteteacutes des RAC pour lesprincipales SAD
1
10
100
1000
50 100 150 200Rank
Abu
ndan
ce
Fig 23 Diagrammerang-abondance (diagramme deWhittaker) des arbres du dispositifde Barro Colorado Island Lespoints sont les donneacutees enabscisse le rang de lrsquoespegravece agravepartir de la plus abondante enordonneacutee lrsquoabondance de lrsquoespegraveceLa courbe est lrsquoajustement drsquounedistribution log-normale
Code de la figure 22
Ns lt- sort(colSums(BCI) decreasing = TRUE)N lt- sum(Ns)SADhist lt- ggplot(dataframe(Ns) aes(Ns)) +
16 Outils
21A E Magurran Ecological Di-versity and Its Measurement Prince-ton NJ Princeton University Press1988
22B J McGill et al laquo SpeciesAbundance Distributions Movingbeyond Single Prediction Theories toIntegration within an Ecological Fra-mework raquo In Ecology Letters 1010(2007) p 995-1015 doi 101111j1461-0248200701094x
23R A Fisher et al laquo The Rela-tion between the Number of Speciesand the Number of Individuals in aRandom Sample of an Animal Popu-lation raquo In Journal of Animal Eco-logy 12 (1943) p 42-58 doi 10 23071411
24I Motomura laquo On the sta-tistical treatment of communities raquoIn Zoological Magazine 44 (1932)p 379-383 R H Whittaker laquo Evolu-tion and Measurement of Species Di-versity raquo In Taxon 2123 (1972)p 213-251 doi 1023071218190
25Preston laquo The Commonnessand Rarity of Species raquo cf note 18p 15
26R H MacArthur laquo On the Re-lative Abundance of Bird Species raquoIn Proceedings of the NationalAcademy of Sciences of the UnitedStates of America 433 (1957) p 293-295 doi 101073pnas433293 JS-TOR 89566
27S P Hubbell The UnifiedNeutral Theory of Biodiversity andBiogeography Princeton UniversityPress 2001
28MacArthur cf note 26
geom_histogram(bins=nclassSturges(log(Ns))color=black fill=white boundary = 0) +
scale_x_log10() +labs(x=Effectifs (eacutechelle logarithmique)
y=Nombre despegraveces)SADhist
Code de la figure 23
library(entropart)autoplot(asAbdVector(Ns) Distribution = lnorm)
Les SAD sont traiteacutees en deacutetail par Magurran21 ou McGillet al22 Les principales distributions neacutecessaires agrave la compreacute-hension de la suite sont preacutesenteacutees ici
bull La distribution en log-seacuteries de Fisher et al 23
bull La distribution geacuteomeacutetrique 24
bull La distribution log-normale 25
bull Le modegravele Broken Stick26
Formellement la distribution des probabiliteacutes des espegravecesnoteacutees 119901119904 est agrave eacutetablir
La distribution en log-seacuteriesCette distribution est traiteacutee en deacutetail dans le chapitre 20Le nombre drsquoespegraveces est lieacute au nombre drsquoindividus par la
relation 120124(119878119899) = 120572 ln(1 + 119899120572) ougrave 119878119899 indique le nombre drsquoes-pegraveces observeacutees dans un eacutechantillon de 119899 individus 120572 est leparamegravetre qui fixe la pente de la partie lineacuteaire de la rela-tion valide degraves que 119899 gtgt 120572 ougrave le nombre drsquoespegraveces 119878119899 aug-mente proportionnellement au logarithme du nombre drsquoindivi-dus ln(119899)
La distribution a eacuteteacute obtenue agrave partir drsquoinventaires de com-munauteacutes de papillons en Malaisie et en Angleterre Le mo-degravele est tombeacute en deacutesueacutetude faute de confirmation empiriqueagrave lrsquoeacutechelle de la communauteacute avant drsquoecirctre remis en valeurpar la theacuteorie neutre27 dans lequel la distribution de la meacuteta-communauteacute est en log-seacuteries
La distribution Broken StickSi les espegraveces se partagent les ressources ou lrsquoespace des
niches repreacutesenteacutees par un bacircton par un processus de cassurealeacuteatoire et simultaneacutee (preacuteciseacutement les 119878 minus 1 cassures dubacircton sont distribueacutees uniformeacutement sur sa longueur) et queleur abondance est proportionnelle agrave la quantiteacute de ressourcesou drsquoespace de niche obtenus alors leur distribution suit lemodegravele Broken Stick de MacArthur28
24 Distribution de lrsquoabondance des espegraveces (SAD) 17
29R M May laquo Patterns of Spe-cies Abundance and Diversity raquo In Ecology and Evolution of Communi-ties Sous la dir de M L Cody etJ M Diamond Harvard UniversityPress 1975 p 81-120
30M G Bulmer laquo On Fitting thePoisson Lognormal Distribution toSpecies-Abundance Data raquo In Bio-metrics 301 (1974) p 101-110 doi 1023071939021
31S Engen et R Lande laquo Popula-tion Dynamic Models Generating theLognormal Species Abundance Dis-tribution raquo In Mathematical Bios-ciences 1322 (1996) p 169-183 doi 1010160025-5564(95)00054-2
32Hubbell cf note 27
33I Volkov et al laquo Neutral Theo-ry and Relative Species Abundancein Ecology raquo In Nature 4246952(2003) p 1035-1037 doi 101038nature01883
Parmi les distributions classiques crsquoest la plus eacutequitable la distribution uniforme des probabiliteacutes (119901119904 = 1119878 pour tout119904) nrsquoest jamais approcheacutee
Elle est peu observeacutee empiriquement
La distribution log-normale
Dans une distribution log-normale le logarithme des pro-babiliteacutes des espegraveces (noteacutees 119901119904 pour lrsquoespegravece 119904) suit une loinormale Lrsquoeacutecart-type 120590 de cette distribution regravegle lrsquoeacutequitabi-liteacute de la distribution Son espeacuterance est obtenue agrave partir dunombre drsquoespegraveces et de 120590 pour que la somme des probabiliteacuteseacutegale 1
May29 explique cette distribution par le theacuteoregraveme de lalimite centrale la variable aleacuteatoire valant 1 si un individu estde lrsquoespegravece 119904 et 0 sinon est le produit de nombreuses variablesde loi inconnues valant 1 en cas de succegraves (germination drsquounegraine survie agrave de nombreux eacutevegravenementshellip) Le logarithme dece produit est une somme de variables aleacuteatoire dont la loi estforceacutement normale par application du theacuteoregraveme de la limitecentrale
La distribution est aussi le reacutesultat drsquoun algorithme debacircton briseacute (broken stick) hieacuterarchique 30
bull Si les ressources (repreacutesenteacutees par un bacircton) sont parta-geacutees une premiegravere fois aleacuteatoirement selon une loi quel-conque
bull Si chaque bacircton obtenu est partageacute agrave nouveau selon lemecircme proceacutedeacute et que lrsquoopeacuteration est reacutepeacuteteacutee un assezgrand nombre de fois
bull Si lrsquoabondance de chaque espegravece est proportionnelle auxressources dont elle dispose
bull Alors la distribution des espegraveces est log-normale
Ce meacutecanisme deacutecrit assez bien un meacutecanisme de partagesuccessif des ressources par exemple entre groupes drsquoespegravecesde plus en plus petits correspondant agrave des niches eacutecologiquesde plus en plus eacutetroites
Drsquoautres arguments existent dans la litteacuterature Parexemple Engen et Lande31 obtiennent une distributionnormale agrave partir drsquoun modegravele de dynamique des populations
La distribution log-normale deacutecrit assez bien (mais pasexactement) une communauteacute locale dans le cadre de la theacuteo-rie neutre32 comme le montre la figure 23 Le nombre drsquoes-pegraveces rares est un peu surestimeacute La distribution exacte estdonneacutee par Volkov et al33
18 Outils
34Motomura laquo On the statisti-cal treatment of communities raquo cfnote 24 p 16
35May laquo Patterns of SpeciesAbundance and Diversity raquo cfnote 29 p 17
36Whittaker laquo Evolution andMeasurement of Species Diversity raquocf note 24 p 16
37S Pueyo et al laquo The MaximumEntropy Formalism and the Idiosyn-cratic Theory of Biodiversity raquo In Ecology letters 1011 (2007) p 1017-28 doi 101111j1461- 0248200701096x
38F A Bazzaz laquo Plant SpeciesDiversity in Old-Field SuccessionalEcosystems in Southern Illinois raquo In Ecology 562 (mars 1975) p 485-488doi 1023071934981
39B Haegeman et al laquo RobustEstimation of Microbial Diversity inTheory and in Practice raquo In TheISME journal 76 (2013) p 1092-101doi 101038ismej201310
40Magurran Ecological Diversityand Its Measurement cf note 21p 16
La distribution geacuteomeacutetriqueSi les espegraveces se partagent les ressources selon un algo-
rithme broken stick seacutequentiel (comme dans la distributionlog-normale) mais de proportion fixe 0 lt 119896 lt 1 alors ladistribution obtenue est geacuteomeacutetrique Les abondances succes-sives sont proportionnelles agrave 119896 119896(1 minus 119896) 119896(1 minus 119896)2 hellip 119896(1 minus119896)119904 hellip 119896(1 minus 119896)119878
Ce modegravele a eacuteteacute eacutetabli par Motomura34 citeacute par May35 Sesproprieacuteteacutes ont eacuteteacute eacutetudieacutees par Whittaker36
Crsquoest la distribution qui traduit lrsquoabsence de relation entrela taille de lrsquoeacutechantillon et lrsquoabondance des espegraveces 37 la dis-tribution du logarithme de ses probabiliteacutes est uniforme Endrsquoautre termes lrsquoordre de grandeur de lrsquoabondance drsquoune es-pegravece est uniformeacutement distribueacute
La distribution est observeacutee dans les communauteacutes pion-niegraveres38 peu diverses ou les communauteacutes microbiennes39
Synthegravese
Fig 24 Diagrammerang-freacutequence des distributions de
probabiliteacute classiques Toutes lesdistributions sont de 100 espegraveces
Les probabiliteacutes infeacuterieures agrave 10minus6
ne sont pas afficheacutees Lesparamegravetres choisis sont 120572 = 11pour la distribution log-seacuteries
119896 = 0 2 pour la distributiongeacuteomeacutetrique et 120590 = 2 pour la
distribution log-normale
1eminus05
1eminus03
1eminus01
0 25 50 75 100Rang
Pro
babi
liteacute
Distribution
Broken Stick
Geacuteometrique
LogminusNormale
LogminusSeacuteries
La figure 24 est inspireacutee de la figure tregraves connue de Ma-gurran40 Elle montre bien une gradation en termes de deacutecrois-sance de probabiliteacute entre des distributions de mecircme richesse de la plus eacutequitable (broken stick) agrave la plus ineacutequitable (geacuteo-meacutetrique) Elle doit ecirctre nuanceacutee la proportion 119896 de la distri-bution geacuteomeacutetrique fixe la pente de la droite qui la repreacutesentesur la figure 119896 = 10 sur la figure une valeur plus faiblediminuerait la pente De mecircme lrsquoeacutecart-type de la distributionlog-normale deacutecrit sa dispersion Une valeur supeacuterieure aug-menterait sa deacutecroissance
24 Distribution de lrsquoabondance des espegraveces (SAD) 19
Le code utiliseacute pour produire la figure 24 est le suivant
library(entropart) Tirage dune communauteacute en log-seacuterieslseries lt- rCommunity(1 size=1E5 Distribution=lseries alpha=11) Nombre despegraveces de reacutefeacuterenceS lt- length(lseries) Part des ressources accapareacutees dans la distribution geacuteomeacutetriqueprob=02 Calcul des probabiliteacutes de la distribution geacuteomeacutetriquegeom lt- prob(1-(1-prob)^S)(1-prob)^(0(S-1)) Dispersion de la loi lognormalesd lt- 2 Tirage de S valeurs dans une loi lognormaleNslnorm lt- rlnorm(S 0 sd) Normalisation pour obtenir des probabiliteacuteslnorm lt- Nslnormsum(Nslnorm) Tirage des probabiliteacutes de la distribution broken stickbstick lt- c(cuts lt- sort(statsrunif(S-1)) 1)- c(0 cuts) Graphiquetibble(Rang=1S
`Log-Seacuteries`=sort(lseriessum(lseries) decreasing=TRUE)`Geacuteometrique`=sort(geom decreasing=TRUE)`Log-Normale`=sort(lnorm decreasing=TRUE)`Broken Stick`=sort(bstick decreasing=TRUE)) gt
pivot_longer(cols=-Rang) gtggplot() +geom_line(aes(x=Rang y=value color=name)) +scale_y_log10(limits=c(1E-6 NA)) +labs(y=Probabiliteacute color=Distribution)
La simulation de ces quatre distributions peut ecirctre reacutealiseacuteepar la fonction rCommunity() du package entropart ougrave lrsquoargu-ment Distribution peut valoir laquo bstick raquo laquo lnorm raquo laquo geom raquoou laquo lseries raquo La simulation des communauteacutes autres que log-seacuteries passe par le tirage des probabiliteacutes des espegraveces (le calculest deacuteterministe dans le cas de la distribution geacuteomeacutetrique)puis le tirage drsquoun nombre drsquoindividus dans une loi multino-miale respectant ces probabiliteacutes et lrsquoeffectif total
Les fonction RACbstick() RAClnorm() RACgeom() etRAClseries() permettent drsquoinfeacuterer agrave partir drsquoun vecteurdrsquoabondance les paramegravetres drsquoune distribution La distribu-tion correspondant au modegravele estimeacute peut ecirctre afficheacutee sur lafigure Rang-Abondance (figure 22)
Le package sads fournit les fonctions classiques de R (den-siteacute de probabiliteacute cumulative quantile simulation) pour lesdistributions utiles en eacutecologie au-delagrave de celles preacutesenteacuteesici La distribution de Volkov notamment peut ecirctre simuleacuteeLes fonctions fitxxx() complegravetent les fonctions RACxxx()drsquoentropart
Le code suivant montre comment ajuster une distributionlog-normale aux donneacutees de BCI avec entropart ou sads
entropartlibrary(entropart)fit_entropart_lnorm lt- RAClnorm(Ns) Affichage des paramegravetres estimeacutesfit_entropart_lnorm$mu
20 Outils
[1] 3142695
fit_entropart_lnorm$sigma
[1] 1791177
sadslibrary(sads) Estimation Les donneacutees sont tronqueacutees les espegraveces observeacutees 0 fois ne sont pas compteacuteesfit_sads_lnorm lt- fitlnorm(Ns trunc = 0)fit_sads_lnormfullcoef
meanlog sdlog 3142695 1787195
Lrsquoajustement du modegravele de Volkov peut ecirctre compareacute agravecelui drsquoune distribution log-normale Ajustement du modegravele de Volkovfit_volkov lt- fitvolkov(Ns)fit_volkovfullcoef
theta m J 4767437e+01 9237586e-02 2145700e+04
Graphiquement lrsquoajustement est tregraves proche mais la dis-tribution de Volkov preacutevoit explicitement des effectifs eacutegauxparce qursquoentiers Comparaison graphique des deux modegraveles Log-normal en rougeplot(asAbdVector(Ns) Distribution = lnorm)
$mu [1] 3142695 $sigma [1] 1791177
Volkov en vertlines(sort(rvolkov(length(Ns) fit_volkovfullcoef[1] fit_volkovfullcoef[2]
fit_volkovfullcoef[3]) decreasing = TRUE) col = green)
Rank
Abu
ndan
ce
1 51 101 151 201
15
5050
0
24 Distribution de lrsquoabondance des espegraveces (SAD) 21
Les vraisemblances sont proches
Comparaison des vraisemblancesfit_sads_lnormmin
[1] 1157013
fit_volkovmin
[1] 1150182
Les paramegravetres du modegravele de communauteacute locale de latheacuteorie neutre sont 120579 le laquo nombre fondamental de la biodiver-siteacute raquo eacutegal agrave deux fois le nombre drsquoespegraveces apparaissant par pasde temps dans la meacuteta-communauteacute 119898 le taux de migrationet 119869 la taille de la communauteacute locale (qui nrsquoest pas agrave propre-ment parler un paramegravetre mais une statistique deacutecrivant lesdonneacutees)
La diffeacuterence entre les logarithmes de vraisemblance desdeux modegraveles en faveur du modegravele de Volkov alors que lenombre de paramegravetres est le mecircme Lrsquoajustement est doncmeilleur mais la diffeacuterence est petite et la complexiteacute du mo-degravele et des calculs pour lrsquoestimer ne se justifient pas en geacuteneacuteral le modegravele de Volkov est tregraves peu utiliseacute en pratique
Deuxiegraveme partie
Diversiteacute neutre drsquounecommunauteacute
23
1R K Peet laquo The Measurementof Species Diversity raquo In Annual re-view of ecology and systematics 5(1974) p 285-307 doi 10 1146 annureves05110174001441
2V Devictor et al laquo SpatialMismatch and Congruence betweenTaxonomic Phylogenetic and Func-tional Diversity The Need for Inte-grative Conservation Strategies in aChanging World raquo In Ecology let-ters 138 (2010) p 1030-40 doi 10 1111 j 1461 - 0248 2010 01493 x PMID 20545736 J C Ste-gen et A H Hurlbert laquo InferringEcological Processes from TaxonomicPhylogenetic and Functional Trait -Diversity raquo In PloS one 66 (2011)e20906 doi 101371journalpone0020906
3K R Clarke et R M War-wick laquo A Further Biodiversity In-dex Applicable to Species Lists Va-riation in Taxonomic Distinctness raquoIn Marine Ecology-Progress Se-ries 216 (2001) p 265-278 doi 10 3354 meps216265 C Ricottaet G C Avena laquo An Information-Theoretical Measure of TaxonomicDiversity raquo In Acta biotheoretica2551 (2003) p 35-41 doi 101023A1023000322071
4A Balmford et al laquo Measuringthe Changing State of Nature raquo In Trends in Ecology amp Evolution 187(2003) p 326-330 doi 10 1016 S0169-5347(03)00067-3
5M Williamson et al laquo TheSpeciesndashArea Relationship Does NotHave an Asymptote raquo In Journalof Biogeography 287 (2001) p 827-830 doi 101046j1365-2699200100603x
6Fisher et al laquo The Relationbetween the Number of Species andthe Number of Individuals in a Ran-dom Sample of an Animal Popula-tion raquo cf note 23 p 16
Chapitre 3
Mesures neutres de la diversiteacute 120572ou 120574
Les indices classiques de diversiteacute sont ceux de Shannon et de Simpson etla richesse speacutecifique Ils peuvent ecirctre estimeacutes agrave partir des donneacutees drsquoin-ventaire Lrsquoestimation de la richesse est particuliegraverement difficile et faitlrsquoobjet drsquoune abondante litteacuterature les estimateurs non-parameacutetriques(Chao et Jackknife) sont les plus utiliseacutes
Lrsquoessentiel
Les mesures classiques1 considegraverent que chaque classe drsquoob-jets est diffeacuterente de toutes les autres sans que certaines soientplus ou moins semblables Dans ce chapitre les classes serontdes espegraveces Les mesures sont qualifieacutees de neutres (species-neutral) au sens ougrave elles ne prennent en compte aucune carac-teacuteristique propre des espegraveces La diversiteacute neutre est souventappeleacutee diversiteacute taxonomique2 mecircme si le terme peut precircteragrave confusion avec la diversiteacute phylogeacuteneacutetique quand la phylo-geacutenie se reacuteduit agrave une taxonomie3
Ce type de mesure nrsquoa de sens qursquoagrave lrsquointeacuterieur drsquoun taxo-cegravene bien deacutefini sommer un nombre drsquoespegraveces drsquoinsectes agraveun nombre drsquoespegraveces de mammifegraveres a peu drsquointeacuterecirct Ces meacute-thodes ne sont donc pas forceacutement les plus adapteacutees agrave laconservation agrave grande eacutechelle des indicateurs de biodiver-siteacute4 peuvent ecirctre plus pertinents Drsquoautre part les commu-nauteacutes sont consideacutereacutees comme limiteacutees avec un nombre drsquoes-pegraveces fini la courbe drsquoaccumulation des espegraveces atteint donctheacuteoriquement une asymptote quand lrsquoeffort drsquoinventaire estsuffisant Cette approche est opposeacutee agrave celle traiteacutee dans leschapitres 20 et suivants qui considegravere que la diversiteacute aug-mente indeacutefiniment avec la surface5 que ce soit par change-ment drsquoeacutechelle (eacutelargir lrsquoinventaire ajoute de nouvelles commu-nauteacutes) ou plus theacuteoriquement parce que les communauteacutesreacuteelles sont consideacutereacutees comme un tirage aleacuteatoire parmi uneinfiniteacutes drsquoespegraveces6
25
26 Mesures neutres de la diversiteacute 120572 ou 120574
7D Mouillot et A Leprecirctre laquo AComparison of Species Diversity Esti-mators raquo In Researches on Popula-tion Ecology 412 (1999) p 203-215doi 101007s101440050024
8A Chao laquo Nonparametric Esti-mation of the Number of Classes in aPopulation raquo In Scandinavian Jour-nal of Statistics 114 (1984) p 265-270 JSTOR 4615964
9K P Burnham et W S Over-ton laquo Robust Estimation of Popula-tion Size When Capture ProbabilitiesVary among Animals raquo In Ecology605 (1979) p 927-936 doi 1023071936861
10R B OrsquoHara laquo Species Rich-ness Estimators How Many SpeciesCan Dance on the Head of a Pin raquoIn Journal of Animal Ecology 74(2005) p 375-386 doi 101111j1365-2656200500940x
11Y Basset et al laquo Arthropod Di-versity in a Tropical Forest raquo In Science 3386113 (2012) p 1481-1484 doi 101126science1226727
Les mesures preacutesenteacutees ici sont les plus utiliseacutees richesseindices de Shannon et de Simpson et lrsquoindice de HurlbertElles sont sujettes agrave des biais drsquoestimation7 notamment (maispas seulement) agrave cause des espegraveces non eacutechantillonneacutees
Au chapitre suivant lrsquoentropie HCDT permettra drsquounifierces mesures et les nombres de Hill et de leur donner un sensintuitif
31 Richesse speacutecifiqueLa richesse est tout simplement le nombre drsquoespegraveces preacute-
sentes dans le taxocegravene consideacutereacute Crsquoest la mesure conceptuel-lement la plus simple mais pratiquement la plus deacutelicate dansdes systegravemes tregraves riches comme les forecircts tropicales mecircmeavec des efforts drsquoinventaire consideacuterables il nrsquoest en geacuteneacuteralpas possible de relever toutes les espegraveces rares ce qui impliquede recourir agrave des modegraveles matheacutematiques pour en estimer lenombre
On ne fait pas de supposition sur la forme de la SAD quandon utilise des meacutethodes drsquoestimation non parameacutetriques Lesestimateurs les plus connus sont ceux de Chao8 et le jackknife9
Une alternative consiste agrave infeacuterer agrave partir des donneacutees lesparamegravetres drsquoune SAD choisie et particuliegraverement le nombretotal drsquoespegraveces Cette approche est bien moins reacutepandue parceqursquoelle suppose le bon choix du modegravele et est beaucoup plusintensive en calcul Il nrsquoexiste pas de meilleur estimateur uni-versel10 et il peut ecirctre efficace drsquoutiliser plusieurs meacutethodesdrsquoestimation de faccedilon concurrente sur les mecircmes donneacutees11
Techniques drsquoestimation non parameacutetriqueDans le cadre drsquoun eacutechantillonnage de 119899 individus on ob-
serve 119904119899ne0 espegraveces diffeacuterentes parmi les 119878 existantes Chaque
individu a une probabiliteacute 119901119904 drsquoappartenir agrave lrsquoespegravece 119904On ne sait rien sur la loi des 119901119904 On sait seulement comme
les individus sont tireacutes indeacutependamment les uns des autresque lrsquoespeacuterance du nombre 119899119904 drsquoindividus de lrsquoespegravece 119904 observeacutedans lrsquoeacutechantillon est 119899119901119904 La probabiliteacute de ne pas observerlrsquoespegravece est (1 minus 119901119904)119899
Pour les espegraveces freacutequentes 119899119901119904 est grand et les espegravecessont observeacutees systeacutematiquement La difficulteacute est due auxespegraveces pour lesquelles 119899119901119904 lrsquoespeacuterance du nombre drsquoobserva-tions est petit La probabiliteacute de les observer est donneacutee par laloi binomiale si 119899119901119904 est proche de 0 la probabiliteacute drsquoobserverun individu est faible
Les estimateurs non parameacutetriques cherchent agrave tirer lemaximum drsquoinformation de la distribution des abondances 119899119904
31 Richesse speacutecifique 27
12C X Mao et R K Colwelllaquo Estimation of Species Richness Mixture Models the Role of RareSpecies and Inferential Challenges raquoIn Ecology 865 (2005) p 1143-1153doi 10189004-1078
13Chao cf note 8
pour estimer le nombre drsquoespegraveces non observeacutees Une preacutesen-tation deacutetailleacutee du problegraveme et des limites agrave sa reacutesolution estfournie par Mao et Colwell12 qui concluent notamment queles estimateurs ne peuvent fournir qursquoune borne infeacuterieure delrsquointervalle des possibles valeurs du nombre reacuteel drsquoespegraveces
Chao1 et Chao2
Chao13 estime le nombre drsquoespegraveces non observeacutees agrave partirde celles observeacutees 1 ou 2 fois
Dans un eacutechantillon de taille 119899 reacutesultant drsquoun tirage indeacute-pendant des individus la probabiliteacute que lrsquoespegravece 119904 soit obser-veacutee 120584 fois est obtenue en eacutecrivant la probabiliteacute de tirer danslrsquoordre 120584 fois lrsquoespegravece 119904 puis 119899 minus 120584 fois une autre espegravece multi-plieacute par le nombre de combinaisons possible pour prendre encompte lrsquoordre des tirages
119901119899119904120584 = (119899
120584)119901120584119904 (1 minus 119901119904)119899minus120584 (31)
Lrsquoespeacuterance du nombre drsquoespegraveces observeacutees 120584 fois 120124(119904119899120584 )
est obtenue en sommant pour toutes les espegraveces la probabiliteacutede les observer 120584 fois
120124 (119904119899120584 ) = (119899
120584) sum119904
119901120584119904 (1 minus 119901119904)119899minus120584 (32)
Le carreacute de la norme du vecteur en 119878 dimensions dont lescoordonneacutees sont (1 minus 119901119904)1198992 est
sum119904
(1 minus 119901119904)119899
crsquoest-agrave-dire 120124(1199041198990 ) lrsquoespeacuterance du nombre drsquoespegraveces non obser-
veacutees Celui du vecteur de coordonneacutees 119901119904(1 minus 119901119904)1198992minus1 est
sum119904
1199012119904(1 minus 119901119904)119899minus2 = 2
119899(119899 minus 1)120124(1199041198992 )
Enfin le produit scalaire des deux vecteurs vaut
sum119904
119901119904(1 minus 119901119904)119899minus1 = 1119899120124(119904119899
1 )
Lrsquoineacutegaliteacute de Cauchy-Schwarz (le produit scalaire est infeacute-rieur au produit des normes des vecteurs) peut ecirctre appliqueacuteeaux deux vecteurs (tous les termes sont au carreacute)
[sum119904
(1 minus 119901119904)119899] [sum119904
1199012119904(1 minus 119901119904)119899minus2] ge [sum
119904119901119904(1 minus 119901119904)119899minus1]
2
(33)
28 Mesures neutres de la diversiteacute 120572 ou 120574
14J Beacuteguinot laquo An Algebraic De-rivation of Chaorsquos Estimator of theNumber of Species in a Commu-nity Highlights the Condition Allo-wing Chao to Deliver Centered Esti-mates raquo In International Scholar-ly Research Notices 2014 (Article ID847328 2014) doi 10 1155 2014 847328
15A Chao laquo Species Richness Es-timation raquo In Encyclopedia of Sta-tistical Sciences Sous la dir de NBalakrishnan et al 2nd ed NewYork Wiley 2004
16A Chao laquo Estimating the Po-pulation Size for Capture-RecaptureData with Unequal Catchability raquoIn Biometrics 434 (1987) p 783-791 doi 1023072531532
drsquoougrave
120124(1199041198990 ) ge 119899 minus 1
119899[120124(119904119899
1 )]22120124(119904119899
2 ) (34)
Lrsquoestimateur est obtenu en remplaccedilant les espeacuterances parles valeurs observeacutees
119878Chao1 = 119904119899ne0 + (119899 minus 1) (119904119899
1 )2
21198991199041198992
(35)
ougrave 119904119899ne0 est le nombre drsquoespegraveces diffeacuterentes observeacute
Il srsquoagit drsquoun estimateur minimum lrsquoespeacuterance du nombredrsquoespegraveces est supeacuterieure ou eacutegale au nombre estimeacute
Beacuteguinot14 a montreacute que lrsquoestimateur est sans biais si lenombre drsquoespegraveces non observeacutees deacutecroicirct exponentiellementavec la taille de lrsquoeacutechantillon
1199041198990 = 119878119890minus119896119899 (36)
ougrave 119896 est un reacuteel strictement positif Cette relation est coheacuterenteavec un eacutechantillonnage poissonien dans lequel la densiteacute desindividus est constante voir le chapitre 21
Si aucune espegravece nrsquoest observeacutee deux fois lrsquoestimateur estremplaceacute par
119878Chao1 = 119904119899ne0 + (119899 minus 1) 119904119899
1 (1199041198991 minus 1)
2119899 (37)
Si 119899 nrsquoest pas trop petit les approximations suivantes sontpossibles
119878Chao1 = 119904119899ne0 + (119904119899
1 )2
21199041198992
(38)
Si aucune espegravece nrsquoest observeacutee deux fois lrsquoestimateur estremplaceacute15 par
119878Chao1 = 119904119899ne0 + 119904119899
1 (1199041198991 minus 1)2 (39)
La variance de lrsquoestimateur est connue mais pas sa distri-bution
Var ( 119878Chao1) = 1199041198992 [1
2(1199041198991
1199041198992
)2
+ (1199041198991
1199041198992
)3
+ 14(119904119899
1119904119899
2)
4] (310)
Si aucune espegravece nrsquoest observeacutee deux fois
Var ( 119878Chao1) = 1199041198991 (119904119899
1 minus 1)2 + 119904119899
1 (21199041198991 minus 1)2
4 + (1199041198991 )4
4119904119899ne0
(311)
31 Richesse speacutecifique 29
17M I Eren et al laquo Estimatingthe Richness of a Population Whenthe Maximum Number of Classes IsFixed A Nonparametric Solution toan Archaeological Problem raquo In PlosOne 75 (2012) doi 101371journalpone0034179 eq 8
18Chao cf note 16
19Chiu et al laquo An Improved Non-parametric Lower Bound of SpeciesRichness via a Modified Good-TuringFrequency Formula raquo cf note 4p 11
20A Chao et al laquo Seen Once orMore than Once Applying Good-Turing Theory to Estimate SpeciesRichness Using Only Unique Obser-vations and a Species List raquo In Me-thods in Ecology and Evolution 810(2017) p 1221-1232 doi 1011112041-210X12768
21A Chao et S-M Lee laquo Esti-mating the Number of Classes viaSample Coverage raquo In Journal ofthe American Statistical Association87417 (1992) p 210-217 doi 10 108001621459199210475194
Chao16 donne une approximation de lrsquointervalle deconfiance agrave 95 en assumant une distribution normale
119904119899ne0 +
119878Chao1 minus 119904119899ne0
119888 le 119878 le 119904119899ne0 + ( 119878Chao1 minus 119904119899
ne0) 119888 (312)
ougrave
119888 = 119890119905119899
1minus1205722
radicradicradic
ln⎛⎜⎝
1+ Var( 119878Chao1)
( 119878Chao1minus119904119899ne0)
2⎞⎟⎠ (313)
Eren et al17 calculent un intervalle de confiance qui estplus petit quand la valeur maximum theacuteorique du nombredrsquoespegraveces est connue ce qui est rarement le cas en eacutecologie
Chao18 propose un estimateur du nombre drsquoespegraveces ap-pliqueacute aux donneacutees de preacutesence-absence (un certain nombrede releveacutes contiennent seulement lrsquoinformation de preacutesence ouabsence de chaque espegravece) appeleacute Chao2 Il est identique agraveChao1 mais 119899 est le nombre de releveacutes en geacuteneacuteral trop petitpour appliquer lrsquoapproximation de Chao1
Chiu et al19 ameacuteliorent lrsquoestimateur en reprenant la deacute-marche originale de Chao mais en utilisant un estimateur pluspreacutecis du taux de couverture (29) au lieu de (24)
119878iChao1 = 119878Chao1 + 1199041198993
41199041198994
max (1199041198991 minus 119904119899
2 1199041198993
21199041198994
0) (314)
Chao et al20 eacutetendent lrsquoapplicabiliteacute de lrsquoestimateur Chao2agrave des donneacutees dans lesquelles les espegraveces sont noteacutees unique-ment comme singletons ou doubletons et plus sans distinctionentre doubletons et espegraveces plus freacutequentes Une relation entrele nombre de doubletons et les donneacutees disponibles est fournie sa reacutesolution numeacuterique (le code R neacutecessaire est disponibleavec lrsquoarticle) permet drsquoestimer 119904119899
2 et de lrsquoinjecter dans lrsquoesti-mateur Chao2
Lrsquoestimateur ACE
Chao et Lee21 deacuteveloppent lrsquoestimateur ACE (Abundance-based coverage estimator) agrave travers lrsquoestimation du taux decouverture 119862 Lrsquoestimateur ACE utilise toutes les valeurs de120584119904 correspondant aux espegraveces rares concregravetement la valeurlimite de 120584 noteacutee 120581 est fixeacutee arbitrairement geacuteneacuteralement agrave10
Lrsquoestimateur prend en compte le coefficient de variationde la distribution des freacutequences ( 119901119904) plus les probabiliteacutessont heacuteteacuterogegravenes plus le nombre drsquoespegraveces non observeacutees seragrand Finalement
30 Mesures neutres de la diversiteacute 120572 ou 120574
22Chao et T-J Shen laquo ProgramSPADE Species Prediction andDiversity Estimation Program andUserrsquos Guide raquo cf note 13 p 13
23K P Burnham et W S Over-ton laquo Estimation of the Size of a Clo-sed Population When Capture Pro-babilities Vary among Animals raquo In Biometrika 653 (1978) p 625-633doi 1023072335915 Burnham etOverton laquo Robust Estimation of Po-pulation Size When Capture Proba-bilities Vary among Animals raquo cfnote 9 p 26
24Chao laquo Nonparametric Estima-tion of the Number of Classes in a Po-pulation raquo cf note 8 p 26
25J F Heltshe et N E Forresterlaquo Estimating Species Richness Usingthe Jackknife Procedure raquo In Bio-metrics 391 (1983) p 1-11 doi 1023072530802 JSTOR 2530802
119878ACE = 119904119899gt120581 + 119904119899
le120581119862rares
+ 1199041198991
119862rares120574rares (315)
119904119899gt120581 est le nombre drsquoespegraveces dites abondantes observeacutees
plus de 120581 fois 119904119899le120581 le nombre drsquoespegraveces dites rares observeacutees
120581 fois ou moins 119862rares est le taux de couverture ne prenant encompte que les espegraveces rares
Lrsquoestimateur du coefficient de variation est
1205742rares = max ( 119904119899
le120581 sum120581120584=1 120584 (120584 minus 1) 119904119899
120584119862rares (sum120581
120584=1 120584119904119899120584 ) (sum120581120584=1 120584119904119899120584 minus 1)
minus 1 0)
(316)Lorsque lrsquoheacuteteacuterogeacuteneacuteiteacute est tregraves forte un autre estimateur
est plus performant
1205742rares = max ( 1205742
rares (1 +(1 minus 119862rares) sum120581
120584=1 120584 (120584 minus 1) 119904119899120584
119862rares (sum120581120584=1 120584119904119899120584 minus 1)
) 0)
(317)Chao et T-J Shen22 conseillent drsquoutiliser le deuxiegraveme es-
timateur degraves que 1205742rares deacutepasse 08 Lrsquoestimateur ACE donne
normalement une valeur plus grande que Chao1 Si ce nrsquoestpas le cas la limite des espegraveces rares 120581 doit ecirctre augmenteacutee
Lrsquoestimateur jackknife
La meacutethode jackknife a pour objectif de reacuteduire le biaisdrsquoun estimateur en consideacuterant des jeux de donneacutees dans les-quels on a supprimeacute un certain nombre drsquoobservations (cenombre est lrsquoordre de la meacutethode) Burnham et Overton23 ontutiliseacute cette technique pour obtenir des estimateurs du nombredrsquoespegraveces appeleacutes jackknife agrave lrsquoordre 119895 prenant en compte lesvaleurs de 119904119899
1 agrave 119904119899119895 Les estimateurs du premier et du deuxiegraveme
ordre sont les plus utiliseacutes en pratique
119878J1 = 119904119899ne0 + (119899 minus 1) 119904119899
1119899 (318)
119878J2 = 119904119899ne0 + (2119899 minus 3) 119904119899
1119899 minus (119899 minus 2)2119904119899
2119899 (119899 minus 1) (319)
Augmenter lrsquoordre du jackknife diminue le biais mais aug-mente la variance de lrsquoestimateur
Chao24 a montreacute que les estimateurs jackknife pouvaientecirctre retrouveacutes par approximation de lrsquoindice Chao1
La variance du jackknife drsquoordre 1 est25
31 Richesse speacutecifique 31
26R M Cormack laquo Log-LinearModels for Capture-Recapture raquo In Biometrics 452 (1989) p 395-413doi 1023072531485
Var ( 119878J1) = 119899 minus 1119899
⎛⎜⎝
119899sum119895=1
1198952119904119899119895 minus
(119904119899ne0)2
119899⎞⎟⎠
(320)
Lrsquoestimateur est construit agrave partir de lrsquohypothegravese selonlaquelle le nombre drsquoespegraveces non observeacutees est de la forme
1199041198990 =
infinsum119894=1
119886119894119899119894
Pour cette raison Cormack26 affirme qursquoil nrsquoa pas de sup-port theacuteorique solide Lrsquoespeacuterance du nombre drsquoespegraveces nonobserveacutees est (32) sum119904 (1 minus 119901119904)119899 qui deacutecroicirct beaucoup plusrapidement que sum119894 119886119894119899119894 lrsquohypothegravese est bien fausse En re-vanche pour une gamme de 119899 fixeacutee (de la taille de lrsquoinventaireagrave une taille suffisante pour approcher la richesse asymptotiquepar exemple) il est toujours possible drsquoeacutecrire le nombre drsquoes-pegraveces non observeacutees sous la forme drsquoune seacuterie de puissancesneacutegatives de 119899 comme dans lrsquoillustration ci-dessous
Une communauteacute log-normale similaire agrave BCI (300 es-pegraveces eacutecart-type eacutegal agrave 2) est simuleacutee et un eacutechantillon de1000 individus est tireacute
library(entropart) Ecart-typesdlog lt- 2 Nombre despegravecesS lt- 300 Tirage des probabiliteacutes log-normalesPs lt- asProbaVector(rlnorm(S 0 sdlog)) Taille de leacutechantillonN lt- 1000 Tirage dun eacutechantillonNs lt- rCommunity(1 size = N NorP = Ps)
Lrsquoeacutechantillon est preacutesenteacute en figure 31Code de la figure 31
autoplot(Ns Distribution = lnorm)
Il est possible de veacuterifier que lrsquoespeacuterance du nombre drsquoes-pegraveces non observeacutees correspond bien agrave la moyenne des obser-vations
Espeacuterance des espegraveces non vuesE0 lt- (1 - Ps)^N(f0 lt- sum(E0))
[1] 1699725
Tirage de 1000 eacutechantillons nombre moyen despegraveces observeacutees(Sn lt- mean(colSums(rmultinom(1000 N Ps) gt 0)))
32 Mesures neutres de la diversiteacute 120572 ou 120574
Fig 31 Echantillon de 1000individus tireacute dans une
communauteacute log-normale
1
10
100
25 50 75 100 125Rank
Abu
ndan
ce
[1] 129987
Veacuterification nombre despegraveces observeacutees en moyenne et non observeacuteesSn + f0
[1] 2999595
Nombre total despegraveces dans la communauteacute(S lt- length(Ps))
[1] 300
Le nombre drsquoespegraveces non observeacutees peut ecirctre eacutecrit sousla forme drsquoune seacuterie de puissances neacutegatives de 119899 comme lepreacutevoit le jackknife entre deux valeurs de 119899 fixeacutees
Echantillonnage de 500 agrave 5000 individusnseq lt- 5005000 Calcul du nombre despegraveces non observeacuteesBias lt- sapply(nseq function(n) sum((1 - Ps)^n))
Le nombre drsquoespegraveces non observeacutees qui est le biais de lrsquoes-timateur de la richesse est preacutesenteacute en figure 32
Code de la figure 32
ggplot(dataframe(n=nseq Biais=Bias lm1=predict(lm1)lm2=predict(lm2) lm4=predict(lm4)) aes(x=n)) +
geom_line(aes(y=Biais) col=black lty=1) +geom_line(aes(y=lm1) col=red lty=2) +geom_line(aes(y=lm2) col=orange lty=3) +geom_line(aes(y=lm4) col=blue lty=4) +coord_cartesian(ylim = c(0 250))
La courbe peut ecirctre approcheacutee par une seacuterie de puissancesneacutegatives de 119899 dont quelques termes sont preacutesenteacutes sur la fi-gure
31 Richesse speacutecifique 33
27J Beacuteguinot laquo Basic Theoreti-cal Arguments Advocating Jackknife-2 as Usually Being the Most Appro-priate Nonparametric Estimator ofTotal Species Richness raquo In AnnualResearch amp Review in Biology 101(2016) p 1-12 doi 109734ARRB201625104
Ordre 1lm1 lt- lm(Bias ~ 0 +I(1nseq)) Ordre 2lm2 lt- lm(Bias ~ 0 +I(1nseq) + I(1nseq^2)) Ordre 4summary(lm4 lt- lm(Bias ~ 0 +I(1nseq) + I(1nseq^2)
+ I(1nseq^3) + I(1nseq^4)))
Call lm(formula = Bias ~ 0 + I(1nseq) + I(1nseq^2) + I(1nseq^3) + I(1nseq^4)) Residuals Min 1Q Median 3Q Max -88796 -32632 01727 38447 222823 Coefficients Estimate Std Error t value Pr(gt|t|) I(1nseq) 5662e+05 7979e+02 7095 lt2e-16 I(1nseq^2) -8026e+08 2803e+06 -2863 lt2e-16 I(1nseq^3) 5184e+11 2821e+09 1837 lt2e-16 I(1nseq^4) -1180e+14 8461e+11 -1395 lt2e-16 --- Signif codes 0 0001 001 005 01 1 Residual standard error 3972 on 4497 degrees of freedom Multiple R-squared 09991 Adjusted R-squared 09991 F-statistic 1212e+06 on 4 and 4497 DF p-value lt 22e-16
0
50
100
150
200
250
1000 2000 3000 4000 5000n
Bia
is
Fig 32 Nombre drsquoespegraveces nonoberveacutees dans un eacutechantillon detaille croissante et sadeacutecomposition en seacuteries depuissances neacutegatives de 119899 Lenombre drsquoespegraveces non observeacuteesest repreacutesenteacute par la courbecontinue noire Les seacuteries depuissances neacutegatives drsquoordre 1(courbe rouge) 2 (courbe orange)et 4 (courbe bleue) sontrepreacutesenteacutees en pointilleacutes Lescourbes drsquoordre 6 et plus sontconfondues avec la courbe noire
Lrsquoajustement est possible pour des valeurs de 119899 diffeacuterentesmais les coefficients 119886119894 sont alors diffeacuterents la forme du biaisnrsquoest valide que pour une gamme de valeurs de 119899 fixeacutee
Beacuteguinot27 apporte un autre argument important en fa-veur du jackknife Agrave condition que 119899 soit suffisamment grandlrsquoestimateur du nombre drsquoespegraveces non observeacutees est une fonc-tion lineacuteaire du nombre drsquoespegraveces observeacutees 120584 fois 119904119899
1 pourle jackknife 1 2119904119899
1 minus 1199041198992 pour le jackknife 2 et ainsi de suite
pour les ordres suivants contrairement agrave lrsquoestimateur de ChaoGracircce agrave cette proprieacuteteacute lrsquoestimateur du jackknife est addi-tif quand plusieurs groupes drsquoespegraveces disjoints sont pris en
34 Mesures neutres de la diversiteacute 120572 ou 120574
28E P Smith et G V Bellelaquo Nonparametric Estimation of Spe-cies Richness raquo In Biometrics 401(1984) p 119-129 doi 10 1002 9780470015902a0026329
29R K Colwell et J A Codding-ton laquo Estimating Terrestrial Biodi-versity through Extrapolation raquo In Philosophical Transactions of theRoyal Society of London Series B Biological Sciences 3451311 (1994)p 101-118 doi 101098rstb19940091
30Chao et al laquo SpadeR SpeciesPrediction and Diversity Estimationwith R raquo cf note 14 p 13
compte lrsquoestimation du nombre drsquoespegraveces de papillons et descarabeacutees inventorieacutees ensemble est eacutegale agrave la somme des es-timations des deux groupes inventorieacutes seacutepareacutement Ce nrsquoestpas le cas pour lrsquoestimateur de Chao
Lrsquoestimateur du jackknife est tregraves utiliseacute parce qursquoil estefficace en pratique notamment parce que son ordre peut ecirctreadapteacute aux donneacutees
Lrsquoestimateur du bootstrap
Lrsquoestimateur du bootstrap28 est119878b = 119904119899
ne0 + sum119904
(1 minus 119901119904)119899 (321)
Il est peu utiliseacute parce que le jackknife est plus perfor-mant29
Calcul
Ces estimateurs peuvent ecirctre calculeacutes de faccedilon relative-ment simple agrave lrsquoaide du logiciel SPADE dans sa version pourR30 Le guide de lrsquoutilisateur preacutesente quelques estimateurssuppleacutementaires et des directives pour choisir Il est conseilleacutedrsquoutiliser Chao1 pour une estimation minimale et ACE pourune estimation moins biaiseacutee de la richesse
Les intervalles de confiance de chaque estimateur sont cal-culeacutes par bootstrap mecircme quand la variance drsquoun estimateurest connue sa loi ne lrsquoest geacuteneacuteralement pas et le calcul analy-tique de lrsquointervalle de confiance nrsquoest pas possible
Les estimateurs et leurs intervalles de confiance peuventeacutegalement ecirctre calculeacutes avec le package vegan qui dispose pourcela de deux fonctions specpool et estimateR
specpool est baseacute sur les incidences des espegraveces dansun ensemble de sites drsquoobservation et donne une estimationunique de la richesse selon les meacutethodes Chao2 jackknife(ordre 1 et 2) et bootstrap Lrsquoeacutecart-type de lrsquoestimateurest eacutegalement fourni par la fonction sauf pour le jackknifedrsquoordre 2
estimateR est baseacute sur les abondances des espegraveces et re-tourne un estimateur de la richesse speacutecifique par site et nonglobal comme specpool
Exemple
On utilise les donneacutees de Barro Colorado Island (BCI)La parcelle a eacuteteacute diviseacutee en carreacutes de 1 ha Le tableau drsquoen-treacutee est un dataframe contenant pour chaque espegravece drsquoarbres(DBH ge 10 cm) ses effectifs par carreacute
On charge le tableau de donneacutees
31 Richesse speacutecifique 35
31J-P Wang laquo SPECIES An RPackage for Species Richness Estima-tion raquo In Journal of Statistical Soft-ware 409 (2011) p 1-15 doi 10 18637jssv040i09
library(vegan)data(BCI)
On utilise la fonction estimateR pour calculer la richessedes deux premiers carreacutes
estimateR(BCI[12 ])
1 2 Sobs 93000000 84000000 Schao1 117473684 117214286 sechao1 11583785 15918953 SACE 122848959 117317307 seACE 5736054 5571998
Le package SPECIES31 permet de calculer les estimateursjackknife drsquoordre supeacuterieur agrave 2 et surtout choisit lrsquoordre quifournit le meilleur compromis entre biais et variance
Comparaison des fonctions sur lrsquoensemble du dispositifBCI (119904119899
ne0 = 225 1199041 = 19)
specpool(BCI)
Species chao chaose jack1 jack1se jack2 All 225 2363732 654361 24558 5650522 2478722 boot bootse n All 2356862 3468888 50
library(SPECIES) Distribution du nombre despegraveces (vecteur noms = nombre dindividus valeurs = nombres despegraveces ayant ce nombre dindividus)Ns lt- colSums(BCI) Mise au format requis (matrice colonne 1 = nombre dindividus colonne 2 = nombres despegraveces ayant ce nombre dindividus) par la fonction AbdFreqCount dans entropartjackknife(AbdFreqCount(Ns))
Your specified order is larger than that determined by the test Therefore the order from the test is used
$JackknifeOrder [1] 1 $Nhat [1] 244 $SE [1] 6164414 $CI lb ub [1] 232 256
Comparaison avec la valeur de lrsquoeacutequation (318)
36 Mesures neutres de la diversiteacute 120572 ou 120574
32U Brose et al laquo EstimatingSpecies Richness Sensitivity toSample Coverage and Insensitivity toSpatial Patterns raquo In Ecology 849(2003) p 2364-2377 doi 10189002-0558
33J Beck et W Schwanghartlaquo Comparing Measures of Species Di-versity from Incomplete Inventories An Update raquo In Methods in Ecolo-gy and Evolution 11 (2010) p 38-44 doi 101111j2041-210X200900003x
34Brose et al cf note 32 fig 6
Nombre despegraveces par efffectif observeacuteDistNs lt- tapply(Ns Ns length) Calcul direct de Jack1sum(DistNs) + DistNs[1] (sum(BCI) - 1)sum(BCI)
1 2439991
La valeur du jackknife 1 fournie par specpool est fausseLa fonction jackknife de SPECIES donne le bon reacutesultatavec un intervalle de confiance calculeacute en supposant que ladistribution est normale (plusmn 196 eacutecart-type au seuil de 95)
Lrsquoestimateur du bootstrap est calculable simplement
N lt- sum(Ns)Ps lt- NsNlength(Ps) + sum((1 - Ps)^N)
[1] 2343517
Choix de lrsquoestimateur
Des tests pousseacutes ont eacuteteacute meneacutes par Brose et al32 pour per-mettre le choix du meilleur estimateur de la richesse en fonc-tion de la compleacutetude de lrsquoeacutechantillonnage 119904119899
ne0119878 Les auteursappellent cette proportion couverture (coverage) Le termecompleteness a eacuteteacute proposeacute par J Beck et Schwanghart33 poureacuteviter la confusion avec le taux de couverture deacutefini par Good(vu en section 23) La compleacutetude est infeacuterieure agrave la couver-ture toutes les espegraveces ont le mecircme poids alors que les espegravecesmanquantes sont plus rares et peacutenalisent moins le taux de cou-verture
Fig 33 Arbre de deacutecision dumeilleur estimateur du nombre
drsquoespegraveces
September 2003 2375ESTIMATING SPECIES RICHNESS
FIG 6 Two alternative ways to choose the most appropriate estimator based on either an estimated range of samplecoverage or the community evenness Sobs 5 observed species richness Thresholds are accurate within 61
Jack1 Our results indicate that this might stem fromthe differences in their sample coverage The field datasets in the present study give an example that evalu-ations under different sampling intensity communityevenness and consequently different sample coverageyield different results concerning estimator ranking Incontrast to this in simulated landscapes Strue samplingintensity and community evenness are not only un-questionably known they are also controlled as inde-pendent variables This has led to the new estimatorperformance model based on sample coverage in thepresent study
All jacknife estimators were positively biased above95 sample coverage This has previously been re-ported in field studies by Heltshe and Forrester (1983)Colwell and Coddington (1994) and Hellmann andFowler (1999) but with different magnitudes In con-trast to this the jacknife estimators did not overesti-mate in the studies of Palmer (1990 1991) and Baltanas(1992) Potential explanations include the followingFirst differences in the sample coverage between thestudies might be responsible Second particularly infield studies the determination of Strue is prone to un-derestimation Such lower Strue may account for someof the jacknife estimatorrsquos overestimations In our sim-ulations however the first- and second-order jacknifeestimators were less positively biased under high sam-ple coverage than previously reported (eg Hellmannand Fowler 1999)
Estimator choice
We will subsequently present a framework for thechoice of the most appropriate nonparametric estimatordepending on sample coverage (see Fig 6) Howeverunless the sample contains the entire community onecan only guess about the sample coverage whichmakes the estimator choice more problematic An es-timator evaluation based on sampling intensity ie thepercentage of total quadrats sampled (Hellmann andFowler 1999) only provides an incomplete frameworksince sampling intensity is only one of the factors in-fluencing sample coverage This framework remainsspecific for the respective levels of community even-ness Strue and habitat area As independent reliable in-formation about Strue is scarcely obtainable in field stud-ies the most promising procedure to choose the ap-propriate estimator is iterative (Fig 6 path 1) First arange of Strue needs to be calculated by various esti-mators Then the most accurate estimator can be cho-sen based on the resulting mean estimated sample cov-erage Applying this procedure to the field data setsyields mean inaccuracies of 15 of Strue for the tem-porary wetlands and 35 of Strue and 96 of Strue forthe dry grasslands in the full and reduced data setrespectively While these estimates are the most ac-curate for the temporary wetlands they are only slight-ly outperformed by Jack2 and Jack3 on the dry grass-lands Compared to a decision based on communityevenness (Fig 6 path 2) the decision path based onestimated sample coverage (Fig 6 path 1) is more
Dans tous les cas les estimateurs jackknife sont lesmeilleurs Lrsquoarbre de deacutecision est en figure 3334 Le choixdeacutepend principalement de la compleacutetude (coverage sur lafigure) Une premiegravere estimation est neacutecessaire par plusieursestimateurs Si les reacutesultats sont coheacuterents choisir un estima-teur jackknife drsquoordre drsquoautant plus faible que la compleacutetude
31 Richesse speacutecifique 37
35Chiu et al laquo An Improved Non-parametric Lower Bound of SpeciesRichness via a Modified Good-TuringFrequency Formula raquo cf note 4p 11
36E Marcon laquo Practical Estima-tion of Diversity from Abundance Da-ta raquo In HAL 01212435 (version 22015)
37J Beacuteguinot laquo Extrapolation ofthe Species Accumulation Curve forIncomplete Species Samplings ANew Nonparametric Approach to Es-timate the Degree of Sample Com-pleteness and Decide When to StopSampling raquo In Annual Research ampReview in Biology 85 (2015) p 1-9 doi 10 9734 ARRB 2015 22351 Beacuteguinot laquo Basic Theoreti-cal Arguments Advocating Jackknife-2 as Usually Being the Most Appro-priate Nonparametric Estimator ofTotal Species Richness raquo cf note 27p 33
est grande Au-delagrave de 96 le nombre drsquoespegraveces observeacuteest plus performant parce que les jackknifes surestiment 119878Srsquoils sont incoheacuterents (intervalle des estimations supeacuterieuragrave 50 de leur moyenne) le critegravere majeur est lrsquoeacutequitabiliteacute(voir section 5) Si elle est faible (de lrsquoordre de 05-06)les estimateurs jackknife 2 agrave 4 sont performants lrsquoordrediminuant avec lrsquointensiteacute drsquoeacutechantillonnage (forte 10faible 05 de la communauteacute) Pour une forte eacutequitabiliteacute(08-09) on preacutefeacuterera jackknife 1 ou 2
Pour BCI le nombre drsquoespegraveces estimeacute par jackknife 1 est244 La compleacutetude est 225244 = 92 dans le domaine devaliditeacute du jackknife 1 (74 agrave 96) qui est donc le bon esti-mateur
La parcelle 6 de Paracou neacutecessite lrsquoestimateur jackknife2
library(SpatDiv)jackknife(AbdFreqCount(asAbdVector(Paracou6)))
Your specified order is larger than that determined by the test Therefore the order from the test is used
$JackknifeOrder [1] 2 $Nhat [1] 471 $SE [1] 2424871 $CI lb ub [1] 423 519
Compleacutetudeasnumeric(Richness(Paracou6 Correction = None)Richness(Paracou6
Correction = Jackknife))
[1] 07091295
Chiu et al35 agrave partir drsquoautres simulations preacutefegraverent lrsquouti-lisation de lrsquoestimateur iChao1 Quand lrsquoeacutechantillonnage estsuffisant les estimateurs de Chao ont lrsquoavantage de posseacutederune base theacuteorique solide et de fournir une borne infeacuterieuredu nombre drsquoespegraveces possible Dans ce cas les estimations dujackknife drsquoordre 1 sont coheacuterentes avec celles de Chao Enrevanche quand lrsquoeacutechantillonnage est insuffisant lrsquoestimateurjackknife drsquoordre supeacuterieur agrave 1 permet de reacuteduire le biais drsquoes-timation au prix drsquoune variance accrue36
Enfin Beguinot37 suggegravere drsquoutiliser en regravegle geacuteneacuterale le ja-cknife 2 (mais ne traite pas les cas dans lesquels lrsquoeacutechantillon-nage est trop faible pour justifier un ordre supeacuterieur) tant que
38 Mesures neutres de la diversiteacute 120572 ou 120574
38Brose et al laquo Estimating Spe-cies Richness Sensitivity to SampleCoverage and Insensitivity to SpatialPatterns raquo cf note 32 p 36
39T-J Shen et al laquo Predictingthe Number of New Species in a Fur-ther Taxonomic Sampling raquo In Eco-logy 843 (2003) p 798-804 doi 10 1890 0012 - 9658(2003 ) 084[0798 PTNONS]20CO2
le nombre de singletons est supeacuterieur agrave 2 minus radic(2) asymp 0 6 fois lenombre de doubletons Le ratio des singletons sur les double-tons diminue quand lrsquoeacutechantillonnage approche de lrsquoexhausti-viteacute Quand le seuil de 06 est deacutepasseacute la valeur de lrsquoestimateurde Chao devient supeacuterieur au jacknife 2 et doit ecirctre utiliseacute Ceseuil est coheacuterent avec les regravegles de Brose et al38
Preacutediction de la richesse drsquoun nouvel eacutechantillon
La preacutediction du nombre drsquoespegraveces 119878prime deacutecouvert dans unenouvelle placette drsquoun habitat dans lequel on a deacutejagrave eacutechan-tillonneacute est une question importante par exemple pour eacutevaluerle nombre drsquoespegraveces preacuteserveacutees dans le cadre drsquoune mise en reacute-serve ou eacutevaluer le nombre drsquoespegraveces perdues en reacuteduisant lasurface drsquoune forecirct
T-J Shen et al39 proposent un estimateur et leconfrontent avec succegraves agrave des estimateurs anteacuterieurs Onnote 119878119899
0 lrsquoestimateur du nombre drsquoespegraveces non observeacuteesdans le premier eacutechantillon et 119862 lrsquoestimateur de son tauxde couverture Lrsquoestimateur du nombre drsquoespegraveces du nouveleacutechantillon de 119899prime individus est
119878prime = 1198781198990
⎡⎢⎣
1 minus (1 minus 1 minus 1198621198781198990
)119899prime
⎤⎥⎦
(322)
1198781198990 est obtenu par la diffeacuterence entre les nombres drsquoespegraveces
estimeacute et observeacute 1198781198990 = 119878 minus 119904119899
ne0Exemple de BCI suite combien de nouvelles espegraveces se-
ront deacutecouvertes en eacutechantillonnant plus
Espegraveces non observeacutees(NonObs lt- jackknife(AbdFreqCount(Ns))$Nhat - length(Ns))
Your specified order is larger than that determined by the test Therefore the order from the test is used
[1] 19
Taux de couverture(C lt- Coverage(Ns))
ZhangHuang 09991146
Le taux de couverture de lrsquoinventaire de BCI est tregravesproche de 100 donc peu de nouvelles espegraveces seront deacutecou-vertes en augmentant lrsquoeffort drsquoeacutechantillonnage La courbeobtenue est en figure 34
Le code R neacutecessaire pour reacutealiser la figure est
31 Richesse speacutecifique 39
0
2
4
6
0 2500 5000 7500 10000n
S
Fig 34 Nombre de nouvellesespegraveces deacutecouvertes en fonction delrsquoeffort drsquoeacutechantillonnagesuppleacutementaire (donneacutees de BCI)Seulement 7 nouvelles espegravecesseront observeacutees eneacutechantillonnant 10000 arbressuppleacutementaires (environ 25 ha enplus des 50 ha de la parcelle quicontiennent 225 espegraveces)
40Preston laquo The Commonnessand Rarity of Species raquo cf note 18p 15
41M Williamson et K J Gas-ton laquo The Lognormal Distribution IsNot an Appropriate Null Hypothesisfor the Species-Abundance Distribu-tion raquo In Journal of Animal Eco-logy 742001 (2005) p 409-422 doi 101111j1365-2656200500936x
Nouvelles espegraveces en fonction du nombre de nouveaux individusSprime lt- function(Nprime) NonObs (1 - (1 - (1 - C)NonObs)^Nprime)ggplot(dataframe(x = c(1 10000)) aes(x)) +
stat_function(fun = Sprime) +labs(x = n y = S)
La question de lrsquoextrapolation de la richesse est traiteacutee plusen deacutetail dans les sections 46 et 212
Infeacuterence du nombre drsquoespegraveces agrave partir de la SADDistribution de Preston
Preston40 fournit degraves lrsquointroduction de son modegravele log-normal une technique drsquoestimation du nombre total drsquoespegravecespar la ceacutelegravebre meacutethode des octaves Elle est disponible dansle package vegan
veiledspec(colSums(BCI))
Extrapolated Observed Veiled 23540577 22500000 1040577
Lrsquoajustement direct du modegravele aux donneacutees sans regrou-pement par octaves41 est eacutegalement possible (figure 35)
modll lt- prestondistr(colSums(BCI))veiledspec(modll)
Extrapolated Observed Veiled 230931018 225000000 5931018
Le code R neacutecessaire pour reacutealiser la figure est
plot(modll)
40 Mesures neutres de la diversiteacute 120572 ou 120574
Fig 35 Ajustement du modegravelede Preston aux donneacutees de BCI
Frequency
Spe
cies
05
1015
2025
3035
1 2 4 8 16 32 64 128 512 2048
42J L Norris et K H Pollocklaquo Non-Parametric MLE for PoissonSpecies Abundance Models Allowingfor Heterogeneity between Species raquoIn Environmental and EcologicalStatistics 54 (1998) p 391-402 doi 101023A1009659922745
Maximum de vraisemblance drsquoune distribution deFisher
Norris et Pollock42 supposent que la distribution des es-pegraveces suit le modegravele de Fisher (voir chapitre 20) et infegraverent lenombre drsquoespegraveces par maximum de vraisemblance non para-meacutetrique (ils ne cherchent pas agrave infeacuterer les paramegravetres de laloi de probabiliteacute de 119901119904 mais seulement agrave ajuster au mieux lemodegravele de Poisson aux valeurs de 119901119904 observeacutees)
Le calcul est possible avec la librairie SPECIES de R Distribution du nombre despegraveces (vecteur noms = nombre dindividus valeurs = nombres despegraveces ayant ce nombre dindividus)Ns lt- colSums(BCI) Mise au format requis (matrice colonne 1 = nombre dindividus colonne 2 = nombres despegraveces ayant ce nombre dindividus)DistNsSPECIES lt- AbdFreqCount(Ns) Regroupement de la queue de distribution la longueur du vecteur est limiteacutee agrave 25 pour alleacuteger les calculsDistNsSPECIES[25 2] lt- sum(DistNsSPECIES[25nrow(DistNsSPECIES)
2])DistNsSPECIES lt- DistNsSPECIES[125 ]unpmle(DistNsSPECIES)
Method Unconditional NPMLE method by Norris and Pollock 1996 1998 using algorithm by Wang and Lindsay 2005 MLE= 239 Estimated Poisson mixture components p= 110372 3595437 1060832 pi= 0402579 02525368 03448842
$Nhat [1] 239
Le problegraveme de cette meacutethode drsquoestimation est qursquoelle di-verge freacutequemment Les calculs nrsquoaboutissent pas si la queuede distribution nrsquoest pas regroupeacutee (il existe 108 valeurs diffeacute-rentes de 119899119904 dans lrsquoexemple de BCI aucune des fonctions deSPECIES ne fonctionne en lrsquoeacutetat)
31 Richesse speacutecifique 41
43J-P Wang et al laquo Gene Cap-ture Prediction and Overlap Estima-tion in EST Sequencing from One orMultiple Libraries raquo In BMC Bio-informatics 61 (2005) p 300 doi 1011861471-2105-6-300
44J-P Wang laquo Estimating Spe-cies Richness by a Poisson-CompoundGamma Model raquo In Biometrika 973(2010) p 727-740 doi 10 1093 biometasq026
45L Michaelis et M L Mentenlaquo Die Kinetik Der Invertinwirkung raquoIn Biochemische Zeitschrift 49(1913) p 333-369 PMID 21888353
46H K Clench laquo How to MakeRegional Lists of Butterflies SomeThoughts raquo In Journal of theLepidopteristsrsquo Society 334 (1979)p 216-231
47Fiche TD de JR Lobry httppbiluniv-lyon1frRpdftdr47pdf
Wang et al43 ont ameacutelioreacute sa stabiliteacute en peacutenalisant lecalcul de la vraisemblance
pnpmle(DistNsSPECIES)
Method Penalized NPMLE method by Wang and Lindsay 2005 MLE= 243 Estimated zero-truncated Poisson mixture components p= 09033625 3397048 1059029 pi= 02771211 03208847 04019942
$Nhat [1] 243
Enfin Wang44 perfectionne la technique drsquoestimation ensupposant que les 119901119904 suivent une loi gamma et en estimantaussi ses paramegravetres La souplesse de la loi gamma permetdrsquoajuster le modegravele agrave des lois diverses et lrsquoestimateur de Wangest tregraves performant
Il est disponible dans SPECIES fonction pcg Son deacute-faut est qursquoil neacutecessite un tregraves long temps de calcul (plusieursheures selon les donneacutees)
Calcul longpcg(DistNsSPECIES)
Infeacuterence du nombre drsquoespegraveces agrave partir decourbes drsquoaccumulation
Cette approche consiste agrave extrapoler la courbe drsquoaccumu-lation observeacutee
Le modegravele le plus connu est celui de Michaelis-Menten45
proposeacute par Clench46 En fonction de lrsquoeffort drsquoeacutechantillonnage119899 eacutevalueacute en temps (il srsquoagit de la collecte de papillons) lenombre drsquoespegraveces deacutecouvert augmente jusqursquoagrave une asymptoteeacutegale au nombre drsquoespegraveces total
119878119899 = 119878 119899119870 + 119899 (323)
119870 est une constante que Clench relie agrave la difficulteacute decollecte
Lrsquoestimation empirique du modegravele de Michaelis-Mentenpeut ecirctre faite avec R47 Les 50 carreacutes de BCI sont utiliseacutespour fabriquer une courbe drsquoaccumulation
data(BCI) Cumul du nombre darbresnArbres lt- cumsum(rowSums(BCI)) Cumul de linventaireCumul lt- apply(BCI 2 cumsum) Nombre despegraveces cumuleacuteesnEspeces lt- apply(Cumul 1 function(x) sum(x gt 0))
42 Mesures neutres de la diversiteacute 120572 ou 120574
48Colwell et Coddington laquo Es-timating Terrestrial Biodiversitythrough Extrapolation raquo cf note 29p 34
49J G W Raaijmakers laquo Sta-tistical Analysis of the Michaelis-Menten Equation raquo In Biometrics434 (1987) p 793-803 doi 1023072531533
Le modegravele est ajusteacute par nlsfit Des valeurs de deacutepartdoivent ecirctre fournies pour 119870 et 119878 119870 est la valeur de 119899 cor-respondant agrave 119878119899 = 1198782 Une approximation suffisante est1198994 Pour 119878 le nombre total drsquoespegraveces inventorieacutees est unbon choix Le reacutesultat se trouve en figure 37
Ajustement du modegravele(nlsfit lt- nls(nEspeces ~ S nArbres(K + nArbres) data = list(nArbres
nEspeces) start = list(K = max(nArbres)4 S = max(nEspeces))))
Nonlinear regression model model nEspeces ~ S nArbres(K + nArbres) data list(nArbres nEspeces) K S 12510 2328 residual sum-of-squares 3066 Number of iterations to convergence 6 Achieved convergence tolerance 7881e-06
Lrsquoestimation preacuteceacutedente utilise la meacutethode des moindrescarreacutes qui suppose lrsquoindeacutependance des reacutesidus hypothegraveses eacutevi-demment violeacutee par une courbe drsquoaccumulation48 Lrsquoestima-tion par le maximum de vraisemblance est plus convenable49
Elle utilise la totaliteacute des points de la courbe drsquoaccumulationLa courbe drsquoaccumulation de BCI est preacutesenteacutee en figure 212Ses donneacutees sont utiliseacutees ici
SAC lt- specaccum(BCI random) Calculs intermeacutediairesYi lt- SAC$richnessN lt- length(Yi)Xi lt- Yi(1N)Xbar lt- mean(Xi)Ybar lt- mean(Yi)Syy lt- sum((Yi - Ybar)^2)Sxx lt- sum((Xi - Xbar)^2)Sxy lt- sum((Xi - Xbar) (Yi - Ybar)) Estimations(Khat lt- (Xbar Syy - Ybar Sxy)(Ybar Sxx - Xbar Sxy))
[1] 1712278
(Shat lt- Ybar + Khat Xbar)
[1] 2236211
Lrsquoestimation preacuteceacutedente repose sur une approximation nu-meacuterique Le paramegravetre 119870 peut ecirctre estimeacute plus preacuteciseacutementpar reacutesolution numeacuterique de lrsquoeacutequation exacte du maximumde vraisemblance
Equation que Khat doit annulerf lt- function(Khat) Sxy + Khat Sxx - (Syy + 2 Khat Sxy +
Khat Khat Sxx) sum(Xi(Yi + Khat Xi)N) Reacutesolution numeacuterique lintervalle de recherche doit ecirctre fourniSolution lt- uniroot(f c(0 1e+07))(Khat lt- Solution$root)
31 Richesse speacutecifique 43
50H Lineweaver et D Burk laquo TheDetermination of Enzyme Dissocia-tion Constants raquo In Journal ofthe American Chemical Society 563(1934) p 658-666 doi 10 1021 ja01318a036
51Raaijmakers cf note 49
52J Soberoacuten M et J LlorenteB laquo The Use of Species Accumula-tion Functions for the Prediction ofSpecies Richness raquo In ConservationBiology 73 (1993) p 480-488 doi 101046j1523-1739199307030480x
[1] 1712293
(Shat lt- Ybar + Khat Xbar)
[1] 2236213
Le nombre drsquoespegraveces estimeacute est 224 infeacuterieur au nombredrsquoespegraveces observeacute
Pour calculer lrsquointervalle de confiance il est plus simple depasser par une transformation lineacuteaire du modegravele 50
[ 1119878119899
] = 119870119878[ 1
119899] + 1119878
(324)
Le nombre drsquoespegraveces est estimeacute par lrsquoinverse de lrsquoordonneacuteeagrave lrsquoorigine du modegravele
y lt- 1nEspecesx lt- 1nArbreslm1 lt- lm(y ~ x)(S lt- 1lm1$coef[1])
(Intercept) 217002
`geom_smooth()` using formula y ~ x
0006
0008
0010
0012
00000 00005 00010 00015 000201n
1S
Fig 36 Ajustement du mecircmemodegravele de Michaelis-Mententransformeacute selon Lineweaver etBurk
On voit assez clairement que le modegravele (figure 36) srsquoajustemal quand il est repreacutesenteacute sous cette forme51
Le code R neacutecessaire pour reacutealiser la figure est
ggplot(dataframe(x y) aes(x y)) +geom_point() +stat_smooth(method = lm col = red) +labs(x = 1n y=1S)
44 Mesures neutres de la diversiteacute 120572 ou 120574
53L R Holdridge et al Fo-rest Environments in Tropical LifeZones Oxford Pergamon Press1971
Le nombre drsquoespegraveces estimeacute est infeacuterieur au nombre obser-veacute qui ne se trouve mecircme pas dans lrsquointervalle de confiance agrave95 Le modegravele de Michaelis-Menten ne convient pas
Soberoacuten M et Llorente B52 deacuteveloppent un cadre theacuteo-rique plus vaste qui permet drsquoajuster la courbe drsquoaccumulationagrave plusieurs modegraveles Ces modegraveles sont efficaces empiriquementmais manquent de support theacuteorique pour justifier leur formeLe modegravele le plus simple est exponentiel neacutegatif Si la proba-biliteacute de trouver une nouvelle espegravece est proportionnelle aunombre drsquoespegraveces non encore deacutecouvertes la courbe drsquoaccu-mulation suit la relation
119878119899 = 119878 (1 minus 119890119870119899) (325)
Les paramegravetres peuvent ecirctre estimeacutes par la meacutethode desmoindres carreacutes
(nlsexp lt- nls(nEspeces ~ S (1 - exp(K nArbres)) data = list(nArbresnEspeces) start = list(S = max(nEspeces) K = -11000)))
Nonlinear regression model model nEspeces ~ S (1 - exp(K nArbres)) data list(nArbres nEspeces) S K 212198082 -0000494 residual sum-of-squares 10664 Number of iterations to convergence 13 Achieved convergence tolerance 8042e-06
Ce modegravele proposeacute par Holdridge et al53 sous-estime larichesse parce que la probabiliteacute de deacutecouvrir une nouvelleespegravece diminue plus vite que le nombre drsquoespegraveces restant agravedeacutecouvrir les derniegraveres espegraveces sont plus rares et donc plusdifficiles agrave deacutetecter
Un modegravele plus reacutealiste deacutefinit cette probabiliteacute commeune fonction deacutecroissante du nombre drsquoespegraveces manquantesLa fonction la plus simple est une exponentielle neacutegative maiselle ne srsquoannule jamais et le nombre drsquoespegraveces nrsquoa pas drsquoasymp-tote Un paramegravetre suppleacutementaire pour obtenir lrsquoasymptoteest neacutecessaire et aboutir agrave la relation
119878119899 = 1119911 ln [119886
119888 minus 119886 minus 119888119888 119890minus119888119911119899] (326)
Les paramegravetres agrave estimer sont 119911 119886 et 119888
(nlslog lt- nls(nEspeces ~ 1z log(ac - (a - c)c exp(-c z nArbres)) data = list(nArbres nEspeces) start = list(z = 005a = 1 c = 0001)))
Nonlinear regression model model nEspeces ~ 1z log(ac - (a - c)c exp(-c z nArbres)) data list(nArbres nEspeces)
31 Richesse speacutecifique 45
z a c 0025139 0755365 0001114 residual sum-of-squares 4461 Number of iterations to convergence 4 Achieved convergence tolerance 4813e-06
Nombre despegravecescoefs lt- coef(nlslog)log(coefs[a]coefs[c])coefs[z]
a 2593128
0
50
100
150
200
0 5000 10000 15000 20000Nombre darbres
Nom
bre
des
pegravece
s
Fig 37 Ajustement des modegravelede Michaelis-Menten (trait plein)et de de Soberoacuten et Llorente(pointilleacutes longs modegraveleexponentiel neacutegatif pointilleacutescourts modegravele agrave trois paramegravetres)aux donneacutees de BCI Les cerclesrepreacutesentent le nombre drsquoespegravecescumuleacutees en fonction du nombredrsquoarbres Le modegravele exponentielneacutegatif (Holdridge) sous-estime larichesse plus que celui deMichaelis-Menten (Clench) Lemodegravele agrave trois paramegravetres srsquoajustemieux aux donneacutees mais ilsurestime probablement larichesse
Lrsquoestimation est cette fois supeacuterieure agrave celle du jackknife(244 espegraveces)
La figure 37 preacutesente les deux ajustements de modegravele deSoberoacuten et Llorente avec celui de Clench Lrsquoestimation de larichesse par extrapolation est plus incertaine que par les meacute-thodes non parameacutetriques Elle est tregraves peu utiliseacutee
Le code R neacutecessaire pour reacutealiser la figure est
x lt- seq(from = 0 to = max(nArbres) length = 255)NewData lt- list(nArbres = x)ggplot(dataframe(x
MM = predict(nlsfit newdata = NewData)Holdridge = predict(nlsexp newdata = NewData)Soberon = predict(nlslog newdata = NewData))
aes(x)) +geom_point(aes(nArbres nEspeces) dataframe(nArbres nEspeces)) +geom_line(aes(y = MM)) +geom_line(aes(y = Holdridge) lty = 2) +geom_line(aes(y = Soberon) lty = 3) +labs(x = Nombre darbres y = Nombre despegraveces)
Diversiteacute geacuteneacuteriqueLa deacutetermination des genres est plus facile et fiable que
celle des espegraveces le biais drsquoeacutechantillonnage moins sensible (lenombre de singletons diminue rapidement en regroupant les
46 Mesures neutres de la diversiteacute 120572 ou 120574
54A Balmford et al laquo UsingHigher-Taxon Richness as a Surro-gate for Species Richness II Lo-cal Applications raquo In Proceedings ofthe Royal Society of London SeriesB Biological Sciences 263 (1996)p 1571-1575 doi 101098rspb19960230
55P H Williams et K J Gastonlaquo Measuring More of Biodiversity Can Higher-Taxon Richness PredictWholesale Species Richness raquo In Biological Conservation 67 (1994)p 211-217 doi 10 1016 0006 -3207(94)90612-2
56A Balmford et al laquo UsingHigher-Taxon Richness as a Surro-gate for Species Richness I RegionalTests raquo In Proceedings of the RoyalSociety of London Series B Bio-logical Sciences 263 (1996) p 1267-1274 doi 101098rspb19960186
57C C Cartozo et al laquo Quanti-fying the Taxonomic Diversity in RealSpecies Communities raquo In Journalof Physics A Mathematical andTheoretical 41 (2008) p 224012 doi 1010881751-81134122224012
58G Caldarelli et al laquo Scale-FreeNetworks from Varying Vertex Intrin-sic Fitness raquo In Physical ReviewLetters 8925 (2002) p 258702 doi 101103PhysRevLett89258702
59C Mora et al laquo How ManySpecies Are There on Earth and inthe Ocean raquo In PLoS Biology 98(2011) e1001127 doi 10 1371 journalpbio1001127
60Ibid figure 1
61R M May laquo Why Worry aboutHow Many Species and Their Loss raquoIn PLoS Biology 98 (2011)e1001130 doi 1013712Fjournalpbio1001130
donneacutees) et les coucircts drsquoinventaire sont geacuteneacuteralement large-ment reacuteduits54 Le choix drsquoestimer la diversiteacute de taxons derang supeacuterieur (genres ou mecircme familles au lieu des espegraveces)est envisageable55
Empiriquement la correacutelation entre la richesse geacuteneacuteriqueet la richesse speacutecifique (des angiospermes des oiseaux et desmammifegraveres) est bonne en forecirct tropicale56 suffisante pourcomparer les communauteacutes mecircme si la preacutediction de la ri-chesse speacutecifique agrave partir de la richesse geacuteneacuterique est tregraves im-preacutecise
Cartozo et al57 ont montreacute que le nombre de taxons deniveau supeacuterieur (genre par rapport aux espegraveces ordres parrapport aux sous-ordres) est universellement proportionnel aunombre de taxons du niveau immeacutediatement infeacuterieur agrave la puis-sance 061 Cette relation est valideacutee agrave lrsquoeacutechelle mondiale pourles systegravemes veacutegeacutetaux La loi de puissance reste valide pourdes assemblages aleacuteatoires crsquoest donc la conseacutequence de pro-prieacuteteacutes matheacutematiques58 mais la puissance de la relation estplus eacuteleveacutee (les communauteacutes reacuteelles sont plus agreacutegeacutees dupoint de vue phylogeacuteneacutetique que sous lrsquohypothegravese nulle drsquounassemblage aleacuteatoire) et varie entre les niveaux
Combien y a-t-il drsquoespegraveces diffeacuterentes sur Terre La question de lrsquoestimation du nombre total drsquoespegraveces geacute-
negravere une abondante litteacuterature Mora et al59 en font une revueet proposent une meacutethode nouvelle
Dans chaque regravegne le nombre de taxons de niveaux supeacute-rieurs (phylums classes ordres familles et mecircme genres) estestimeacute par des modegraveles prolongeant jusqursquoagrave leur asymptoteles valeurs connues en fonction du temps Cette meacutethode estapplicable jusqursquoau niveau du genre (figure 38 A agrave E) Lenombre de taxon de chaque niveau est lieacute agrave celui du niveaupreacuteceacutedent ce qui est repreacutesenteacute par la figure 38 G60 sous laforme du relation lineacuteaire entre le logarithme du logarithmedu nombre de taxons et le rang (1 pour les phylums 5 pourles genres) La droite est prolongeacutee jusqursquoau rang 6 pour ob-tenir le nombre drsquoespegraveces Une faccedilon alternative de deacutecrire lameacutethode est de dire que le nombre de taxons du niveau 119899 + 1est eacutegal agrave celui du niveau 119899 agrave la puissance 119896 La pente de ladroite de la figure est ln 119896 Aucune justification de ce reacutesultatmajeur nrsquoest donneacutee par les auteurs si ce nrsquoest leur veacuterificationempirique
Le nombre total drsquoespegraveces estimeacute est 87 millions tousregravegnes confondus dans la fourchette des estimations preacuteceacute-dentes (de 3 agrave 100 millions) et neacutecessitant pregraves de 500 ansdrsquoinventaires au rythme actuel des deacutecouvertes61
En se limitant aux arbres lrsquoestimation se monte agrave 16000
32 Indice de Simpson 47
through our higher taxon approach which suggests that our
species estimates are conservative particularly for poorly sampled
taxa We reason that underestimation due to this effect is severe for
prokaryotes due to the ongoing discovery of higher taxa (Figure
S1) but is likely to be modest in most eukaryote groups because the
rate of discovery of higher taxa is rapidly declining (Figure 1Andash3E
Figure S1 Figure 3Fndash3J)
Since higher taxonomic levels are described more completely
(Figure 1Andash1E) the resulting error from incomplete inventories
should decrease while rising in the taxonomic hierarchy
Recalculating the number of species while omitting all data from
genera yielded new estimates that were mostly within the intervals
of our original estimates (Figure S3) However Chromista (on
Earth and in the ocean) and Fungi (in the ocean) were exceptions
having inflated predictions without the genera data (Figure S3)
This inflation in the predicted number of species without genera
data highlights the high incompleteness of at least the genera data
in those three cases In fact Adl et alrsquos [28] survey of expert
opinions reported that the number of described species of
chromists could be in the order of 140000 which is nearly 10
times the number of species currently catalogued in the databases
used here (Table 1) These results suggest that our estimates for
Chromista and Fungi (in the ocean) need to be considered with
caution due to the incomplete nature of their data
Subjectivity in the Linnaean system of classification
Different ideas about the correct classification of species into a
taxonomic hierarchy may distort the shape of the relationships we
describe here However an assessment of the taxonomic hierarchy
shows a consistent pattern we found that at any taxonomic rank
the diversity of subordinate taxa is concentrated within a few
groups with a long tail of low-diversity groups (Figure 3Pndash3T)
Although we cannot refute the possibility of arbitrary decisions in
the classification of some taxa the consistent patterns in Figure 3Pndash
3T imply that these decisions do not obscure the robust underlying
relationship between taxonomic levels The mechanism for the
exponential relationships between nested taxonomic levels is
uncertain but in the case of taxa classified phylogenetically it
may reflect patterns of diversification likely characterized by
radiations within a few clades and little cladogenesis in most others
[29] We would like to caution that the database we used here for
protistan eukaryotes (mostly in Protozoa and Chromista in this
work) combines elements of various classification schemes from
different agesmdashin fact the very division of these organisms into
lsquolsquoProtozoarsquorsquo and lsquolsquoChromistarsquorsquo kingdoms is non-phylogenetic and
not widely followed among protistologists [28] It would be
valuable to revisit the species estimates for protistan eukaryotes
once their global catalogue can be organized into a valid and
stable higher taxonomy (and their catalogue of described species is
more completemdashsee above)
Discussion
Knowing the total number of species has been a question of
great interest motivated in part by our collective curiosity about
the diversity of life on Earth and in part by the need to provide a
reference point for current and future losses of biodiversity
Unfortunately incomplete sampling of the worldrsquos biodiversity
combined with a lack of robust extrapolation approaches has
Figure 1 Predicting the global number of species in Animalia from their higher taxonomy (AndashF) The temporal accumulation of taxa(black lines) and the frequency of the multimodel fits to all starting years selected (graded colors) The horizontal dashed lines indicate the consensusasymptotic number of taxa and the horizontal grey area its consensus standard error (G) Relationship between the consensus asymptotic number ofhigher taxa and the numerical hierarchy of each taxonomic rank Black circles represent the consensus asymptotes green circles the cataloguednumber of taxa and the box at the species level indicates the 95 confidence interval around the predicted number of species (see Materials andMethods)doi101371journalpbio1001127g001
On the Number of Species on Earth and in the Ocean
PLoS Biology | wwwplosbiologyorg 4 August 2011 | Volume 9 | Issue 8 | e1001127
Fig 38 Eacutevolution du nombre detaxons connus en fonction dutemps et valeur estimeacutee du nombretotal (ligne horizontale grise A agraveE) Le nombre drsquoespegraveces connuesest trop faible pour utiliser cettemeacutethode (F) Il est obtenu parextrapolation de la relation dunombre de taxons drsquoun niveau agravecelui du niveau supeacuterieur (G)
62H ter Steege et al laquo Hyperdo-minance in the Amazonian Tree Flo-ra raquo In Science 3426156 (2013)p 1243092 doi 10 1126 science 1243092
63J W F Slik et al laquo An Es-timate of the Number of TropicalTree Species raquo In Proceedings ofthe National Academy of Sciences ofthe United States of America 11224(2015) p 7472-7477 doi 101073pnas1423147112
64S P Hubbell laquo Estimating theGlobal Number of Tropical Tree Spe-cies and Fisherrsquos Paradox raquo In Pro-ceedings of the National Academy ofSciences 11224 (2015) p 7343-7344doi 101073pnas1507730112
65J B Wilson et al laquo Plant Spe-cies Richness The World Records raquoIn Journal of Vegetation Science234 (2012) p 796-802 doi 101111j1654-1103201201400x
66J H Connell laquo Diversity inTropical Rain Forests and CoralReefs raquo In Science 1994335 (1978)p 1302-1310 doi 101126science19943351302
67E H Simpson laquo Measurementof Diversity raquo In Nature 1634148(1949) p 688 doi 10 1038 163688a0
espegraveces pour lrsquoAmazonie62 de lrsquoordre de 5000 pour lrsquoAfriqueet entre 40000 et 53000 pour lrsquoensemble des tropiques63
(donc pour lrsquoensemble de la planegravete le nombre drsquoespegravecesnon-tropicales eacutetant neacutegligeable) Ces estimations sont ob-tenues par extrapolation du modegravele en log-seacuteries (chapitre20) et sont sujettes au paradoxe de Fisher les espegravecesrepreacutesenteacutees par un tregraves petit nombre drsquoindividu dans lemodegravele notamment les singletons sont les plus nombreusesUne discussion approfondie est donneacutee par Hubbell 64 lesespegraveces reacutecemment apparues au sens du modegravele ne sont pasdeacutetectables avant plusieurs geacuteneacuterations creacuteant un deacutecalageentre le nombre drsquoespegraveces reconnues par la taxonomie et lemodegravele
J B Wilson et al65 compilent les releveacutes du nombre drsquoes-pegraveces de plantes vasculaires en fonction de la surface et re-tiennent uniquement les plus riches agrave chaque eacutechelle spatiale(du millimegravetre carreacute agrave lrsquohectare) Ces releveacutes sont tous situeacutes enforecirct tropicale ou en prairie tempeacutereacutee geacutereacutee (les perturbationsreacuteguliegraveres et modeacutereacutees y favorisent la diversiteacute conformeacutementagrave la theacuteorie de la perturbation intermeacutediaire66) La relationentre le nombre drsquoespegraveces et la surface est celle drsquoArrheniusSon extrapolation agrave la surface terrestre donne environ 220000espegraveces comparables agrave lrsquoestimation de 275000 espegraveces rappor-teacutee par Mora et al
32 Indice de SimpsonDeacutefinition
On note 119901119904 la probabiliteacute qursquoun individu tireacute au hasardappartienne agrave lrsquoespegravece 119904 Lrsquoindice de E H Simpson67 ou Gini-Simpson est
119864 = 1 minus119878
sum119904=1
1199012119904 (327)
Il peut ecirctre interpreacuteteacute comme la probabiliteacute que deux indi-
48 Mesures neutres de la diversiteacute 120572 ou 120574
68T D Olszewski laquo A UnifiedMathematical Framework for theMeasurement of Richness and Even-ness within and among Multiple Com-munities raquo In Oikos 1042 (2004)p 377-387 doi 101111j0030-1299200412519x
69S H Hurlbert laquo The Noncon-cept of Species Diversity A Cri-tique and Alternative Parameters raquoIn Ecology 524 (1971) p 577-586doi 1023071934145
70R S Mendes et al laquo A UnifiedIndex to Measure Ecological Diversityand Species Rarity raquo In Ecography314 (2008) p 450-456 doi 101111j0906-7590200805469x
71C Gini Variabilitagrave e Mutabili-tagrave Bologna C Cuppini 1912
72D Ellerman laquo An Introductionto Logical Entropy and Its Relationto Shannon Entropy raquo In Interna-tional Journal of Semantic Compu-ting 702 (2013) p 121-145 doi 101142S1793351X13400059
vidus tireacutes au hasard soient drsquoespegraveces diffeacuterentes Il est comprisdans lrsquointervalle [0 1[ Sa valeur diminue avec la reacutegulariteacute dela distribution 119864 = 0 si une seule espegravece a une probabiliteacutede 1 119864 = 1 minus 1119878 si les 119878 espegraveces ont la mecircme probabili-teacute 119901119904 = 1119878 La valeur 1 est atteinte pour un nombre infinidrsquoespegraveces de probabiliteacutes nulles
Deux autres formes de lrsquoindice sont utiliseacutees Tout drsquoabordla probabiliteacute que deux individus soient de la mecircme espegravecesouvent appeleacutee indice de concentration de Simpson qui estcelui deacutefini dans lrsquoarticle original de Simpson
119863 =119878
sum119904=1
1199012119904 (328)
Lrsquoindice de Simpson est parfois consideacutereacute comme une me-sure drsquoeacutequitabiliteacute68 mais il varie avec la richesse cette ap-proche est donc erronneacutee S H Hurlbert69 lrsquoa diviseacute par savaleur maximale 1 minus 1119878 pour obtenir une mesure drsquoeacutequita-biliteacute valide geacuteneacuteraliseacutee plus tard par Mendes et al70 voirsection 55 Le nombre drsquoespegraveces doit ecirctre estimeacute par les meacute-thodes preacutesenteacutees plus haut pour ne pas deacutependre de la taillede lrsquoeacutechantillon
Lrsquoestimateur du maximum de vraisemblance de lrsquoindice est
119864 = 1 minus119904119899
ne0
sum119904=1
1199012119904 (329)
Le calcul de lrsquoindice de Simpson peut se faire avec la fonc-tion diversity disponible dans le package vegan de R ou avecla fonction Simpson du package entropart
data(BCI) asProbaVector() transforme les abondances en probabiliteacutesPs lt- asProbaVector(colSums(BCI))Simpson(Ps)
None 09736755
Un historique de la deacutefinition de lrsquoindice de Gini71 agrave Simp-son inspireacute par Turing est fourni par Ellerman72
EstimationDeacutefinissons lrsquoindicatrice 1119904ℎ valant 1 si lrsquoindividu ℎ ap-
partient agrave lrsquoespegravece 119904 0 sinon 1119904ℎ suit une loi de Bernoullidrsquoespeacuterance 119901119904 et de variance 119901119904 (1 minus 119901119904) 119864 est la somme surtoutes les espegraveces de cette variance Un estimateur non biai-seacute drsquoune variance agrave partir drsquoun eacutechantillon est la somme des
33 Indice de Shannon 49
73Good laquo The Population Fre-quency of Species and the Estima-tion of Population Parameters raquo cfnote 3 p 11 R Lande laquo Statisticsand Partitioning of Species Diversityand Similarity among Multiple Com-munities raquo In Oikos 761 (1996)p 5-13 doi 1023073545743
74C E Shannon laquo A Mathemati-cal Theory of Communication raquo In The Bell System Technical Journal273 (1948) p 379-423 623-656 doi 101002j1538-73051948tb01338x C E Shannon et W Weaver TheMathematical Theory of Communi-cation University of Illinois Press1963
75I F Spellerberg et P J Fe-der laquo A Tribute to Claude Shan-non (1916ndash2001) and a Plea for MoreRigorous Use of Species RichnessSpecies Diversity and the lsquoShannonndashWienerrsquo Index raquo In Global Ecologyand Biogeography 123 (2003) p 177-179 doi 101046j1466-822X200300015x
eacutecarts quadratiques diviseacutee par le nombre drsquoobservation moinsune Lrsquoestimateur 119864 est leacutegegraverement biaiseacute parce qursquoil est calcu-leacute agrave partir des 119901119904 ce qui revient agrave diviser la somme des eacutecartspar 119899 et non 119899 minus 1 Un estimateur non biaiseacute est73
119864 = ( 119899119899 minus 1) ⎛⎜
⎝1 minus
119904119899ne0
sum119904=1
1199012119904⎞⎟⎠
(330)
La correction par 119899(119899 minus 1) tend rapidement vers 1 quandla taille de lrsquoeacutechantillon augmente lrsquoestimateur est tregraves peubiaiseacute
Le non-eacutechantillonnage des espegraveces rares est pris en comptedans cette correction parce qursquoelle considegravere que 119864 est lrsquoesti-mateur de variance drsquoun eacutechantillon et non drsquoune populationcomplegravetement connue Il est neacutegligeable si 119901119904 est petit 1199012
119904 estneacutegligeable dans la somme
Simpson a fourni un estimateur non biaiseacute de 119863 agrave partirdu calcul du nombre de paires drsquoindividus tireacutes sans remise
= sum119878119904=1 119899119904 (119899119904 minus 1)
119899 (119899 minus 1) (331)
Lrsquoargumentation est totalement diffeacuterente mais le reacutesultatest le mecircme 119864 = 1 minus
La fonction Simpson de entropart accepte comme argu-ment un vecteur drsquoabondances et propose par deacutefaut la cor-rection de Lande
Simpson(colSums(BCI))
Lande 09737209
33 Indice de ShannonDeacutefinition
Lrsquoindice de Shannon74 aussi appeleacute indice de Shannon-Weaver ou Shannon-Wiener75 ou simplement entropie est deacute-riveacute de la theacuteorie de lrsquoinformation
119867 = minus119878
sum119904=1
119901119904 ln 119901119904 (332)
Consideacuterons une placette forestiegravere contenant 119878 espegravecesveacutegeacutetales diffeacuterentes La probabiliteacute qursquoune plante choisie auhasard appartienne agrave lrsquoespegravece 119904 est noteacutee 119901119904 On preacutelegraveve 119899plantes et on enregistre la liste ordonneacutee des espegraveces des 119899
50 Mesures neutres de la diversiteacute 120572 ou 120574
76L Brillouin Science and Infor-mation Theory 2nd ed Oxford Aca-demic Press 1962
77E C Pielou laquo The Measure-ment of Diversity in Different Typesof Biological Collections raquo In Jour-nal of Theoretical Biology 13C(1966) p 131-144 doi 10 1016 0022-5193(66)90013-0
78H Theil Economics and Infor-mation Theory Chicago Rand Mc-Nally amp Company 1967
79P Conceiccedilatildeo et P Ferreira TheYoung Personrsquos Guide to the TheilIndex Suggesting Intuitive Inter-pretations and Exploring Analyti-cal Applications Austin Texas 2000p 54
plantes Si 119899 est suffisamment grand le nombre de plantes delrsquoespegravece 119904 est 119899119901119904 On note 119871 le nombre de listes respectantces conditions
119871 = 119899prod119878
119894=1 (119899119901119904) (333)
Ce reacutesultat est obtenu en calculant le nombre de positionspossibles dans la liste pour les individus de la premiegravereespegravece ( 119899
1198991199011) Le nombre de positions pour la deuxiegraveme
espegravece est (119899minus11989911990111198991199012
) Pour la 119878-iegraveme espegravece le nombre est(119899minus1198991199011minus⋯minus119899119901119904minus1
119899119901119894) Les produits de combinaisons se simplifient
pour donner lrsquoeacutequation (333)On peut maintenant eacutecrire le logarithme de 119871
ln 119871 = ln 119899 minus119878
sum119904=1
ln 119899119901119904
On utilise lrsquoapproximation de Stirling
ln 119899 asymp 119899 ln 119899 minus 119899
pour obtenir apregraves simplifications
ln 119871 = minus119899119878
sum119904=1
119901119904 ln 119901119904 (334)
119867 = (ln 119871)119899 est lrsquoindice de Shannon Ce reacutesultat estconnu sous le nom de formule de Brillouin76 Agrave lrsquoorigine Shan-non a utiliseacute un logarithme de base 2 pour que 119867 soit lenombre moyen de questions binaires (reacuteponse oui ou non) neacute-cessaire pour identifier lrsquoespegravece drsquoune plante (un caractegravere uti-liseacute dans une chaicircne dans le contexte du travail de Shannon)Les logarithmes naturels de base 2 ou 10 ont eacuteteacute utiliseacutes parla suite77
La formule (334) est celle de lrsquoindice de Theil78 preacutesen-teacute en deacutetail par Conceiccedilatildeo et Ferreira79 agrave lrsquoorigine utiliseacutepour mesurer les ineacutegaliteacutes de revenu puis pour caracteacuteriserles structures spatiales en eacuteconomie Lrsquoindice est proportion-nel au nombre de plantes choisies on peut donc le diviser par119899 et on obtient lrsquoindice de biodiversiteacute de Shannon Ces in-dices ont eacuteteacute deacutefinis en choisissant des lettres au hasard pourformer des chaicircnes de caractegraveres Leur valeur est le nombrede chaicircnes de caractegraveres diffeacuterentes que lrsquoon peut obtenir aveclrsquoensemble des lettres disponibles crsquoest-agrave-dire la quantiteacute drsquoin-formation contenue dans lrsquoensemble des lettres Lrsquoindice deShannon donne une mesure de la biodiversiteacute en tant que quan-titeacute drsquoinformation
Lrsquoestimateur du maximum de vraisemblance de lrsquoindice est
33 Indice de Shannon 51
80K Hutcheson laquo A Test forComparing Diversities Based on theShannon Formula raquo In Journal ofTheoretical Biology 29 (1970) p 151-154 doi 10 1016 0022 - 5193(70 )90124-4
81Bulmer laquo On Fitting thePoisson Lognormal Distributionto Species-Abundance Data raquocf note 30 p 17
82G P Basharin laquo On a Statisti-cal Estimate for the Entropy of a Se-quence of Independent Random Va-riables raquo In Theory of Probabili-ty and its Applications 43 (1959)p 333-336 doi 1011371104033
83G A Miller laquo Note on the Biasof Information Estimates raquo In Infor-mation Theory in Psychology Pro-blems and Methods Sous la dir de HQuastler Free Press 1955 p 95-100
= minus119904119899
ne0
sum119904=1
119901119904 ln 119901119904 (335)
Le calcul de lrsquoindice de Shannon peut se faire avec la fonc-tion diversity disponible dans le package vegan de R ou avecla fonction Shannon de entropart
Ps lt- asProbaVector(colSums(BCI))Shannon(Ps)
None 4270409
La distribution de lrsquoestimateur est connue80 mais elle estinutile en pratique agrave cause du biais drsquoestimation
Bulmer81 eacutetablit une relation entre lrsquoindice de Shannon etlrsquoindice 120572 de Fisher agrave condition que la distribution de lrsquoabon-dance des espegraveces soit log-normale
= ( 120572 + 1) minus (1) (336)
(sdot) est la fonction digamma et 120572 est lrsquoestimateur de lrsquoin-dice de Fisher (204)
digamma(fisheralpha(colSums(BCI)) + 1) - digamma(1)
[1] 4148322
La sous-estimation est assez seacutevegravere sur cet exemple
EstimationBasharin82 a montreacute que lrsquoestimateur de lrsquoindice de Shan-
non eacutetait biaiseacute parce que des espegraveces ne sont pas eacutechantillon-neacutees Si 119878 est le nombre drsquoespegraveces reacuteel et 119899 le nombre drsquoindi-vidus eacutechantillonneacutes le biais est
120124 () minus 119867 = minus119878 minus 12119899 + 119874 (119899minus2) (337)
119874 (119899minus2) est un terme neacutegligeable La valeur estimeacutee agrave par-tir des donneacutees est donc trop faible drsquoautant plus que lenombre drsquoespegraveces total est grand mais drsquoautant moins quelrsquoeacutechantillonnage est important Comme le nombre drsquoespegraveces119878 nrsquoest pas observable le biais reacuteel est inconnu
Lrsquoestimateur de Miller-Madow83 utilise lrsquoinformation dis-ponible en sous-estimant le nombre drsquoespegraveces et donc lrsquoentro-pie
= minus119904119899
ne0
sum119904=1
119901119904 ln 119901119904 +119904119899
ne0 minus 12119899 (338)
52 Mesures neutres de la diversiteacute 120572 ou 120574
84A Chao et T-J Shen laquo Nonpa-rametric Estimation of Shannonrsquos In-dex of Diversity When There Are Un-seen Species in Sample raquo In Envi-ronmental and Ecological Statistics104 (2003) p 429-443 doi 101023A1026096204727
85J Ashbridge et I B J Gou-die laquo Coverage-Adjusted Estimatorsfor Mark-Recapture in HeterogeneousPopulations raquo In Communicationsin Statistics - Simulation and Com-putation 294 (2000) p 1215-1237doi 10108003610910008813661
86D G Horvitz et D J Thomp-son laquo A Generalization of Samplingwithout Replacement from a FiniteUniverse raquo In Journal of the Ame-rican Statistical Association 47260(1952) p 663-685 doi 10 1080 01621459195210483446
87J Beck et Schwanghart laquo Com-paring Measures of Species Diversityfrom Incomplete Inventories An Up-date raquo cf note 33 p 36
88V Q Vu et al laquo Coverage-Adjusted Entropy Estimation raquo In Statistics in Medicine 2621 (2007)p 4039-4060 doi 101002sim2942
89Z Zhang laquo Entropy Estimationin Turingrsquos Perspective raquo In Neu-ral Computation 245 (2012) p 1368-1389 doi 101162NECO_a_00266
90Z Zhang laquo Asymptotic Norma-lity of an Entropy Estimator withExponentially Decaying Bias raquo In IEEE Transactions on InformationTheory 591 (2013) p 504-508 doi 101109TIT20122217393
91Z Zhang et M Grabchaklaquo Bias Adjustment for a Nonparame-tric Entropy Estimator raquo In Entro-py 156 (2013) p 1999-2011 doi 103390e15061999
92M Vinck et al laquo Estimation ofthe Entropy Based on Its PolynomialRepresentation raquo In Physical Re-view E 855 (2012) doi 10 1103 PhysRevE85051139
Chao et T-J Shen84 eacutetablissent un estimateur moins biai-seacute agrave partir du taux de couverture de lrsquoeacutechantillonnage 119862
= minus119904119899
ne0
sum119904=1
119862 119901119904 ln ( 119862 119901119904)1 minus (1 minus 119862 119901119904)
119899 (339)
Multiplier les freacutequences observeacutees par le taux de couver-ture permet drsquoobtenir un estimateur non biaiseacute des probabili-teacutes conditionnellement aux espegraveces non observeacutees85
Le terme au deacutenominateur est la correction de Horvitz etThompson 86 chaque terme de la somme est diviseacute par la pro-babiliteacute drsquoobserver au moins une fois lrsquoespegravece correspondanteIl tend vers 1 quand la taille de lrsquoeacutechantillon augmente
J Beck et Schwanghart87 montrent que la correction dubiais est efficace mecircme agrave des niveaux de compleacutetude delrsquoeacutechantillonnage (voir section 31) tregraves faibles Vu et al88
eacutetudient la vitesse de convergence de lrsquoestimateurZ Zhang89 deacutefinit lrsquoindice de Simpson geacuteneacuteraliseacute
120577119906119907 =119878
sum119904=1
119901119906119904 (1 minus 119901119904)119907 (340)
ougrave 120577119906119907 est la somme sur toutes les espegraveces de la probabiliteacutede rencontrer 119906 fois lrsquoespegravece dans un eacutechantillon de taille 119906+119907Lrsquoindice de Shannon peut srsquoexprimer en fonction de 1205771119907
119867 =infin
sum119907=1
11199071205771119907 (341)
Les premiers termes de la somme jusqursquoagrave 119907 = 119899minus1 peuventecirctre estimeacutes agrave partir des donneacutees les suivants constituent lebiais de lrsquoestimateur qui est caculeacute en pratique par
119867119911 =119899minus1sum119907=1
1119907
⎧⎨⎩
119899119907+1 [119899 minus (119907 + 1)]119899
119904119899ne0
sum119904=1
119901119904119907minus1prod119895=0
(1 minus 119901119904 minus 119895119899)
⎫⎬⎭
(342)Z Zhang90 montre que le biais de lrsquoestimateur 119867119911 est
asymptotiquement normal et calcule sa variance Z Zhang etGrabchak91 ameacuteliorent lrsquoestimateur en le compleacutetant par unestimateur de son biais mais les calculs deviennent excessive-ment complexes Vinck et al92 appliquent la mecircme deacutemarcheavec un estimateur bayesien du biais utilisant un prior aussiplat que possible pour la valeur de lrsquoentropie (et non un priorplat sur les probabiliteacutes qui tire lrsquoestimateur vers lrsquoentropiemaximale) Cet estimateur neacutecessite de connaicirctre le nombre
33 Indice de Shannon 53
93E C Pielou laquo Species-Diversityand Pattern-Diversity in the Study ofEcological Succession raquo In Journalof Theoretical Biology 102 (1966)p 370-383 doi 10 1016 0022 -5193(66)90133-0
94A Chao et al laquo Entropy andthe Species Accumulation Curve ANovel Entropy Estimator via Disco-very Rates of New Species raquo In Me-thods in Ecology and Evolution 411(2013) p 1091-1100 doi 1011112041-210x12108
95Chao et Jost laquo Coverage-BasedRarefaction and Extrapolation Stan-dardizing Samples by CompletenessRather than Size raquo cf note 6 p 12
96J A Bonachela et al laquo Entro-py Estimates of Small Data Sets raquo In Journal of Physics A Mathemati-cal and Theoretical 41202001 (2008)p 1-9 doi 1010881751-81134120202001
97J L W V Jensen laquo Sur lesfonctions convexes et les ineacutegaliteacutesentre les valeurs moyennes raquo In ActaMathematica 301 (1906) p 175-193doi 101007bf02418571
drsquoespegraveces ce qui empecircche son utilisation sur des donneacutees drsquoeacuteco-logie
Pielou93 a deacuteveloppeacute une autre meacutethode de correction debiais lorsque de nombreux releveacutes de petite taille sont dispo-nibles ln 119871 est calculeacute pour un releveacute choisi aleacuteatoirement puisles donneacutees du premier releveacute sont ajouteacutees agrave celles drsquoun autrepuis un autre jusqursquoagrave ce que 119867 = (ln 119871)119899 nrsquoaugmente plus la diversiteacute augmente dans un premier temps mais se stabi-lise quand lrsquoeffet des espegraveces ajouteacutees est compenseacute par celuide la diminution de lrsquoeacutequitabiliteacute due aux espegraveces preacutesentesdans tous les releveacutes Agrave partir de ce seuil lrsquoaugmentation deln 119871 par individu ajouteacute est calculeacutee pour chaque releveacute sup-pleacutementaire Son espeacuterance estimeacutee par sa moyenne calculeacuteeen ajoutant tous les releveacutes disponibles est
Chao et al94 utilisent lrsquoestimateur de la pente de lacourbe de rareacutefaction calculeacute preacuteceacutedemment95 pour estimerla richesse speacutecifique pour fournir un estimateur extrecircmementperformant
= minus119904119899
ne0
sum119904=1
119899119904119899 ( (119899) minus (119899119904)) (343)
minus 1199041119899 (1 minus 119860)1minus119899 (minusln (119860) minus
119899minus1sum119903=1
1119903 (1 minus 119860)119903) (344)
ougrave (sdot) est la fonction digamma et 119860 vaut
bull 21199042[(119899 minus 1) 1199041 + 21199042] en preacutesence de singletons et dou-bletons
bull 2[(119899 minus 1) (1199041 minus 1) + 2] en preacutesence de singletons seule-ment
bull 1 en absence de singletons et doubletons
Enfin la litteacuterature de physique statistique srsquoest abondam-ment inteacuteresseacutee agrave cette question (Bonachela et al96 en fontune revue) Le problegraveme traiteacute est la non-lineacuteariteacute de lrsquoin-dice de Shannon par rapport aux probabiliteacutes qui entraine unbiais drsquoestimation La fonction logarithme fournit un exemplesimple lrsquoespeacuterance de ln(119901119904) nrsquoest pas le logarithme de lrsquoes-peacuterance de 119901119904 parce que la fonction ln est concave Chaque es-timateur 119901119904 fluctue autour de 119901119904 mais vaut 119901119904 en moyenne Agravecause de la concaviteacute ln( 119901119904) est en moyenne infeacuterieur agrave ln(119901119904) cette relation est connue sous le nom drsquoineacutegaliteacute de Jensen97
Lrsquoindice de Shannon est concave (figure 39) donc son esti-mateur (332) est biaiseacute neacutegativement mecircme sans prendre enconsideacuteration les espegraveces non observeacutees
Code de la figure 21
54 Mesures neutres de la diversiteacute 120572 ou 120574
Fig 39 Courbe de 119909 ln 119909 entre 0et 1
00
01
02
03
000 025 050 075 100p
H(p
)
ggplot(dataframe(x = c(00001 1)) aes(x)) +stat_function(fun = function(x) -xlog(x)) +labs(x = p y = H(p))
Le biais peut ecirctre eacutevalueacute par simulation 10000 tirages sontreacutealiseacutes dans une loi normale drsquoespeacuterance 119901119904 choisie et drsquoeacutecart-type 001 Le biais est la diffeacuterence entre minus119901119904ln 119901119904 (connu) etla moyenne des 1000 valeurs de minus 119901119904ln 119901119904 (la probabiliteacute estestimeacutee par sa reacutealisation agrave chaque tirage) La valeur du biaisen fonction de 119901119904 est en figure 310 Le biais de lrsquoindice deShannon est la somme des biais pour toutes les probabiliteacutesspeacutecifiques de la communauteacute eacutetudieacutee et son calcul est tou-jours lrsquoobjet de recherches
Fig 310 Biais de 119904 ln 119904 entre 0et 1
minus000075
minus000050
minus000025
000000
025 050 075p
Bia
is
Code de la figure 310
Biaisp lt- function (p) Ps lt-rnorm(10000 p 001)p log(p) - mean(Ps log(Ps))
Biais lt- function (Ps)
Applique Biaisp agrave chaque valeur de Ps
33 Indice de Shannon 55
98P Grassberger laquo Finite SampleCorrections to Entropy and Dimen-sion Estimates raquo In Physics LettersA 1286-7 (1988) p 369-373 doi 1010160375-9601(88)90193-4
99P Grassberger laquo EntropyEstimates from Insufficient Sam-plings raquo In arXiv Physics e-prints0307138v2 (2003)
100T Schuumlrmann laquo Bias Analysisin Entropy Estimation raquo In Jour-nal of Physics A Mathematical andGeneral 3727 (2004) p L295-L301doi 1010880305-44703727L02
sapply(Ps Biaisp)ggplot(dataframe(x = c(005 095)) aes(x)) +
stat_function(fun = Biais) +geom_hline(yintercept = 0 lty = 2) +labs(x = p y = Biais)
Grassberger98 a fourni la correction de reacutefeacuterence
= minus119904119899
ne0
sum119904=1
119899119904119899 (ln (119899) minus (119899119904) minus (minus1)119899119904
119899119904 + 1 ) (345)
Grassberger99 lrsquoa perfectionneacutee
= minus119904119899
ne0
sum119904=1
119899119904119899 ( (119899) minus (119899119904) minus (minus1)119899119904 int
1
0
119905119899119904minus1
1 + 119905 119889119905) (346)
Enfin Schuumlrmann100 lrsquoa geacuteneacuteraliseacutee pour deacutefinir une fa-mille de corrections deacutependant drsquoun paramegravetre 120585
= minus119904119899
ne0
sum119904=1
119899119904119899 ( (119899) minus (119899119904) minus (minus1)119899119904 int
1120585 minus1
0
119905119899119904minus1
1 + 119905 119889119905)
(347)Le biais drsquoestimation diminue avec 120585 mais lrsquoerreur qua-
dratique augmente Schuumlrmann suggegravere drsquoutiliser 120585 = 119890minus12
comme meilleur compromisLa fonction Shannon permet toutes ces corrections Elle
accepte comme argument un vecteur drsquoabondances (et non deprobabiliteacutes)
Shannon(colSums(BCI) Correction = ChaoWangJost)
ChaoJost 4276193
Shannon(colSums(BCI) Correction = Grassberger)
Grassberger 4276599
Shannon(colSums(BCI) Correction = Grassberger2003)
Grassberger2003 4276491
56 Mesures neutres de la diversiteacute 120572 ou 120574
101J Hausser et K Strimmerlaquo Entropy Inference and the James-Stein Estimator with Applicationto Nonlinear Gene Association Net-works raquo In Journal of MachineLearning Research 10 (2009) p 1469-1484
102W James et C Stein laquo Esti-mation with Quadratic Loss raquo In Proceedings of the Fourth BerkeleySymposium on Mathematical Statis-tics and Probability Sous la dir de JNeyman T 1 Berkeley California University of California Press 1961p 361-379
Shannon(colSums(BCI) Correction = Schurmann)
Schurmann 4276094
Shannon(colSums(BCI) Correction = ZhangHz)
ZhangHz 4272529
Drsquoautres estimateurs peu utiliseacutes en eacutecologie sont dispo-nibles dans le package entropy101 La contraction de Stein102
consiste agrave estimer la distribution des probabiliteacutes drsquooccurencedes espegraveces par la pondeacuteration optimale entre un estimateuragrave faible biais et un estimateur agrave faible variance Lrsquoestimateur119901119904 est sans biais mais a une variance importante Lrsquoestimateur
1119878 si 119878 est connu est de variance nulle mais est tregraves biai-seacute Comme le nombre drsquoespegraveces est en geacuteneacuteral inconnu il doitecirctre estimeacute par une meacutethode quelconque mais de preacutefeacuterencele surestimant plutocirct que le sous-estimant Lrsquoestimateur deJames-Stein (shrinkage estimator) optimal est
119901119904 = 1119878+ (1 minus ) 119901119904 (348)
ougrave
= 1 minus sum119904119899ne0
119904=1 ( 119901119904)2
(119899 minus 1) sum119904119899ne0
119904=1 ( 1119878 minus 119901119904)2 (349)
Lrsquoentropie est ensuite simplement estimeacutee par lrsquoestimateurplug-in = minus sum119904119899
ne0119904=1 119901119904 ln 119901119904 Le calcul sous R est le suivant
library(entropy)entropyshrink(colSums(BCI))
Estimating optimal shrinkage intensity lambdafreq (frequencies) 00021
[1] 4275689 attr(lambdafreqs) [1] 0002074043
Le principe mecircme de lrsquoestimation rapproche la distributionde lrsquoeacutequiprobabiliteacute des espegraveces et donc augmente lrsquoentropieLrsquoestimation preacuteceacutedente ignore les espegraveces non observeacutees Pourles inclure le vecteur des abondance doit ecirctre allongeacute par au-tant de zeacuteros que drsquoespegraveces estimeacutees
(S0 lt- jackknife(AbdFreqCount(Ns))$Nhat - ncol(BCI))
Your specified order is larger than that determined by the test Therefore the order from the test is used
34 Indice de Hurlbert 57
103D Liu et al laquo Entropy ofHydrological Systems under SmallSamples Uncertainty and Variabili-ty raquo In Journal of Hydrology 532(2016) p 163-176 doi 101016jjhydrol201511019
104S H Hurlbert laquo The Noncon-cept of Species Diversity A Cri-tique and Alternative Parameters raquocf note 69 p 48
105Dauby et O J Hardylaquo Sampled-Based Estimation of Di-versity Sensu Stricto by TransformingHurlbert Diversities into EffectiveNumber of Species raquo cf note 7p 12
[1] 19
entropyshrink(c(colSums(BCI) rep(0 S0)))
Estimating optimal shrinkage intensity lambdafreq (frequencies) 0002
[1] 4276543 attr(lambdafreqs) [1] 0002041748
Les freacutequences sont estimeacutees par la fonction freqsshrinkLeur utilisation dans lrsquoestimateur plug-in donne le mecircme reacute-sultat
PsJS lt- freqsshrink(c(colSums(BCI) rep(0 S0)))
Estimating optimal shrinkage intensity lambdafreq (frequencies) 0002
Shannon(asProbaVector(PsJS))
None 4276543
Appliqueacute agrave des donneacutees de biodiversiteacute aquatique lrsquoestima-teur de James-Stein obtient de meilleurs reacutesultats que celui deChao et Shen103 quand lrsquoeacutechantillonnage est reacuteduit
34 Indice de HurlbertDeacutefinition
Lrsquoindice de S H Hurlbert104 est lrsquoespeacuterance du nombredrsquoespegraveces observeacutees dans un eacutechantillon de taille 119896 choisie
119896119878 =119878
sum119904=1
[1 minus (1 minus 119901119904)119896] (350)
Chaque terme de la somme est la probabiliteacute drsquoobserverau moins une fois lrsquoespegravece correspondante
Lrsquoaugmentation de la valeur de 119896 permet de donner plusdrsquoimportance aux espegraveces rares
Lrsquoindice peut ecirctre converti en nombre eacutequivalent drsquoes-pegraveces105 crsquoest-agrave-dire le nombre drsquoespegraveces eacutequiprobablesneacutecessaire pour obtenir la mecircme diversiteacute noteacutes 119896119863 agrave partirde la relation
119896119878 = 119896119863 [1 minus (1 minus 1119896119863)
119896] (351)
Lrsquoeacutequation doit ecirctre reacutesolue pour obtenir 119896119863 agrave partir de lavaleur de 119896119878 estimeacutee numeacuteriquement pour 119896 gt 3
58 Mesures neutres de la diversiteacute 120572 ou 120574
106A Chao et al laquo Rarefaction andExtrapolation with Hill Numbers A Framework for Sampling and Es-timation in Species Diversity Stu-dies raquo In Ecological Monographs841 (2014) p 45-67 doi 10189013-01331 Annexe S2
107T Leinster et C Cobboldlaquo Measuring Diversity The Impor-tance of Species Similarity raquo In Eco-logy 933 (2012) p 477-489 doi 10189010-24021
108C X Mao laquo Estimating Spe-cies Accumulation Curves and Diver-sity Indices raquo In Statistica Sinica 17(2007) p 761-774
109Dauby et O J Hardylaquo Sampled-Based Estimation of Di-versity Sensu Stricto by TransformingHurlbert Diversities into EffectiveNumber of Species raquo cf note 7p 12
110W Smith et J F Grasslelaquo Sampling Properties of a Family ofDiversity Measures raquo In Biometrics332 (1977) p 283-292 doi 1023072529778 JSTOR 2529778
Dans deux cas particuliers les nombres eacutequivalents drsquoes-pegraveces de Hurlbert sont identiques aux nombres de Hill 2119863 =2119863 et infin119863 = 0119863
Pour les autres ordres entiers de diversiteacute il existe unecorrespondance parfaite entre les deux mesures 106 la connais-sance de lrsquoune permet drsquoobtenir lrsquoautre Pour 119896 gt 1 on a107
119896119878 = 119896 +119896
sum119902=2
(119896119902)(minus1)119902+1(119902119863)1minus119902 (352)
On a vu que 0119863 eacutegale infin119863 donc infin119878 = 0119863 (351)Inversement pour 119902 gt 1
(119902119863)1minus119902 = 119902 +119902
sum119896=2
(119902119896)(minus1)119896+1
119896119878 (353)
Pour 119902 = 1 la relation est108
1119867 = minus1 +infin
sum119896=2
119896119878119896(119896 minus 1) (354)
EstimationHurlbert fournit un estimateur non biaiseacute de son indice
(119899 est la taille de lrsquoeacutechantillon 119899119904 le nombre drsquoindividus delrsquoespegravece 119904)
119896 119878 =119904119899
ne0
sum119904=1
[1 minus (119899 minus 119899119904119896 )(119899
119896)] (355)
Dauby et O J Hardy109 montrent que cet estimateur esttregraves peu sensible agrave la taille de lrsquoeacutechantillon et obtient demeilleurs reacutesultats sur ce point que les estimateurs de Chaoet Shen pour lrsquoindice de Shannon ou du nombre drsquoespegraveces WSmith et Grassle110 ont calculeacute sa variance
Le calcul de la diversiteacute de Hurlbert est possible dans en-tropart
Indice de Hurlbert (probabiliteacutes)Hurlbert(asProbaVector(colSums(BCI)) k = 2)
Biased 1973676
Estimateur sans biais (abondances)Hurlbert(colSums(BCI) k = 2)
Unbiased 1973721
34 Indice de Hurlbert 59
Nombre effectif despegravecesHurlbertD(colSums(BCI) k = 2)
Unbiased 3805308
1E C Pielou Ecological Diver-sity New York Wiley 1975
2H T Davis The Theory ofEconometrics Bloomington India-na The Principia Press 1941
3Theil Economics and Informa-tion Theory cf note 78 p 50
4Shannon laquo A Mathemati-cal Theory of Communication raquocf note 74 p 49 Shannon etWeaver The Mathematical Theoryof Communication cf note 74p 49
5E Maasoumi laquo A Compendiumto Information Theory in Economicsand Econometrics raquo In EconometricReviews 122 (1993) p 137-181 doi 10108007474939308800260
Chapitre 4
Entropie
Lrsquoentropie est la surprise moyenne apporteacutee par lrsquoobservation des indivi-dus drsquoune communauteacute drsquoautant plus grande qursquoun individu appartientagrave une espegravece plus rare Lrsquoentropie HCDT permet drsquounifier les indices clas-siques de diversiteacute son paramegravetre appeleacute ordre fixe lrsquoimportance don-neacutee aux espegraveces rares Lrsquoentropie drsquoordre 0 est la richesse celle drsquoordre 1lrsquoindice de Shannon celle drsquoordre 2 celui de Simpson Lrsquoentropie est lamoyenne du logarithme deacuteformeacute de la rareteacute des espegraveces deacutefinie commelrsquoinverse de leur probabiliteacuteLrsquoentropie va de pair avec la diversiteacute au sens strict (Nombres de Hill) le nombre drsquoespegraveces eacutequiprobables dont lrsquoentropie est la mecircme que cellede la communauteacute reacuteelle La diversiteacute est lrsquoexponentielle deacuteformeacutee delrsquoentropie Les profils de diversiteacute repreacutesentent la diversiteacute en fonction deson ordre et permettent la comparaison de communauteacutesLrsquoestimation de la diversiteacute est difficile pour des ordres infeacuterieurs agrave 0 5dans des taxocegravenes tregraves divers comme les arbres des forecircts tropicales
Lrsquoessentiel
Lrsquoentropie peut ecirctre entendue comme la surprise moyennefournie par lrsquoobservation drsquoun eacutechantillon Crsquoest intuitivementune bonne mesure de diversiteacute1 Ses proprieacuteteacutes matheacutematiquespermettent drsquounifier les mesures de diversiteacute dans un cadregeacuteneacuteral
41 Deacutefinition de lrsquoentropieLes textes fondateurs sont Davis2 et surtout Theil3 en eacuteco-
nomeacutetrie et Shannon4 pour la mesure de la diversiteacute Unerevue est fournie par Maasoumi5
Consideacuterons une expeacuterience dont les reacutesultats possiblessont 1199031 1199032 hellip 119903119878 La probabiliteacute drsquoobtenir 119903119904 est 119901119904 etp = (1199011 1199012 hellip 119901119878) est le vecteur composeacute des probabiliteacutesdrsquoobtenir chaque reacutesultat Les probabiliteacutes sont connues a prio-ri Tout ce qui suit est vrai aussi pour des valeurs de 119903 conti-nues dont on connaicirctrait la densiteacute de probabiliteacute
On considegravere maintenant un eacutechantillon de valeurs de 119903La preacutesence de 119903119904 dans lrsquoeacutechantillon est peu eacutetonnante si 119901119904est grande elle apporte peu drsquoinformation suppleacutementaire
61
62 Entropie
6G P Patil et C Taillie laquo Di-versity as a Concept and Its Measure-ment raquo In Journal of the AmericanStatistical Association 77379 (1982)p 548-561 doi 1023072287709 JS-TOR 2287709
7Ibid
par rapport agrave la simple connaissance des probabiliteacutes En re-vanche si 119901119904 est petite la preacutesence de 119903119904 est surprenante Ondeacutefinit donc une fonction drsquoinformation 119868(119901119904) deacutecroissantequand la probabiliteacute augmente de 119868(0) gt 0 (eacuteventuellement+infin) agrave 119868(1) = 0 Chaque valeur observeacutee dans lrsquoeacutechantillonapporte une certaine quantiteacute drsquoinformation dont la sommeest lrsquoinformation de lrsquoeacutechantillon Patil et Taillie6 appellentlrsquoinformation laquo rareteacute raquo
La quantiteacute drsquoinformation attendue de lrsquoexpeacuterience estsum119878
119904=1 119901119904119868(119901119904) = 119867(p) Si on choisit 119868 (119901119904) = minus ln (119901119904) 119867 (p)est lrsquoindice de Shannon mais bien drsquoautres formes de 119868 (119901119904)sont possibles 119867 (p) est appeleacutee entropie Crsquoest une mesurede lrsquoincertitude (de la volatiliteacute) du reacutesultat de lrsquoexpeacuterience Sile reacutesultat est certain (une seule valeur 119901119878 vaut 1) lrsquoentropieest nulle Lrsquoentropie est maximale quand les reacutesultats sonteacutequiprobables
Si p est la distribution des probabiliteacute des espegraveces dansune communauteacute Patil et Taillie7 montrent que
bull Si 119868 (119901119904) = (1 minus 119901119904)119901119904 alors 119867 (p) est le nombre drsquoes-pegraveces 119878 moins 1
bull Si 119868 (119901119904) = minus ln (119901119904) alors 119867 (p) est lrsquoindice de Shannon bull Si 119868 (119901119904) = 1 minus 119901119904 alors 119867 (p) est lrsquoindice de Simpson
Fig 41 Fonctions drsquoinformationutiliseacutees dans le nombre drsquoespegraveces(trait plein) lrsquoindice de Shannon
(pointilleacutes longs) et lrsquoindice deSimpson (pointilleacutes) Lrsquoinformation
apporteacutee par lrsquoobservationdrsquoespegraveces rares deacutecroicirct du nombre
drsquoespegraveces agrave lrsquoindice de Simpson
00
25
50
75
100
000 025 050 075 100p
I(p)
Ces trois fonctions drsquoinformation sont repreacutesenteacutees en fi-gure 41
Le code R neacutecessaire pour reacutealiser la figure est
I0 lt- function(p) (1 - p)pI1 lt- function(p) -log(p)I2 lt- function(p) 1 - pggplot(dataframe(x = c(0 1)) aes(x)) + stat_function(fun = I0) +
stat_function(fun = I1 lty = 2) + stat_function(fun = I2lty = 3) + coord_cartesian(ylim = c(0 10)) + labs(x = py = I(p))
42 Entropie relative 63
000
025
050
075
100
000 025 050 075 100p
H(p
)
Fig 42 Valeur de 119901119904119868(119901119904) dansle nombre drsquoespegraveces (trait plein)lrsquoindice de Shannon (pointilleacuteslongs) et lrsquoindice de Simpson(pointilleacutes) Les espegraveces rarescontribuent peu sauf pour lenombre drsquoespegraveces
8S Kullback et R A Leiblerlaquo On Information and Sufficiency raquoIn The Annals of Mathematical Sta-tistics 221 (1951) p 79-86 JSTOR 2236703
9Theil Economics and Informa-tion Theory cf note 78 p 50
La contribution de chaque espegravece agrave la valeur totale de lrsquoen-tropie est repreacutesenteacutee figure 42
Code R
H0 lt- function(p) 1 - pH1 lt- function(p) -p log(p)H2 lt- function(p) p (1 - p)ggplot(dataframe(x = c(0001 1)) aes(x)) + stat_function(fun = H0) +
stat_function(fun = H1 lty = 2) + stat_function(fun = H2lty = 3) + labs(x = p y = H(p))
42 Entropie relativeConsideacuterons maintenant les probabiliteacutes 119902119904 formant lrsquoen-
semble q obtenues par la reacutealisation de lrsquoexpeacuterience Ellessont diffeacuterentes des probabiliteacutes 119901119904 par exemple parce quelrsquoexpeacuterience ne srsquoest pas deacuterouleacutee exactement comme preacutevuOn deacutefinit le gain drsquoinformation 119868(119902119904 119901119904) comme la quantiteacutedrsquoinformation suppleacutementaire fournie par lrsquoobservation drsquounreacutesultat de lrsquoexpeacuterience connaissant les probabiliteacutes a prio-ri La quantiteacute totale drsquoinformation fournie par lrsquoexpeacuteriencesum119878
119904=1 119902119904119868(119902119904 119901119904) = 119867(q p) est souvent appeleacutee entropie rela-tive Elle peut ecirctre vue comme une distance entre la distribu-tion a priori et la distribution a posteriori Il est possible queles distributions p et q soit identiques que le gain drsquoinforma-tion soit donc nul mais les estimateurs empiriques nrsquoeacutetant pasexactement eacutegaux entre eux des tests de significativiteacute de lavaleur de (q p) seront neacutecessaires
Quelques formes possibles de 119867(q p) sont
bull La divergence de Kullback-Leibler8 connue par les eacuteco-nomistes comme lrsquoindice de dissimilariteacute de Theil 9
119879 =119878
sum119904=1
119902119904 ln 119902119904119901119904
(41)
64 Entropie
10Conceiccedilatildeo et Ferreira TheYoung Personrsquos Guide to the TheilIndex Suggesting Intuitive Inter-pretations and Exploring AnalyticalApplications cf note 79 p 50
11E Marcon et al laquo The Decom-position of Shannonrsquos Entropy and aConfidence Interval for Beta Diversi-ty raquo In Oikos 1214 (2012) p 516-522 doi 101111j1600-0706201119267x
12R H MacArthur laquo Fluctua-tions of Animal Populations and aMeasure of Community Stability raquoIn Ecology 363 (1955) p 533-536doi doi1023071929601
13R E Ulanowicz laquo InformationTheory in Ecology raquo In Computersamp Chemistry 254 (2001) p 393-399doi 101016S0097-8485(01)00073-0
bull Sa proche parente appeleacutee parfois deuxiegraveme mesure deTheil10 qui inverse simplement les rocircles de 119901 et 119902
119871 =119878
sum119904=1
119901119904 ln 119901119904119902119904
(42)
Fig 43 Valeur de 119902 ln(119902119901) enfonction de 119901 et 119902 La divergencede Kullback-Leibler est la somme
de cette valeur pour toutes lesespegraveces
00 02 04 06 08 10
00
02
04
06
08
10
q
p
minus03
minus02 minus01
0
02
05
1
2 3
4
Lrsquoentropie relative est essentielle pour la deacutefinition de ladiversiteacute 120573 preacutesenteacutee dans le chapitre 12 En se limitant agrave ladiversiteacute 120572 on peut remarquer que lrsquoindice de Shannon est ladivergence de Kullback-Leibler entre la distribution observeacuteeet lrsquoeacutequiprobabiliteacute des espegraveces11 Les valeurs de chaque termede la divergence sont repreacutesenteacutees en figure 43
Le code R neacutecessaire pour reacutealiser la figure est
p lt- q lt- seq(001 1 001)KB lt- function(p q) p log(pq)xyz lt- t(outer(p q FUN = KB))library(sp)image(xyz col = bpycolors(n = 100 cutofftails = 03 alpha = 06)
xlab = q ylab = p asp = 1)contour(xyz levels = c(seq(-03 0 01) c(02 05) seq(1
4 1)) labcex = 1 add = T)
43 Lrsquoappropriation de lrsquoentropie par labiodiversiteacute
MacArthur12 est le premier agrave avoir introduit la theacuteoriede lrsquoinformation en eacutecologie13 MacArthur srsquointeacuteressait aux reacute-seaux trophiques et cherchait agrave mesurer leur stabiliteacute lrsquoindicede Shannon qui comptabilise le nombre de relations possibleslui paraissait une bonne faccedilon de lrsquoeacutevaluer Mais lrsquoefficaciteacute
43 Lrsquoappropriation de lrsquoentropie par la biodiversiteacute 65
14A Reacutenyi laquo On Measures of En-tropy and Information raquo In 4th Ber-keley Symposium on MathematicalStatistics and Probability Sous ladir de J Neyman T 1 BerkeleyUSA University of California Press1961 p 547-561
15Patil et Taillie laquo Diversity as aConcept and Its Measurement raquo cfnote 6 p 62
16H Dalton laquo The Measure-ment of the Inequality of Incomes raquoIn The Economic Journal 30119(1920) p 348-361 doi 10 2307 2223525
17M O Hill laquo Diversity andEvenness A Unifying Notation andIts Consequences raquo In Ecology 542(1973) p 427-432 doi 10 2307 1934352
18S H Hurlbert laquo The Noncon-cept of Species Diversity A Cri-tique and Alternative Parameters raquocf note 69 p 48
implique la speacutecialisation ignoreacutee dans 119867 qui est une mesureneutre (toutes les espegraveces y jouent le mecircme rocircle) MacArthura abandonneacute cette voie
Les premiers travaux consistant agrave geacuteneacuteraliser lrsquoindice deShannon sont dus agrave Reacutenyi14 Lrsquoentropie drsquoordre 119902 de Reacutenyi est
119902119877 = 11 minus 119902 ln sum119878
119902=1 119901119902119904 (43)
Reacutenyi pose eacutegalement les axiomes pour une mesure drsquoen-tropie 119877 (p) ougrave p = (1199011 1199012 hellip 119901119878)
bull La symeacutetrie les espegraveces doivent ecirctre interchangeablesaucune nrsquoa de rocircle particulier et leur ordre est indiffeacute-rent
bull La mesure doit ecirctre continue par rapport aux probabili-teacutes
bull La valeur maximale est atteinte si toutes les probabiliteacutessont eacutegales
Il montre que 119902119877 respecte les 3 axiomesPatil et Taillie15 ont montreacute de plus que
bull Lrsquointroduction drsquoune espegravece dans une communauteacute aug-mente sa diversiteacute (conseacutequence de la deacutecroissance de119892(119901119904))
bull Le remplacement drsquoun individu drsquoune espegravece freacutequentepar un individu drsquoune espegravece plus rare augmente lrsquoentro-pie agrave condition que 119877(p) soit concave Dans la litteacuteratureeacuteconomique sur les ineacutegaliteacutes cette proprieacuteteacute est connuesous le nom de Pigou-Dalton16
Hill17 transforme lrsquoentropie de Reacutenyi en nombres de Hillqui en sont simplement lrsquoexponentielle
119902119863 = (119878
sum119904=1
119901119902119904)
11minus119902
(44)
Le souci de Hill eacutetait de rendre les indices de diversiteacute in-telligibles apregraves lrsquoarticle remarqueacute de S H Hurlbert18 intituleacutelaquo le non-concept de diversiteacute speacutecifique raquo Hurlbert reprochait agravela litteacuterature sur la diversiteacute sa trop grande abstraction et soneacuteloignement des reacutealiteacutes biologiques notamment en fournis-sant des exemples dans lesquels lrsquoordre des communauteacutes nrsquoestpas le mecircme selon lrsquoindice de diversiteacute choisi Les nombres deHill sont le nombre drsquoespegraveces eacutequiprobables donnant la mecircmevaleur de diversiteacute que la distribution observeacutee Ils sont destransformations simples des indices classiques
66 Entropie
19J A Stoddart laquo A Genoty-pic Diversity Measure raquo In Jour-nal of Heredity 74 (1983) p 489-490doi 101093oxfordjournalsjhereda109852
20R H MacArthur laquo Patterns ofSpecies Diversity raquo In BiologicalReviews 404 (1965) p 510-533 doi 101111j1469-185X1965tb00815x
21M A Adelman laquo Comment onthe rdquoHrdquo Concentration Measure as aNumbers-Equivalent raquo In The Re-view of Economics and Statistics511 (1969) p 99-101 doi 1023071926955
22H-R Gregorius laquo On theConcept of Effective Number raquoIn Theoretical population bio-logy 402 (1991) p 269-83 doi 10 1016 0040 - 5809(91 ) 90056 - LPMID 1788824
23S Wright laquo Evolution in Men-delian Populations raquo In Genetics162 (1931) p 97-159
24H-R Gregorius laquo Partitioningof Diversity The rdquowithin Communi-tiesrdquo Component raquo In Web Ecology14 (2014) p 51-60 doi 105194we-14-51-2014
25Ricotta et Avena laquo AnInformation-Theoretical Measure ofTaxonomic Diversity raquo cf note 3p 25
bull 0119863 est le nombre drsquoespegraveces bull 1119863 = 119890119867 lrsquoexponentielle de lrsquoindice de Shannon bull 2119863 = 1(1 minus 119864) lrsquoinverse de lrsquoindice de concentration de
Simpson connu sous le nom drsquoindice de Stoddart19
Ces reacutesultats avaient deacutejagrave eacuteteacute obtenus avec une autre ap-proche par MacArthur20 et repris par Adelman21 dans la lit-teacuterature eacuteconomique
Les nombres de Hill sont des laquo nombres effectifs raquo oulaquo nombres eacutequivalents raquo Le concept a eacuteteacute deacutefini rigoureu-sement par Gregorius22 drsquoapregraves S Wright23 (qui avait lepremier deacutefini la taille effective drsquoune population) eacutetantdonneacute une variable caracteacuteristique (ici lrsquoentropie) fonctionseulement drsquoune variable numeacuterique (ici le nombre drsquoespegraveces)dans un cas ideacuteal (ici lrsquoeacutequiprobabiliteacute des espegraveces) lenombre effectif est la valeur de la variable numeacuterique pourlaquelle la variable caracteacuteristique est celle du jeu de donneacutees
Gregorius24 montre que de nombreux autres indicesde diversiteacute sont acceptables dans le sens ougrave ils veacuterifientles axiomes preacuteceacutedents et de plus que la diversiteacute drsquounassemblage de communauteacutes est obligatoirement supeacuterieureagrave la diversiteacute moyenne de ces communauteacutes (lrsquoeacutegaliteacute nrsquoeacutetantpossible que si les communauteacutes sont toutes identiques) Cettederniegravere proprieacuteteacute sera traiteacutee en deacutetail dans la partie consa-creacutee agrave la deacutecomposition de la diversiteacute Ces indices doiventveacuterifier deux proprieacuteteacutes leur fonction drsquoinformation doitecirctre deacutecroissante et ils doivent ecirctre une fonction strictementconcave de 119901119904 Parmi les possibiliteacutes 119868(119901119904) = cos (1199011199041205872) estenvisageable par exemple le choix de la fonction drsquoinfor-mation est virtuellement illimiteacute mais seules quelques unesseront interpreacutetables clairement
Un nombre eacutequivalent drsquoespegraveces existe pour tous ces in-dices il est toujours eacutegal agrave lrsquoinverse de lrsquoimage de lrsquoindice parla reacuteciproque de la fonction drsquoinformation
119863 = 1119868minus1 (sum119878
119904=1 119901119904119868(119901119904)) (45)
Drsquoautres entropies ont eacuteteacute utliseacutees avec plus ou moins desuccegraves Par exemple Ricotta et Avena25 proposent drsquoutiliserla fonction drsquoinformation 119868(119901119904) = minus ln(119896119904) ougrave 119896119904 est la dissi-milariteacute totale de lrsquoespegravece 119904 avec les autres (par exemple lasomme des distances aux autres espegraveces dans un arbre phylo-geacuteneacutetique voir section 62) normaliseacutee pour que sum119904 119896119904 = 1Ainsi les espegraveces les plus originales apportent peu drsquoinforma-tion ce qui nrsquoest pas tregraves intuitif Les auteurs montrent queleur mesure est la somme de lrsquoentropie de Shannon et de ladivergence de Kullback-Leibler entre les probabiliteacutes et les dis-
44 Entropie HCDT 67
26C Ricotta et L Szeidl laquo To-wards a Unifying Approach to Di-versity Measures Bridging the Gapbetween the Shannon Entropy andRaorsquos Quadratic Index raquo In Theore-tical Population Biology 703 (2006)p 237-243 doi 101016jtpb200606003
27C Tsallis laquo Possible Genera-lization of Boltzmann-Gibbs Statis-tics raquo In Journal of Statistical Phy-sics 521 (1988) p 479-487 doi 101007BF01016429
28J Havrda et F Charvaacutetlaquo Quantification Method of Classifica-tion Processes Concept of StructuralAlpha-Entropy raquo In Kybernetika 31(1967) p 30-35
29Z Daroacuteczy laquo Generalized Infor-mation Functions raquo In Informationand Control 161 (1970) p 36-51doi 101016s0019-9958(70)80040-7
30Mendes et al laquo A Unified Indexto Measure Ecological Diversity andSpecies Rarity raquo cf note 70 p 48
31C Ricotta laquo On Parametric Di-versity Indices in Ecology A Histo-rical Note raquo In Community Ecology62 (2005) p 241-244 doi 101556ComEc62005212
32Patil et Taillie laquo Diversity as aConcept and Its Measurement raquo cfnote 6 p 62
33C J Keylock laquo Simpson Diver-sity and the Shannon-Wiener Index asSpecial Cases of a Generalized Entro-py raquo In Oikos 1091 (2005) p 203-207 doi 101111j0030-1299200513735x
34L Jost laquo Entropy and Diversi-ty raquo In Oikos 1132 (2006) p 363-375 doi 10 1111 j 2006 0030 -1299 14714 x L Jost laquo Partitio-ning Diversity into Independent Al-pha and Beta Components raquo In Eco-logy 8810 (2007) p 2427-2439 doi 10189006-17361
35C Tsallis laquo What Are the Num-bers That Experiments Provide raquoIn Quiacutemica Nova 176 (1994)p 468-471
36G E P Box et D R Cox laquo AnAnalysis of Transformations raquo In Journal of the Royal Statistical So-ciety Series B (Statistical Metho-dology) 262 (1964) p 211-252 doi 101111j2517-61611964tb00553xJSTOR 2984418
similariteacutes des espegraveces Ricotta et Szeidl26 ont deacutefini plus tardune entropie augmentant avec lrsquooriginaliteacute de chaque espegravecepreacutesenteacutee au chapitre 9
44 Entropie HCDTTsallis27 propose une classe de mesures appeleacutee entropie
geacuteneacuteraliseacutee deacutefinie par Havrda et Charvaacutet28 pour la premiegraverefois et redeacutecouverte plusieurs fois notamment par Daroacuteczy29
drsquoougrave son nom entropie HCDT (voir Mendes et al30 page 451pour un historique complet)
119902119867 = 1119902 minus 1 (1 minus
119878sum119904=1
119901119902119904) (46)
Tsallis a montreacute que les indices de Simpson et de Shannoneacutetaient des cas particuliers drsquoentropie geacuteneacuteraliseacutee retrouvantsans faire le rapprochement31 la deacutefinition drsquoun indice de di-versiteacute de Patil et Taillie32
Ces reacutesultats ont eacuteteacute compleacuteteacutes par drsquoautres et repris eneacutecologie par Keylock33 et Jost34 Lagrave encore
bull Le nombre drsquoespegraveces moins 1 est 0119867 bull Lrsquoindice de Shannon est 1119867 bull Lrsquoindice de Gini-Simpson est 2119867
Lrsquoentropie HCDT est particuliegraverement attractive parce quesa relation avec la diversiteacute au sens strict est simple apregraves in-troduction du formalisme adapteacute (les logarithmes deacuteformeacutes)Son biais drsquoestimation peut ecirctre corrigeacute globalement et nonseulement pour les cas particuliers (nombre drsquoespegraveces Shan-non Simpson) Enfin sa deacutecomposition sera preacutesenteacutee en deacute-tail dans le chapitre 12
Logarithmes deacuteformeacutesLrsquoeacutecriture de lrsquoentropie HCDT est largement simplifieacutee en
introduisant le formalisme des logarithmes deacuteformeacutes35 Le lo-garithme drsquoordre 119902 est deacutefini par
ln119902 119909 = 1199091minus119902 minus 11 minus 119902 (47)
dont la forme est identique agrave la transformation de Box et Cox36
utiliseacutee en statistiques pour normaliser une variableLe logarithme deacuteformeacute converge vers le logarithme naturel
quand 119902 rarr 1 (figure 44)Le code R neacutecessaire pour reacutealiser la figure est
68 Entropie
ln0 lt- function(p) lnq(p 0)ln2 lt- function(p) lnq(p 2)lnm1 lt- function(p) lnq(p -1)ggplot(dataframe(x = c(0 1)) aes(x)) +
stat_function(fun = log) +stat_function(fun = ln0 lty = 2 col = red) +stat_function(fun = ln2 lty = 3 col = blue) +stat_function(fun = lnm1 lty = 4 col = green) +coord_cartesian(ylim = c(-4 0)) +labs(x = p y = expression(ln[q](p)))
Sa fonction inverse est lrsquoexponentielle drsquoordre 119902
119890119909119902 = [1 + (1 minus 119902) 119909]
11minus119902 (48)
Fig 44 Valeur du logarithmedrsquoordre 119902 de probabiliteacutes entre 0 et
1 pour diffeacuterentes valeurs de 119902 119902 = 0 (pointilleacutes longs rouges) la
courbe est une droite 119902 = 1 (traitplein) logarithme naturel 119902 = 2
(pointilleacutes courts bleus) la courbea la mecircme forme que le logarithme
naturel pour les valeurs positivesde 119902 119902 = minus1 (pointilleacutes alterneacutes
verts) la courbe est convexe pourles valeurs neacutegatives de 119902
minus4
minus3
minus2
minus1
0
000 025 050 075 100p
lnq(p
)
Enfin le logarithme deacuteformeacute est subadditif
ln119902 (119909119910) = ln119902 119909 + ln119902 119910 minus (119902 minus 1) (ln119902 119909) (ln119902 119910) (49)
Ses proprieacuteteacutes sont les suivantes
ln1199021119909 = minus119909119902minus1 ln119902 119909 (410)
ln119902 (119909119910) = ln119902 119909 + 1199091minus119902 ln119902 119910 (411)
ln119902 (119909119910 ) = ln119902 119909 minus (119909
119910 )1minus119902
ln119902 119910 (412)
et
119890119909+119910119902 = 119890119909
119902 119890119910
1+(1minus119902)119909119902 (413)
Si 119902 gt 1 lim119909rarr+infin (ln119902 119909) = 1(119902 minus 1) donc 119890119909119902 nrsquoest pas
deacutefinie pour 119909 gt 1(119902 minus 1)
44 Entropie HCDT 69
37E Marcon et al laquo Generaliza-tion of the Partitioning of ShannonDiversity raquo In Plos One 93 (2014)e90289 doi 101371journalpone0090289
38Jost laquo Entropy and Diversity raquocf note 34 p 67
39Jost laquo Partitioning Diversityinto Independent Alpha and BetaComponents raquo cf note 34 p 67
40S Hoffmann et A Hoffmannlaquo Is There a rdquoTruerdquo Diversity raquo In Ecological Economics 652 (2008)p 213-215 doi 101016jecolecon200801009
41L Jost laquo Mismeasuring Biologi-cal Diversity Response to Hoffmannand Hoffmann (2008) raquo In Ecologi-cal Economics 68 (2009) p 925-928doi 101016jecolecon200810015
La deacuteriveacutee du logarithme deacuteformeacute est quel que soit 119902
lnprime119902 (119909) = 119909minus119902 (414)
Les deacuteriveacutees premiegravere et seconde de lrsquoexponentielle deacutefor-meacutee sont quel que soit 119902
expprime119902 (119909) = (119890119909
119902 )119902 (415)
expPrime119902 (119909) = (119890119909
119902 )2119902minus1 (416)
Ces fonctions sont impleacutementeacutees dans le package entro-part lnq(x q) et expq(x q)
Lrsquoentropie drsquoordre 119902 srsquoeacutecrit
119902119867 = 1119902 minus 1 (1 minus
119878sum119904=1
119901119902119904) = minus sum
119904119901119902
119904 ln119902 119901119904 = sum119904
119901119904 ln1199021119901119904
(417)Ces trois formes sont eacutequivalentes mais les deux derniegraveres
srsquointerpregravetent comme une geacuteneacuteralisation de lrsquoentropie de Shan-non37
Le calcul de 119902119867 peut se faire avec la fonction Tsallis dela librairie entropart
Ps lt- asProbaVector(colSums(BCI))q lt- 15Tsallis(Ps q)
None 1715954
Entropie et diversiteacuteOn voit immeacutediatement que lrsquoentropie de Tsallis est le lo-
garithme drsquoordre 119902 du nombre de Hill correspondant commelrsquoentropie de Reacutenyi en est le logarithme naturel
119902119867 = ln119902119902119863 (418)
119902119863 = 119890119902119867119902 (419)
Lrsquoentropie est utile pour les calculs la correction des biaisdrsquoestimation notamment Les nombres de Hill ou nombreseacutequivalents drsquoespegraveces ou nombres effectif drsquoespegraveces permettentune appreacutehension plus intuitive de la notion de biodiversiteacute38
En raison de leurs proprieacuteteacutes notamment de deacutecomposition(voir le chapitre 12) Jost39 les appelle laquo vraie diversiteacute raquo SHoffmann et A Hoffmann40 critiquent cette deacutefinition totali-taire et fournissent une revue historique plus lointaine sur les
70 Entropie
42Dauby et O J Hardylaquo Sampled-Based Estimation of Di-versity Sensu Stricto by TransformingHurlbert Diversities into EffectiveNumber of Species raquo cf note 7p 12
43H-R Gregorius laquo Linking Di-versity and Differentiation raquo In Di-versity 23 (2010) p 370-394 doi 103390d2030370
44A Chao et al laquo Phylogene-tic Diversity Measures Based onHill Numbers raquo In PhilosophicalTransactions of the Royal Socie-ty of London Series B Biologi-cal Sciences 3651558 (2010) p 3599-3609 doi 10 1098 rstb 2010 0272Supplementary
45Hill laquo Diversity and Evenness A Unifying Notation and Its Conse-quences raquo cf note 17 p 65
46W H Berger et F L Parkerlaquo Diversity of Planktonic Foramini-fera in Deep-Sea Sediments raquo In Science 1683937 (1970) p 1345-1347 doi 101126science16839371345
origines de ces mesures Jost41 reconnaicirct qursquoun autre termeaurait pu ecirctre choisi (laquo diversiteacute neutre raquo ou laquo diversiteacute matheacute-matique raquo par exemple)
Dauby et O J Hardy42 eacutecrivent laquo diversiteacute au sens strict raquo Gregorius43 laquo diversiteacute explicite raquo
Quoi qursquoil en soit les nombres de Hill respectent le principede reacuteplication (voir Chao et al44 section 3 pour une discus-sion et un historique) si 119868 communauteacutes de mecircme taille demecircme niveau de diversiteacute 119863 mais sans espegraveces en communsont regroupeacutees dans une meacuteta-communauteacute la diversiteacute dela meacuteta-communauteacute doit ecirctre 119868 times 119863
Lrsquointeacuterecirct de ces approches est de fournir une deacutefinitionparameacutetrique de la diversiteacute qui donne plus ou moins drsquoim-portance aux espegraveces rares
bull minusinfin119863 = 1min(119901119878) est lrsquoinverse de la proportion de lacommunauteacute repreacutesenteacutee par lrsquoespegravece la plus rare (toutesles autres espegraveces sont ignoreacutees) Le biais drsquoestimationest incontrocirclable lrsquoespegravece la plus rare nrsquoest pas danslrsquoeacutechantillon tant que lrsquoinventaire nrsquoest pas exhaustif
bull 0119863 est le nombre drsquoespegraveces (alors que 0119867 est le nombredrsquoespegraveces moins 1) Crsquoest la mesure classique qui donnele plus drsquoimportance aux espegraveces rares toutes les es-pegraveces ont la mecircme importance quel que soit leur effectifen termes drsquoindividus Il est bien adapteacute agrave une approchepatrimoniale celle du collectionneur qui considegravere quelrsquoexistence drsquoune espegravece suppleacutementaire a un inteacuterecirct ensoi par exemple parce qursquoelle peut contenir une moleacute-cule valorisable Comme les espegraveces rares sont difficilesagrave eacutechantillonner le biais drsquoestimation est tregraves importantet sa reacutesolution a geacuteneacutereacute une litteacuterature en soi
bull 1119863 est lrsquoexponentielle de lrsquoindice de Shannon donne lamecircme importance agrave tous les individus Il est adapteacute agraveune approche drsquoeacutecologue inteacuteresseacute par les interactionspossibles le nombre de combinaisons drsquoespegraveces en estune approche satisfaisante Le biais drsquoestimation est sen-sible
bull 2119863 est lrsquoinverse de lrsquoindice de concentration de Gini-Simpson donne moins drsquoimportance aux espegraveces raresHill45 lrsquoappelle laquo le nombre drsquoespegraveces tregraves abondantes raquoIl comptabilise les interactions possibles entre pairesdrsquoindividus les espegraveces rares interviennent dans peu depaires et influent peu sur lrsquoindice En conseacutequence lebiais drsquoestimation est tregraves petit de plus un estimateurnon biaiseacute existe
bull infin119863 = 1119889 est lrsquoinverse de lrsquoindice de Berger-Parker46 quiest la proportion de la communauteacute repreacutesenteacutee par lrsquoes-pegravece la plus abondante 119889 = max(p) Toutes les autres
45 Profils de diversiteacute 71
47R Gadagkar laquo An UndesirableProperty of Hillrsquos Diversity IndexN2 raquo In Oecologia 80 (1989) p 140-141 doi 101007BF00789944
48Leinster et Cobbold laquo Measu-ring Diversity The Importance ofSpecies Similarity raquo cf note 107p 58
49Hill laquo Diversity and Evenness A Unifying Notation and Its Conse-quences raquo cf note 17 p 65
50Patil et Taillie laquo Diversity as aConcept and Its Measurement raquo cfnote 6 p 62
51B Tothmeresz laquo Comparison ofDifferent Methods for Diversity Or-dering raquo In Journal of VegetationScience 62 (1995) p 283-290 doi 1023073236223
52R Kindt et al laquo Tree Diversi-ty in Western Kenya Using Profilesto Characterise Richness and Even-ness raquo In Biodiversity and Conser-vation 154 (2006) p 1253-1270 doi 101007s10531-005-0772-x
53Tothmeresz cf note 5154R Lande et al laquo When Spe-
cies Accumulation Curves Intersect Implications for Ranking DiversityUsing Small Samples raquo In Oikos 893(2000) p 601-605 doi 101034j1600-07062000890320x
espegraveces sont ignoreacutees
Le calcul de 119902119863 peut se faire avec la fonction Diversityde la librairie entropart
Ps lt- asProbaVector(colSums(BCI))q lt- 15Diversity(Ps q)
None 4957724
Les proprieacuteteacutes matheacutematiques de la diversiteacute ne sont pascelles de lrsquoentropie Lrsquoentropie doit ecirctre une fonction concavedes probabiliteacutes comme on lrsquoa vu plus haut mais pas la di-versiteacute (un exemple de confusion est fourni par Gadagkar47
qui reproche agrave 2119863 de ne pas ecirctre concave) Lrsquoentropie est unemoyenne pondeacutereacutee par les probabiliteacutes de la fonction drsquoin-formation crsquoest donc une fonction lineacuteaire des probabiliteacutesproprieacuteteacute importante pour deacutefinir lrsquoentropie 120572 (section 103)comme la moyenne des entropies de plusieurs communauteacutesou lrsquoentropie phylogeacuteneacutetique (chapitre 8) comme la moyennede lrsquoentropie sur les peacuteriodes drsquoun arbre La diversiteacute nrsquoest pasune fonction lineacuteaire des probabiliteacutes la diversiteacute moyennenrsquoest en geacuteneacuteral pas la moyenne des diversiteacutes
SynthegraveseLrsquoinverse de la probabiliteacute drsquoune espegravece 1119901119904 deacutefinit sa
rareteacute Lrsquoentropie est la moyenne du logarithme de la rareteacute
119902119867 = 1119902 minus 1 (1 minus
119878sum119904=1
119901119902119904) = sum
119904119901119904 ln119902
1119901119904
(420)
La diversiteacute est son exponentielle
119902119863 = 119890119902119867119902 (421)
45 Profils de diversiteacuteLeinster et Cobbold48 apregraves Hill49 Patil et Taillie50 Toth-
meresz51 et Kindt et al52 recommandent de tracer des profilsde diversiteacute crsquoest-agrave-dire la valeur de la diversiteacute 119902119863 en fonctionde lrsquoordre 119902 (figure 45) pour comparer plusieurs communau-teacutes Une communauteacute peut ecirctre deacuteclareacutee plus diverse qursquouneautre si son profil de diversiteacute est au-dessus de lrsquoautre pourtoutes les valeurs de 119902 Si les courbes se croisent il nrsquoy a pasde relation drsquoordre53
72 Entropie
55P Pallmann et al laquo Asses-sing Group Differences in Biodiversi-ty by Simultaneously Testing a User-Defined Selection of Diversity In-dices raquo In Molecular Ecology Re-sources 126 (2012) p 1068-1078doi 1011111755-099812004
56C Liu et al laquo Unifying and Dis-tinguishing Diversity Ordering Me-thods for Comparing Communities raquoIn Population Ecology 492 (2006)p 89-100 doi 101007s10144-006-0026-0
57Patil et Taillie laquo Diversity as aConcept and Its Measurement raquo cfnote 6 p 62
Lande et al54 montrent que si la diversiteacute de Simpson et larichesse de deux communauteacutes nrsquoont pas le mecircme ordre alorsles courbes drsquoaccumulation du nombre drsquoespegraveces en fonctiondu nombre drsquoindividus eacutechantillonneacutes se croisent aussi
Fig 45 Profil de diversiteacutecalculeacute pour deux parcelles de
Paracou (Parcelle 6 trait plein etParcelle 18 trait pointilleacute) Lacorrection du biais drsquoestimation
est celle de Chao et Jost
100
200
300
00 05 10 15 20q
Div
ersi
teacute
Code R pour reacutealiser la figure 45
qseq lt- seq(0 2 1)P6Dlt- CommunityProfile(Diversity Paracou618MC$Nsi[ 1] qseq)P18Dlt- CommunityProfile(Diversity Paracou618MC$Nsi[ 2] qseq)autoplot(P6D xlab = q ylab = Diversiteacute) +
geom_line(aes(x y) asdataframelist(P18D) lty = 2)
Pallmann et al55 ont deacuteveloppeacute un test statistique pourcomparer la diversiteacute de deux communauteacutes pour plusieursvaleurs de 119902 simultaneacutement
C Liu et al56 nomment seacuteparables des communauteacutes dontles profils ne se croisent pas Ils montrent que des communau-teacutes peuvent ecirctre seacuteparables en selon un profil de diversiteacute de 119902119863sans lrsquoecirctre forceacutement selon un profil de diversiteacute de Hurlbert(section 34) et inversement Ils montrent que les communau-teacutes seacuteparables selon un troisiegraveme type de profil celui de laqueue de distribution57 le sont dans tous les cas Le profil dela queue de distribution est construit en classant les espegravecesde la plus freacutequente agrave la plus rare et en traccedilant la probabiliteacuteqursquoun individu appartienne agrave une espegravece plus rare que lrsquoespegraveceen abscisse (figure 46)
Code R
Elimination des espegraveces absentes des deux parcellesPsi lt- asdataframe(Paracou618MC$Psi[Paracou618MC$Ps gt 0
])Psi[ 1] ltgt
sort gtcumsum gtrev
Psi[ 2] ltgtsort gtcumsum gt
46 Estimation de lrsquoentropie 73
000
025
050
075
100
1 10 100Espegraveces
Freacute
quen
ce
Fig 46 Profil de queue dedistribution calculeacute pour les deuxparcelles de Paracou (Parcelle 6 trait plein et Parcelle 18 traitpointilleacute) En abscisse rang delrsquoespegravece dans le classement de laplus freacutequente agrave la plus rare enordonneacutee probabiliteacute qursquounindividu de la communauteacuteappartienne agrave une espegravece plus rare
58L Fattorini et M Marchesellilaquo Inference on Intrinsic Diversity Pro-files of Biological Populations raquo In Environmetrics 105 (1999) p 589-599 doi 10 1002 (SICI ) 1099 -095X(199909 10 ) 10 5lt589 AID -ENV374gt30CO2-0
59Z Zhang et M Grabchak laquo En-tropic Representation and Estima-tion of Diversity Indices raquo In Jour-nal of Nonparametric Statistics 283(2016) p 563-575 doi 10 1080 1048525220161190357
60Z Zhang et J Zhou laquo Re-Parameterization of Multinomial Dis-tributions and Diversity Indices raquo In Journal of Statistical Planning andInference 1407 (2010) p 1731-1738doi 101016jjspi200912023
revPsi$x lt- 1nrow(Psi)ggplot(Psi aes(x)) + geom_path(aes(y = P006)) + geom_path(aes(y = P018)
lty = 2) + labs(x = Espegraveces y = Freacutequence) + scale_x_log10()
Les coordonneacutees des points du profil sont deacutefinies par
119910(119909) =119878
sum119904=119909+1
119901[119904] 119909 isin 0 1 hellip 119878 (422)
119901[119904] est la probabiliteacute de lrsquoespegravece 119904 les espegraveces sont classeacuteespar probabiliteacute deacutecroissante
Ce profil est exhaustif (toutes les espegraveces sont repreacutesenteacutees)alors que les autres profils de diversiteacute ne sont repreacutesenteacutes quepour un intervalle restreint du paramegravetre et qursquoun croisementde courbes peut se produire au-delagrave En revanche il ne prendpas en compte les espegraveces non observeacutees
Fattorini et Marcheselli58 proposent un test pour compa-rer deux profils de queue de distribution agrave partir drsquoeacutechantillon-nages multiples (neacutecessaires pour eacutevaluer la variance de cha-cune des probabiliteacutes) mais qui neacuteglige les espegraveces non obser-veacutees
46 Estimation de lrsquoentropieZhang et Grabchak
Z Zhang et Grabchak59 montrent que toutes les mesuresdrsquoentropie usuelles sont des combinaisons lineacuteaires de 120577119906119907(340) Agrave partir des estimateurs de 12057711990611990760 lrsquoestimateur suivantest proposeacute pour ℎ119902 = sum119878
119904=1 119901119902119904
ℎ119902 = 1 +119904119899
ne0
sum119904=1
119899119904119899
119899minus119899119904
sum119907=1
[119907
prod119894=1
119894 minus 119902119894 ] [
119907prod119895=1
(1 minus 119899119904 minus 1119899 minus 119895 )] (423)
74 Entropie
61Z Zhang laquo Entropy Estimationin Turingrsquos Perspective raquo cf note 89p 52
62Mao laquo Estimating Species Ac-cumulation Curves and Diversity In-dices raquo cf note 108 p 58 Vincket al laquo Estimation of the EntropyBased on Its Polynomial Representa-tion raquo cf note 92 p 52 Chao et allaquo Entropy and the Species Accumu-lation Curve A Novel Entropy Es-timator via Discovery Rates of NewSpecies raquo cf note 94 p 53 AnnexeS1
63A Chao et L Jost laquo Estima-ting Diversity and Entropy Profilesvia Discovery Rates of New Species raquoIn Methods in Ecology and Evolu-tion 68 (2015) p 873-882 doi 1011112041-210X12349
64Chao et al laquo Entropy and theSpecies Accumulation Curve A No-vel Entropy Estimator via DiscoveryRates of New Species raquo cf note 94p 53
65Chao et Jost cf note 63
ℎ119902 peut ensuite ecirctre utiliseacute pour lrsquoestimation de lrsquoentropieHCDT
119902 = 1 minus ℎ119902119902 minus 1 (424)
Lrsquoestimateur est asymptotiquement normal et son biais deacute-croit exponentiellement vite
ℎ119902 nrsquoest deacutefini que pour 119902 ne 1 Lrsquoestimateur corrigeacute de 1119867est
1 =119904119899
ne0
sum119904=1
119899119904119899
119899minus119899119904
sum119907=1
1119907 [
119907prod119895=1
1 minus 119899119904 minus 1119899 minus 119895 ] (425)
Cet estimateur est diffeacuterent de 11986711991161 Il a eacuteteacute eacutegalementobtenu par drsquoautres auteurs62 avec drsquoautres approches
Dans entropart utiliser Tsallis et Diversity
Tsallis(Paracou618MC$Ns q = 1 Correction = ZhangGrabchak)
ZhangGrabchak 4846407
Diversity(Paracou618MC$Ns q = 1 Correction = ZhangGrabchak)
ZhangGrabchak 1272823
Chao et JostChao et Jost63 complegravetent cet estimateur par une es-
timation du biais reacutesiduel selon la mecircme deacutemarche quepour lrsquoentropie de Shannon64 ℎ119902 srsquoeacutecrit sous la forme dela somme infinie des entropies de Simpson geacuteneacuteraliseacutees ℎ119902 = suminfin
119896=0 (119902minus1119896 )(minus1)1198961205771119896 Alors que lrsquoestimateur de Zhang et
Grabchak ne prend en compte que les 119899 minus 1 premiers termesde la somme pour un estimateur sans biais Chao et Jost65
eqn 5 le complegravetent par une estimation forceacutement biaiseacuteedes termes suivants pour obtenir
119902 = 1119902 minus 1 (426)
[1 minus ℎ119902 minus 1199041119899 (1 minus 119860)1minus119899 (119860119902minus1 minus
119899minus1sum119903=0
(119902 minus 1119903 )(119860 minus 1)119903)]
(427)
La formule du nombre de combinaisons est geacuteneacuteraliseacutee auxvaleurs de 119902 minus 1 non entiegraveres et vaut par convention 1 pour119903 = 0 119860 vaut
46 Estimation de lrsquoentropie 75
66Chao et al laquo Entropy and theSpecies Accumulation Curve A No-vel Entropy Estimator via DiscoveryRates of New Species raquo cf note 94p 53
67Chao et Jost laquo Coverage-BasedRarefaction and Extrapolation Stan-dardizing Samples by CompletenessRather than Size raquo cf note 6 p 12
68Good laquo The Population Fre-quency of Species and the Estima-tion of Population Parameters raquo cfnote 3 p 11
bull 21199042[(119899 minus 1) 1199041 + 21199042] en preacutesence de singletons et dou-bletons
bull 2[(119899 minus 1) (1199041 minus 1) + 2] en preacutesence de singletons seule-ment
bull 1 en absence de singletons et doubletons
Cet estimateur est le plus performant Quand 119902 rarr 1 iltend vers lrsquoestimateur de lrsquoentropie de Shannon de Chao etal66 eacutequation (343) Quand 119902 = 0 lrsquoestimateur se reacuteduit agraveChao1 Pour toutes les valeurs entiegraveres de 119902 supeacuterieures oueacutegales agrave 2 il se reacuteduit agrave lrsquoestimateur (424) identique agrave lrsquoesti-mateur de Lande pour 119902 = 2 et est sans biais
Lrsquoestimateur est obtenu agrave partir de celui du taux de couver-ture extrapoleacute (section 23) fourni par Chao et Jost67 annexeE sans le deacutetail de la deacutemonstration preacutesenteacute ici Lrsquoespeacuteranceconditionnelle du taux de couverture dans un eacutechantillon detaille 119899+119898 compte-tenu des effectifs observeacutes noteacutes 119899119904 est
120124 (119862119899+119898|119899119904) = 119862119899+sum119904
119901119904[1 minus (1 minus 119901119904)119898]1(119899119904 = 0) (428)
Le taux de couverture 119862119899 est augmenteacute par lrsquoeacutechantillon-nage de 119898 individus suppleacutementaires si les espegraveces non eacutechan-tillonneacutees (veacuterifiant 1(119899119904 = 0)) sont deacutecouvertes (la probabili-teacute de le faire est 1 minus (1 minus 119901119904)119898)
119862119899 + sum119904 1199011199041(119899119904 = 0) vaut par deacutefinition 1Le deuxiegraveme terme de la somme est estimeacute en posant 119901119904 =
1205720 pour toutes les espegraveces non observeacutees ce qui constitue lamecircme approximation que pour lrsquoestimation de la relation deGood-Turing eacutequation (22) Alors (1 minus 119901119904)119898 est estimeacute par(1 minus 1205720)119898 et peut sortir de la somme qui ne contient plus quele terme sum119904 1199011199041(119899119904 = 0) estimeacute par 1205720119904119899
0 = 1199041198991119899 (1 minus 1205721)
Les deux estimateurs 1205721 et 1205720 sont eacutegaux agrave 119860 si le nombredrsquoespegraveces non eacutechantillonneacutees est estimeacute par lrsquoestimateurChao1 On obtient
120124 (119862119899+119898) = 1 minus 1199041198991119899 [ (119899 minus 1) 119904119899
1(119899 minus 1) 119904119899
1 + 21199041198992
]119899+119898
(429)
= 1 minus 1199041198991119899 (1 minus 119860)119898+1 (430)
Lrsquoespeacuterance du taux de couverture est directement lieacutee agravelrsquoindice de Simpson geacuteneacuteraliseacute 68 120124(119862119899+119898) = 1 minus 1205771119899+119898 Lrsquoes-timateur de ℎ119902 est obtenu en remplaccedilant les termes 1205771119896 dela somme infinie suminfin
119896=119899 (119902minus1119896 )(minus1)1198961205771119896 par la valeur de 1 minus
120124(119862119899+119898) calculeacutee dans lrsquoeacutequation (429) La formule obtenue
76 Entropie
69Chao et Jost laquo Estimating Di-versity and Entropy Profiles via Dis-covery Rates of New Species raquo cfnote 63 p 74 Appendix S1 TheoremS12d
70Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
71Chao et T-J Shen laquo Nonpara-metric Estimation of Shannonrsquos Indexof Diversity When There Are UnseenSpecies in Sample raquo cf note 84 p 52
72Grassberger laquo Finite SampleCorrections to Entropy and Dimen-sion Estimates raquo cf note 98 p 55
73Marcon laquo Practical Estimationof Diversity from Abundance Data raquocf note 36 p 37
74A Chao et al laquo Unveiling theSpecies-Rank Abundance Distribu-tion by Generalizing Good-TuringSample Coverage Theory raquo In Eco-logy 965 (2015) p 1189-1201 doi 10189014-05501
contient le deacuteveloppement en seacuterie entiegravere de [1 minus (1 minus 119860)119902minus1]ce qui permet drsquoeacuteliminer la somme infinie et drsquoobtenir lrsquoesti-mateur de lrsquoeacutequation (426) apregraves simplifications69
Autres meacutethodesDeux autres approches sont possibles 70
bull Celle de Chao et T-J Shen71 eacutetendue au-delagrave de lrsquoen-tropie de Shannon qui prend en compte les espegraveces nonobserveacutees
bull Celle de Grassberger72 qui prend en compte la non-lineacuteariteacute de lrsquoestimateur
Le domaine de validiteacute des deux corrections est diffeacuterentQuand 119902 est petit les espegraveces rares non observeacutees ont unegrande importance alors que 119902119867 est presque lineacuteaire la cor-rection de Grassberger disparaicirct quand 119902 = 0 Quand 119902 estgrand (au-delagrave de 2) lrsquoinfluence des espegraveces rares est faiblela correction de Chao et Shen devient neacutegligeable alors que lanon-lineacuteariteacute augmente Un compromis raisonnable consiste agraveutiliser le plus grand des deux estimateurs
Lrsquoestimateur de Chao et Shen est
119902 = minus119904119899
ne0
sum119904=1
119862 119901119904 ln119902 ( 119862 119901119904)1 minus (1 minus 119862 119901119904)
119899 (431)
Celui de Grassberger est
119902 = 1 minus sum119904119899ne0
119904=1 119901119902119904
119902 minus 1 (432)
ougrave
119901119902119904 = 119899119904
minus119902 ( (119899119904 + 1) (119899119904 minus 119902 + 1) + (minus1)119899 (1 + 119902) sin 120587119902
120587 (119899 + 1) ) (433)
(sdot) est la fonction gamma Lrsquoestimateur est lineacuteaire parrapport agrave 119901119902
119904 le problegraveme original est donc reacutesolu par laconstruction de lrsquoestimateur de 119901119902
119904 mais celui-ci est biaiseacute eacutega-lement
Lrsquoestimateur de Chao et Shen peut ecirctre ameacutelioreacute73 en es-timant mieux les probabiliteacutes Chao et al74 ont deacuteveloppeacute unestimateur de la distribution des probabiliteacutes agrave partir de lrsquoes-timation du taux de couverture geacuteneacuteraliseacute 119862 119901119904 peut ecirctre rem-placeacute par cet estimateur pour reacuteduire le biais de lrsquoestimateurde Chao et Shen
46 Estimation de lrsquoentropie 77
75Ibid
76Burnham et Overton laquo RobustEstimation of Population Size WhenCapture Probabilities Vary amongAnimals raquo cf note 9 p 26
77Brose et al laquo Estimating Spe-cies Richness Sensitivity to SampleCoverage and Insensitivity to SpatialPatterns raquo cf note 32 p 36
78Marcon laquo Practical Estimationof Diversity from Abundance Data raquocf note 36 p 37
79voir par exemple Chao et allaquo Entropy and the Species Accumu-lation Curve A Novel Entropy Es-timator via Discovery Rates of NewSpecies raquo cf note 94 p 53 figure 1
80Haegeman et al laquo Robust Es-timation of Microbial Diversity inTheory and in Practice raquo cf note 39p 18
Enfin la distribution des espegraveces non eacutechantillonneacutees peutecirctre ajouteacutee en estimant leur nombre et en choisissant une loiChao et al75 ont utiliseacute lrsquoestimateur Chao1 et une distributiongeacuteomeacutetrique Lrsquoestimateur jackknife76 est plus versatile parceque son ordre peut ecirctre adapteacute aux donneacutees quand lrsquoeffortdrsquoeacutechantillonnage est trop faible pour que lrsquoestimateur Chao1soit performant77 Un simple estimateur plug-in appeleacute laquo esti-mateur reacuteveacuteleacute raquo peut ensuite ecirctre appliqueacute agrave cette distributionreacuteveacuteleacutee78
Lrsquoestimateur du taux de couverture geacuteneacuteraliseacute ne fait au-cune hypothegravese sur les espegraveces non observeacutees et nrsquoutilise que letaux de couverture et la technique de Horvitz-Thompson pourestimer leur contribution Lrsquoestimateur reacuteveacuteleacute ne tente aucunecorrection mais utilise lrsquoestimation la meilleure possible pourla distribution des probabiliteacutes
Biais des estimateurs
Eacutetant donneacute la distribution des probabiliteacutes des espegravecesdans la communauteacute lrsquoeacutechantillon inventorieacute peut ecirctre consi-deacutereacute comme un tirage dans une loi multinomiale qui contientpas toutes les espegraveces Par simulation agrave partir drsquoune distribu-tion connue il est possible de tirer un grand nombre drsquoeacutechan-tillons et de reacutepeacuteter lrsquoestimation de la diversiteacute sur chacundrsquoeux La distribution de la valeur de lrsquoeacutechantillon permet dejuger ses performances son biais moyen (mesureacute par rap-port agrave la valeur de reacutefeacuterence calculeacutee agrave partir des probabiliteacuteschoisies) et sa variabiliteacute (eacutevalueacutee par sa variance empiriquesur les simulations) Un estimateur performant doit ecirctre peubiaiseacute mais aussi peu variable Lrsquoerreur quadratique moyennesomme du carreacute du biais et de la variance ou sa racine car-reacutee dont la dimension est celle des donneacutees (root mean squareerror RMSE) est un bon critegravere de test79
Haegeman et al80 proposent deux estimateurs de la diver-siteacute 119902119863 agrave partir des courbes de rareacutefaction et drsquoextrapolationdu nombre drsquoespegraveces Les deux estimateurs bornent la vraievaleur de 119902119863 (leur variabiliteacute nrsquoest pas prise en compte maiselle est neacutegligeable dans le cadre utiliseacute) Lrsquoestimateur minimalest tregraves proche de celui de Chao et Jost agrave la diffeacuterence que lestermes estimant le biais reacutesiduel sont eacutevalueacutes par une approxi-mation numeacuterique Lrsquoestimateur maximal suppose que tous lesindividus non eacutechantillonneacutes appartiennent agrave une espegravece nou-velle ce qui est effectivement le pire cas possible Les deuxestimateurs sont appliqueacutes agrave la diversiteacute de communauteacutes mi-crobiennes (jusqursquoagrave un million drsquoespegraveces distribueacutees selon uneloi geacuteomeacutetrique) et tregraves sous-eacutechantillonneacutees (un individu sur1010 dans le pire des cas)
Les reacutesultats preacutesentent de tregraves grands intervalles drsquoestima-
78 Entropie
81Marcon laquo Practical Estimationof Diversity from Abundance Data raquocf note 36 p 37
82Marcon et al laquo The Decompo-sition of Shannonrsquos Entropy and aConfidence Interval for Beta Diversi-ty raquo cf note 11 p 64 Marcon et allaquo Generalization of the Partitioningof Shannon Diversity raquo cf note 37p 69
83Chao et Jost laquo Estimating Di-versity and Entropy Profiles via Dis-covery Rates of New Species raquo cfnote 63 p 74
84Chao et al laquo Entropy and theSpecies Accumulation Curve A No-vel Entropy Estimator via DiscoveryRates of New Species raquo cf note 94p 53
tion (de plusieurs ordres de grandeur) entre la borne infeacuterieureet la borne supeacuterieure ce qui montre que la meacutethode est inuti-lisable pour 119902 lt 1 approximativement Lrsquoestimateur minimalqui correspond agrave lrsquoeacutetat de lrsquoart sous-estime seacutevegraverement la di-versiteacute quand lrsquoeacutechantillonnage est faible Lrsquoestimateur maxi-mal est excessivement conservateur (il est conccedilu pour bornerlrsquoestimation dans la pire hypothegravese)
Aux ordres de diversiteacute supeacuterieurs les estimateursconvergent mecircme avec de petits eacutechantillons mecircme ensupposant que la richesse de la communauteacute est la plusgrande possible lrsquoestimation de la diversiteacute est preacutecise degraves119902 = 1
Dans des conditions moins difficiles correspondant agrave descommunauteacutes moins riches (typiquement des forecircts tropicales)lrsquoestimation est preacutecise degraves 119902 = 0 581 Ces reacutesultats sont deacuteve-loppeacutes plus loin
Intervalle de confiance des estimateurs
Agrave partir de donneacutees drsquoinventaire lrsquoestimation du biais estimpossible (sinon le biais serait simplement ajouteacute agrave lrsquoestima-teur pour le rendre sans biais) La variabiliteacute de lrsquoestimateurpeut ecirctre eacutevalueacutee en geacuteneacuterant des communauteacutes par boots-trap et en estimant leur diversiteacute comme dans la meacutethode preacute-ceacutedente Les communauteacutes peuvent ecirctre simuleacutees par tiragedans une loi multinomiale respectant les probabiliteacutes obser-veacutees82 Lrsquoinconveacutenient est que les espegraveces dont les probabiliteacutessont petites ne sont pas tireacutees ce qui entraicircne un nouveaubiais drsquoestimation Lrsquoestimateur le corrige en partie le biaisdrsquoestimation ducirc au non eacutechantillonnage des espegraveces rares de lacommunauteacute (corrigeacute par lrsquoestimateur appliqueacute aux donneacuteesreacuteelles) nrsquoest pas accessible Il est donc neacutecessaire de recen-trer les valeurs obtenues par simulation autour de la valeurobtenue sur les donneacutees
Chao et Jost83 proposent une meacutethode plus eacutelaboreacutee quiconsiste agrave reconstituer la distribution des probabiliteacutes de lacommunauteacute reacuteelle le mieux possible avant drsquoen tirer les eacutechan-tillons simuleacutes Lrsquoestimateur naiumlf de la probabiliteacute drsquoune espegraveceobserveacutee 119904 est 119901119904 = 119899119904119899 119901119904 est sans biais mais comme on nedispose que drsquoune reacutealisation de la loi il est preacutefeacuterable de cher-cher un estimateur sans biais conditionnellement aux espegravecesobserveacutees Il est obtenu par Chao et al84 agrave partir de lrsquoespeacute-rance conditionnelle de 119873119904119899
120124 (119873119904119899 |119899119904 gt 0) = 119901119904
1 minus (1 minus 119901119904)119899 (434)
Lrsquoestimateur de 119901119904 obtenu est
46 Estimation de lrsquoentropie 79
85Chao et al laquo Unveiling theSpecies-Rank Abundance Distribu-tion by Generalizing Good-TuringSample Coverage Theory raquo cfnote 74 p 76
86Grassberger laquo Finite SampleCorrections to Entropy and Dimen-sion Estimates raquo cf note 98 p 55
87Marcon laquo Practical Estimationof Diversity from Abundance Data raquocf note 36 p 37
119901119904 = 119899119904119899 [1 minus (1 minus 119899119904
119899 )119899] (435)
ougrave
= 1 minus 119862sum119904119899
ne0119904=1
119899119904119899 (1 minus 119899119904
119899 )119899 (436)
120582 est un paramegravetre drsquoun modegravele permettant drsquoestimer lesvaleurs de 119901119894 agrave partir de leur espeacuterance conditionnelle et desdonneacutees Le modegravele complet est preacutesenteacute par Chao et al85
Les probabiliteacutes des espegraveces non observeacutees sont consideacute-reacutees comme eacutegales par souci de simplification et parce qursquoellesinfluencent peu la variance des estimateurs Leur somme esteacutegale au deacuteficit de couverture et leur nombre estimeacute parChao1
Lrsquointervalle de confiance de lrsquoestimateur obtenu par cettetechnique agrave partir des donneacutees permet de connaicirctre sa variabi-liteacute mais pas son biais Il nrsquoest absolument pas garanti (et peuprobable si lrsquoeacutechantillonnage est faible et 119902 petit) que la vraievaleur de la diversiteacute se trouve dans lrsquointervalle de confiance
Pratique de lrsquoestimation
La conversion de lrsquoestimateur de lrsquoentropie en estimateurde la diversiteacute pose un nouveau problegraveme puisque 119902119863 nrsquoestpas une transformation lineacuteaire de 119902119867 Ce dernier biais peutecirctre neacutegligeacute86 parce que 119902119867 lrsquoentropie est la valeur moyennede lrsquoinformation de nombreuses espegraveces indeacutependantes et fluc-tue donc peu agrave cause de lrsquoeacutechantillonnage contrairement auxestimateurs des probabiliteacutes
Des simulations meneacutees sur des distributions log-normaleou geacuteomeacutetrique de richesse diverses avec des efforts drsquoeacutechan-tillonnage varieacutes permettent de tester les estimateurs dans descas theacuteoriques reacutealistes87 Un reacutesultat repreacutesentatif est donneacuteici
La figure 47 compare les reacutesultats des deux meilleurs es-timateurs agrave la vraie valeur de la diversiteacute drsquoune communau-teacute de 300 espegraveces dont la distribution log-normale (avec uneacutecart-type dont le logarithme vaut 2) mime une forecirct tropi-cale similaire agrave Barro-Colorado Lrsquoeffort drsquoinventaire simuleacuteest de 500 ou 5000 individus (de lrsquoordre drsquoun ou dix hectarespour les arbres de diamegravetre supeacuterieur ou eacutegal agrave 10 cm) Lrsquoes-timation ne pose pas de problegraveme avec 5000 individus bienque Chao-Wang-Jost sous-estime un peu le nombre drsquoespegravecesLrsquoestimateur reacuteveacuteleacute est centreacute sur la vraie valeur mais avecune plus grande variabiliteacute
80 Entropie
Fig 47 Estimation de ladiversiteacute drsquoune communauteacute
log-normale de 300 espegraveces Uninventaire de 500 (en bas) ou 5000(en haut) individus est reacutepeacuteteacute 1000
fois et la diversiteacute estimeacutee agravechaque fois par lrsquoestimateur deChao-Wang-Jost (agrave gauche) ou
lrsquoestimateur reacuteveacuteleacute (agrave droite) Lacourbe noire en gras repreacutesente lavraie diversiteacute de la communauteacuteLa courbe maigre est la moyennede lrsquoestimation lrsquoenveloppe grise
limiteacutee par les pointilleacutes rougescontient 95 des valeurs simuleacuteesA 5000 individus estimateur de
Chao-Wang-Jost B 5000individus estimateur reacuteveacuteleacute C
500 individus estimateur deChao-Wang-Jost D 500
individus estimateur reacuteveacuteleacute
00 01 02 03 04 05 06
050
100
200
300
Diversity
00 01 02 03 04 05 06
050
100
200
300
Diversity
00 01 02 03 04 05 06
050
100
200
300
Diversity
00 01 02 03 04 05 06
050
100
200
300
Diversity
A B
C D
En limitant lrsquoeacutechantillonnage agrave 500 individus lrsquoestimateurde Chao-Wang-Jost sous-estime le nombre drsquoespegraveces de moitieacuteLrsquoestimateur reacuteveacuteleacute sous-estime beaucoup moins la diversiteacutedrsquoordre faible mais son intervalle de confiance est tregraves large
Degraves 119902 = 0 5 lrsquoestimation est tregraves preacutecise dans tous les casmecircme en reacuteduisant lrsquoeacutechantillonnage agrave 200 individus ou pourdes communauteacutes dont la queue de distribution est beaucoupplus longue (reacutesultats non preacutesenteacutes ici)
Les conclusions de ce travail drsquoeacutevaluation tiennent en deuxpoints Dans des conditions reacutealistes drsquoinventaire drsquoarbres enforecirct tropicale les estimateurs de diversiteacute les plus perfor-mants sont celui de Chao Wang et Jost et lrsquoestimateur reacuteveacuteleacuteLe premier a une variance plus faible pour les valeurs de 119902proches de 0 mais est limiteacute par son estimation du nombredrsquoespegraveces par lrsquoestimateur Chao1 Le second est preacutefeacuterablequand le nombre drsquoespegraveces estimeacute par lrsquoestimateur jackknifedrsquoordre optimal est clairement supeacuterieur (crsquoest-agrave-dire en pra-tique quand lrsquoordre du jacknife optimal est supeacuterieur agrave 1)Son biais est alors bien infeacuterieur au prix drsquoune variance plusgrande
Dans tous les cas lrsquoestimation de la diversiteacute aux ordresinfeacuterieurs agrave 05 est impreacutecise sauf agrave disposer drsquoinventairesde taille consideacuterable (de lrsquoordre de la dizaine drsquohectares aumoins)
Les fonctions Tsallis et Diversityde entropart acceptentcomme argument un vecteur drsquoabondances (et non de proba-biliteacutes) et proposent par deacutefaut la correction de Chao et Jost
Tsallis(colSums(BCI) q = 1)
UnveilJ 4276075
47 Autres approches 81
88J Zhang et al laquo Partitioning of and Diversity Using HierarchicalBayesian Modeling of Species Distri-bution and Abundance raquo In Envi-ronmental and Ecological Statistics214 (2014) p 611-625 doi 101007s10651-013-0271-2
89K M Broms et al laquo Accountingfor Imperfect Detection in Hill Num-bers for Biodiversity Studies raquo In Methods in Ecology and Evolution61 (2014) p 99-108 doi 1011112041-210X12296
90K J Iknayan et al laquo DetectingDiversity Emerging Methods to Es-timate Species Diversity raquo In Trendsin Ecology amp Evolution 292 (2014)p 97-106 doi 101016jtree201310012
91Chao et al laquo Rarefaction andExtrapolation with Hill Numbers AFramework for Sampling and Estima-tion in Species Diversity Studies raquo cfnote 106 p 58
92N J Gotelli et R K Col-well laquo Quantifying Biodiversity Pro-cedures and Pitfalls in the Measu-rement and Comparison of SpeciesRichness raquo In Ecology Letters 44(2001) p 379-391 doi 101046j1461-0248200100230x
93T C Hsieh et al laquo iNEXT An R Package for Interpolation andExtrapolation in Measuring SpeciesDiversity raquo In Methods in Ecologyand Evolution 7 (2016) p 1451-1456doi 1011112041-210X12613
94Reacutenyi laquo On Measures of Entro-py and Information raquo cf note 14p 65
Diversity(colSums(BCI) q = 1)
UnveilJ 7195748
MSOM et MSAM
Lrsquoutilisation de modegraveles hieacuterarchiques bayesiens fondeacutessur des modegraveles drsquooccupation multispeacutecifiques (MSOM) oudes modegraveles drsquoabondance multispeacutecifiques (MSAM) progressedans la litteacuterature reacutecente Ils neacutecessitent de choisir une loide probabiliteacute drsquoobservation des espegraveces compatible avec uneacutechantillonnage non exhaustif par exemple une loi ZIP (zero-inflated Poisson)88 dans laquelle lrsquoespeacuterance de la preacutesencede chaque espegravece peut ecirctre modeacuteliseacutee agrave son tour comme laconseacutequence de variables environnementales Une approchealternative consiste agrave modeacuteliser la probabiliteacute drsquoobservationcomme la combinaison drsquoune probabiliteacute de preacutesence et drsquouneprobabiliteacute de deacutetection89 Ces meacutethodes ont lrsquoavantage defournir une distribution de probabiliteacute des paramegravetres desmodegraveles et donc de la diversiteacute qui est calculeacutee comme unequantiteacute deacuteriveacutee Leur faiblesse est qursquoils deacutependent de la loichoisie Une revue complegravete est fournie par Iknayan et al90
Rareacutefaction et extrapolation
Chao et al91 eacutetendent lrsquoapproche de Gotelli et Colwell92
aux nombres de Hill et fournissent les meacutethodes neacutecessairesau calcul de courbes de rareacutefaction et drsquoextrapolation de lrsquoes-timateur de 119902119863 en fonction de la taille de lrsquoeacutechantillon ou dutaux de couverture
Les courbes de rareacutefaction sont obtenues agrave partir delrsquoeacutechantillon disponible en simulant la diminution de sa tailleLes courbes drsquoextrapolation simulent lrsquoaugmentation de lataille de lrsquoeacutechantillon Elles sont en reacutealiteacute calculeacutees parrareacutefaction drsquoun eacutechantillon hypotheacutetique de taille infinie unestimateur de 119902119863 corrigeacute du biais drsquoestimation est neacutecessaireLrsquoarticle se limite aux valeurs de 119902 eacutegales agrave 0 1 ou 2 ounon entiegraveres mais supeacuterieures agrave 2 Le package iNEXT93
impleacutemente ces calculs dans R comme le package entropartqui ameacuteliore lrsquoestimation des ordres non entiers de diversiteacute
47 Autres approches
Lrsquoentropie de Reacutenyi
Lrsquoentropie drsquoordre 119902 de Reacutenyi94 est
82 Entropie
95Hill laquo Diversity and Evenness A Unifying Notation and Its Conse-quences raquo cf note 17 p 65
96C Beck laquo Generalised Informa-tion and Entropy Measures in Phy-sics raquo In Contemporary Physics504 (2009) p 495-510 doi 10108000107510902823517
97F Cowell laquo Measurement of In-equality raquo In Handbook of IncomeDistribution Sous la dir drsquoA B At-kison et F Bourguignon T 1 6North Holland 2000 p 87-166 doi 101016S0014-2921(81)80003-7
98M Bruumllhart et R Traeger laquo AnAccount of Geographic ConcentrationPatterns in Europe raquo In RegionalScience and Urban Economics 356(2005) p 597-624 doi 101016jregsciurbeco200409002
99Maasoumi laquo A Compendium toInformation Theory in Economics andEconometrics raquo cf note 5 p 61
100N Cressie et T R C Readlaquo Multinomial Goodness-of-FitTests raquo In Journal of the RoyalStatistical Society Series B (Sta-tistical Methodology) 463 (1984)p 440-464 JSTOR 2345686
101Kullback et Leibler laquo On Infor-mation and Sufficiency raquo cf note 8p 63
102K Pearson laquo On the Crite-rion That a given System of De-viations from the Probable in theCase of a Correlated System of Va-riables Is Such That It Can Be Rea-sonably Supposed to Have Arisenfrom Random Sampling raquo In Phi-losophical Magazine Series 5 50302(1900) p 157-175 doi 10 1080 14786440009463897
103A C Studeny et allaquo Goodness-of-Fit Measures ofEvenness A New Tool for ExploringChanges in Community Structure raquoIn Ecosphere 22 (2011) art15doi 101890ES10-000741
119902119877 = 11 minus 119902 ln sum119878
119902=1 119901119902119904 (437)
Crsquoest le logarithme naturel des nombres de Hill95 qui onteacuteteacute deacutefinis agrave partir drsquoelle Lrsquoentropie de Reacutenyi a connu un suc-cegraves important en tant que seule mesure drsquoentropie geacuteneacuteraliseacuteejusqursquoagrave la diffusion de lrsquoentropie HCDT Son deacutefaut est qursquoellenrsquoest pas forceacutement concave96 ce qui empecircche sa deacutecomposi-tion (voir chapitre 12)
Lrsquoentropie geacuteneacuteraliseacutee des mesures drsquoineacutegaliteacute
Lrsquoentropie geacuteneacuteraliseacutee des eacuteconomistes drsquoordre 119902 est deacutefi-nie comme
119867119902 = 1119902 (119902 minus 1) [ 1
119878119878
sum119904=1
(119899119904119899119904)
119902minus 1] (438)
Crsquoest en reacutealiteacute une entropie relative qui mesure lrsquoeacutecartentre la distribution observeacutee 119899119904 et sa valeur moyenne Elletend vers lrsquoentropie de Theil quand 119902 rarr 1 et la moyenne desln(119899119904
119899119904) quand 119902 rarr 0 Elle a eacuteteacute conccedilue pour mesurer les ineacutegali-
teacutes97 puis utiliseacutee par exemple pour mesurer la concentrationspatiale98
Maasoumi99 explicite cet usage et pour comparer la distri-bution de probabiliteacute observeacutee 119902119904 agrave une distribution atten-due 119901119904 plutocirct qursquoagrave la distribution uniforme dont toutes lesvaleurs seraient 1
119878 En posant 119903 = 119902 minus 1 en transformant lesabondances 119899119904 en probabiliteacutes 119902119904 et en choisissant 119901119904arbitrairement on obtient
119867119903 (q p) = 1119903 (119903 + 1) [
119878sum119904=1
119902119904(119902119904119901119904
)119903
minus 1] (439)
N Cressie et Read100 ont deacutefini une mesure geacuteneacuteraliseacutee dequaliteacute drsquoajustement (Goodness of Fit) de la distribution 119902119904agrave celle de 119901119904 Elle est identique agrave lrsquoentropie geacuteneacuteraliseacutee (agrave uncoefficient 2 pregraves) bien que deacuteveloppeacutee indeacutependamment pourdrsquoautres motivations La statistique de Cressie et Read drsquoordre1 est la divergence de Kullback et Leibler101 celle drsquoordre 2 le1205942 de Pearson102
Studeny et al103 deacutefinissent une mesure drsquoeacutequitabiliteacutecomme la divergence entre la distribution observeacutee 119901119904 etla distribution uniforme ce qui les ramegravene agrave lrsquoentropie deCowell
47 Autres approches 83
104Theil Economics and Informa-tion Theory cf note 78 p 50
105Z Zhang et Zhou laquo Re-Parameterization of MultinomialDistributions and Diversity Indices raquocf note 60 p 73
106Z Zhang et Grabchak laquo Entro-pic Representation and Estimation ofDiversity Indices raquo cf note 59 p 73
107Chao et al laquo Entropy and theSpecies Accumulation Curve A No-vel Entropy Estimator via DiscoveryRates of New Species raquo cf note 94p 53
108M Grabchak et al laquo The Gene-ralized Simpsonrsquos Entropy Is a Mea-sure of Biodiversity raquo In Plos One123 (2017) e0173305 doi 101371journalpone0173305
119868119903 = 1119903 (119903 + 1) [
119878sum119904=1
119901119904 ( 1199011199041119878 )
119903minus 1] (440)
Cette mesure inclut agrave la fois lrsquoeacutequitabiliteacute et la richesse dela distribution Il srsquoagit donc drsquoune mesure de diversiteacute qui estagrave une normalisation pregraves lrsquoeacutecart entre la valeur de lrsquoentropieHCDT drsquoordre 119902 = 119903+1 et sa valeur maximale Elle geacuteneacuteralisedonc lrsquoindice de Theil 104
119868119903 = 11199021198781minus119902 (ln119902 119878 minus119902119867) (441)
Lrsquoentropie de Simpson geacuteneacuteraliseacuteeLrsquoentropie de Simpson geacuteneacuteraliseacutee a eacuteteacute introduite dans
une classe drsquoindices plus geacuteneacuterale (340) par Z Zhang etZhou105 et eacutetudieacutee en deacutetail par Z Zhang et Grabchak106
Lrsquoentropie drsquoordre 119903 gt 0 est
120577119903 =119878
sum119904=1
119901119904(1 minus 119901119904)119903 (442)
Elle se reacuteduit agrave lrsquoentropie de Simpson pour 119903 = 1La fonction drsquoinformation de lrsquoentropie de Simpson geacuteneacute-
raliseacutee 119868(119901) = (1 minus 119901)119903 repreacutesente la probabiliteacute de nrsquoobserveraucun individu de lrsquoespegravece de probabiliteacute 119901 dans un eacutechan-tillon de taille 119903 crsquoest une mesure intuitive de la rareteacute Chaoet al107 ont interpreacuteteacute 120577119903 comme la probabiliteacute qursquoun individueacutechantillonneacute au rang 119903 + 1 appartienne agrave une espegravece nouvelledans une SAC (119903 + 1)120577119903 est aussi lrsquoespeacuterance du nombre desingletons dans un eacutechantillon de taille (119903 + 1)
Lrsquointeacuterecirct majeur de cette entropie est qursquoelle dispose drsquounestimateur non biaiseacute pour toutes les valeurs de 119903 strictementinfeacuterieures agrave la taille de lrsquoeacutechantillon Crsquoest une mesure dediversiteacute valide pour les ordres 119903 strictement infeacuterieurs aunombre drsquoespegraveces108 Au-delagrave elle ne respecte plus lrsquoaxiomedrsquoeacutequitabiliteacute sa valeur maximale nrsquoest pas obtenue quandles espegraveces sont eacutequiprobables
Son nombre effectif drsquoespegraveces est
119903119863120577 = 11 minus 120577
1119903119903
(443)
Lrsquoexistence drsquoun estimateur sans biais et drsquoun intervalle deconfiance calculable analytiquement permet de comparer desprofils de diversiteacute de faccedilon robuste quand lrsquoeacutechantillonnageest limiteacute et la richesse eacuteleveacutee
La figure 48a montre les profils de diversiteacute (en nombreeffectifs drsquoespegraveces) des deux parcelles 6 et 18 de Paracou
84 Entropie
1 ha inventorieacute respectivement 681 et 483 arbres pour unerichesse estimeacutee agrave 254 et 309 espegraveces par les estimateurs ja-ckknife drsquoordres 2 et 3
NsP6 lt- asAbdVector(Paracou618MC$Nsi[ 1])(S6 lt- Richness(NsP6 Correction = Jackknife))
Jackknife 2 254
NsP18 lt- asAbdVector(Paracou618MC$Nsi[ 2])(S18 lt- Richness(NsP18 Correction = Jackknife))
Jackknife 3 309
S lt- min(S6 S18)
En comparaison la figure 48b montre les profils de diver-siteacute HCDT des mecircmes parcelles Ils se chevauchent pour lespetits ordres de diversiteacute ce qui ne permet pas de conclure
Fig 48 Comparaison des profilsde diversiteacute des parcelles 6 et 18
de Paracou avec leur intervalle deconfiance agrave 95 La parcelle 18 est
traceacutee en rouge lignes continueset la 6 en vert lignes pointilleacutees
(a) Diversiteacute geacuteneacuteraliseacutee deSimpson (nombres effectif
drsquoespegraveces) les profils sontdistincts ce qui permet de
conclure que la parcelle 6 est plusdiverse que la parcelle 18 (b)
Diversiteacute HCDT les profils sechevauchent jusqursquoagrave 119902 asymp 0 7
50
100
150
0 50 100 150 200 250Ordre de diversiteacute
Div
ersi
teacute d
e S
imps
on g
eacuteneacuter
alis
eacutee
a
0
500
1000
00 05 10 15 20Ordre de diversiteacute
Nom
bre
de H
ill
b
La diversiteacute est donc estimeacutee jusqursquoagrave lrsquoordre 253Code R pour reacutealiser la figure 48
Profil P6library(EntropyEstimation)zeta6 lt- CommunityProfile(GenSimpson NsP6 1(S - 1))sigma6 lt- sapply(1(S - 1) function(r) GenSimpsd(NsP6 r))ic6 lt- qnorm(1 - 0052) sigma6sqrt(sum(NsP6))zeta6$low lt- zeta6$y - ic6zeta6$high lt- zeta6$y + ic6 Profil P18zeta18 lt- CommunityProfile(GenSimpson NsP18 1(S - 1))sigma18 lt- sapply(1(S - 1) function(r) GenSimpsd(NsP18 r))ic18 lt- qnorm(1 - 0052) sigma18sqrt(sum(NsP18))zeta18$low lt- zeta18$y - ic18zeta18$high lt- zeta18$y + ic18 Transformation en diversiteacutezeta6D lt- zeta6zeta6D$y lt- 1(1 - (zeta6$y)^(1zeta6$x))zeta6D$low lt- 1(1 - (zeta6$low)^(1zeta6$x))zeta6D$high lt- 1(1 - (zeta6$high)^(1zeta6$x))
47 Autres approches 85
zeta18D lt- zeta18zeta18D$y lt- 1(1 - (zeta18$y)^(1zeta18$x))zeta18D$low lt- 1(1 - (zeta18$low)^(1zeta18$x))zeta18D$high lt- 1(1 - (zeta18$high)^(1zeta18$x)) Figuregga lt- ggplot() +
geom_ribbon(aes(x ymin = low ymax = high)asdataframelist(zeta18D) alpha = 03) +
geom_line(aes(x y) asdataframelist(zeta18D) col = red) +geom_ribbon(aes(x ymin = low ymax = high)
asdataframelist(zeta6D) alpha = 03) +geom_line(aes(x y) asdataframelist(zeta6D) col = darkgreen) +labs(x = Ordre de diversiteacute
y = Diversiteacute de Simpson geacuteneacuteraliseacutee) +labs(tag = a)
Calcul des profils HCDTD6 lt- CommunityProfile(Diversity NsP6 NumberOfSimulations = 10qseq=qseq Correction = UnveilJ)D18 lt- CommunityProfile(Diversity NsP18 NumberOfSimulations = 10qseq=qseq Correction = UnveilJ) Figureggb lt- ggplot(dataframe(x = D6$x D6$y D18$y)) +
geom_ribbon(aes(x ymin = low ymax = high) asdataframelist(D6)alpha = 03) +
geom_line(aes(x D6y) col = darkgreen lty = 2) +geom_ribbon(aes(x ymin = low ymax = high) asdataframelist(D18)
alpha = 03) +geom_line(aes(x D18y) col = red) +labs(x = Ordre de diversiteacute y = Nombre de Hill) +labs(tag = b)
gridarrange(gga ggb ncol = 2)
La distribution statistique de la diffeacuterence drsquoentropie estconnue et peut donc ecirctre traceacutee (figure 49) Son intervallede confiance ne contient jamais la valeur 0 ce qui permet deconclure que la parcelle 18 est plus diverse
000
005
010
0 50 100 150 200 250Ordre de diversiteacute
Diff
eacuteren
ce d
ent
ropi
e
Fig 49 Diffeacuterence entre lesentropies de Simpson geacuteneacuteraliseacuteesdes parcelles 18 et 6 de Paracouavec son intervalle de confiance agrave95 La ligne horizontalerepreacutesente lrsquohypothegravese nulledrsquoeacutegaliteacute entre les entropies quipeut ecirctre rejeteacutee
Code R pour reacutealiser la figure Calcul de P18-P6 avec IC
Difference lt- list(x = zeta18$x y = zeta18$y-zeta6$y)class(Difference) lt- class(zeta18)icDifference lt- qnorm(1-0052)sqrt(sigma6^2sum(NsP6)
+ sigma18^2sum(NsP18))Difference$low lt- Difference$y - icDifferenceDifference$high lt- Difference$y + icDifference
86 Entropie
109Marcon laquo Practical Estimationof Diversity from Abundance Data raquocf note 36 p 37
110R Rajaram et B Castellanilaquo An Entropy Based Measure forComparing Distributions of Com-plexity raquo In Physica A Statisti-cal Mechanics and its Applications453 (2016) p 35-43 doi 101016jphysa201602007
111B Castellani et R Rajaramlaquo Past the Power Law Complex Sys-tems and the Limiting Law of Restric-ted Diversity raquo In Complexity 21S2(nov 2016) p 99-112 doi 101002cplx21786
Plotautoplot(Difference xlab = Ordre de diversiteacute
ylab = Diffeacuterence dentropie) +geom_hline(yintercept = 0 col = blue lty = 2)
La prise en compte des espegraveces rares est limiteacutee par lavaleur maximale de lrsquoordre 119903 (limiteacute agrave 119878 minus 1) Les espegravecesplus rares ne peuvent pas ecirctre prises en compte le profil dediversiteacute srsquoarrecircte lagrave Le nombre effectif drsquoespegraveces maximumcorrespond au nombre de Hill drsquoordre 05 environ Les espegravecesplus rares sont prises en compte dans la partie du profil dediversiteacute HCDT drsquoordre infeacuterieur agrave 05 mais son incertitudeest grande et son biais tregraves important quand lrsquoeacutechantillonnageest aussi reacuteduit109
Lrsquoentropie de Simpson geacuteneacuteraliseacutee est donc lrsquooutil le plusapproprieacute pour comparer des profils de diversiteacute de commu-nauteacutes riches et sous-eacutechantillonneacutees
Lrsquoentropie par cas
Rajaram et Castellani110 deacutecomposent la diversiteacute de Shan-non en produit des contributions de chaque cateacutegorie et pro-posent une mesure cumulative de la diversiteacute drsquoune commu-nauteacute prenant en compte une partie des espegraveces classeacutees selonun critegravere pertinent deacutecrivant leur complexiteacute par exemplela diversiteacute des mammifegraveres classeacutes par taille croissante ou laposition dans lrsquoeacutevolution
La fraction de la communauteacute dont le cumul des probabi-liteacutes eacutegale 119888 est prise en compte La diversiteacute cumuleacutee est
Dc = prod119888
119901minus119901119904119904 (444)
La mesure normaliseacutee est appeleacutee case-based entropy enanglais et vaut
Cc = 1001198631198881119863 (445)
Dc = 1119863 quand toute la communauteacute est prise en compte(119888 = 1) Les auteurs srsquointeacuteressent principalement agrave la courbede 119862119888 en fonction de 119888 pour montrer111 que la contribution agrave ladiversiteacute totale des 40 des composants les moints complexesde systegravemes tregraves divers (laquo des galaxies au gegravenes raquo) atteint tou-jours au moins 60 ce reacutesultat eacutetant interpreacuteteacute comme uneloi universelle de limitation de la complexiteacute
Cette mesure peut ecirctre eacutetendue agrave lrsquoentropie HCDT sansdifficulteacute
qCc = (sum119888
119901119902119904)
11minus119902
(446)
47 Autres approches 87
La meacutethode peut ecirctre appliqueacutee pour eacutevaluer la contribu-tion de nrsquoimporte quel partie de la communauteacute agrave la diversiteacutetotale Il ne srsquoagit pas drsquoune deacutecomposition de la diversiteacute ausens classique du terme qui consiste agrave partitionner la diversi-teacute totale en diversiteacute intra et inter-groupes mais plutocirct drsquounefaccedilon de prendre en compte les caracteacuteristiques des espegravecesdans une approche non-neutre
1M Lloyd et R J Ghelardi laquo ATable for Calculating the rsquoequitabili-tyrsquo Component of Species Diversity raquoIn Journal of Animal Ecology 332(1964) p 217-225 doi 10 2307 2628 JSTOR 2628
2Jost laquo The Relation betweenEvenness and Diversity raquo cf note 7p 5
3H Tuomisto laquo An UpdatedConsumerrsquos Guide to Evenness andRelated Indices raquo In Oikos 1218(2012) p 1203-1218 doi 101111j1600-0706201119897x
4Dalton laquo The Measurement ofthe Inequality of Incomes raquo cfnote 16 p 65
5B Smith et J B Wilson laquo AConsumerrsquos Guide to Evenness In-dices raquo In Oikos 761 (1996) p 70-82 doi 1023073545749 JSTOR 3545749
6F Gosselin laquo Lorenz PartialOrder The Best Known Logical Fra-mework to Define Evenness Indices raquoIn Community Ecology 22 (2001)p 197-207 doi 101556ComEc2200127
7M O Lorenz laquo Methods ofMeasuring the Concentration ofWealth raquo In Quarterly Publicationsof the American Statistical Asso-ciation 9 (1905) p 209-219 doi 10108015225437190510503443
8figure 51 Tuomisto cf note 3
Chapitre 5
Eacutequitabiliteacute
Lrsquoeacutequitabiliteacute mesure lrsquoeacutecart entre la distribution observeacutee et une distri-bution uniformeLrsquoindice de Pielou est la mesure drsquoeacutequitabiliteacute la plus connue Il a eacuteteacutegeacuteneacuteraliseacute pour permettre de pondeacuterer plus ou moins les espegraveces raresde la mecircme faccedilon que lrsquoentropie HCDT
Lrsquoessentiel
La reacutegulariteacute drsquoune distribution est une notion intuitive-ment assez simple la faiblesse de lrsquoeacutecart entre la distribu-tion reacuteelle et une distribution parfaitement reacuteguliegravere1 veacuterifiant119901119904 = 1119878 Des difficulteacutes apparaissent quand il srsquoagit de com-parer lrsquoeacutequitabiliteacute de communauteacutes de richesses diffeacuterentesLrsquoapproche axiomatique est preacutesenteacutee puis les diffeacuterents in-dices de la litteacuterature et enfin la geacuteneacuteralisation de lrsquoindice dePielou en coheacuterence avec lrsquoentropie HCDT
51 Approche axiomatiqueUne approche axiomatique a eacuteteacute deacuteveloppeacutee par la litteacutera-
ture revue par Jost2 ou Tuomisto3 Les proprieacuteteacutes fondamen-tales sont les critegraveres de Dalton 4
bull Lrsquoeacutequitabiliteacute augmente quand un individu est transfeacutereacutedrsquoune espegravece freacutequente agrave une espegravece rare
bull Lrsquoeacutequitabiliteacute diminue quand une espegravece rare est ajou-teacutee
bull Invariance drsquoeacutechelle lrsquoeacutequitabiliteacute ne deacutepend que desfreacutequences pas des abondances absolues
Un critegravere suppleacutementaire eacutetabli par B Smith et J BWilson5 compleacuteteacute par Gosselin6 est la compatibiliteacute avec lacourbe de Lorenz7 construite en classant les espegraveces de lamoins freacutequente agrave la plus freacutequente et en traccedilant le cumuldes freacutequences en fonction du rang 8 une communauteacute parfai-
89
90 Eacutequitabiliteacute
Fig 51 Tuomisto2012
1204
Their four essential requirements have a long history (Dalton 1920) and can be rephrased as follows
1) Evenness should be replication invariant it should not change when a dataset is replicated such that each of its species gives rise to n new species of the same absolute abundance as the original one
2) Evenness should decrease when abundance is transferred from a less abundant species to a more abundant one
3) Evenness should decrease when an exceedingly rare speshycies is added
4) Evenness should be scale invariant such that it depends on the proportional rather than absolute abundances of species
After describing the essential requirements and desirable features of evenness Smith and Wilson (1996) proceeded to evaluate how well fourteen evenness indices performed against these criteria They found that five of the indices (Evar 0 EQ E primeand ElD in their notation) fulfilled all essential requirements but none had all the desirable features
Another popular approach is to use compatibility with the Lorenz partial order as the main criterion for choosing among evenness measures (Taillie 1979 Nijssen et al 1998 Rousseau et al 1999 Gosselin 2001) The Lorenz curve shows the increase in cumulative proportional abundance of the species as a function of the proportion of species already considered with species being ranked from the least abunshydant to the most abundant (Fig 1) If all species are equally abundant each new species adds the same amount of proshyportional abundance and the Lorenz curve becomes a straight line along the diagonal of the diagram As the inequality in the species abundances increases the Lorenz curve falls increasingly below the diagonal Any evenness index that is Lorenz compatible must correctly indicate whether the Lorenz curve of one dataset is above or below that of another dataset If the Lorenz curves of two datasets cross then one is not intrinsically more even than the other and two Lorenz compatible indices may rank them in opposite ways
The essential requirements of Smith and Wilson (1996) pose no conflict with the Lorenz criterion but many of
their desirable features do and some of these also conflict with each other (Gosselin 2001 Ricotta 2004) Only two of the five indices that fared best in the evaluation of Smith and Wilson (1996) are Lorenz compatible (0 and ElD Gosselin 2001) On the other hand Gosselin (2001) and Ricotta et al (2001) listed several Lorenz compatible indishyces that were not discussed by Smith and Wilson (1996) Since Smith and Wilsonrsquos review other researchers have made further additions to the wish list of desirable index properties (Mouillot and Wilson 2002 Ricotta 2004 Camargo 2008)
After all this discussion the fundamental problem still remains preferences concerning the mathematical behavshyior of index values may vary and a consensus on a universal set of requirements for an optimal evenness index will never be reached Indeed studies that compare evenness indices often finish by stating that there are many ways in which evenness can be quantified and that different evenshyness indices can be used in different situations (Alatalo 1981 Smith and Wilson 1996 Ricotta et al 2001) This is rather like comparing different indices in order to identify the optimal index of size The obvious conclusion from such comparisons is that there is no universally best index because different aspects of size are relevant in different situations
Settling for terminological clarity
The fact that no single index can be declared universally superior to the others does not mean that the indices are interchangeable On the contrary different evenness indices correspond to very different phenomena (such as relative diversity entropy ratio and rate of increase in diversity) Choosing a relevant index for any particular purpose requires that it is understood which phenomenon each of the available indices quantifies Similarly and perhaps more obviously different size indices (such as m r r2 pr2 r3 and 43pr3) correspond to very different phenomena (such as mass length area and volume) Comparing index values without keeping track of which values represent length and which represent volume is both meaningless and potentially dangerous
Similarly accurate communication about issues related to evenness is only possible if indices that actually quantify different things are each called by a different name The tershyminology is currently unstable so the words lsquoevennessrsquo and lsquoequitabilityrsquo have been used as synonyms as have lsquounevenshynessrsquo and lsquoinequalityrsquo I propose to use the terms lsquoevennessrsquo and lsquounevennessrsquo in a specific quantitative sense (to be defined below analogous to lsquolengthrsquo) and the terms lsquoequitashybilityrsquo and lsquoinequalityrsquo in a more generic sense (analogous to lsquosizersquo) I also propose descriptive unique names for the pheshynomena that correspond to aspects other than evenness in the strict sense
If the use of the term lsquoevennessrsquo is restricted to just one phenomenon which one should that be Ideally this choice should be as compatible as possible with earlier pracshytice Let us therefore use as a starting point the most often repeated statement that involves the word lsquoevennessrsquo in the ecological literature lsquodiversity consists of two independent components richness and evennessrsquo On the basis of this
Figure 1 Lorenz curves of different datasets Species along the xshyaxis are ranked from the least abundant to the most abundant The absolute abundances of the species of each dataset are listed below the corresponding line type Because the Lorenz curve is repshylication invariant the same curve is obtained with the threeshyspecies dataset (1510) and any dataset derived by exactly replicating its species such as (11551010) and (111555101010)
9Gini Variabilitagrave e Mutabilitagravecf note 71 p 48 L Ceriani et PVerme laquo The Origins of the Gini In-dex Extracts from Variabilitagrave e Mu-tabilitagrave (1912) by Corrado Gini raquo In Journal of Economic Inequality 103(2012) p 421-443 doi 10 1007 s10888-011-9188-x
10C Ricotta laquo A Recipe forUnconventional Evenness Measures raquoIn Acta Biotheoretica 522 (2004)p 95-104 doi 10 1023 B ACBI 000004343841888ac
11R D Routledge laquo Evenness In-dices Are Any Admissible raquo In Oikos 401 (1983) p 149-151 doi 1023073544211 JSTOR 3544211
12Ricotta cf note 10
tement eacutequitable est repreacutesenteacutee par la bissectrice La surfaceentre la courbe reacuteelle et la bissectrice est tregraves utiliseacutee en eacutecono-mie pour mesurer lrsquoineacutegaliteacute sous le nom drsquolaquo indice de Gini raquo 9
bull Compatibiliteacute avec la courbe de Lorenz lrsquoeacutequitabiliteacuteaugmente pour une communauteacute si sa courbe de Lorenzest plus proche de la bissectrice Si les courbes de deuxcommunauteacutes se croisent lrsquoordre de leurs eacutequitabiliteacutesest impreacutevisible
Ce critegravere est remis en cause par Ricotta 10 il est incom-patible11 avec le critegravere de continuiteacute retenu pour les mesuresde diversiteacute lrsquointroduction drsquoune espegravece suppleacutementaire avecune probabiliteacute infiniteacutesimale peut modifier consideacuterablementlrsquoeacutequitabiliteacute
Lrsquoinvariance par reacuteplication est une proprieacuteteacute neacutecessaire(mais pas suffisante) agrave la compatibiliteacute avec la courbe de Lo-renz 12
bull Invariance par reacuteplication lrsquoeacutequitabiliteacute ne change passi chaque espegravece est remplaceacutee par plusieurs nouvellesespegraveces ayant la mecircme abondance
Cette proprieacuteteacute est retenue par Tuomisto mais rejeteacutee parJost comme par Ricotta et drsquoautres Lrsquoargumentation de Jostest la plus convaincante une communauteacute drsquoune richesse don-neacutee dans laquelle tous les individus (agrave lrsquoexception drsquoun nombreneacutegligeable) sont concentreacutes dans une seule espegravece atteint leniveau minimum drsquoeacutequitabiliteacute Si elle est dupliqueacutee les indivi-dus seront reacutepartis dans deux espegraveces et non une la nouvellecommunauteacute nrsquoatteindra pas le niveau minimum drsquoeacutequitabi-liteacute il est donc souhaitable que la mesure drsquoeacutequitabiliteacute aug-mente
52 Indice classiques 91
13L Bulla laquo An Index of Even-ness and Its Associated DiversityMeasure raquo In Oikos 701 (1994)p 167-172 doi 1023073545713 JS-TOR 3545713
14C Taillie laquo Species Equitabili-ty A Comparative Approach raquo In Ecological Diversity in Theory andPractice Sous la dir de J F Grassleet al Fairland MD InternationalCooperative Publishing House 1979p 51-62
15Hill laquo Diversity and Evenness A Unifying Notation and Its Conse-quences raquo cf note 17 p 65
16A L Sheldon laquo Equitability In-dices Dependence on the SpeciesCount raquo In Ecology 503 (1969)p 466-467 doi 1023071933900
17Peet laquo The Measurement ofSpecies Diversity raquo cf note 1 p 25
18R V Alatalo laquo Problems in theMeasurement of Evenness in Ecolo-gy raquo In Oikos 372 (1981) p 199-204 doi 1023073544465
19C Ricotta et al laquo On the Mu-tual Relatedness of Evenness Mea-sures raquo In Community Ecology 21(2001) p 51-56 doi 10 1556 ComEc2200116
52 Indice classiquesIndice de Bulla
Lrsquoindice drsquoeacutequitabiliteacute de Bulla13 respecte les critegraveres deSmith et Wilson
119874 = sum119904
min(119901119904 1119878 ) (51)
Il mesure lrsquoeacutecart entre la distribution reacuteelle et une distri-bution parfaitement eacutequitable Bulla le normalise pour qursquoilsoit compris entre 0 et 1
119864119874 = 119874 minus min 1198741 minus min 119874 (52)
La valeur minimale de 119874 est 1119878 Bulla considegravere que cenrsquoest pas le cas si les effectifs sont entiers et fournit une valeurexacte deacutependant du nombre drsquoespegraveces
Indice de GiniLrsquoindice de Gini est le double de la surface comprise entre
la courbe de Lorenz et la bissectrice (figure 51)
Rapports de moyennesTaillie14 propose le rapport de la moyenne geacuteomeacutetrique
ou de la moyenne harmonique agrave la moyenne arithmeacutetique desprobabiliteacutes
Ratios de HillHill15 utilise les rapports entre nombres effectifs drsquoespegraveces
drsquoordres diffeacuterents comme mesure drsquoeacutequitabiliteacute 11986410 = 11198630119863avait deacutejagrave eacuteteacute proposeacute par Sheldon16 Peet17 le normalise enretirant au numeacuterateur et au deacutenominateur leur valeur mini-male crsquoest-agrave-dire 1
La version normaliseacutee de 11986421 est recommandeacutee par Alata-lo18
SynthegraveseRicotta et al19 testent ces indices sur 65 jeux de donneacutees
diffeacuterents pour observer leurs correacutelations Tous sont compa-tibles avec la courbe de Lorenz Ils concluent que les indicesse reacutepartissent en deux groupes la plupart sont sensiblesaux abondances relatives des espegraveces rares 119864infin0 et dansune moindre mesure 11986420 sont plus sensibles aux espegraveces freacute-quentes
92 Eacutequitabiliteacute
20S Engen laquo Exponential and Lo-garithmic Species-Area Curves raquo In The American Naturalist 111979(1977) p 591-594 JSTOR 2460244
21C Ricotta laquo On ParametricEvenness Measures raquo In Journalof Theoretical Biology 2222 (2003)p 189-197 doi 10 1016 S0022 -5193(03)00026-2
22Ricotta laquo A Recipe for Uncon-ventional Evenness Measures raquo cfnote 10 p 90
23R R Yager laquo On the Speci-ficity of a Possibility Distribution raquoIn Fuzzy Sets and Systems AnInternational Journal in Informa-tion Science and Engineering 503(1992) p 279-292 doi 10 1016 0165-0114(92)90226-T
24Lloyd et Ghelardi laquo A Table forCalculating the rsquoequitabilityrsquo Com-ponent of Species Diversity raquo cfnote 1 p 89 Sheldon laquo Equitabili-ty Indices Dependence on the Spe-cies Count raquo cf note 16 p 91 Pie-lou laquo The Measurement of Diversityin Different Types of Biological Col-lections raquo cf note 77 p 50 PielouEcological Diversity cf note 1 p 61
53 Indice alternatifs
Variance de la rareteacute
Engen20 deacutefinit comme mesure drsquoeacutequitabiliteacute la variance dela rareteacute (la fonction drsquoinformation) de lrsquoentropie de Shannon(minus ln 119901)
119864VS = sum119904
119901119904(ln 119901119904)2 minus (sum119904
119901119904 ln 119901119904)2 (53)
Sa valeur est nulle si les espegraveces sont eacutequiprobablesRicotta21 geacuteneacuteralise cette mesure aux autres fonctions drsquoin-
formation Toutes peuvent ecirctre utiliseacutees
119864VR = sum119904
119901119904119868(119901119904)2 minus [sum119904
119901119904119868(119901119904)]2 (54)
Ces mesures ne sont pas invariantes par reacuteplication maissont continues par rapport aux probabiliteacutes
Non-speacutecificiteacute
Ricotta22 propose un indice fondeacute sur les ensembles flousutilisant les mesures de speacutecificiteacute23 Les espegraveces sont classeacuteespar probabiliteacute deacutecroissante La mesure de non-speacutecificiteacute uti-lisable comme mesure drsquoeacutequitabiliteacute est
119864NSp =119878minus1sum119904=1
119901119904 minus 119901119904+1119904 (55)
Cet indice nrsquoest pas invariant par reacuteplication mais est conti-nu par rapport aux probabiliteacutes
54 Indice de Pielou
Une expression de lrsquoeacutequitabiliteacute est souvent donneacutee agrave par-tir de lrsquoindice de Shannon24 La valeur maximale de lrsquoindice deShannon est obtenue quand la distribution est parfaitement reacute-guliegravere Alors 119867max = ln 119878 On a donc deacutefini lrsquoindice souventappeleacute laquo indice de Pielou raquo
119869 = 119867119867max
= 119867ln 119878 (56)
119869 est compris entre 0 (une seule espegravece a une probabiliteacutede 1) et 1 (toutes les espegraveces ont la mecircme probabiliteacute)
55 Geacuteneacuteralisation de lrsquoindice de Pielou 93
25Mendes et al laquo A Unified Indexto Measure Ecological Diversity andSpecies Rarity raquo cf note 70 p 48
26S H Hurlbert laquo The Noncon-cept of Species Diversity A Cri-tique and Alternative Parameters raquocf note 69 p 48
27B Smith et J B Wilson laquo AConsumerrsquos Guide to Evenness In-dices raquo cf note 5 p 89
55 Geacuteneacuteralisation de lrsquoindice de PielouMendes et al
Mendes et al25 geacuteneacuteralisent lrsquoindice de Pielou en rempla-ccedilant lrsquoindice de Shannon par lrsquoentropie de Tsallis Ils deacutefi-nissent
119902119869 lowast =119902119867
119902119867max=
119902119867ln119902 119878 (57)
et tracent des profils drsquoeacutequitabiliteacute crsquoest-agrave-dire la valeurde 119902119869 lowast en fonction de 119902 Ils observent que lrsquoeacutequitabiliteacute est mi-nimale pour une valeur particuliegravere de 119902 qursquoils notent 119902lowast etmontrent sur des exemples simuleacutes que 119902lowast diminue avec la ri-chesse de la communauteacute mais sans en explorer complegravetementles proprieacuteteacutes
2119869 lowast est lrsquoindice drsquoeacutequitabiliteacute deacuteriveacute de lrsquoindice de diversiteacutede Simpson par S H Hurlbert26
TuomistoTuomisto argumente en faveur drsquoune deacutefinition stricte de
lrsquoeacutequitabiliteacute (evenness en anglais equitability pouvant ecirctreutiliseacute dans un sens plus large) en tant que ratio de Hill
119902119864 = 1198641199020 =1199021198630119863 =
119902119863119878 (58)
Lrsquoeacutequitabiliteacute drsquoordre 119902 est le rapport de la diversiteacutedrsquoordre 119902 sur la richesse
Lrsquoideacutee fondamentale de la notion drsquoeacutequitabiliteacute est que lamesure de la diversiteacute doit pouvoir ecirctre partitionneacutee en deuxcomposantes indeacutependantes la richesse et lrsquoeacutequitabiliteacute27
Jost
2
4
6
00 05 10 15 20Ordre de diversiteacute
Ineacuteq
uita
bilit
eacute
Fig 52 Profil drsquoineacutequitabiliteacute deBCI Lrsquoineacutequitabiliteacute augmentequand on neacuteglige de plus en plusles espegraveces rares Pour q=2 laforecirct de BCI est aussi ineacutequitableqursquoune communauteacute de 6 espegravecesdans laquelle une seule seraitrepreacutesenteacutee au-delagrave drsquoun nombreneacutegligeable drsquoindividus
94 Eacutequitabiliteacute
28Jost laquo The Relation betweenEvenness and Diversity raquo cf note 7p 5
29Sheldon laquo Equitability Indices Dependence on the Species Count raquocf note 16 p 91
30Alatalo laquo Problems in the Mea-surement of Evenness in Ecology raquocf note 18 p 91
31Tuomisto laquo An UpdatedConsumerrsquos Guide to Evenness andRelated Indices raquo cf note 3 p 89
32B Smith et J B Wilson laquo AConsumerrsquos Guide to Evenness In-dices raquo cf note 5 p 89 Tuomistolaquo An Updated Consumerrsquos Guide toEvenness and Related Indices raquo cfnote 3 p 89
33Jost laquo The Relation betweenEvenness and Diversity raquo cf note 7p 5
Jost28 montre que lrsquoindeacutependance est impossible dans lecadre de la deacutecomposition multiplicative si 119902119864 = 119902119863119878 savaleur minimale est contrainte par le nombre drsquoespegraveces unecommunauteacute pauvre ne peut pas ecirctre aussi ineacutequitable qursquounecommunauteacute riche (proprieacuteteacute deacutejagrave montreacutee par Sheldon29 ouAlatalo30) En revanche la richesse peut ecirctre partitionneacutee defaccedilon indeacutependante en diversiteacute et ineacutequitabiliteacute 119878 = 119902119863119902119864
Lrsquoineacutequitabiliteacute 1119902119864 (figure 52) est un nombre ef-fectif drsquoespegraveces crsquoest la richesse drsquoune communauteacute dumecircme niveau drsquoeacutequitabiliteacute que la communauteacute reacuteelle danslaquelle tous les individus (sauf un nombre neacutegligeable)appartiendraient agrave une seule espegravece
Code R pour la figure 52
Estimation du nombre despegravecesNs lt- colSums(BCI)UBNs lt- jackknife(AbdFreqCount(Ns) k = 1)$Nhat ProfilInq lt- DivPrf lt- CommunityProfile(Diversity Ns)Inq$y lt- UBNsDivPrf$yautoplot(Inq xlab = Ordre de diversiteacute ylab = Ineacutequitabiliteacute)
SynthegraveseLrsquoindice de Pielou est le plus utiliseacute31 mais nrsquoest pas inva-
riant par reacuteplication parce qursquoil ne normalise pas une diversiteacutemais une entropie Il est rejeteacute pour cette raison32 par unepartie de la litteacuterature Jost33 argumente au contraire en safaveur 119902119864 deacutepend de la richesse et ne peut donc pas ecirctre com-pareacute entre communauteacutes de richesse diffeacuterente Le logarithmede 119902119864 normaliseacute est une meilleure geacuteneacuteralisation de lrsquoindice dePielou que celle de Mendes et al
119902119869 = ln (119902119863)ln 119878 =
119902119877ln 119878 (59)
119902119869 varie entre 0 et 1 et est une transformation monotonede 119902119864 contrairement au 119902119869 lowast de Mendes et al Il est eacutegal aurapport de lrsquoentropie de Reacutenyi sur le logarithme du nombredrsquoespegraveces
Lrsquoestimation de lrsquoeacutequitabiliteacute repose lourdement sur lrsquoes-timation du nombre drsquoespegraveces quelle que soit la valeur duparamegravetre 119902 La solution la plus eacutevidente consiste agrave corrigerle mieux possible le biais drsquoestimation du nombre drsquoespegraveces etcelui de lrsquoentropie drsquoordre 119902
119902 119869 =ln (119890119902
119902 )ln 119878
(510)
Un profil drsquoeacutequitabiliteacute calculeacute de cette faccedilon est preacutesenteacuteen figure 53 repreacutesentation alternative de la figure 52
56 Relations empiriques entre richesse et eacutequitabiliteacute 95
07
08
09
10
00 05 10 15 20Ordre de diversiteacute
Indi
ce d
e P
ielo
u
Fig 53 Profil drsquoeacutequitabiliteacute deBCI Lrsquoeacutequitabiliteacute est icinormaliseacutee selon Jost
34B J Wilsey et al laquo Relation-ships among Indicies Suggest ThatRichness Is an Imcomplete Surrogatefor Grassland Diversity raquo In Eco-logy 865 (2005) p 1178-1184 doi 10189004-0394
35Z G MacDonald et al laquo Ne-gative Relationships between SpeciesRichness and Evenness Render Com-mon Diversity Indices Inadequate forAssessing Long-Term Trends in But-terfly Diversity raquo In Biodiversityand Conservation 263 (2017) p 617-629 doi 101007s10531-016-1261-0
36P A DeBenedictis laquo On theCorrelations between Certain Diversi-ty Indices raquo In The American Natu-ralist 107954 (1973) p 295-302 doi 1023072459799
37Jost laquo The Relation betweenEvenness and Diversity raquo cf note 7p 5
Code R suppleacutementaire
Inq$y lt- log(DivPrf$y)log(UBNs)autoplot(Inq xlab = Ordre de diversiteacute ylab = Indice de Pielou)
56 Relations empiriques entre richesseet eacutequitabiliteacute
Au-delagrave de la question des contraintes matheacutematiquesentre richesse et eacutequtabiliteacute traiteacutees preacuteceacutedemment il srsquoagitici des relations entre les deux aspects de la diversiteacute dansdes communauteacutes reacuteelles
Wilsey et al34 passent en revue lrsquoargument selon lequelrichesse et eacutequitabiliteacute seraient toujours positivement correacute-leacutes Srsquoil est valide la richesse peut ecirctre consideacutereacutee comme unemesure suffisante de la diversiteacute Agrave partir drsquoinventaires de prai-ries ils montrent la tregraves faible relation entre les deux valeursLe suivi temporel de communauteacutes de papillons35 met en eacutevi-dence une relation neacutegative Les auteurs de lrsquoeacutetude critiquentun peu naiumlvement lrsquoutilisation des nombres de Hill pour mesu-rer la diversiteacute parce qursquoils confondent les effets de la richesseet de lrsquoeacutequitabiliteacute crsquoest justement leur but
Drsquoun point de vue plus theacuteorique DeBenedictis36 eacutetudie lescontraintes numeacuteriques sur lrsquointervalle des valeurs possiblesde lrsquoentropie de Shannon et de lrsquoeacutequitabiliteacute en fonction dela richesse Il ne prouve pas de correacutelation entre ces valeurspour des communauteacutes reacuteelles mais simplement un lien positifquand les eacutechantillons sont de petite taille et lrsquoeffectif mini-mum de chaque espegravece eacutegal agrave 1 ces contraintes se relacircchentsi les donnneacutees sont des probabiliteacutes pouvant tendre vers 0pour les espegraveces rares ou des abondances dans de grandseacutechantillons Cette approche est similaire agrave celle de Jost37
plus aboutie
96 Eacutequitabiliteacute
38May laquo Patterns of SpeciesAbundance and Diversity raquo cfnote 29 p 17
39G Stirling et B J Wilseylaquo Empirical Relationships betweenSpecies Richness Evenness and Pro-portional Diversity raquo In The Ame-rican naturalist 1583 (2001) p 286-299 doi 101086321317
May38 montre que dans le cadre drsquoune distribution log-normale la richesse lrsquoentropie de Simpson et lrsquoeacutequitabiliteacute dePielou sont positivement correacuteleacutees Ce reacutesultat a eacuteteacute eacutetendupar G Stirling et Wilsey39 aux distributions en log-seacuterieset testeacute dans des communauteacutes reacuteelles avec des conclusionscontrasteacutees notamment des correacutelations neacutegatives ntrerichesse et eacutequitabiliteacute dans des communauteacutes tregraves riches
Des simulations permettent de comprendre les correacutelationsdans des cas simples
La figure 54 montre que lrsquoentropie et lrsquoeacutequitabiliteacute sontcorreacuteleacutees positivement agrave la richesse dans des communauteacuteslog-normales de mecircme variance
Fig 54 Relations entrelrsquoentropie de Shannon (a) lrsquoindice
drsquoeacutequitabiliteacute de Pielou (b)lrsquoentropie de Simpson (c)
lrsquoeacutequitabiliteacute de Hurlbert (d) et larichesse de communauteacutes
log-normales similaires (mecircmeeacutecart-type des probabiliteacutes seule
la richesse varie)
3
4
5
30 100 300S (eacutechelle logarithmique)
H
a
06
07
08
09
100 200 300S
J
b
075
080
085
090
095
100
100 200 300S
E
c
080
085
090
095
100
100 200 300S
J2
d
Code R pour reacutealiser les figures
Communauteacutes de 30 agrave 300 espegravecesS lt- 30300 Tirage de communauteacutes log-normales de 10000 individusrcl lt- lapply(S function(S) rCommunity(1 10000 S=S)) Richesse et ShannonSobs lt- sapply(rcl Richness)H lt- sapply(rcl Shannon)ggH lt- ggplot(dataframe(S H) aes(S H)) +
geom_point() + scale_x_log10() +labs(x=S (eacutechelle logarithmique)) +labs(tag = a)
Equitabiliteacute de PielouJ lt- Hlog(S)ggJ lt- ggplot(dataframe(S J) aes(S J)) +
geom_point() + labs(tag = b)E lt- sapply(rcl Simpson)ggE lt- ggplot(dataframe(S E) aes(S E)) +
geom_point() + labs(tag = c)J2 lt- E(1-1S)ggJ2 lt- ggplot(dataframe(S J2) aes(S J2)) +
geom_point() + labs(tag = d)gridarrange(ggH ggJ ggE ggJ2 ncol = 2 nrow = 2)
56 Relations empiriques entre richesse et eacutequitabiliteacute 97
En revanche dans une communauteacute log-normale derichesse fixe mais insuffisamment eacutechantillonneacutee les correacute-lations sont neacutegatives (figure 55) Le sous-eacutechantillonnagea un effet plus seacutevegravere sur la richesse que sur les entropiesdrsquoordres supeacuterieurs La non observation des espegraveces les plusrares augmente aussi lrsquoeacutequitabiliteacute
3
4
5
10 30 100S (eacutechelle logarithmique)
H
a
090
095
100
0 50 100 150 200 250S
J
b
0875
0900
0925
0950
0975
0 50 100 150 200 250S
E
c
096
097
098
099
100
0 50 100 150 200 250S
J2
d
Fig 55 Relations entrelrsquoentropie de Shannon (a) lrsquoindicedrsquoeacutequitabiliteacute de Pielou (b)lrsquoentropie de Simpson (c)lrsquoeacutequitabiliteacute de Hurlbert (d) et larichesse drsquoeacutechantillons de taillevariable drsquoune mecircme communauteacutelog-normale
Code R pour reacutealiser les figures
Communauteacutes de taille 10 agrave 1000 individus 300 sprmc lt- MetaCommunity(sapply(101000 function(n) rCommunity(1 n))) Richesse et ShannonS lt- apply(rmc$Psi 2 Richness)H lt- apply(rmc$Psi 2 Shannon)ggH lt- ggplot(dataframe(S H) aes(S H)) +
geom_point() + scale_x_log10() +labs(x=S (eacutechelle logarithmique)) +labs(tag = a)
Equitabiliteacute de PielouJ lt- Hlog(S)ggJ lt- ggplot(dataframe(S J) aes(S J)) +
geom_point() + labs(tag = b)E lt- apply(rmc$Psi 2 Simpson)ggE lt- ggplot(dataframe(S E) aes(S E)) +
geom_point() + labs(tag = c)J2 lt- E(1-1S)ggJ2 lt- ggplot(dataframe(S J2) aes(S J2)) +
geom_point() + labs(tag = d)gridarrange(ggH ggJ ggE ggJ2 ncol = 2 nrow = 2)
La correacutelation entre richesse et eacutequitabiliteacute est donc po-sitive si la richesse varie entre communauteacutes mais neacutegativesi ce nrsquoest qursquoun effet de lrsquoeacutechantillonnage Les reacutesultats sontsimilaires avec des communauteacutes en log-seacuteries la correacutelationest positive quand 120572 varie neacutegative quand lrsquoeacutechantillonnagevarie
Troisiegraveme partie
Diversiteacute fonctionnelleet phylogeacuteneacutetique
99
1B H Walker laquo Biodiversityand Ecological Redundancy raquo In Conservation biology 61 (1992)p 18-23 doi 101046j1523-17391992610018x
2Pielou Ecological Diversitycf note 1 p 61 R M May laquo Taxo-nomy as Destiny raquo In Nature 347(1990) p 129-130 doi 10 1038 347129a0 S H Cousins laquo SpeciesDiversity Measurement Choosingthe Right Index raquo In Trends in Eco-logy amp Evolution 66 (1991) p 190-192 doi 10 1016 0169 - 5347(91 )90212-G
3D Tilman et al laquo The Influenceof Functional Diversity and Compo-sition on Ecosystem Processes raquo In Science 2775330 (1997) p 1300-1302 doi 101126science27753301300
4C O Webb et al laquo IntegratingPhylogenies into Community Ecolo-gy raquo In Ecology 87 (sp7 2006) S1-S2 doi 10 1890 0012 - 9658(2006 )87[1IPICE]20CO2
5C R Rao laquo Diversity and Dis-similarity Coefficients A Unified Ap-proach raquo In Theoretical PopulationBiology 21 (1982) p 24-43 doi 1010160040-5809(82)90004-1
6R I Vane-Wright et al laquo Whatto Protect mdashSystematics and theAgony of Choice raquo In BiologicalConservation 553 (1991) p 235-254doi 1010160006-3207(91)90030-D
7R M Warwick et K R Clarkelaquo New rsquobiodiversityrsquo Measures Reveala Decrease in Taxonomic Distinctnesswith Increasing Stress raquo In MarineEcology Progress Series 129 (1995)p 301-305 JSTOR 24855596
8J Chave et al laquo The Impor-tance of Phylogenetic Structure inBiodiversity Studies raquo In ScalingBiodiversity Sous la dir de D Storchet al Santa Fe Institute Editions2007 p 150-167
9Ricotta laquo A Semantic Taxono-my for Diversity Measures raquo cfnote 3 p 4 M Vellend et allaquo Measuring Phylogenetic Biodiversi-ty raquo In Biological Diversity Fron-tiers in Measurement and Assess-ment Sous la dir drsquoA E Magurranet B J McGill Oxford Oxford Uni-versity Press 2010 p 194-207
Chapitre 6
Cadre
La diversiteacute fonctionnelle ou phylogeacuteneacutetique prend en compte la proxi-miteacute des espegraveces entre elles Geacuteneacuteralement la distance entre espegraveces esteacutevalueacutee dans lrsquoespace des traits approximation de lrsquoespace des nichespour la diversiteacute fonctionnelle et dans un dendrogramme repreacutesentant laphylogeacutenie ou la taxonomie pour la diversiteacute phylogeacuteneacutetique
Lrsquoessentiel
Les mesures neutres de la diversiteacute considegraverent que toutesles classes auxquelles les objets appartiennent sont diffeacuterentessans que certaines soient plus diffeacuterentes que drsquoautres Parexemple toutes les espegraveces sont eacutequidistantes les unes desautres qursquoelles appartiennent au mecircme genre ou agrave des famillesdiffeacuterentes Intuitivement lrsquoideacutee qursquoune communauteacute de 119878 es-pegraveces toutes de genres diffeacuterents est plus diverse qursquoune com-munauteacute de 119878 espegraveces du mecircme genre est satisfaisante B HWalker1 argumente en faveur de la protection de groupes fonc-tionnels plutocirct que de celle de chacune des espegraveces qui lesconstitue pour maintenir le bon eacutetat des eacutecosystegravemes
Il srsquoagit donc de caracteacuteriser la diffeacuterence entre deux classesdrsquoobjets puis de construire des mesures de diversiteacute en rap-port2 En eacutecologie ces diffeacuterences sont fonctionnelles ou phy-logeacuteneacutetiques deacutefinissant la diversiteacute fonctionnelle3 ou la diver-siteacute phylogeacuteneacutetique (phylodiversity)4
Les premiegraveres propositions de ce type drsquoindices sont duesagrave Rao5 (voir section 76) puis avec nettement moins de suc-cegraves Vane-Wright et al6 et Warwick et Clarke7 Chave et al8montrent que la diversiteacute neutre preacutedit mal la diversiteacute phylo-geacuteneacutetique (calculeacutee par lrsquoentropie quadratique de Rao)
De nombreuses mesures de diversiteacute ont eacuteteacute creacuteeacutees et plu-sieurs revues permettent drsquoen faire le tour9 Les mesures preacute-senteacutees ici sont les plus utiliseacutees et notamment celles quipeuvent ecirctre rameneacutees aux mesures classiques en fixant unedistance eacutegale entre toutes les espegraveces Le cadre meacutethodolo-gique dans lequel ces mesures ont eacuteteacute deacuteveloppeacutees est preacutesenteacutedans ce chapitre suivi par une revue des nombreuses mesures
101
102 Cadre
10J C Lingoes laquo Some Bounda-ry Conditions for a Monotone Ana-lysis of Symmetric Matrices raquo In Psychometrika 362 (1971) p 195-203 doi 10 1007BF02291398 FCailliez laquo The Analytical Solution ofthe Additive Constant Problem raquo In Psychometrika 48 (1983) p 305-310doi 101007BF02294026
de diversiteacute fonctionnelles et phylogeacuteneacutetiques de la litteacuteratureLrsquoentropie phylogeacuteneacutetique et la diversiteacute de Leinster et Cob-bold sont ensuite deacuteveloppeacutees en deacutetail suivies drsquoune synthegraveseet de consideacuterations sur la mesure de la diversiteacute individuelleplutocirct que speacutecifique
Des exemples montrent comment calculer cette diversi-teacute principalement agrave lrsquoaide du package entropart Le packagecontient les donneacutees drsquoinventaire de deux hectares du disposi-tif de Paracou et la taxonomie des espegraveces concerneacutees
library(entropart) Chargement du jeu de donneacuteesdata(Paracou618)
61 Dissimilariteacute et distanceUne similariteacute ou dissimilariteacute est toute application agrave va-
leurs numeacuteriques qui permet de mesurer le lien entre les in-dividus drsquoun mecircme ensemble ou entre les variables Pour unesimilariteacute le lien est drsquoautant plus fort que sa valeur est grande
Une dissimilariteacute veacuterifie (119896 119897 et 119898 sont trois individus)
bull La dissimilariteacute drsquoun individu avec lui-mecircme est nulle 119889 (119896 119896) = 0
bull La dissimilariteacute entre deux individus diffeacuterents est posi-tive 119889 (119896 119897) ge 0
bull La dissimilariteacute est symeacutetrique 119889 (119896 119897) = 119889 (119897 119896)
Une distance veacuterifie en plus
bull La distance entre deux individus diffeacuterents est stricte-ment positive 119889 (119896 119897) = 0 rArr 119896 = 119897
bull Lrsquoineacutegaliteacute triangulaire 119889 (119896 119898) le 119889 (119896 119897) + 119889 (119897 119898) Denombreux indices de dissimilariteacute ne veacuterifient pas cetteproprieacuteteacute
Une distance est euclidienne si elle peut ecirctre repreacutesen-teacutee par des figures geacuteomeacutetriques On peut rendre toute dis-tance euclidienne par ajout drsquoune constante10 Dans R utiliseriseuclid() pour veacuterifier qursquoune distance est euclidienne etcailliez() ou lingoes() pour la transformation
Enfin une distance est ultrameacutetrique si 119889 (119896 119898) lemax (119889 (119896 119897) 119889 (119897 119898)) Les distances obtenues en mesurant leslongueurs des branches drsquoun dendrogramme (arbre) reacutesultantdrsquoune classification hieacuterarchique sont ultrameacutetriques
La faccedilon exacte de mesurer les longueurs de branche estillustreacutee par la figure 61 la distance entre les espegraveces 1 et2 est 1198791 + 1198792 elle est eacutegale agrave 1198791 entre les espegraveces 4 et 5 Ladistance est la hauteur du premier noeud commun
62 Distance phylogeacuteneacutetique 103
1198791 1199011 1199015 1199012 1199013 1199014
1198792
1198793 b31
b23
b11 b12 b13 b14 b15
Fig 61 Arbre phylogeacuteneacutetique oufonctionnel hypotheacutetique 5espegraveces sont preacutesentes (119878 = 5)leurs probabiliteacutes noteacutees 1199011 agrave 1199015Les noms des branches sontafficheacutes
11Clarke et Warwick laquo A FurtherBiodiversity Index Applicable to Spe-cies Lists Variation in TaxonomicDistinctness raquo cf note 3 p 25 War-wick2001
12Chave et al laquo The Importanceof Phylogenetic Structure in Biodiver-sity Studies raquo cf note 8 p 101
13A E Zanne et al laquo Three Keysto the Radiation of Angiosperms intoFreezing Environments raquo In Nature5067486 (2014) p 89-92 doi 10 1038nature12872
14C Ricotta et al laquo ComputingDiversity from Dated Phylogenies andTaxonomic Hierarchies Does It Makea Difference to the Conclusions raquo In Oecologia 1702 (2012) p 501-506doi 101007s00442-012-2318-8
15R H Crozier laquo Preserving theInformation Content of Species Ge-netic Diversity Phylogeny andConservation Worth Interaction withReasons Justifying the Preservation raquoIn Annual Review of Ecology andSystematics 28 (1997) p 243-268doi 101146annurevecolsys281243
16M Westoby et al laquo PLANTECOLOGICAL STRATEGIES Some Leading Dimensions of Varia-tion between Species raquo In AnnualReview of Ecology and Systematics331 (2002) p 125-159 doi 101146annurevecolsys33010802150452
62 Distance phylogeacuteneacutetique
La faccedilon la plus eacutevidente de deacutefinir une distance entre es-pegraveces est drsquoutiliser la taxonomie11 en attribuant une distancearbitraire (par exemple 1) agrave deux espegraveces du mecircme genre uneautre (par exemple 2) agrave deux espegraveces de la mecircme famille etcLa distance deacutefinie est ultrameacutetrique
La taxonomie peut ecirctre remplaceacutee avantageusement parune phylogeacutenie La phylogeacutenie ideacuteale contiendrait lrsquohistoireeacutevolutive de toutes les espegraveces et les distances seraient lestemps de divergence depuis le premier ancecirctre commun Enpratique les phylogeacutenies sont eacutetablies agrave partir drsquoun nombrede marqueurs geacuteneacutetiques limiteacutes sans datation preacutecise (maisavec des calages partiels agrave partir de fossiles) et ne sont pas tou-jours ultrameacutetriques Elles peuvent prendre en compte chaqueindividu sans regroupement par espegravece Une meacutethode pourdater une phylogeacutenie est fournie par Chave et al12 Zanne etal13 fournissent une phylogeacutenie dateacutee de plus de 32000 espegravecesRicotta et al14 montrent sur des exemples que la diversiteacute cal-culeacutee agrave partir de phylogeacutenies dateacutees est tregraves correacuteleacutee agrave cellecalculeacutee agrave partir de simples taxonomies
Dans tous les cas la distance est une mesure de la diver-gence eacutevolutive Du point de vue de la biologie de la conserva-tion chaque espegravece accumule une quantiteacute drsquoeacutevolution inter-preacuteteacutee comme une quantiteacute drsquoinformation15 dont le maximumdoit ecirctre preacuteserveacute
Lrsquoentropie phylogeacuteneacutetique (voir chapitre 8) utilise un arbrephylogeacuteneacutetique pour mesurer la diversiteacute
63 Distance fonctionnelle
Lrsquoapproche fonctionnelle est diffeacuterente Chaque espegravece ouindividu est repreacutesenteacute par ses valeurs de traits dans un espacemultidimensionnel Le vecteur de traits est consideacutereacute commeun proxy de la niche eacutecologique16 Les individus proches danslrsquoespace des traits sont donc consideacutereacutes comme proches eacutecologi-quement Les distances entre les points peuvent ecirctre calculeacutees
104 Cadre
17J H C Cornelissen et al laquo AHandbook of Protocols for Standardi-sed and Easy Measurement of PlantFunctional Traits Worldwide raquo In Australian Journal of Botany 514(2003) p 335-380 doi 10 1071 BT02124
18I J Wright et al laquo The World-wide Leaf Economics Spectrum raquo In Nature 428 (2004) p 821-827 doi 101038nature02403
19C Baraloto et al laquo FunctionalTrait Variation and Sampling Strate-gies in Species Rich Plant Communi-ties raquo In Functional Ecology 241(2010) p 208-216 doi 101111j1365-2435200901600x
20S van Buuren et al laquo FullyConditional Specification in Multiva-riate Imputation raquo In Journal ofStatistical Computation and Simula-tion 7612 (2006) p 1049-1064 doi 10108010629360600810434
21S van Buuren et K Groothuis-Oudshoorn laquo Mice Multivariate Im-putation by Chained Equations inR raquo In Journal of Statistical Soft-ware 453 (2011) p 1-67 doi 10 18637jssv045i03
22J C Gower laquo A General Co-efficient of Similarity and Some ofIts Properties raquo In Biometrics 274(1971) p 857-871 doi 10 2307 2528823
23J Podani laquo Extending GowerrsquosGeneral Coefficient of Similarity toOrdinal Characters raquo In Taxon 482(1999) p 331-340 doi 10 2307 1224438 JSTOR 1224438
24S Pavoine et al laquo On the Chal-lenge of Treating Various Types ofVariables Application for Improvingthe Measurement of Functional Diver-sity raquo In Oikos 1183 (2009) p 391-402 doi 101111j1600-0706200916668x
25J Podani et D Schmeralaquo On Dendrogram-Based Measures ofFunctional Diversity raquo In Oikos1151 (2006) p 179-185 doi 10 1111j20060030-129915048x
26R R Sokal et C D Michenerlaquo A Statistical Method for EvaluatingSystematic Relationships raquo In TheUniversity of Kansas Science Bulle-tin 3822 (1958) p 1409-1438 doi citeulike-article-id1327877
27M A Mouchet et al laquo To-wards a Consensus for CalculatingDendrogram-Based Functional Diver-sity Indices raquo In Oikos 117 (2008)p 794-800 doi 101111j0030-1299200816594x
28R R Sokal et F J Rohlf laquo TheComparison of Dendrograms by Ob-jective Methods raquo In Taxon 112(1962) p 33-40 doi 10 2307 1217208 JSTOR 1217208 P Le-gendre et L Legendre NumericalEcology 3rd Ed Elsevier 2012
29J Felsenstein Inferring Phylo-genies 2nd Ed Sinauer Associates2004
directement dans lrsquoespace des traits ou freacutequemment un arbreest construit par classification automatique hieacuterarchique
La premiegravere eacutetape consiste donc agrave choisir un ensemblede traits pertinents et agrave les mesurer de faccedilon standardiseacutee17
Toute la strateacutegie relative agrave la photosynthegravese peut ecirctrepar exemple assez bien reacutesumeacutee par la masse surfaciquedes feuilles18 mais en forecirct tropicale ce trait est deacutecorreacuteleacutede la densiteacute du bois19 Les valeurs manquantes peuventecirctre compleacuteteacutees en utilisant toute lrsquoinformation disponiblepar MICE (multiple imputation by chained equations)20
disponible sous R dans le package mice21
La prise en compte de variables qualitatives ou de rang etla possibiliteacute de donneacutees manquantes pose un problegraveme pra-tique de construction de la matrice de dissimilariteacute traiteacute parGower22 La formule de Gower eacutetendue par Podani23 puisPavoine et al24 agrave drsquoautres types de variables calcule la dissi-milariteacute entre deux espegraveces par la moyenne des dissimilariteacutescalculeacutees pour chaque trait dont la valeur est comprise entre0 et 1
bull Pour une variable quantitative la diffeacuterence de valeurentre deux espegraveces est normaliseacutee par lrsquoeacutetendue des va-leurs de la variable
bull Les variables ordonneacutees sont remplaceacutees par leur rang ettraiteacutees comme les variables quantitatives
bull Pour des variables qualitatives la dissimilariteacute vaut 0 ou1
bull Les valeurs manquantes sont simplement ignoreacutees etnrsquoentrent pas dans la moyenne
Une matrice de distances entre espegraveces est construite decette faccedilon Podani et Schmera25 suggegraverent drsquoutiliser ensuiteune classification hieacuterarchique par UPGMA26 qursquoils montrentecirctre la plus robuste (pour le calcul de FD voir section 75)agrave lrsquoajout ou au retrait drsquoun trait ou drsquoune espegravece Mouchetet al27 suggegraverent plutocirct drsquoappliquer toutes les meacutethodes declassification et de retenir agrave la fin lrsquoarbre dont la distributiondes distances entre espegraveces dans lrsquoarbre est la plus proche dela distribution des distances dans la matrice de dissimilariteacutes cette proximiteacute est mesureacutee par la correacutelation copheacuteneacutetiquecrsquoest-agrave-dire le coefficient de correacutelation entre les valeurs dedistances28 Un arbre consensus29 est souvent plus proche dela matrice de distance
Un dendrogramme fonctionnel nrsquoa pas drsquointerpreacutetationaussi claire qursquoun arbre phylogeacuteneacutetique qui repreacutesente leprocessus de lrsquoeacutevolution Il peut ecirctre interpreacuteteacute comme larepreacutesentation agrave des eacutechelles de plus en plus grossiegraveres en
64 Eacutequivalence des deux diversiteacutes 105
30S Pavoine et al laquo Is the Origi-nality of a Species Measurable raquo In Ecology Letters 8 (2005) p 579-586doi 101111j1461-0248200500752x J Podani et D Schmera laquo HowShould a Dendrogram-Based Measureof Functional Diversity Function ARejoinder to Petchey and Gaston raquoIn Oikos 1168 (2007) p 1427-1430doi 101111j20070030-129916160x
31E Maire et al laquo How ManyDimensions Are Needed to Accura-tely Assess Functional Diversity APragmatic Approach for Assessingthe Quality of Functional Spaces raquoIn Global Ecology and Biogeogra-phy 246 (2015) p 728-740 doi 101111geb12299
32S Villeacuteger et al laquo On the Risksof Using Dendrograms to MeasureFunctional Diversity and Multidimen-sional Spaces to Measure Phylogene-tic Diversity A Comment on Sobralet al (2016) raquo In Ecology Letters204 (avr 2017) Sous la dir de MVila p 554-557 doi 101111ele 12750
33F L Sobral et al laquo Introduc-tions Do Not Compensate for Func-tional and Phylogenetic Losses Follo-wing Extinctions in Insular Bird As-semblages raquo In Ecology Letters 199(2016) p 1091-1100 doi 101111ele12646
34J Felsenstein laquo Phylogeniesand the Comparative Method raquoIn The American Naturalist 251(1985) p 1-15 doi 101086284325
35C O Webb laquo Exploring thePhylogenetic Structure of EcologicalCommunities An Example for RainForest Trees raquo In American Natu-ralist 1562 (2000) p 145-155 doi 101086303378
allant vers le haut de lrsquoarbre de regroupements fonctionnelsdans des niches de plus en plus vastes
La transformation drsquoune matrice (non ultrameacutetrique) endendrogramme deacuteforme la topologie des espegraveces 30 une me-sure de diversiteacute qui utilise directement la matrice est preacutefeacute-rable crsquoest un inteacuterecirct de la diversiteacute de Leinster et Cobbold(voir chapitre 9) Maire et al31 ont deacutefini une mesure de qua-liteacute drsquoun espace fonctionnel mSD comme lrsquoeacutecart quadratiquemoyen entre les distances fonctionnelles entre espegraveces dans lrsquoes-pace utiliseacute (par exemple les distances copheacuteneacutetiques dans undendrogramme fonctionnel) et les distances originales (dans lamatrice de distance agrave partir de laquelle lrsquoarbre a eacuteteacute obtenu)Dans la matrice originale les valeurs de traits sont centreacutees etreacuteduites et la hauteur du dendrogramme est fixeacutee pour que ladistance copheacuteneacutetique maximale soit eacutegale agrave la distance origi-nale maximale
Villeacuteger et al32 ont montreacute que lrsquoutilisation de dendro-grammes fonctionnels dans une eacutetude de Sobral et al33 amegraveneagrave sous-estimer les changements de niveau de biodiversiteacute lieacutesagrave lrsquoarriveacutee drsquoespegraveces invasives drsquooiseaux Dans la tregraves grandemajoriteacute des dendrogrammes utiliseacutes la transformation de lamatrice de distance a entraicircneacute un eacutecart moyen de plus de 10par rapport aux valeurs originales (une valeur de mSD lrsquoeacutecartquadratique moyen supeacuterieure agrave 1) Cette deacuteformation estsuffisante pour largement invalider les reacutesultats obtenus
64 Eacutequivalence des deux diversiteacutes
Lrsquoapproche fonctionnelle eacutetant particuliegraverement complexeet lourde agrave mettre en oeuvre (notamment pour la mesure destraits sur chaque individu) la tentation a eacuteteacute grande de consi-deacuterer que la phylogeacutenie contenait plus drsquoinformation fonction-nelle que ce qui pouvait ecirctre mesureacute et donc de consideacuterer ladiversiteacute phylogeacuteneacutetique comme proxy de la diversiteacute fonction-nelle
Du point de vue theacuteorique le modegravele le plus simple delrsquoeacutevolution de la valeur drsquoun trait hypotheacutetique au cours dutemps est le mouvement brownien agrave chaque geacuteneacuteration lavaleur du trait varie un peu sans meacutemoire Dans ce cadre34 lavariance de la valeur actuelle du trait pour une espegravece donneacuteeest proportionnelle agrave la dureacutee de lrsquoeacutevolution et la covarianceentre deux espegraveces agrave celle de lrsquoacircge de leur ancecirctre communDeux espegraveces proches dans lrsquoarbre phylogeacuteneacutetique deacutecrivantlrsquoeacutevolution doivent donc avoir des valeurs de trait correacuteleacutees
Webb35 a montreacute que des communauteacutes drsquoarbres tropi-caux avaient une moins grande diversiteacute phylogeacuteneacutetique localeqursquoattendue sous lrsquohypothegravese nulle drsquoune distribution aleacuteatoire
106 Cadre
36J Cavender-Bares et al laquo TheMerging of Community Ecology andPhylogenetic Biology raquo In EcologyLetters 127 (2009) p 693-715 doi 101111j1461-0248200901314x
37N G Swenson et B J Enquistlaquo Opposing Assembly Mechanisms ina Neotropical Dry Forest Implica-tions for Phylogenetic and Functio-nal Community Ecology raquo In Eco-logy 908 (2009) p 2161-2170 doi 10189008-10251
38Pavoine et Bonsall laquo MeasuringBiodiversity to Explain CommunityAssembly A Unified Approach raquo cfnote 4 p 4
39Devictor et al laquo SpatialMismatch and Congruence betweenTaxonomic Phylogenetic andFunctional Diversity The Need forIntegrative Conservation Strategiesin a Changing World raquo cf note 2p 25
40Ricotta laquo A Semantic Taxono-my for Diversity Measures raquo cfnote 3 p 4 Pavoine et Bonsalllaquo Measuring Biodiversity to ExplainCommunity Assembly A Unified Ap-proach raquo cf note 4 p 4
41Pavoine et Bonsall laquo MeasuringBiodiversity to Explain CommunityAssembly A Unified Approach raquo cfnote 4 p 4
42Ibid43A Oslash Mooers et S B Heard
laquo Inferring Evolutionary Process fromPhylogenetic Tree Shape raquo In TheQuarterly Review of Biology 721(1997) p 31-54 doi 10 1086 419657
des espegraveces et a supposeacute que la cause en eacutetait le filtrage envi-ronnemental local agissant sur les traits et observables par laphylogeacutenie sous lrsquohypothegravese de conservation phylogeacuteneacutetiquedes traits fonctionnels La discipline appeleacutee eacutecologie phylogeacute-neacutetique des communauteacutes cherche encore agrave comprendre quelstraits sont conserveacutes et lesquels sont convergents36
Swenson et Enquist37 ont montreacute que la relation entre lesdeux diversiteacutes eacutetait faible Lrsquoutilisation de la diversiteacute phy-logeacuteneacutetique comme proxy de la diversiteacute fonctionnelle nrsquoestpas satisfaisante38 Pour optimiser la conservation les deuxaspects de la diversiteacute souvent divergents doivent ecirctre prisen compte39
65 Typologie des mesuresAgrave partir de la litteacuterature40 une typologie des mesures de
diversiteacute eacutemerge Elle eacutetend les notions classiques de richesseet eacutequitabiliteacute
La richesse est lrsquoaccumulation de classes diffeacuterentes dansles mesures classiques Dans un arbre phylogeacuteneacutetique la lon-gueur des branches repreacutesente un temps drsquoeacutevolution la ri-chesse en est la somme FD et PD sont des mesures de richesse
Fig 62 Reacutegulariteacute contreirreacutegulariteacute Les arbres de A agrave D
sont de plus en plus irreacuteguliersLrsquoarbre A parfaitement reacutegulier
est le cadre des mesures classiquesde la diversiteacute La phylogeacutenie eacutetantdonneacutee trois vecteurs drsquoabondance(P1 agrave P3) sont de moins en moinsreacuteguliers dans les cas C et D la
reacutegulariteacute maximale nrsquoest pasobtenue pour des effectifs
identiques mais en augmentant leseffectifs des espegraveces originales Skewness
Re gularity
Abundance vectors
025
025
025
025
P2P1
033
027
020
020
P3
010
020
035
035
(C)
SkewnessRegularity
Abundance vectors(D)
025
025
025
025
P2P1
005
085
005
005
P3
030
010
030
030
SkewnessRegularity
Abundance vectors(B)
025
025
025
025
P1
045
045
005
005
P2
085
005
005
005
P3
SkewnessRegularity
(A)
025
025
025
025
P1
050
025
020
005
P2
090
006
003
001
P3
SkewnessRegularity
Abundance vectors
La reacutegulariteacute mesure la faccedilon dont les espegraveces occupentuniformeacutement lrsquoespace des niches41 Cette notion est simpledans un espace multidimensionnel (par exemple lrsquoespace destraits fonctionnels) Dans un arbre phylogeacuteneacutetique (figure 62Pavoine et Bonsall42) la reacutegulariteacute de lrsquoarbre43 est un premiercritegravere compleacuteteacute eacuteventuellement par les abondances Dans unarbre parfaitement reacutegulier la reacutegulariteacute se reacuteduit agrave lrsquoeacutequita-biliteacute
Les mesures de divergence sont des fonctions croissantes dela dissimilariteacute entre les espegraveces geacuteneacuteralement consideacutereacutees parpaires Certaines sont pondeacutereacutees par les abondances drsquoautresnon Dans un arbre parfaitement reacutegulier lrsquoindice de Simp-son est une mesure de divergence pondeacutereacutee Ces mesures sontinfluenceacutees par la richesse et la reacutegulariteacute
65 Typologie des mesures 107
44C Ricotta laquo A Note on Func-tional Diversity Measures raquo In Ba-sic and Applied Ecology 65 (2005)p 479-486 doi 101016jbaae200502008
45A R Solow et S Polaskylaquo Measuring Biological Diversity raquoIn Environmental and EcologicalStatistics 12 (1994) p 95-103 doi 101007BF02426650
46M L Weitzman laquo On Diversi-ty raquo In The Quarterly Journal ofEconomics 1072 (1992) p 363-405doi 1023072118476
Face agrave la profusion des mesures de diversiteacute fonctionnelleRicotta44 en compleacutement de A R Solow et Polasky45 eacutetablitun certain nombre drsquoaxiomes
1 Monotoniciteacute drsquoensemble la diversiteacute ne doit pas dimi-nuer quand une espegravece est ajouteacutee avec une faible proba-biliteacute (qui ne modifie pas la structure de la communauteacuteexistante) quelles que soient ses caracteacuteristiques fonc-tionnelles
2 Jumelage 46 lrsquointroduction drsquoune espegravece identique agrave uneespegraveces existante ne doit pas augmenter la diversiteacute Defaccedilon moins triviale une espegravece infiniment proche nedoit pas augmenter la diversiteacute il srsquoagit donc drsquounaxiome de continuiteacute dans lrsquoespace des niches
3 Monotoniciteacute de distance la diversiteacute ne doit pas dimi-nuer quand la distance entre espegraveces est augmenteacutee
4 Deacutecomposabiliteacute les mesures de divergence doivent ecirctredeacutecomposables en diversiteacute 120572 120573 et 120574 ce qui implique leurconcaviteacute par rapport aux probabiliteacutes
Lrsquoentropie phylogeacuteneacutetique permet drsquounifier ces notionsmais de nombreuses mesures ont eacuteteacute proposeacutees Elles sontdeacutetailleacutees au chapitre suivant
1N W H Mason et al laquo Func-tional Richness Functional Evennessand Functional Divergence The Pri-mary Components of Functional Di-versity raquo In Oikos 1111 (2005)p 112-118 doi 101111j0030-1299200513886x
2Jost laquo The Relation betweenEvenness and Diversity raquo cf note 7p 5
3Pavoine et Bonsall laquo MeasuringBiodiversity to Explain CommunityAssembly A Unified Approach raquo cfnote 4 p 4
4D Schleuter et al laquo A UserrsquosGuide to Functional Diversity In-dices raquo In Ecological Monographs803 (2010) p 469-484 doi 10189008-22251
Chapitre 7
Mesures particuliegraveres
De nombreuses mesures de diversiteacute fonctionnelle ou phylogeacuteneacutetique onteacuteteacute deacuteveloppeacutees pour combiner le mieux possible la richesse et la reacutegulariteacutede la distribution des espegraveces dans lrsquoespace des niches ou la phylogeacutenieCertaines (PD FD lrsquoentropie quadratique de Rao 119867119901 et 1198681) serontunifieacutees au chapitre suivant dans le cadre de lrsquoentropie phylogeacuteneacutetique
Lrsquoessentiel
Un certain nombre de mesures de diversiteacute phylogeacuteneacutetiquesa eacutemergeacute dans la litteacuterature Elles sont passeacutees en revue icien commenccedilant par la diversiteacute fonctionnelle envisageacutee danslrsquoespace multidimensionnel des traits Les sections suivantesenvisagent les espegraveces dans un arbre phylogeacuteneacutetique
71 Richesse eacutequitabiliteacute et divergencefonctionnelle
Mason et al1 postulent que la diversiteacute fonctionnelle peutecirctre abordeacutee dans trois dimensions indeacutependantes (Jost2 mon-trera que lrsquoindeacutependance nrsquoest pas assureacutee)
bull la richesse fonctionnelle qui indique lrsquoeacutetendue de lrsquoes-pace des niches fonctionnelles occupeacute par la communau-teacute
bull lrsquoeacutequitabiliteacute de la distribution des espegraveces dans cesniches (appeleacutee reacutegulariteacute par Pavoine et Bonsall3)
bull la divergence fonctionnelle qui mesure comment la dis-tribution des espegraveces dans lrsquoespace des niches maximisela variabiliteacute des caracteacuteristiques fonctionnelles dans lacommunauteacute et combine richesse et eacutequitabiliteacute
Schleuter et al4 font une revue des mesures utiliseacutees dansce cadre Les notations des indices utiliseacutees ici sont les leurs
Diffeacuterents traits numeacuteriques sont connus pour toutes lesespegraveces de la communauteacute La matrice X les contient lrsquoeacuteleacute-ment 119909119905119904 est la valeur moyenne du trait 119905 pour lrsquoespegravece 119904 On
109
110 Mesures particuliegraveres
5Mason et al laquo Functional Rich-ness Functional Evenness and Func-tional Divergence The PrimaryComponents of Functional Diversi-ty raquo cf note 1 p 109
6G E Hutchinson laquo ConcludingRemarks raquo In Cold spring harborsymposia on quantitative biology 22(1957) p 415-427 doi 10 1101 SQB195702201039
note T119904 le vecteur des valeurs moyennes de chaque trait delrsquoespegravece 119904
Richesse fonctionnelleEacutetendue fonctionnelle
Lrsquoeacutetendue fonctionnelle5 mesure lrsquoeacutetendue des valeurs drsquountrait occupeacutee par une communauteacute normaliseacutee par lrsquoeacutetenduemaximale possible
FR119877 = max119904(119909119905119904) minus min119904(119909119905119904)119883119905119898119886119909 minus 119883119905119898119894119899
(71)
ougrave max119904(119909119905119904) est la valeur maximale pour toutes les es-pegraveces de la matrice de la valeur du trait 119905 119883119905119898119886119909 est sa valeurmaximale absolue (les notations sont identiques pour les mi-nima) Les extrecircmes absolus peuvent ecirctre ceux de lrsquoensembledes communauteacutes compareacutees Ils sont toujours sous-estimeacutes ilest toujours possible theacuteoriquement de trouver des valeurs plusextrecircmes en augmentant lrsquoeffort drsquoeacutechantillonnage Lrsquoeacutetenduefonctionnelle peut ecirctre moyenneacutee sur plusieurs traits
Schleuter et al deacuteveloppent lrsquoindice FR119868119904 pour prendreen compte la variabiliteacute intraspeacutecifique et les valeurs de traitsnon occupeacutees par des espegraveces dans lrsquoeacutetendue fonctionnelle Lesvaleurs de traits individuelles sont neacutecessaires lrsquoeacutetendue desvaleurs drsquoun trait est deacutefinie comme lrsquounion des eacutetendues desvaleurs de chaque espegravece
Fig 71 Fonction drsquoappartenancede lrsquoespace des niches de Schleuter
et al en une dimension 119909 enordonneacutee est la valeur du trait
consideacutereacute Chaque espegravece estconsideacutereacutee comme un ensemble
flou dans lrsquoespace des traitsQuatre espegraveces sont repreacutesenteacuteesavec leur fonction drsquoappartenance119891119904(119909) Le volume de lrsquoespace destraits occupeacute FR119868119898 est obtenu
en inteacutegrant les fonctionsdrsquoappartenance crsquoest la zone
griseacutee de la figure
Appendix B Multi-dimensional functional richness (FRIm)
FRIm is a new index specifically designed to account for gaps in multidimensional functional trait space and for intraspecific variability The idea is to consider each species as a fuzzy set in trait space Thus species are characterized by their membership functions (or degree of truth functions) fi At a point x of trait space the membership function of species i is equal to fi ( ) f x( ) point x belongs surely to species x which is comprised between 0 and 1 When i =1
i When f x( ) = 0 x does not belong at all to species i For intermediate values of fi ( ) xxi
may belong to species i with the degree of truth of this proposition quantified by fi ( ) x
Two operations on membership functions are useful to compute functional richness First the ldquovolumerdquo of a set in trait space is computed by integrating its membership function over all trait space Second the membership function of a union of sets is equal to the maximum of all membership functions Thus the total ldquovolumerdquo of trait space occupied by a community is FRIm = intmax [ fi ( ) ]dx (B1) x
i
An example of such a computation is given in Fig B1
Fig B1 ndash An example of FRIm computation (for one-dimensional data) following equation (A2) Four species are present in the community with mean trait values 10 13 15 and 20 and trait standard deviations 01 02 03 and 01 respectively The four fs functions are represented using colored dashed lines (red yellow purple and green resp) The value of FRIm is the area in gray
We chose a simple form for membership functions that could use information on both mean trait values ( μi ) and trait variance-covariance matrices ( Σi ) for each species
⎡ 1 T minus1 ⎤i ( ) = exp ⎢minus (x minus μi ) Σi (x i )⎥f x minus μ (B2)
⎣ 2 ⎦
When covariances among traits are equal to 0 the expression for matrix Σi reduces to a diagonal matrix with elements σ ij
2 describing the variance of trait j in species i
⎡ 1 (x j minus μij )2 ⎤i
⎢ sum 2 ⎥f x( ) = exp minus (B3)
⎢ 2 σ ⎥j ij⎣ ⎦
Volume de niches
La deacutefinition de la niche eacutecologique de Hutchinson6 est lrsquohy-pervolume dans lrsquoespace des ressources environnementalesqursquoune espegravece peut occuper Lrsquoespace des traits fonctionnelspeut ecirctre consideacutereacute comme une approximation de lrsquoespace desressources Le volume de lrsquoenveloppe convexe de lrsquoespace destraits occupeacute par la communauteacute (convex hull volume) estdonc une mesure de richesse fonctionnelle multidimensionnelle
71 Richesse eacutequitabiliteacute et divergence fonctionnelle 111
7B Blonder et al laquo The N-Dimensional Hypervolume raquo In Glo-bal Ecology and Biogeography 23(2014) p 595-609 doi 101111geb12146
8L Zadeh laquo Fuzzy Sets raquo In Information and Control 83 (1965)p 338-353 doi 10 1016 S0019 -9958(65)90241-X
9Schleuter et al laquo A UserrsquosGuide to Functional Diversity In-dices raquo cf note 4 p 109
10Mouchet et al laquo Towardsa Consensus for CalculatingDendrogram-Based FunctionalDiversity Indices raquo cf note 27p 104
11O L Petchey et K J Gastonlaquo Functional Diversity (FD) SpeciesRichness and Community Composi-tion raquo In Ecology Letters 5 (2002)p 402-411 doi 101046j1461-0248200200339x
12Pavoine et Bonsall laquo MeasuringBiodiversity to Explain CommunityAssembly A Unified Approach raquo cfnote 4 p 4
13D Mouillot et al laquo FunctionalRegularity A Neglected Aspect ofFunctional Diversity raquo In Oecolo-gia 1423 (2005) p 353-359 doi 101007s00442-004-1744-7
La prise en compte des trous crsquoest-agrave-dire la restriction du vo-lume agrave lrsquoespace reacuteellement occupeacute agrave lrsquointeacuterieur de cette enve-loppe est possible gracircce agrave une meacutethode drsquoestimation drsquohyper-volume plus eacutelaboreacutee impleacutementeacutee dans le package hypervo-lume pour R7
De mecircme que pour lrsquoeacutetendue fonctionnelle Schleuteret al deacuteveloppent une mesure proche FR119868119898 prenant encompte la variabiliteacute intraspeacutecifique et les espaces nonoccupeacutes Chaque espegravece est supposeacutee occuper un espaceautour de sa position moyenne dans lrsquoespace des traits avecune fonction drsquoappartenance8 gaussienne multidimensionnelle(une repreacutesentation unidimensionnelle se trouve en figure 71Schleuter et al9) la fonction drsquoappartenance issue de lalogique floue peut ecirctre vue comme une densiteacute de probabiliteacutenon normaliseacutee
Les variances et covariances intraspeacutecifiques des traits (ras-sembleacutes dans la matrice carreacutee 119904 de dimension 119905 pour chaqueespegravece 119904) sont neacutecessaires La fonction drsquoappartenance de lrsquoes-pegravece 119904 dans lrsquoespace des traits est pour le vecteur T de valeurde lrsquoensemble des traits
119891119904(T) = 119890minus 12 (TminusT119904)⊤minus1
119904 (TminusT119904) (72)
La richesse fonctionnelle est lrsquointeacutegrale des valeurs maxi-males de 119891119904 dans lrsquoensemble de lrsquoespace des traits
FR119868119898 = int max119904
(119891119904(T)) 119889T (73)
Apregraves transformation de la matrice de distance en dendro-gramme fonctionnel eacuteventuellement sous la forme drsquoun arbre-consensus10 la longueur totale des branches FD11 est uneautre mesure de richesse multidimensionnelle
Equitabiliteacute fonctionnelleLrsquoeacutequitabiliteacute fonctionnelle ou reacutegulariteacute12 rend compte
de lrsquohomogeacuteneacuteiteacute de lrsquooccupation des nichesLrsquoindice drsquoeacutequitabiliteacute de Mouillot et al13 que les auteurs
nomment laquo indice de reacutegulariteacute fonctionnelle raquo est inspireacute delrsquoindice drsquoeacutequitabiliteacute de Bulla (51) Crsquoest un indice unidimen-sionnel un seul trait est pris en compte Les espegraveces sont clas-seacutees par valeur croissante du trait Lrsquoeacutequitabiliteacute maximale estobtenue si lrsquoeacutecart entre deux valeurs de traits est proportionnelaux abondances cumuleacutees des deux espegraveces La statistique fon-damentale est appeleacutee eacutequitabiliteacute pondeacutereacutee (weighted even-ness) Pour lrsquointervalle entre lrsquoespegravece 119904 et lrsquoespegravece 119904 + 1
EW119904 = 119879119904+1 minus 119879119904119873119904+1 + 119873119904
(74)
112 Mesures particuliegraveres
14S Villeacuteger et al laquo New Multi-dimensional Functional Diversity In-dices for a Multifaceted Frameworkin Functional Ecology raquo In Ecolo-gy 898 (2008) p 2290-2301 doi 10189007-12061
15Clarke et Warwick laquo A FurtherBiodiversity Index Applicable to Spe-cies Lists Variation in TaxonomicDistinctness raquo cf note 3 p 25
16B Meacuterigot et J-C Gaert-ner laquo Incorporation of Phylogeny inBiological Diversity Measurement Drawbacks of Extensively Used In-dices and Advantages of Quadra-tic Entropy raquo In BioEssays 3311(2011) p 819-822 doi 101002bies201100103
17N W H Mason et al laquo AnIndex of Functional Diversity raquo In Journal of Vegetation Science 144(2003) p 571-578 doi 101111j1654-11032003tb02184x
18B Walker et al laquo Plant Attri-bute Diversity Resilience and Eco-system Function The Nature andSignificance of Dominant and Mi-nor Species raquo In Ecosystems 22(1999) p 95-113 doi 10 1007 s100219900062
Cette valeur est normaliseacutee PEW119904 = EW119904sum119904 EW119904 Savaleur de PEW119904 attendue pour le maximum drsquoeacutequitabiliteacute est1(119878 minus 1) Lrsquoindice est celui de Bulla appliqueacute aux 119878 minus 1 in-tervalles entre espegraveces
FE119904 =119878minus1sum119904=1
min(PEW119904 1119878 minus 1) (75)
Lrsquoindice FE119904 a eacuteteacute eacutetendu pour ecirctre multidimensionnel parVilleacuteger et al14 Lrsquoarbre recouvrant de longueur minimum (mi-nimum spanning tree) est drsquoabord calculeacute agrave partir des distanceseuclidiennes entre les espegraveces dans lrsquoespace des traits il srsquoagitde lrsquoarbre de longueur totale minimale reliant tous les pointsLa longueur des branches est ensuite traiteacutee de la mecircme faccedilonque 120575119879119904 preacuteceacutedemment
Un autre indice Λ+15 mesure la variance des distancesentre paires drsquoespegraveces
Λ+ =sum119904 sum119905 (119889119904119905 minus 119889)2
119878 (119878 minus 1) (76)
Comme le montrent Meacuterigot et Gaertner16 les mesures dereacutegulariteacute nrsquoont absolument pas les mecircmes proprieacuteteacutes que lesmesures de diversiteacute elles peuvent par exemple augmenterquand on retire des espegraveces originales
Divergence fonctionnelle
Les mesures de divergence fonctionnelle deacutecrivent la varia-biliteacute de position des espegraveces dans lrsquoespace des traits Ce sonttout simplement des mesures de diversiteacute au sens classique duterme
Quand un seul trait est consideacutereacute la mesure la plus simpleest sa variance Mason et al17 effectuent une transformationlogarithmique de la valeur du trait et pondegraverent le calcul dela variance par les probabiliteacutes 119901119904 Ils transforment finalementle reacutesultat en son arc-tangente pour qursquoil soit compris entre 0et 1
Schleuter et al proposent drsquoutiliser la diffeacuterence entre letroisiegraveme et le premier quartile de la valeur du trait normali-seacutee par son eacutetendue maximale possible
FAD a eacuteteacute proposeacute par B Walker et al18 agrave partir drsquounematrice de distances dans lrsquoespace des traits 119889119904119905 est la dis-tance entre deux espegraveces indiceacutees par 119904 et 119905 alors
FAD = sum119904
sum119905
119889119904119905 (77)
71 Richesse eacutequitabiliteacute et divergence fonctionnelle 113
19D Schmera et al laquo A Measurefor Assessing Functional Diversity inEcological Communities raquo In Aqua-tic Ecology 431 (2009) p 157-167doi 101007s10452-007-9152-9
20G D Kader et M Perry laquo Va-riability for Categorical Variables raquoIn Journal of Statistics Education152 (2007) doi 10108010691898200711889465
21Villeacuteger et al cf note 14
FAD est tregraves sensible au nombre drsquoespegraveces Sa version nor-maliseacutee MFAD19 est
MFAD = sum119904 sum119905 119889119904119905119878 (78)
Les deux indices violent lrsquoaxiome de jumelage Agrave un facteurde normalisation pregraves ce sont des cas particuliers de lrsquoindicede Rao pour des effectifs eacutegaux
Le calcul sous R est immeacutediat avec un arbre au for-mat phylog du package ade4 Un arbre au format phylodu package ape neacutecessite une conversion la fonctionPreprocessTree du package entropart la reacutealise
phyTree lt- Paracou618Taxonomy La conversion ashclust() double les distances Il faut donc les diviser par deuxphyTree$edgelength lt- phyTree$edgelength2library(ape)
Attaching package ape
The following objects are masked from packagespatstatgeom edges rotate
Conversion au format hclusthTree lt- ashclustphylo(phyTree) Conversion au format phyloglibrary(ade4)
Attaching package ade4
The following object is masked from packagespatstatgeom disc
Tree lt- hclust2phylog(hTree) Tree$Wdist contient les valeurs de sqrt(2distance)(FAD lt- sum(Tree$Wdist^22))
[1] 264159
(MFAD lt- FADlength(Tree$leaves))
[1] 6215506
Kader et Perry20 regroupent les valeurs de trait par cateacute-gories et calculent lrsquoentropie de Simpson des cateacutegories
Enfin Villeacuteger et al21 utilisent la distance euclidiennemoyenne des espegraveces au centre de graviteacute de la communauteacuteplutocirct que la variance Preacuteciseacutement le centre de graviteacute dela communauteacute (sans pondeacuteration par les freacutequences) est
114 Mesures particuliegraveres
22E Laliberteacute et P Legendrelaquo A Distance-Based Framework forMeasuring Functional Diversity fromMultiple Traits raquo In Ecology 911(2010) p 299-305 doi 10189008-22441
23Villeacuteger et al laquo New Multidi-mensional Functional Diversity In-dices for a Multifaceted Frameworkin Functional Ecology raquo cf note 14p 112
24D P Faith laquo Threatened Spe-cies and the Potential Loss of Phylo-genetic Diversity Conservation Sce-narios Based on Estimated ExtinctionProbabilities and Phylogenetic RiskAnalysis raquo In Conservation Biology226 (2008) p 1461-70 doi 101111j 1523- 1739 2008 01068 x PMID 18798854
25Vane-Wright et al laquo What toProtect mdashSystematics and the Ago-ny of Choice raquo cf note 6 p 101
26N J Isaac et al laquo Mammals onthe EDGE Conservation PrioritiesBased on Threat and Phylogeny raquo In PLoS ONE 23 (2007) e296 doi 101371journalpone0000296
calculeacute La distance euclidienne de lrsquoespegravece 119904 au centre degraviteacute est 119889119866119904 la moyenne pour toutes les espegraveces 119889119866Lrsquoeacutecart moyen des individus de la communauteacute agrave la distancemoyenne est Δ119889 = sum119904 119901119904(119889119866119904 minus 119889119866) Lrsquoeacutecart moyen absoluest Δ|119889| = sum119904 119901119904|119889119866119904 minus 119889119866|
Lrsquoindice estFD119898 = Δ119889 + 119889119866
Δ|119889| + 119889119866 (79)
Sa forme lui permet drsquoecirctre compris entre 0 et 1Laliberteacute et P Legendre22 geacuteneacuteralisent FD119898 en proposant
lrsquousage de nrsquoimporte quelle dissimilariteacute entre espegraveces obtenueagrave partir de la meacutethode de Gower (vue en section 63) auto-risant des variables qualitatives et des donneacutees manquantesau-delagrave de la seule distance euclidienne entre traits quantita-tifs Ils fournissent le package FD pour calculer leur indiceFDis et ceux de Villeacuteger et al23
72 Originaliteacute richesse et eacutequitabiliteacutephylogeacuteneacutetique
La litteacuterature de la diversiteacute phylogeacuteneacutetique srsquoest inteacuteres-seacutee tocirct agrave lrsquooriginaliteacute taxonomique des espegraveces parce que lesquestions traiteacutees concernaient la conservation concerneacutee parla valeur de lrsquoheacuteritage eacutevolutif24
Mesures speacutecifiques drsquooriginaliteacuteVane-Wright et al25 deacutefinissent la distinction taxonomique
(taxonomic distinctness) TD119904 de chaque espegravece comme lrsquoin-verse du nombre de noeuds entre elle et la racine de lrsquoarbrephylogeacuteneacutetique normaliseacute pour que sum119904 TD119904 = 1 Dans lrsquoarbrede la figure 72 les valeurs de TD non normaliseacutees sont 12pour les deux premiegraveres espegraveces et 13 pour les trois autres laracine de lrsquoarbre est comptabiliseacutee dans le nombre de noeudsLes valeurs de TD119904 sont respectivement 14 et 16 apregraves nor-malisation
Fig 72 Arbre phylogeacuteneacutetique oufonctionnel hypotheacutetique Lrsquoarbre
comprend 5 espegraveces dont lesprobabiliteacutes sont noteacutees 119901119904 3
peacuteriodes de dureacutees 119879119896 deacutelimiteacuteespar les noeuds Les branches sontnoteacutees 119887 et indiceacutees par la peacuteriodeagrave laquelle elles se terminent et un
numeacutero drsquoordre
1198791 1199011 1199015 1199012 1199013 1199014
1198792
1198793 b31
b23
b11 b12 b13 b14 b15
La particulariteacute eacutevolutive26 (evolutive distinctiveness ED119904)
72 Originaliteacute richesse et eacutequitabiliteacute phylogeacuteneacutetique 115
27C Ricotta laquo A Parametric Di-versity Measure Combining the Rela-tive Abundances and Taxonomic Dis-tinctiveness of Species raquo In Diver-sity and Distributions 102 (2004)p 143-146 doi 101111j1366-9516200400069x
28S H Hurlbert laquo The Noncon-cept of Species Diversity A Cri-tique and Alternative Parameters raquocf note 69 p 48
29H-P Weikard et al laquo Diversi-ty Measurement Combining RelativeAbundances and Taxonomic Distinc-tiveness of Species raquo In Diversityand Distributions 122 (2006) p 215-217 doi 101111j1366-9516200600234x
30C Ricotta laquo Strong Require-ments for Weak Diversities raquo In Di-versity and Distributions 122 (2006)p 218-219 doi 101111j1366-9516200500233x
de lrsquoespegravece 119904 est la somme de la longueur des branches qui larelient agrave la racine de lrsquoarbre partageacutees entre tous les descen-dants de chaque branche Pour lrsquoespegravece 3 de la figure 72 ED3est eacutegal agrave 119897(11988713) la longueur de la branche terminale propre agravelrsquoespegravece 3 plus un tiers de la longueur de la branche qui reliela racine de lrsquoarbre agrave la polytomie dont lrsquoespegravece 3 est issueClairement la diversiteacute phylogeacuteneacutetique PD (section 75) estla somme des particulariteacutes eacutevolutives de toutes les espegraveces delrsquoarbre
Originaliteacute taxonomique de Ricotta
00
02
04
06
1 10 100Taille de leacutechantillon
Con
trib
utio
n de
s es
pegravece
s
Fig 73 Contribution des espegravecesagrave lrsquoindice de Hurlbert Lescontributions de 4 espegraveces drsquounecommunauteacute agrave lrsquoindice sontrepreacutesenteacutees en fonction de la taillede lrsquoeacutechantillon 119899 Les freacutequencesdes espegraveces sont lisibles pour119899 = 1 une espegravece freacutequente(probabiliteacute eacutegale agrave 07 supeacuterieureagrave 1119878) deux espegraveces peufreacutequentes (019 et 01) et uneespegravece rare (001) Quand 119899 estassez grand toutes lescontributions tendent vers1119878 = 14 (ligne horizontale)
Ricotta27 construit un indice parameacutetrique (permettant dedonner plus ou moins drsquoimportance aux espegraveces rares) agrave partirde lrsquoespeacuterance du nombre drsquoespegraveces tireacutees dans un eacutechantillonde taille 119899 fixeacutee (lrsquoindice de S H Hurlbert28)
120124 (119878119899) = sum119904
[1 minus (1 minus 119901119904)119899] (710)
Ricotta pondegravere cette espeacuterance par lrsquooriginaliteacute taxono-mique de chaque espegravece noteacutee 119908119904 et normalise la mesure
119899119879 = sum119904 119908119904 [1 minus (1 minus 119901119904)119899]120124 (119878119899) (711)
Lrsquooriginaliteacute taxonomique est deacutefinie comme la distancephylogeacuteneacutetique moyenne entre lrsquoespegravece 119904 et les autres 119908119904 =sum119904 119889119904119905(119878 minus 1)
Weikard et al29 montrent que cette deacutefinition de 119908119904 nepermet pas de satisfaire lrsquoaxiome de monotoniciteacute drsquoensembleLa deacutefinition correcte de 119908119904 = sum119904 119889119904119905 valideacutee par Ricotta30
Lrsquointerpreacutetation de 119899119879 est plus intuitive en inversant lalogique de sa construction
116 Mesures particuliegraveres
31Warwick et Clarke laquo New rsquobio-diversityrsquo Measures Reveal a Decreasein Taxonomic Distinctness with In-creasing Stress raquo cf note 7 p 101
32M R Helmus et al laquo Phy-logenetic Measures of Biodiversity raquoIn The American naturalist 1693(2007) E68-83 doi 101086511334
33Felsenstein laquo Phylogenies andthe Comparative Method raquo cfnote 34 p 105
119908119904 est lrsquooriginaliteacute de lrsquoespegravece 119904 [1 minus (1 minus 119901119904)119899]120124(119878119899) estla contribution de lrsquoespegravece 119904 agrave lrsquoespeacuterance du nombre drsquoespegravecescomprise entre 0 et 1 119899119879 est donc lrsquooriginaliteacute moyenne desespegraveces de la communauteacute pondeacutereacutee par la contribution dechaque espegravece agrave lrsquoespeacuterance du nombre drsquoespegraveces observeacute dansun eacutechantillon de taille 119899 Cette contribution est preacutesenteacutee enfigure 73
Quand 119899 = 1 crsquoest simplement la freacutequence des espegravecesQuand 119899 augmente le poids des espegraveces freacutequentes (dont laproabiliteacute est supeacuterieure agrave 1
119878 ) diminue alors que celui des es-pegraveces intermeacutediaires augmente Ce dernier atteint 1120124(119878119899)(une espegravece est eacutechantillonneacutee agrave coup sucircr degraves que lrsquoeacutechantillonest assez grand) drsquoautant plus rapidement que 119901119904 est grand Ilbaisse ensuite alors que les espegraveces rares atteignent agrave leur tourprogressivement leur poids maximal
Quand 119899 rarr +infin le numeacuterateur tend vers FAD et le deacuteno-minateur tend vers le nombre drsquoespegraveces 119899119879 tend vers MFAD
Code R pour la figure 73
Ps lt- c(07 019 01 001)S lt- length(Ps)nRange lt- 1500 Indice de HurlbertESn lt- c(1 sapply(nRange[-1] function(n) Hurlbert(Ps n))) Preacuteparation du graphiqueXlab lt- Taille de leacutechantillonYlab lt- Contribution des espegraveces Contribution de chaque espece agrave chaque valeur de nCsn lt- sapply(1S function(s) sapply(nRange
function(n) (1-(1-Ps[s])^n))ESn) Dataframe contenant les donneacuteesdf lt- asdataframe(cbind(nRange Csn))colnames(df) lt- c(n s07 s019 s01 s001) GraphiqueESnplot lt- ggplot(gather(df Sp Contribution -n) aes(x=n)) +
geom_line(aes(y = Contribution lty=Sp)) +geom_hline(yintercept=14 col=red) +scale_x_log10() +labs(x = Xlab y = Ylab) +theme(legendposition = none)
ESnplot
Richesse phylogeacuteneacutetiqueLa particulariteacute taxonomique moyenne31 (Average Taxo-
nomic Distinctiveness AvTD) est la distance moyenne danslrsquoarbre entre deux espegraveces choisies au hasard Crsquoest donc lrsquoeacutequi-valent taxonomique de MFAD La variabiliteacute phylogeacuteneacutetiquedes espegraveces32 (Phylogenetic Species Variability PSV ) est lamecircme mesure obtenue agrave partir du modegravele drsquoeacutevolution sui-vant un mouvement brownien33 La distance moyenne entredeux espegraveces est dans ce cadre proportionnelle agrave la covariancede leurs traits fonctionnels La richesse phylogeacuteneacutetique des es-pegraveces PSR est PSV multiplieacutee par le nombre drsquoespegraveces crsquoestlrsquoeacutequivalent taxonomique de FAD
72 Originaliteacute richesse et eacutequitabiliteacute phylogeacuteneacutetique 117
34M W Cadotte et al laquo Phylo-genetic Diversity Metrics for Ecolo-gical Communities Integrating Spe-cies Richness Abundance and Evolu-tionary History raquo In Ecology Letters131 (2010) p 96-105 doi 101111j1461-0248200901405x
La diversiteacute FD de Faith (section 75) eacutegale agrave la somme deslongueurs des branches de lrsquoarbre semble avoir fait consensusdrsquoougrave un moindre deacuteveloppement des mesures de richesse quedans la litteacuterature fonctionnelle
Indices de CadotteCadotte et al34 proposent un ensemble de mesure phylo-
geacuteneacutetiques eacutequitabiliteacute deacuteseacutequilibre drsquoabondance et diversiteacutede la particulariteacute evolutive
Equitabiliteacute phylogeacuteneacutetique
Les branches terminales de lrsquoarbre phylogeacuteneacutetique sontici agrave la base de la deacutefinition de lrsquoeacutequitabiliteacute figure 74 lesbranches 1198871119904 sont les segments termineacutes par une feuille (aubas de lrsquoarbre) crsquoest-agrave-dire que leur longueur est la partiede lrsquoarbre que les espegraveces ne partagent pas La mesuredrsquoeacutequitabiliteacute est
PAE = PD + sum119904 119897(1198871119904)(119899119904 minus 1)PD + ( 119899
119878 minus 1) sum119904 119897(1198871119904) (712)
1198791 1199011 1199015 1199012 1199013 1199014
1198792
1198793 b31
b23
b11 b12 b13 b14 b15
Fig 74 Arbre phylogeacuteneacutetique oufonctionnel hypotheacutetique
PAE vaut 1 quand les espegraveces sont sont distribueacutees eacutequita-blement pour la longueur des branches Une valeur plus grandeest obtenue quand les espegraveces sont concentreacutees au bout deslongues branches et inversement si 0 lt PAE lt 1
Deacuteseacutequilibre drsquoabondance
Lrsquoeacutequilibre drsquoabondance est deacutefini par une distributionaleacuteatoire des espegraveces par division de lrsquoeffectif total agrave partirde la racine de lrsquoarbre phylogeacuteneacutetique En figure 74 enpartant de la racine la moitieacute des individus est supposeacutee sereacutepartir sur chaque branche Agrave la peacuteriode 2 les effectifs dela branche de gauche se partagent en deux parties eacutegales Agravepartir du nombre total drsquoindividus de la communauteacute 119899 lenombre attendu drsquoindividus 1198990
119904 de lrsquoespegravece 119904 est une fractionde 119899 correspondant au nombre de noeuds et au nombre debranches partant de chaque noeud On note 119910119896119904 le nombre
118 Mesures particuliegraveres
de branches partant du noeud ancestral de lrsquoespegravece 119904 agrave lapeacuteriode 119896 srsquoil existe 119910119896119904 = 1 sinon
1198990119904 = 119899
prod119870119896=2 119910119896119904
(713)
En figure 74 pour lrsquoespegravece 3 11991013 = 3 (lrsquoespegravece est issuedrsquoune polytomie) 11991023 = 1 (absence de noeud) et 11991033 = 2 (laracine de lrsquoarbre est dichotomique) On srsquoattend donc agrave ce quelrsquoespegravece 3 soit repreacutesenteacutee par un sixiegraveme des individus
Lrsquoindice de deacuteseacutequilibre drsquoabondance mesure lrsquoeacutecart agrave cettedistribution theacuteorique
IAC = sum119904 |119899119904 minus 1198990119904|
120584 (714)
120584 est le nombre de noeuds de lrsquoarbre (3 dans lrsquoexemple dela figure 74)
Diversiteacute de la particulariteacute eacutevolutive
Lrsquoentropie de Shannon peut ecirctre appliqueacutee pour mesurerla diversiteacute des particulariteacutes eacutevolutives
119867ED = minus sum119904
ED119904PD ln ED119904
PD (715)
Lrsquoeacutequitabiliteacute des particulariteacutes eacutevolutives est celle de Pie-lou
119864ED = 119867EDln 119878 (716)
Ces mesures ne prennent pas en compte les abondancesdes espegraveces Pour y remeacutedier il suffit drsquoajouter une peacuteriodede dureacutee nulle agrave chaque feuille de lrsquoarbre correspondant agrave unepolytomie entre les 119899119904 individus de chaque espegravece La particu-lariteacute eacutevolutive AED119904 des individus de lrsquoespegravece 119904 est calculeacuteeen partageant la longueur de chaque branche ancestrale entrele nombre drsquoindividus qui en descendent (et non le nombredrsquoespegraveces) Alors PD = sum119904 119899119904AED119904 Lrsquoentropie devient
119867AED = minus sum119904
119899119904AED119904PD ln 119899119904AED119904
PD (717)
et lrsquoeacutequitabiliteacute correspondante est
119864AED = 119867AEDln 119873 (718)
Ces indices ne mesurent pas la diversiteacute phylogeacuteneacutetique ausens des autres mesures preacutesenteacutees dans ce chapitre Ils me-surent la diversiteacute de le particulariteacute eacutevolutive autrement dit
73 Diversiteacute de Scheiner 119
35S M Scheiner laquo A Metric ofBiodiversity That Integrates Abun-dance Phylogeny and Function raquo In Oikos 1218 (2012) p 1191-1202doi 101111j1600-0706201220607x
36S J Presley et al laquo Evalua-tion of an Integrated Framework forBiodiversity with a New Metric forFunctional Dispersion raquo In PloS one98 (2014) e105818 doi 10 1371 journalpone0105818
du temps drsquoeacutevolution accumuleacute par chaque espegravece ou chaqueindividu Pour un nombre drsquoespegraveces fixeacute 119864ED atteint son maxi-mum quand les valeurs de ED119904 sont toutes identiques Unarbre phylogeacuteneacutetique composeacute drsquoune seule branche depuis laracine termineacute par une polytomie de longueur nulle portanttoutes les espegraveces correspond agrave cette description Dans cetexemple les espegraveces ont une divergence eacutevolutive nulle mais119864ED = 119878 son maximum possible
73 Diversiteacute de Scheiner
Scheiner35 deacuteveloppe un cadre unifieacute pour mesurer la diver-siteacute speacutecifique phylogeacuteneacutetique ou fonctionnelle seacutepareacutement ousimultaneacutement Lrsquoideacutee geacuteneacuterale est que toute quantiteacute parta-geacutee par les espegraveces (le nombre drsquoindividus le temps drsquoeacutevolutionaccumuleacute la taille des niches eacutecologique) peut ecirctre traduite ennombre de Hill
La diversiteacute speacutecifique est simplement 119902119863 Scheiner la note119902119863(119860) pour diversiteacute drsquoabondance
La diversiteacute phylogeacuteneacutetique 119902119863(119875) ne prend pas en compteles abondances mais mesure la diversiteacute de la divergence eacutevo-lutive des espegraveces La divergence totale dans un arbre phylogeacute-neacutetique (pas forceacutement ultrameacutetrique) est la longueur totaledes branches (crsquoest-agrave-dire FD) Elle est reacutepartie entre toutesles espegraveces la longueur de chaque branche (repreacutesentant unequantiteacute drsquoeacutevolution) est partageacutee agrave parts eacutegales entre les es-pegraveces qui en descendent La divergence de lrsquoespegravece 1 de lafigure 77 est 119879 1 + 119879 2 la longueur de la branche terminaleplus 119879 32 parce que la branche est partageacutee par les espegraveces 1et 2 La divergence de lrsquoespegravece 1 est donc 1198711 = 119879 1+119879 2+119879 32La part de la divergence de lrsquoespegravece 119904 est 119897119904 = 119871119904119865119863 La di-versiteacute phylogeacuteneacutetique est le nombre de Hill des divergences
119902119863 = (119878
sum119904=1
119897119902119904)1
1minus119902
(719)
La diversiteacute fonctionnelle 119902119863(119865) est la diversiteacute des taillesdes niches La taille de la niche est deacutefinie par Scheiner commele volume de lrsquohypersphegravere (dans lrsquoespace des traits fonction-nels de dimension 119898) centreacutee sur chaque espegravece dont le rayonest la moitieacute de la distance agrave lrsquoespegravece la plus proche pourque les sphegraveres ne se superposent pas Une meilleure deacutefini-tion36 de la taille de la niche est la somme des distances auxautres espegraveces 119905119904 = sum119905 119889119904119905 La part de chaque espegravece est119891119904 = 119905119904sum119905 119905119905 et la deacutefinition de la diversiteacute fonctionnelle est
120 Mesures particuliegraveres
119902119863(119879 ) = (119878
sum119904=1
119891119902119904 )
11minus119902
(720)
La diversiteacute peut prendre en compte plusieurs com-posantes pas exemple lrsquoabondance et la phylogeacutenie pourdeacutefinir
119902119863(119860119875) = (119878
sum119904=1
( 119899119904119871119904sum119878
119905=1 119899119905119871119905)
119902
)1
1minus119902
(721)
La diversiteacute drsquoabondance et phylogeacuteneacutetique est la diversi-teacute des divergences pondeacutereacutees par les effectifs des espegraveces Lamesure de biodiversiteacute de Scheiner incluant les trois compo-santes est
119902119863(119860119875119865) = (119878
sum119904=1
( 119899119904119871119904119905119904sum119878
119905=1 119899119905119871119905119905119905)
119902
)1
1minus119902
(722)
Son interpreacutetation est moins immeacutediate Chaque espegravece estassocieacutee agrave une fraction drsquoune des trois dimensions de la diver-siteacute (abondance temps drsquoeacutevolution cumuleacute taille des niches)Elle occupe un paralleacuteleacutepipegravede de dimensions (119901119904 119897119904 119891119904) dansle cube de dimension 1 qui les contient toutes Cette repreacutesen-tation ne donne pas drsquoimportance particuliegravere agrave lrsquoabondanceet peut ecirctre appliqueacutee agrave un nombre quelconque de dimensionsLa mesure de biodiversiteacute est la diversiteacute des volumes occupeacutespar les espegraveces normaliseacutes par leur somme (qui nrsquoest pas eacutegaleagrave 1)
En se limitant agrave deux dimensions pour la lisibiliteacute la fi-gure 75 preacutesente les rectangles correspondant agrave la diversi-teacute drsquoabondance et fonctionnelle occupeacutes par les espegraveces dela meacuteta-communauteacute Paracou618 classeacutees par freacutequences deacute-croissantes
Code R
ProbabiliteacutesPs lt- Paracou618MC$Ps[Paracou618MC$Psgt0]Ps lt- sort(Ps decreasing = TRUE) Freacutequences cumuleacuteesPsCum lt- cumsum(Ps)Xgauche lt- c(0 PsCum)Xdroite lt- c(PsCum 1) Matrice de distances fonctionnellesDistanceMatrix lt- asmatrix(Paracou618dist) Mise en correspondance de la matrice et du vecteur de probabiliteacutesDistanceMatrix lt- DistanceMatrix[names(Ps) names(Ps)] Taille des nichests lt- rowSums(DistanceMatrix)fs lt- tssum(ts)
73 Diversiteacute de Scheiner 121
000
025
050
075
100
000 025 050 075 100Freacutequence
Nic
he
Fig 75 Rectangles de surfacefreacutequence times taille de niche desespegraveces de la meacuteta-communauteacuteParacou618 La diversiteacute deScheiner 119902119863(119860119865) est la diversiteacutede leur surface
Freacutequences cumuleacuteesfsCum lt- cumsum(fs)Ybas lt- c(0 fsCum)Yhaut lt- c(fsCum 1) Rectangles occupeacutes par chaque espegraveceggplot(dataframe(Xgauche Ybas Xdroite Yhaut)) +
geom_rect(aes(xmin= Xgauche xmax= Xdroite ymin= Ybas ymax= Yhaut)color = black fill = white) +
coord_fixed() +labs(x = Freacutequence y=Niche)
La diversiteacute drsquoabondance et fonctionnelle est la diversiteacutede la surface des rectangles
Surface lt- Ps fsRs lt- Surfacesum(Surface)Diversity(Rs q = 2)
None 7172482
Le profil de diversiteacute drsquoabondance et fonctionnelle est enfigure 76
100
150
200
00 05 10 15 20Ordre de diversiteacute
Div
ersi
teacute
Fig 76 Profil de diversiteacutedrsquoabondance et fonctionnelle deScheiner de la meacuteta-communauteacuteParacou618 Pointilleacutes longs diversiteacute drsquoabondance pointilleacutescourts diversiteacute fonctionnelle trait plein diversiteacute drsquoabondanceet fonctionnelle
122 Mesures particuliegraveres
37A R Solow et Polasky laquo Mea-suring Biological Diversity raquo cfnote 45 p 107
Code R
autoplot(CommunityProfile(Diversity Rs)xlab=Ordre de diversiteacute ylab=Diversiteacute) +
geom_line(data = asdataframelist(CommunityProfile(Diversity Ps))mapping = aes(x y) lty = 2) +
geom_line(data = asdataframelist(CommunityProfile(Diversity fs))mapping = aes(x y) lty=3)
La notion de diversiteacute phylogeacuteneacutetique ou fonctionnelle trai-teacutee par Scheiner est assez diffeacuterente de celles vues preacuteceacutedem-ment parce qursquoelle considegravere toutes les dimensions de faccedilonsymeacutetrique lrsquoordre de diversiteacute 119902 srsquoapplique agrave toutes les di-mensions Si 119902 est grand les espegraveces dont le produit des dimen-sions de la diversiteacute est petit (que lrsquoespegravece soit rare ait unedivergence phylogeacuteneacutetique faible ou une niche eacutetroite) sont neacute-gligeacutees alors que 119902 nrsquoaffecte que la freacutequence dans le cadre dela phylodiversiteacute 119902 ou la banaliteacute pour 119902119863Z
74 Diversiteacute de Solow et PolaskyA R Solow et Polasky37 relient la richesse fonctionnelle ou
phylogeacuteneacutetique agrave la probabiliteacute de trouver au moins une espegraveceinteacuteressante (par exemple capable de fournir une moleacuteculeutile) dans une communauteacute
Les distances entre espegraveces sont supposeacutees connuesqursquoelles soient fonctionnelle phylogeacuteneacutetique ou autre Laprobabiliteacute qursquoune espegravece quelconque soit inteacuteressante estfixeacutee agrave 119901 par exemple agrave partir de lrsquoexpeacuterience passeacutee (si uneespegravece cribleacutee sur 100 fournit une moleacutecule utile 119901 = 1) Enabsence drsquoinformation sur les espegraveces 119901 est a priori identiquepour toutes mais on suppose une correacutelation entre les probabi-liteacutes deacutependant de la distance entre les espegraveces Formellementune fonction de similariteacute entre les espegraveces 119904 et 119905 est deacutefinie 119911119904119905 = 119891(119889119904119905) Cette fonction est deacutecroissante entre 1 (quandla distance est nulle) et 0 (agrave distance infinie) par exemple119891(119889119904119905) = 119890minus119906119889119904119905 ougrave 119906 est une constante strictement positiveLa matrice Z reacuteunit les eacuteleacutements 119911119904119905
On deacutefinit ensuite la variable de Bernoulli 119861119904 (drsquoespeacuterance119901119904) qui vaut 1 si lrsquoespegravece 119904 est inteacuteressante 119911119904119905 est parconstruction du modegravele la correacutelation entre 119861119904 et 119861119905 deux espegraveces tregraves proches ont la mecircme probabiliteacute drsquoecirctreinteacuteressante deux espegraveces tregraves eacuteloigneacutees ont des probabiliteacutesindeacutependantes La probabiliteacute qursquoau moins une espegravece soitinteacuteressante est minoreacutee par 11990121prime
119878Zminus11119878 ougrave 1119878 est le vecteurde longueur 119878 ne contenant que des 1 prime indique la transposeacuteeet Zminus1 est la matrice inverse de Z (son existence est garantiepuisque Z est une matrice de variance-covariance) La valeurde 119901 est incertaine et sans grand inteacuterecirct
75 FD et PD 123
38D P Faith laquo ConservationEvaluation and Phylogenetic Diver-sity raquo In Biological Conservation611 (1992) p 1-10 doi 1010160006-3207(92)91201-3
39Petchey et Gaston laquo Functio-nal Diversity (FD) Species Richnessand Community Composition raquo cfnote 11 p 111
40D Sol et al laquo Urbanisation andthe Loss of Phylogenetic Diversityin Birds raquo In Ecology Letters 20(2017) p 721-729 doi 101111ele12769
119881 = 1prime119878Zminus11119878 est la mesure de diversiteacute de Solow et Po-
lasky Elle rend compte de la dispersion des espegraveces moinsles espegraveces sont similaires plus la probabiliteacute que lrsquoune drsquoelleau moins soit inteacuteressante est eacuteleveacutee conditionnellement aunombre drsquoespegraveces et agrave 119901 Si les espegraveces sont infiniment eacuteloi-gneacutees les unes des autres Z est la matrice identiteacute et la di-versiteacute est eacutegale agrave la richesse 119881 est donc un nombre effectifdrsquoespegraveces crsquoest-agrave-dire le nombre drsquoespegraveces totalement dissimi-laires neacutecessaires pour obtenir la diversiteacute observeacutee Agrave lrsquoopposeacutesi toutes les espegraveces sont identiques Z ne contient que des 1et la diversiteacute vaut 1
75 FD et PD
1198791 119896 =1
119896 = 2 119896 = 119870 = 3 1198713 = 2 1198712 = 3
1198711 = 119878 = 5 1199011
11990631= 1199011 + 1199012
1199015 1199012 1199013 1199014
11990632= 1199013 + 1199014 + 1199015
11990622= 1199012
11990621= 1199011
11990623= 1199013 + 1199014 + 1199015
1199061119904 = 119901119904
1198793 1198792
1198792
1198793 (a)
(b) (c)
Fig 77 Arbre phylogeacuteneacutetique oufonctionnel hypotheacutetique (a)Arbre complet 5 espegraveces sontpreacutesentes (119878 = 5) Une peacuteriode delrsquoarbre est deacutefinie entre deuxnoeuds successifs lrsquoarbre contient119870 = 3 peacuteriodes Les hauteurs despeacuteriodes sont noteacutees 119879119896 Agrave chaquepeacuteriode correspond un arbre plussimple (b) pour la peacuteriode 2 (c)pour la peacuteriode 3 dans lequel lesespegraveces originales sont regroupeacuteesLe nombre de feuilles de ces arbresest noteacute 119871119896 Les probabiliteacutes pourun individu drsquoappartenir agrave unefeuille sont noteacutees 119906119896119897
Si la dissimilariteacute entre les espegraveces est repreacutesenteacutee par undendrogramme les indices de diversiteacute les plus simples sontla diversiteacute phylogeacuteneacutetique38 et sa transposition la diversiteacutefonctionnelle39
Eacutetant donneacute un arbre contenant toutes les espegraveces ou tousles individus eacutetudieacutes PD ou FD sont eacutegaux agrave la somme de lalongueur des branches (figure 77 PD = 5 times 1198791 + 3 times 1198792 +2 times 1198793) Si les noeuds de lrsquoarbre phylogeacuteneacutetique sont dateacutesPD peut ecirctre consideacutereacute comme une accumulation de tempsdrsquoeacutevolution par la communauteacute eacutetudieacutee Sol et al40 montrentpar exemple que les milieux urbaniseacutes ont un deacuteficit de 450millions drsquoanneacutees drsquoeacutevolution dans les communauteacutes drsquooiseauxrelativement aux environnements naturels voisins
Dans le cas particulier ou toutes les branches sont de lon-gueur 1 crsquoest-agrave-dire que toutes les espegraveces sont lieacutees agrave la mecircmeracine (on dira que lrsquoarbre est parfaitement reacutegulier) PD etFD sont eacutegales agrave la richesse speacutecifique
Le package entropart fournit la fonction PDFD Vecteur des probabiliteacutesPs lt- Paracou618MC$PsPDFD(Ps Paracou618Taxonomy)
124 Mesures particuliegraveres
41A Chao et al laquo Rarefaction andExtrapolation of Phylogenetic Diver-sity raquo In Methods in Ecology andEvolution 64 (2015) p 380-388 doi 1011112041-210X12247
42Weitzman laquo On Diversity raquo cfnote 46 p 107
43M L Weitzman laquo What to Pre-serve An Application of DiversityTheory to Crane Conservation raquo In The Quarterly Journal of Economics1081 (1993) p 157-183 doi 10 23072118499 JSTOR 2118499
44L Witting et V Loeschckelaquo The Optimization of Biodiversi-ty Conservation raquo In BiologicalConservation 712 (1995) p 205-207doi 1010160006-3207(94)00041-N
None 395
Chao et al41 fournissent un estimateur de PD (ou FD)permettant de lrsquoestimer sans biais pour un eacutechantillon pluspetit que celui observeacute et de faccedilon fiable pour un eacutechantillonde taille double au maximum Ces estimateurs permettent detracer des courbes de rareacutefaction et drsquoextrapolation
En mecircme temps que Faith Weitzman42 a eacutetabli une fonc-tion de diversiteacute identique agrave PD Agrave partir drsquoune matrice dedissimilariteacutes entre espegraveces un arbre est construit par la meacute-thode suivante Les deux espegraveces les plus proches sont ras-sembleacutees Lrsquoune drsquoelles celle qui diminue le moins la longueurtotale des branches de lrsquoarbre final en la retirant est lrsquoespegravecede lien lrsquoautre est lrsquoespegravece repreacutesentative du clade Lrsquoespegravecede lien est retireacutee et le regroupement poursuivi entre les deuxnouvelles espegraveces les plus proches Agrave chaque eacutetape lrsquoespegravecede lien est retireacutee jusqursquoau regroupement final entre les deuxderniegraveres espegraveces La difficulteacute est que lrsquoarbre final nrsquoest pasconnu aux premiers stades de regroupement donc tous lesarbres doivent ecirctre testeacutes pour trouver la solution unique Ladiversiteacute est la somme des distances entre les espegraveces de lien etleur espegravece repreacutesentative crsquoest-agrave-dire la longueur totale desbranches de lrsquoarbre obtenu Lrsquoapplication agrave la conservation estque les espegraveces repreacutesentatives doivent ecirctre favoriseacutees par rap-port aux espegraveces de lien en drsquoautres termes les espegraveces dontles branches sont les plus courtes dans lrsquoarbre sont celles quiapportent le moins de diversiteacute Ce reacutesultat est assez eacutevidentquand on dispose drsquoun arbre phylogeacuteneacutetique Lrsquooriginaliteacute dela meacutethode de Weitzman est de fournir un algorithme pourcreacuteer lrsquoarbre agrave partir drsquoune matrice de distances qui est coheacute-rent avec la mesure de diversiteacute appliqueacutee
La mesure de diversiteacute peut ecirctre combineacutee avec une proba-biliteacute drsquoextinction de chaque espegravece (agrave dire drsquoexpert) pour cal-culer lrsquoespeacuterance de la diversiteacute agrave une eacutecheacuteance donneacutee 43 2119878
arbres peuvent ecirctre construit en faisant disparaicirctre certainesdes 119878 espegraveces de la communauteacute la probabiliteacute de chaquearbre est calculable agrave partir des probabiliteacutes drsquoextinction dechaque espegravece (supposeacutees indeacutependantes) et lrsquoespeacuterance de di-versiteacute est simplement la moyenne des diversiteacutes de chaquearbre pondeacutereacutee par sa probabiliteacute Lrsquoespeacuterance de la perte dediversiteacute peut ecirctre calculeacutee de faccedilon plus simple44 comme lamoyenne de la longueur des branches pondeacutereacutee par la proba-biliteacute de leur disparition qui est le produit de la probabiliteacutede disparition de toutes les espegraveces descendant de la branche
Diverses optimisations eacuteconomiques sont possibles dont lechoix des espegraveces agrave proteacuteger agrave partir de lrsquoeacutelasticiteacute de la diver-
76 Indice de Rao 125
45J Izsaacutek et L Papp laquo A Linkbetween Ecological Diversity Indicesand Measures of Biodiversity raquo In Ecological Modelling 130 (2000)p 151-156 doi 10 1016 S0304 -3800(00)00203-9 K Shimatani laquo Onthe Measurement of Species DiversityIncorporating Species Differences raquoIn Oikos 931 (2001) p 135-147doi 10 1034 j 1600 - 0706 2001 930115 x Z Botta-Dukaacutet laquo RaorsquosQuadratic Entropy as a Measure ofFunctional Diversity Based on Mul-tiple Traits raquo In Journal of Vege-tation Science 165 (2005) p 533-540 doi 10 1111 j 1654 - 1103 2005 tb02393 x A Escalas et allaquo A Unifying Quantitative Frameworkfor Exploring the Multiple Facets ofMicrobial Biodiversity across DiverseScales raquo In Environmental Micro-biology 1510 (2013) p 2642-2657doi 1011111462-292012156
46Rao laquo Diversity and Dissimi-larity Coefficients A Unified Ap-proach raquo cf note 5 p 101
47S Pavoine et al laquo Measu-ring Diversity from Dissimilaritieswith Raorsquos Quadratic Entropy AreAny Dissimilarities Suitable raquo In Theoretical Population Biology 674(2005) p 231-239 doi 101016jtpb200501004
siteacute crsquoest-agrave-dire le gain de diversiteacute entraicircneacute par la diminutionde la probabiliteacute de disparition de chaque espegravece les espegravecesayant la plus grande eacutelasticiteacute sont celles sur lesquelles les ef-forts auront les plus grands reacutesultats
76 Indice de RaoLrsquoindice de Rao est une mesure de divergence pondeacutereacutee
Son utilisation srsquoest largement deacuteveloppeacutee depuis le deacutebut desanneacutees 200045 en raison de ses proprieacuteteacutes particuliegraverement in-teacuteressantes
PrincipeAgrave partir de releveacutes fournissant la freacutequence de chaque
espegravece par communauteacute et drsquoune matrice de dissimilariteacuteentre paires drsquoespegraveces lrsquoindice de Rao46 donne la dissimilariteacutemoyenne entre deux individus choisis au hasard
Lrsquoindice de Rao est souvent appeleacute laquo entropie quadratique raquoen raison de sa forme matheacutematique
FormalisationLes espegraveces sont prises deux agrave deux et sont donc noteacutees ici
119904prime et 119904PrimeOn note la matrice de dissimilariteacute dont les eacuteleacutements sont
120575119904prime119904Prime la dissimilariteacute entre lrsquoespegravece 119904prime et lrsquoespegravece 119904Prime Il nrsquoest pasneacutecessaire agrave ce stade que soit une distance p est le vecteurdes probabiliteacutes dont 119901119904prime et 119901119904Prime sont des eacuteleacutements
Lrsquoindice de Rao est
119867 (p) = sum119904prime
sum119904Prime
119901119904prime119901119904Prime120575119904prime119904Prime (723)
ProprieacuteteacutesLa deacutefinition de la distance est essentielle
bull en fixant 120575119904prime119904Prime = 1 si deux espegraveces sont diffeacuterentes on ob-tient lrsquoindice de Simpson Sa valeur peut ecirctre interpreacuteteacuteecomme la probabiliteacute qursquoune paire drsquoindividus choisie auhasard soit de deux espegraveces diffeacuterentes
bull Dans un espace unidimensionnel ougrave la valeur 119910119904 asso-cieacutee agrave lrsquoespegravece 119904 est une variable quantitative 119884 choisir120575119904prime119904Prime = (119910119896 minus 119910119897)
22 rend lrsquoindice de Rao eacutegal agrave la va-riance de 119884
Pavoine et al47 ont montreacute que lrsquoutilisation de distances
126 Mesures particuliegraveres
48Pavoine et al laquo Is the Origina-lity of a Species Measurable raquo cfnote 30 p 105
49Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
50S Champely et D Ches-sel laquo Measuring Biological DiversityUsing Euclidean Metrics raquo In Envi-ronmental and Ecological Statistics92 (2002) p 167-177 doi 101023A1015170104476
51S Pavoine et al laquo From Dissi-milarities among Species to Dissimila-rities among Communities A DoublePrincipal Coordinate Analysis raquo In Journal of Theoretical Biology 2284(2004) p 523-537 doi 101016jjtbi200402014
ordinaires fait que la valeur maximale de lrsquoentropie quadra-tique pour un effectif donneacute est obtenue en eacuteliminant les es-pegraveces intermeacutediaires en ne retenant que les espegraveces extrecircmes(le reacutesultat est eacutevident en une dimension la variance est maxi-male en ne retenant que les valeurs extrecircmes drsquoun eacutechantillon)Ce reacutesultat est contraire aux proprieacuteteacutes attendues drsquoun indicede diversiteacute Les auteurs ont eacutetabli que lrsquoutilisation de dis-tances ultrameacutetriques corrige ce deacutefaut Lrsquoindice atteint alorsson maximum pour des freacutequences drsquoautant plus grandes quelrsquoespegravece est originale48
Lrsquoestimation empirique de lrsquoindice se fait simplement enestimant les probabiliteacutes par les freacutequences Le biais drsquoestima-tion est tregraves faible 49 par analogie avec lrsquoestimateur de lrsquoindicede Simpson les espegraveces rares interviennent peu
Calcul sous RLe package entropart fournit la fonction Rao
Vecteur des probabiliteacutesPs lt- Paracou618MC$PsRao(Ps Paracou618Taxonomy)
None 2878133
Le package ADE4 permet le calcul avec la fonction divcqui utilise un format diffeacuterent pour les probabiliteacutes et surtoutla matrice des racines carreacutees du double des distances de lrsquoob-jet phylog (chaque eacuteleacutement de $Wdist vaut radic2120575119904prime119904Prime Cetteparticulariteacute drsquoADE4 vient de lrsquoanalyse multivarieacutee 50 lrsquoentro-pie quadratique de Rao peut ecirctre repreacutesenteacutee dans lrsquoespaceeuclidien engendreacute par une matrice de distances D entre es-pegraveces (par une Analyse en Coordonneacutees Principales PCoA)Lrsquoinertie des points repreacutesentants les espegraveces preacuteciseacutement lamoyenne des carreacutes des distances entre les espegraveces et leurcentre de graviteacute (les probabiliteacutes p des espegraveces constituentleur poids) est alors eacutegale agrave lrsquoentropie de Rao 119867 (p) ougrave lamatrice de distances est D∘22 les valeurs de valent la moi-tieacute du carreacute de celles de D Cette repreacutesentation est eacutetenduedans la double analyse en composantes principales de Pavoineet al51 section 125
Dans ADE4 les arbres phylogeacuteneacutetiques sont donc stockeacutessous la forme drsquoobjets de type phylog ougrave la matrice des dis-tances ($Wdist) est D mais les longueurs des branches delrsquoarbre ($droot) correspondent aux valeurs de
library(ade4)divc(asdataframe(Ps) Paracou618Taxonomy$Wdist)
76 Indice de Rao 127
52Pavoine et al laquo Is the Origina-lity of a Species Measurable raquo cfnote 30 p 105
diversity Ps 09854485
divc peut traiter plusieurs communauteacutes simultaneacutement Rao peut ecirctre utiliseacute avec la fonction apply
divc(asdataframe(Paracou618MC$Psi) Paracou618Taxonomy$Wdist)
diversity P006 09727197 P018 09794563
apply(Paracou618MC$Psi 2 Rao Tree = Paracou618Taxonomy)
P006 P018 2820856 2876405
Maximum theacuteoriquePavoine et al52 ont deacutefini lrsquooriginaliteacute drsquoune espegravece comme
sa freacutequence maximisant lrsquoentropie quadratique sachant lamatrice de distances entre espegraveces Les espegraveces les plus ori-ginales sont celles ayant le moins drsquoespegraveces proches dans laclassification
Lrsquooriginaliteacute nrsquoest pas inteacuteressante dans une taxonomie une phylogeacutenie doit ecirctre creacuteeacutee pour illustrer cette notion Lefichier raotraitscsv contient une espegravece par ligne identi-fieacutee par le champ Code et un certain nombre de valeurs detraits en colonnes
Lecture des donneacutees traits pour 34 espegravecesreadcsv2(dataraotraitscsv rownames = 1 header = T) -gt
traits
Le reacutesultat est un data frame nommeacute traits agrave 8 lignes(espegraveces) et 6 colonnes (traits)
Aperccedilutraits[14 13]
SLA Am Gm Ess 1010341 9788627 1454455 Me 1427473 6352255 1493502 S1 1371211 7357748 1963457 Sr 1071081 6803988 1305796
La matrice de distances est creacuteeacutee par classification auto-matique hieacuterarchique
ACP sur les traits foliairespcaf lt- dudipca(traits scale = T scannf = FALSE nf = 2)
pcaf (figure 78) est une liste qui contient les reacutesultats delrsquoACP agrave utiliser pour la classification
128 Mesures particuliegraveres
Fig 78 Analyse en composanteprincipale des traits foliaires
d = 1
Ess
Me
S1
Sr
Vm
Bg
Ef
Dg
SLA
Am
Gm
N
CvsN
Thick
Eigenvalues
CAH Ward des traits foliaireshf lt- hclust(dist(pcaf$tab) wardD)
Code R pour la figure 78
scatter(pcaf)
Fig 79 Arbre phylogeacuteneacutetiqueissu de la classification
automatique
Sr
Ess Me
S1
Bg Ef
Vm Dg
02
46
810
Cluster Dendrogram
hclust ( wardD)dist(pcaf$tab)
Hei
ght
Le reacutesultat de la classification est un objet hclust (figure79 qui doit ecirctre transformeacute en phylog pour la suite de lrsquoana-lyse
Transformation de larbre du format hclust au format phylogphyf lt- hclust2phylog(hf)
Code R pour la figure 79
plot(hf h = -1)
Le reacutesultat est en figure 710Code R pour la figure 710
76 Indice de Rao 129
Sr
Ess
Me
S1
Bg
Ef
Vm
Dg S
LA
Am
Gm
N
Cvs
N
Thi
ck
minus15 minus05 05 15 25
Fig 710 Preacutesentation de lrsquoarbrephylogeacuteneacutetique avec lacontribution de chacune desvariables
53Pavoine et al laquo Is the Origina-lity of a Species Measurable raquo cfnote 30 p 105
tablephylog(pcaf$tab[names(phyf$leaves) ] phyf)
La limite des distances ultrameacutetriques est leur tendance agravedeacuteformer le jeu de points53 Dans cet exemple les deux pre-miers axes de lrsquoACP rendent compte de presque toute lrsquoinertieLe nuage de points est pratiquement contenu dans un planalors que sa repreacutesentation en distance ultrameacutetrique est unehypersphegravere en 7 dimensions
Le calcul de lrsquooriginaliteacute des espegraveces utilise la fonctionoriginality (figure 711)
minus1 0 1 2 3
QEbased
Fig 711 Originaliteacute des espegraveces
Code R pour la figure 711
dotchartphylog(phyf originality(phyf 5))
La fonction a pour paramegravetres lrsquoobjet phylog contenant laclassification et le numeacutero de la meacutethode de calcul agrave utiliser 5pour lrsquoentropie quadratique Sa repreacutesentation graphique estfaite par dotchartphylog
130 Mesures particuliegraveres
54S Pavoine et M B Bonsalllaquo Biological Diversity Distinct Dis-tributions Can Lead to the Maximi-zation of Raorsquos Quadratic Entropy raquoIn Theoretical Population Biology752-3 (2009) p 153-163 doi 10 1016jtpb200901008
55C Ricotta et G C Avena laquo Arsquofast-Food Approachrsquo to the Stan-dardization of Quadratic Diversi-ty raquo In Plant Biosystems 1393(2005) p 411-413 doi 10 1080 11263500500158736
56E Marcon et B Heacuterault laquo De-composing Phylodiversity raquo In Me-thods in Ecology and Evolution 63(2015) p 333-339 doi 10 1111 2041-210X12323
57E Garnier et al laquo Plant Func-tional Markers Capture EcosystemProperties during Secondary Succes-sion raquo In Ecology 859 (2004)p 2630-2637 doi 10189003-0799
58S Lavorel et al laquo AssessingFunctional Diversity in the Field -Methodology Matters raquo In Func-tional Ecology 22 (2008) p 134-147doi 101111j1365-2435200701339x
59C Ricotta et M Morettilaquo CWM and Raorsquos Quadratic Diver-sity A Unified Framework for Func-tional Ecology raquo In Oecologia 167(2011) p 181-188 doi 10 1007 s00442-011-1965-5
60J Izsaacutek et S Pavoine laquo NewConcentration Measures as Kinds ofthe Quadratic Entropy raquo In Ecolo-gical Indicators 112 (2011) p 540-544 doi httpdxdoiorg101016jecolind201007010
61R C Guiasu et S Guiasulaquo The Weighted Quadratic Index ofBiodiversity for Pairs of Species AGeneralization of Raorsquos Index raquo In Natural Science 39 (2011) p 795-801 doi 10 4236 ns 2011 39104 R C Guiasu et S Guiasu laquo TheWeighted Gini-Simpson Index Re-vitalizing an Old Index of Biodiver-sity raquo In International Journal ofEcology 2012478728 (2012) p 1-10doi 1011552012478728
Lrsquooriginaliteacute ne repose que sur lrsquoarbre pas sur la freacutequencedes espegraveces
Si la distance utiliseacutee nrsquoest pas ultrameacutetrique il existe plu-sieurs distributions possibles drsquoespegraveces qui maximisent la di-versiteacute54 le concept drsquooriginaliteacute nrsquoa pas de sens dans ce cas
La valeur de lrsquoentropie quadratique deacutepend de la hauteurde lrsquoarbre Plusieurs normalisations ont eacuteteacute proposeacutees par savaleur maximale ou par la diversiteacute de Simpson (correspondantagrave un arbre dont toutes les espegraveces seraient eacutequidistantes)55 ouen fixant la hauteur de lrsquoarbre agrave 156
77 Diversiteacute et moyenneGarnier et al57 deacutefinissent la moyenne pondeacutereacutee drsquoun trait
agrave lrsquoeacutechelle de la communauteacute (CWM Community WeigthedMean) simplement eacutegal agrave la moyenne de la valeur du traitpondeacutereacutee par la freacutequence des espegraveces
CWM = sum119904
119901119904119910119904 (724)
CWM nrsquoest pas une mesure de diversiteacute fonctionnelle bienqursquoil ait eacuteteacute utiliseacute parfois en tant que tel58 mais une mesurede la composition de la communauteacute CWM peut ecirctre eacutetendu agraveplusieurs traits le vecteur formeacute par les valeurs de CWM pourchaque trait correspond au centre de graviteacute de la communau-teacute repreacutesenteacutee dans lrsquoespace des traits Lrsquoentropie quadratiquede Rao mesure la dispersion des espegraveces autour de ce point les deux mesures se complegravetent donc59
78 Variations sur lrsquoentropiequadratique
Izsaacutek et Pavoine60 proposent deux variantes de lrsquoindice deRao dans lesquelles la distance entre espegraveces deacutepend de leursprobabiliteacutes
1198711 = sum119904
sum119905
119901119904119901119905(119901119904 minus 119901119905)2 (725)
1198712 = sum119904
sum119905
119901119904119901119905(ln 119901119904 minus ln 119901119905)2 (726)
Ces indices sont proposeacutes pour leurs proprieacuteteacutes matheacutema-tiques assurant lrsquoexistence de sa deacutecomposition sans supporteacutecologique bien eacutetabli
est la matrice de dissimilariteacute dont les eacuteleacutements sont 120575119904119905la dissimilariteacute entre lrsquoespegravece 119904 et lrsquoespegravece 119905 R C Guiasu et
79 Diversiteacute fonctionnelle de Chiu et Chao 131
62C-H Chiu et A Chaolaquo Distance-Based FunctionalDiversity Measures and TheirDecomposition A FrameworkBased on Hill Numbers raquo In PloSone 97 (2014) e100014 doi 101371journalpone0100014
S Guiasu61 proposent lrsquoindice GSD pour ses proprieacuteteacutes matheacute-matiques et fournissent sa deacutecomposition
GSD = sum119904
sum119905
120575119904119905119901119904119901119905 (1 minus 119901119904119901119905) (727)
79 Diversiteacute fonctionnelle de Chiu etChao
Chiu et Chao62 proposent de pondeacuterer lrsquoentropie quadra-tique par la distance entre les paires drsquoespegraveces et obtiennentun nombre de Hill permettant de mesurer la diversiteacute fonction-nelle agrave partir drsquoune matrice de dissimilariteacute
119902119863 (119876) = [sum119904
sum119905
120575119904119905119876 (119901119904119901119905)
119902]1
2(1minus119902)
(728)
1119863 (119876) = 11989012 [sum119904 sum119905 119901119904119901119905
120575119904119905119876 ln 119901119904119901119905] (729)
La notation 119902119863(119876) fait reacutefeacuterence agrave lrsquoentropie quadratique119876 = 2(119879 ) Une approche compleacutementaire est deacuteveloppeacutee ci-dessous Chiu et Chao notent que GSD = 119876 minus119902119863(119876)
La deacutefinition de Chiu et Chao revient agrave calculer lrsquoentropiedes paires drsquoindividus agrave partir de la fonction drsquoinformation
119868(119901119904119901119905) = ln119902[( 120575119904119905
119876 ) 11minus119902
119901119904119901119905]
pour 119902 ne 1 et119868(119901119904119901119905) = ln[ 1
(119901119904119901119905)120575119904119905
119876]
pour 119902 = 1 Le nombre effectif de paires est [119902119863(119876)]2 Lenombre effectif drsquoespegraveces est donc 119902119863(119876)
Le nombre effectif de paires est le nombres de paires eacutequi-freacutequentes dont la distance entre les deux espegraveces est 119876 Leproblegraveme de cette approche est que les paires constitueacutees dela mecircme espegravece doivent aussi avoir une distance 120575119904119904 eacutegale agrave119876 Chiu et Chao considegraverent ce point comme la possibiliteacutede prendre en compte la variabiliteacute intraspeacutecifique mais elledoit ecirctre identique agrave la variabiliteacute interspeacutecifique ce qui nrsquoestpas tregraves convaincant En absence de variabiliteacute intraspeacutecifiqueChiu et Chao redeacutefinissent la distance de reacutefeacuterence 120575119904119904 = 0et 120575119904119905 = ( 119863
119863minus1)119876 Il nrsquoest donc pas possible de comparer lenombre effectif drsquoespegraveces de deux communauteacutes diffeacuterentespuisque la deacutefinition mecircme du nombre effectif deacutepend de ladiversiteacute ce qui invalide cette deacutefinition de la diversiteacute fonc-tionnelle
132 Mesures particuliegraveres
63A Solow et al laquo On the Measu-rement of Biological Diversity raquo In Archives of biochemistry and biophy-sics 24 (1993) p 60-68 doi 101016S0003-9861(71)80064-4
64Z Botta-Dukaacutet laquo The Genera-lized Replication Principle and thePartitioning of Functional Diversityinto Independent Alpha and BetaComponents raquo In Ecography 411(jan 2018) p 40-50 doi 101111ecog02009
65S Pavoine et al laquo Hierarchi-cal Partitioning of Evolutionary andEcological Patterns in the Organi-zation of Phylogenetically-StructuredSpecies Assemblages Application toRockfish (Genus Sebastes) in theSouthern California Bight raquo In Eco-logy Letters 129 (2009) p 898-908doi 101111j1461-0248200901344x
66B Allen et al laquo A New Phyloge-netic Diversity Measure Generalizingthe Shannon Index and Its Applica-tion to Phyllostomid Bats raquo In Ame-rican Naturalist 1742 (2009) p 236-243 doi 101086600101
Enfin cette deacutefinition de la diversiteacute ne respecte pas le prin-cipe de A Solow et al63 selon lequel le remplacement drsquounepartie des effectifs drsquoune espegravece par le mecircme nombre drsquoindivi-dus drsquoune espegravece diffeacuterente mais fonctionnellement identiquene doit pas faire varier la diversiteacute64
710 119867119901 et 1198681
Simultaneacutement Pavoine et al65 et Allen et al66 ont pro-poseacute la geacuteneacuteralisation de lrsquoindice de Shannon agrave la diversiteacutephylogeacuteneacutetique La preacutesentation de Allen et al est donneacutee icicelle de Pavoine et al plus geacuteneacuterale sera deacutetailleacutee dans leparagraphe suivant
Fig 712 Arbre phylogeacuteneacutetiqueou fonctionnel hypotheacutetique
1198791 1199011 1199015 1199012 1199013 1199014
1198792
1198793 b31
b23
b11 b12 b13 b14 b15
Eacutetant donneacute une phylogeacutenie comme celle de la figure 712on deacutefinit une branche 119887119896119897 comme un segment termineacute parune feuille (au bas de lrsquoarbre) ou un noeud (dans lrsquoarbre) 119896indique la peacuteriode de lrsquoarbre agrave laquelle la branche se termine 119897le numeacutero drsquoordre Une branche nrsquoexiste que si elle se termineeffectivement par un noeud ou une feuille il nrsquoy a pas debranche 11988721 par exemple Sa probabiliteacute 119901(119887119896119897) est la sommedes probabiliteacutes des feuilles de la branche crsquoest-agrave-dire 119906119896119897 et119897(119887) est sa longueur Sur la figure la branche commenccedilant enhaut de lrsquoarbre et se terminant au noeud reacuteunissant les espegraveces3 agrave 5 a une valeur 119901(11988723) eacutegale agrave la somme des probabiliteacutesdrsquooccurrence des espegraveces 3 agrave 5 alors que 119901(11988711) est seulementla probabiliteacute de lrsquoespegravece 1 Leurs longueurs respectives sont1198792 + 1198793 et 1198791 + 1198792 Lrsquoarbre possegravede 7 branches
Lrsquoindice drsquoentropie phylogeacuteneacutetique est
119867119901 = minus sum119887
119897(119887)119901(119887) ln 119901(119887) (730)
Dans un arbre parfaitement reacutegulier toutes les branchessont de longueur 1 et 119867119901 est lrsquoindice de Shannon
1Pavoine et Bonsall laquo BiologicalDiversity Distinct Distributions CanLead to the Maximization of RaorsquosQuadratic Entropy raquo cf note 54p 130
2Chao et al laquo Phylogenetic Di-versity Measures Based on Hill Num-bers raquo cf note 44 p 70
Chapitre 8
Entropie phylogeacuteneacutetique
Lrsquoentropie phylogeacuteneacutetique est la moyenne de lrsquoentropie HCDT le longdrsquoun arbre phylogeacuteneacutetique Son estimation est simplement celle de lrsquoen-tropie HCDT agrave chaque peacuteriode de lrsquoarbre Elle va de pair avec la diver-siteacute phylogeacuteneacutetique qui est son nombre effectif drsquoespegraveces crsquoest-agrave-dire lenombre drsquoespegraveces eacutequiprobables dans un arbre ougrave toutes les espegraveces des-cendraient drsquoun ancecirctre unique dont lrsquoentropie serait la mecircme que cellede la communauteacute reacuteelle Dans un tel arbre la diversiteacute phylogeacuteneacutetiquese reacuteduit agrave la diversiteacute neutre
Lrsquoessentiel
Lrsquoentropie HCDT peut ecirctre eacutetendue pour deacutefinir une me-sure de diversiteacute prenant en compte lrsquohistoire eacutevolutive desespegraveces
81 Geacuteneacuteralisation de lrsquoentropie HCDTPavoine et Bonsall1 deacutecoupent lrsquoarbre phylogeacuteneacutetique en
peacuteriodes Agrave partir de la racine de lrsquoarbre une nouvelle peacuteriodeest deacutefinie agrave chaque ramification drsquoune branche quelconqueLes deacutebuts et fins de peacuteriodes sont noteacutes 119905119896 la racine de lrsquoarbreest fixeacutee agrave 1199050 = 0 Lrsquoarbre est ultrameacutetrique
Nous suivrons plutocirct les notations de Chao et al2 en nu-meacuterotant les peacuteriodes agrave partir du preacutesent et en notant 119879119896 leurdureacutee Figure 77 la premiegravere peacuteriode se termine quand lesbranches des espegraveces 3 agrave 5 se rejoignent Lrsquoarbre comprend119870 = 3 peacuteriodes
Lrsquoentropie HCDT (119902119867 de lrsquoeacutequation (46)) est calculeacutee agravechaque peacuteriode Figure 81 agrave la deuxiegraveme peacuteriode (1198792) lrsquoarbrea trois feuilles avec des probabiliteacutes eacutegales agrave celle des espegraveces1 et 2 et la somme de celles des espegraveces 3 agrave 5 119902119867 peut ecirctre cal-culeacutee avec ces valeurs de probabiliteacutes On notera cette valeurdrsquoentropie 119902
119896119867 ougrave 119896 est le quantiegraveme de la peacuteriodeLrsquoindice 119868119902 de Pavoine et al est la somme des 119902
119896119867 pondeacutereacuteepar la dureacutee de chaque peacuteriode Nous le normalisons par lahauteur totale de lrsquoarbre (119879 ) pour deacutefinir 119902(119879 )
133
134 Entropie phylogeacuteneacutetique
Fig 81 Arbre phylogeacuteneacutetique oufonctionnel hypotheacutetique 5
espegraveces sont preacutesentes (119878 = 5)leurs probabiliteacutes noteacutees 1199011 agrave 1199015
Les noms des branches sontafficheacutes
1198791 1199011 1199015 1199012 1199013 1199014
1198792
1198793 b31
b23
b11 b12 b13 b14 b15
3K Shimatani laquo MultivariatePoint Processes and Spatial Varia-tion of Species Diversity raquo In Fo-rest Ecology and Management 1421-3 (2001) p 215-229 doi 101016s0378-1127(00)00352-2
4C Ricotta laquo Additive Partitio-ning of Raorsquos Quadratic Diversity AHierarchical Approach raquo In Ecolo-gical Modelling 1834 (2005) p 365-371 doi 101016jecolmodel200408020
119902 (119879 ) =119870
sum119896=1
119879119896119879
119902
119896119867 (81)
Dans un arbre parfaitement reacutegulier toutes les branchessont de longueur 1 il nrsquoy a qursquoune seule peacuteriode et 119868119902 = 119902119867
Shimatani3 puis Ricotta4 avaient montreacute que lrsquoindice deRao est la somme pondeacutereacutee sur chaque peacuteriode de lrsquoindicede Simpson crsquoest-agrave-dire lrsquoeacutegaliteacute (81) pour le cas particulier119902 = 2
Les indices 119902(119879 ) geacuteneacuteralisent les mesures drsquoentropie clas-sique agrave la diversiteacute phylogeacuteneacutetique 119879 [0(119879 )+1] est eacutegal agrave PDou FD 1(119879 ) est 119867119901 et 2(119879 ) est lrsquoindice de Rao On peutles interpreacuteter intuitivement comme une somme pondeacutereacutee parla longueur des peacuteriodes des valeurs de lrsquoentropie agrave chaquepeacuteriode Agrave la derniegravere peacuteriode (pregraves des feuilles) toutes lesclasses sont preacutesentes la diversiteacute est donc maximale En re-montant dans lrsquoarbre les classes se confondent et la diversiteacutediminue progressivement Deux classes peu distantes commeles espegraveces 3 agrave 5 de la figure 81 apportent peu de diversiteacutesuppleacutementaire par rapport agrave une situation ougrave les deux espegravecesseraient confondues (et leurs effectifs ajouteacutes) contrairementaux espegraveces 1 et 2
82 EstimationLa correction du biais drsquoestimation applicable agrave lrsquoentropie
geacuteneacuteraliseacutee lrsquoest aussi agrave chaque peacuteriode de lrsquoarbre Les biaissont de moins en moins importants quand on se rapproche dela racine de lrsquoarbre il est de moins en moins probable de nepas observer une classe quand les classes sont de plus en plusvastes
Le package entropart fournit la fonction PhyloEntropypour calculer 119902(119879 ) agrave partir drsquoun vecteur de probabiliteacute oudrsquoabondances Dans le dernier cas la correction de Tsallisest appliqueacutee agrave chaque peacuteriode
Exemple le package contient les donneacutees drsquoinventaire dedeux hectares du dispositif de Paracou et la taxonomie des
83 Entropie et diversiteacute 135
5C Ricotta et A T Acosta laquo Onthe Functional Diversity of PartiallyDistinct Species Some Theory and aPractical Example raquo In CommunityEcology 152 (2014) p 205-211 doi 101556ComEc15201429
espegraveces concerneacutees Le calcul de lrsquoindice de Rao corrigeacute dubiais drsquoestimation utilise le code suivant
data(Paracou618)PhyloEntropy(Paracou618MC$Ns 2 Paracou618Taxonomy)
$Distribution [1] Paracou618MC$Ns $Function [1] PhyloEntropy $Tree [1] Paracou618Taxonomy $Normalized [1] TRUE $Cuts 1 2 3 09863189 09709766 09232516 $Corrections 1 2 3 UnveilJ UnveilJ UnveilJ $Total [1] 09601824 $Type [1] alpha or gamma $Order [1] 2 $Correction [1] Best attr(class) [1] PhyloEntropy PhyloValue
La fonction retourne la valeur de 119902119896119867 dans chaque intervalle
(lrsquoarbre est ici une taxonomie espegravece-genre-famille correspon-dant aux limites des peacuteriodes (Cuts) 1 2 et 3 dont lrsquoentropieva en deacutecroissant) et la valeur de 119902(119879 )
83 Entropie et diversiteacuteLa diversiteacute phylogeacuteneacutetique est le nombre drsquoespegraveces eacutequi-
freacutequentes et dont la distance agrave toutes les autres dans la phy-logeacutenie est maximale dont lrsquoentropie serait eacutegale agrave lrsquoentropieobserveacutee
La possibiliteacute de choisir comme distance de reacutefeacuterence entreespegraveces une valeur infeacuterieure agrave la distance maximale est dis-cuteacutee par Ricotta et Acosta5 pour la diversiteacute fonctionnelle sa signification biologique est lieacutee agrave lrsquoespace fonctionnel dis-ponible pour la communauteacute qui peut ecirctre trop reacuteduit pourpermettre la coexistence drsquoespegraveces dont la dissimilariteacute seraitmaximale
136 Entropie phylogeacuteneacutetique
6Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
7C Ricotta et L Szeidl laquo Diver-sity Partitioning of Raorsquos QuadraticEntropy raquo In Theoretical Popula-tion Biology 764 (2009) p 299-302doi 101016jtpb200910001
8Chao et al laquo Phylogenetic Di-versity Measures Based on Hill Num-bers raquo cf note 44 p 70
9Allen et al laquo A New Phylo-genetic Diversity Measure Generali-zing the Shannon Index and Its Ap-plication to Phyllostomid Bats raquo cfnote 66 p 132
Lrsquoentropie 119902(119879 ) peut ecirctre transformeacutee en diversiteacute6 de lamecircme faccedilon que 119902119863 = 119890119902119867
119902 (119879 ) = 119890119902(119879 )119902 (82)
Le nombre effectif drsquoespegraveces de lrsquoentropie de Rao 2(119879 ) =1
[1minus2(119879 )] a eacuteteacute eacutetabli par Ricotta et Szeidl7
Chao et al8 obtiennent ce reacutesultat sans recourir explicite-ment agrave lrsquoentropie mais en faisant le mecircme calcul
119902 (119879 ) = (sum119887
119897(119887)119879 119901(119887)119902)
11minus119902
(83)
La somme est sur lrsquoensemble des branches de lrsquoarbre deacutefinide faccedilon identique agrave celle de Allen et al9 710
Les entropies ont un comportement lineacuteaire elles srsquoad-ditionnent tout au long de lrsquoarbre pour donner 119902(119879 ) Lesdiversiteacutes 119902
119896119863 calculeacutees agrave chaque peacuteriode ne peuvent pas ecirctresommeacutees sur le modegravele de lrsquoeacutequation (81) 119902(119879 ) nrsquoest pas lamoyenne pondeacutereacutee des diversiteacutes aux diffeacuterentes peacuteriodes saufdans le cas particulier 119902 = 1 ougrave comme pour la deacutecomposi-tion de lrsquoindice de Shannon il en est la moyenne geacuteomeacutetriquepondeacutereacutee
La fonction PhyloDiversity de entropart permet de calcu-ler 119902(119879 ) avec ou sans correction de biais selon qursquoelle traiteun vecteur drsquoabondances ou de probabiliteacutes Agrave la suite delrsquoexemple preacuteceacutedent les reacutesultats sont preacutesenteacutes sous formede diversiteacute au lieu drsquoentropie
PhyloDiversity(Paracou618MC$Ns 2 Paracou618Taxonomy)
$Distribution [1] Paracou618MC$Ns $Function [1] bcPhyloDiversity $Tree [1] Paracou618Taxonomy $Normalized [1] TRUE $Cuts 1 2 3 7309335 3445501 1302960 $Corrections 1 2 3 UnveilJ UnveilJ UnveilJ $Total [1] 2511451 $Type
84 Diversiteacute individuelle 137
10Chao et al laquo Phylogenetic Di-versity Measures Based on Hill Num-bers raquo cf note 44 p 70
11Ibid figure 1b
[1] alpha or gamma $Order [1] 2 $Correction [1] Best attr(class) [1] PhyloDiversity PhyloValue
84 Diversiteacute individuelleLa construction de la diversiteacute fonctionnelle ou phylogeacuteneacute-
tique nrsquoimplique pas de regrouper les individus par espegraveces chaque cateacutegorie peut se reacuteduire agrave un individu si des donneacuteesindividuelles moleacuteculaires ou de traits sont disponibles
Le regroupement des individus en une espegravece revient sim-plement agrave consideacuterer leur distance comme nulle Diviser uneespegravece en deux espegraveces infiniment proches revient seulementagrave creacuteer une peacuteriode suppleacutementaire dans lrsquoarbre de longueurinfiniteacutesimale en drsquoautres termes la mesure de diversiteacute estcontinue face au regroupement Cette proprieacuteteacute permet de li-miter les conseacutequences du problegraveme de lrsquoespegravece seacuteparer lesindividus drsquoune espegravece en deux espegraveces proches dans lrsquoarbrenrsquoa que peu drsquoeffet sur la diversiteacute
85 Arbres non ultrameacutetriques
It is always less than or equal to the present diversityof order q
There are many ways to take this average If we wantthe replication principle to be valid in its strongestpossible form then we must average the diversitiesqD(t) according to Jostrsquos (2007) derivation of the for-mula for the mean (a) diversity of a set of equallyweighted assemblages This mean diversity over thetime interval [2T 0] will be called q DethTTHORN (mean diver-sity of order q over T years) With this choice of meanwhen N maximally distinct trees with equal meandiversities (for fixed T ) are combined the mean diver-sity of the combined tree is N times the mean diversityof any individual tree The branching patterns abun-dances and richnesses of the N trees can all bedifferent as long as each of the trees is completely dis-tinct (all branching off from the earliest point in thetree at or before time T ) Some choices of averagingformulae obey weaker versions of the principle andthese may be useful for some purposes We discussan alternative choice of mean in sect8
We may want to consider not just the mean diversitybut the branch or lineage diversity of the tree as awhole over the interval from ndashT to present At anypoint within a branch the abundance or importanceof each branch lineage is the sum of the abundancesof the present-day species descending from thatpoint as described above Then the total diversity of
all the lsquospeciesrsquo that evolved in the tree during thetime interval [2T 0] is found by taking the Hillnumber of this entire virtual assemblage of ancestralspecies The Hill numbers depend only on the relativeabundances of each species so we need to divide theabundances by the total abundance of all the speciesin the tree If each branch is weighted by its corre-sponding branch length then we show below thatthis diversity depends only on the branching patternand on the relative abundances of the species in thepresent-day assembly We call this measure lsquophyloge-netic diversity of order q through T years agorsquo or lsquobranchdiversityrsquo and denote it by qPD(T ) This turns outto be just the product of the interval duration Tand the mean diversity over that interval q DethTTHORN Forq frac14 0 (only species richness is considered) and T frac14the age of the first node this branch diversity is justFaithrsquos PD
Instead of using time as the metric for a phylo-genetic tree we often want to use a more directmeasure of evolutionary work such as the number ofbase changes at a selected locus or the amount offunctional or morphological differentiation from acommon ancestor The branches of the resulting treewill then be uneven so the tree will not be ultrametricHowever we can easily apply the idea of branch diver-sity to such non-ultrametric trees The branch lengthsare calculated in the appropriate units such as base
t = 0(present time)
p1 + p2 + p3
p2 + p3
p1 p2 p3 p4
T3
t = ndashT
p4
p4
p1
T
(a) (b)
slice 3
slice 2
slice 1
T2
T1
1
2
4
35
p1 = 05
p2 = 02
p3 = 03
p2 + p3 = 05
Figure 1 (a) A hypothetical ultrametric rooted phylogenetic tree with four species Three different slices corresponding tothree different times are shown For a fixed T (not restricted to the age of the root) the nodes divide the phylogenetic treeinto segments 1 2 and 3 with duration (length) T1 T2 and T3 respectively In any moment of segment 1 there are
four species (ie four branches cut) in segment 2 there are three species and in segment 3 there are two species Themean species richness over the time interval [2T 0] is (T1T ) 4 thorn (T2T ) 3 thorn (T3T ) 2 In any moment of segment1 the species relative abundances (ie node abundances correspond to the four branches) are f p1 p2 p3 p4g in segment2 the species relative abundances are fg1 g2 g3g frac14 fp1 p2 thorn p3 p4g in segment 3 the species relative abundances arefh1 h2g frac14 f p1 thorn p2 thorn p3 p4g (b) A hypothetical non-ultrametric tree Let T be the weighted (by species
abundance) mean of the distances from root node to each of the terminal branch tipsT frac14 4 05thorn eth35thorn 2THORN 02thorn eth1thorn 2THORN 03 frac14 4 Note T is also the weighted (by branch length) total node abundancebecause T frac14 05 4thorn 02 35thorn 03 1thorn 05 2 frac14 4 Conceptually the lsquobranch diversityrsquo is defined for an assemblageof four branches each has respectively relative abundance 05=T frac14 0125 02=T frac14 005 03=T frac14 0075 and05=T frac14 0125 and each has respectively weight (ie branch length) 4 35 1 and 2 This is equivalent to an assemblage
with 105 equally weighted lsquobranchesrsquo there are 4 branches with relative abundance 05=T frac14 0125 35 branches with rela-tive abundance 02=T frac14 005 1 branch with relative abundance 03=T frac14 0075 and 2 branches with relative abundance05=T frac14 0125
3602 A Chao et al Phylogenetic diversity measures
Phil Trans R Soc B (2010)
on October 31 2010rstbroyalsocietypublishingorgDownloaded from
Fig 82 Arbre phylogeacuteneacutetiquehypotheacutetique non ultrameacutetrique
Chao et al10 deacutefinissent la diversiteacute phylogeacuteneacutetique selonlrsquoeacutequation (83) quelle que soit la forme de lrsquoarbre y comprissrsquoil nrsquoest pas ultrameacutetrique Dans ce cas 119879 est remplaceacute par 119879 la longueur moyenne des branches pondeacutereacutee par la freacutequencedes espegraveces Cette geacuteneacuteralisation est tregraves discutable son sensnrsquoest pas clair sur le plan de la mesure de la diversiteacute au-delagravedu paralleacutelisme de la forme matheacutematique
Lrsquoarbre de la figure 8211 peut ecirctre deacutecoupeacute en peacuteriodes
138 Entropie phylogeacuteneacutetique
12Pavoine et Bonsall laquo BiologicalDiversity Distinct Distributions CanLead to the Maximization of RaorsquosQuadratic Entropy raquo cf note 54p 130
13Leinster et Cobbold laquo Measu-ring Diversity The Importance ofSpecies Similarity raquo cf note 107p 58
mais les deux premiegraveres (1198791 seule lrsquoespegravece 2 est preacutesente 1198792 les espegraveces 1 et 2 sont preacutesentes) sont incomplegravetes ausens ougrave la somme des probabiliteacutes nrsquoy est pas eacutegale agrave 1 donc(sum 119901119902
119894 )1
1minus119902 ne deacutefinit pas une diversiteacute agrave ces peacuteriodesPavoine et Bonsall12 traitent en deacutetail les reacutesultats aber-
rants que cause un arbre non ultrameacutetrique dans le cas par-ticulier de lrsquoentropie de Rao Leinster et Cobbold13 montrentqursquoun arbre non ultrameacutetrique implique que la dissimilariteacuteentre les espegraveces deacutepende de leur freacutequence ce qui est contra-dictoire avec le cadre dans lequel la diversiteacute phylogeacuteneacutetiquea eacuteteacute deacutefinie
Dans lrsquoeacutetat actuel des connaissances aucune meacutethodenrsquoest applicable de faccedilon satisfaisante aux arbres nonultrameacutetriques
1T Leinster laquo The Magnitude ofMetric Spaces raquo In Documenta Ma-thematica 18 (2013) p 857-905
2Leinster et Cobbold laquo Measu-ring Diversity The Importance ofSpecies Similarity raquo cf note 107p 58
3Ibid
4G H Hardy et al InequalitiesCambridge University Press 1952
Chapitre 9
Diversiteacute de Leinster et Cobbold
La diversiteacute de Leinster et Cobbold est lrsquoinverse de la banaliteacute moyennedes espegraveces qui est elle-mecircme la similariteacute moyenne drsquoune espegravece auxautres Elle va de pair avec lrsquoentropie de Ricotta et Szeidl dont la fonc-tion drsquoinformation est le logarithme deacuteformeacute de lrsquoinverse la banaliteacute Ladiversiteacute peut ecirctre calculeacutee directement agrave partir de la distance entre es-pegraveces sans recourir agrave un dendrogramme intermeacutediaire qui deacuteformerait latopologie des espegraveces
Lrsquoessentiel
Agrave partir de la theacuteorie matheacutematique des cateacutegories1 Leins-ter et Cobbold2 ont proposeacute une mesure de diversiteacute applicableagrave une communauteacute dont la position des espegraveces dans un es-pace multidimensionnel euclidien est connue Crsquoest donc unemesure applicable agrave la diversiteacute fonctionnelle
91 DeacutefinitionsLeinster et Cobbold3 proposent une unification des me-
sures de diversiteacute agrave partir de la deacutefinition de la banaliteacute desespegraveces Une matrice carreacutee de dimension eacutegale au nombredrsquoespegraveces Z deacutecrit par ses valeurs 119911119904119905 la similariteacute entre lrsquoes-pegravece 119904 et lrsquoespegravece 119905 comprises entre 0 et 1 (119911119904119904 = 1)
La banaliteacute drsquoune espegravece 119904 est deacutefinie par sum119905 119901119905119911119904119905 crsquoest-agrave-dire la moyenne pondeacutereacutee de sa similariteacute avec toutes lesautres espegraveces au minimum 119901119904 si elle est totalement diffeacute-rente des autres (approche de la diversiteacute neutre Z est lamatrice identiteacute I119904) au maximum 1 si toutes les espegraveces sonttotalement similaires (Z ne contient que des 1) Une espegravecerare totalement diffeacuterente des autres est peu banale
La moyenne geacuteneacuteraliseacutee drsquoordre 1199034 generalized mean oupower mean en anglais est deacutefinie pour une distribution devaleurs de 119909119904 dont la probabiliteacute drsquooccurrence est 119901119904 par
119909 = (sum119904
119901119904119909119903119904)
1119903
(91)
139
140 Diversiteacute de Leinster et Cobbold
Fig 91 Moyenne geacuteneacuteraliseacuteedrsquoordre 119903 (en abscisse) drsquoune
distribution uniforme de 10000valeurs tireacutees entre 0 et 1 Lamoyenne arithmeacutetique 05 est
obtenue pour 119903 = 1 La moyennegeacuteneacuteraliseacutee tend vers la plus petitevaleur (pregraves de 0) quand 119903 rarr minusinfinet vers la plus grande valeur (pregraves
de 1) quand 119903 rarr +infin
00
02
04
06
08
minus5 0 5 10r
Moy
enne
La moyenne geacuteneacuteraliseacutee se reacuteduit agrave la moyenne arithmeacute-tique pondeacutereacutee pour 119903 = 1 Elle donne un fort poids aux pe-tites valeurs de 119909119904 dans la moyenne pour les faibles valeurs de119903 (qui peuvent ecirctre neacutegatives) et un fort poids aux grandesvaleurs quand 119903 est grand (figure 91)
Le code R neacutecessaire pour reacutealiser la figure est
X lt- runif(10000) La moyenne nest pas deacutefinie agrave r=0 deacutecalage de 10^-8r lt- seq(-5 10 1) + 1E-8 Preacuteparation des donneacuteesdf lt- dataframe(r Moyenne = sapply(r function(r) (mean(X^r))^(1r)))ggplot(df aes(x = r y = Moyenne)) +
geom_line() +geom_hline(yintercept = 5 lty = 2) +geom_vline(xintercept = 1 lty = 2)
La banaliteacute peut srsquoeacutecrire sous forme matricielle en notant ple vecteur des probabiliteacutes 119901119904 on note alors (Zp)119904 = sum119905 119901119905119911119904119905
La banaliteacute moyenne des espegraveces de la communauteacute estcalculeacutee en prenant 119903 = 119902 minus 1
(Zp) = (sum119904
119901119904(Zp)119902minus1119904 )
1119902minus1
(92)
La diversiteacute de la communauteacute est simplement lrsquoinverse dela banaliteacute moyenne des espegraveces
119902119863Z = (sum119904
119901119904(Zp)119902minus1119904 )
11minus119902
(93)
119902119863Z converge vers 1119863Z quand 119902 tend vers 1
1119863Z = 1prod119904 (Zp)119901119904
119904 (94)
92 Diversiteacute neutre 141
92 Diversiteacute neutreLeinster et Cobbold montrent que la diversiteacute HCDT est
un cas particulier de 119902119863Z pour la matrice identiteacute
119902119863 = 119902119863I (95)
93 Diversiteacute non neutreUne mesure de diversiteacute non neutre est obtenue en utili-
sant une matrice Z qui contient lrsquoinformation sur la similariteacuteentre les espegraveces La dissimilariteacute entre espegraveces peut ecirctre obte-nue agrave partir des arbres Lrsquoexemple suivant utilise les donneacuteesdu calcul drsquooriginaliteacute section 76 Pour un arbre de classehclust la fonction cophenetic fournit une demi-matrice dedistances (classe dist)
print(cophenetic(hf) digits = 4)
Ess Me S1 Sr Vm Bg Ef Me 1224 S1 1224 1003 Sr 2464 2464 2464 Vm 9731 9731 9731 9731 Bg 9731 9731 9731 9731 5653 Ef 9731 9731 9731 9731 1694 5653 Dg 9731 9731 9731 9731 1101 5653 1694
La matrice doit ecirctre normaliseacutee puis transformeacutee en ma-trice de similariteacute Une transformation simple est 1 moinsla dissimilariteacute (preacutealablement normaliseacutee pour ecirctre compriseentre 0 et 1)
Dis lt- cophenetic(hf)print((Z lt- 1 - asmatrix(Dismax(Dis))) digits = 4)
Ess Me S1 Sr Vm Bg Ef Dg Ess 10000 08742 08742 07468 00000 00000 00000 00000 Me 08742 10000 08969 07468 00000 00000 00000 00000 S1 08742 08969 10000 07468 00000 00000 00000 00000 Sr 07468 07468 07468 10000 00000 00000 00000 00000 Vm 00000 00000 00000 00000 10000 04191 08259 08868 Bg 00000 00000 00000 00000 04191 10000 04191 04191 Ef 00000 00000 00000 00000 08259 04191 10000 08259 Dg 00000 00000 00000 00000 08868 04191 08259 10000
La diversiteacute peut ecirctre calculeacutee par la fonction Dqz de en-tropart
Vecteur contenant 8 espegraveces(readcsv2(dataraoeffectifscsv rownames = 1 header = T) -gt
effectifs)
142 Diversiteacute de Leinster et Cobbold
5Ricotta et Szeidl laquo Towards aUnifying Approach to Diversity Mea-sures Bridging the Gap between theShannon Entropy and Raorsquos Quadra-tic Index raquo cf note 26 p 67
P1 P2 P3 P4 Ess 97 36 34 61 Me 62 24 49 4 S1 4 6 6 75 Sr 71 78 99 36 Vm 76 29 34 2 Bg 58 49 47 19 Ef 9 34 91 35 Dg 98 14 95 14
Ps lt- rowSums(effectifs)sum(effectifs)Dqz(Ps q = 2 Z)
None 2520938
Dans le cas particulier 119902 = 2 2119863Z est eacutegal agrave 2(119879 )
PhyloDiversity(Ps q = 2 phyf)$Total
None 2520938
Mais ce nrsquoest pas le cas en geacuteneacuteral
94 Entropie de Ricotta et SzeidlRicotta et Szeidl5 ont montreacute une similitude entre les en-
tropies de Shannon et de Rao en geacuteneacuteralisant lrsquoentropie deShannon en deux temps Tout drsquoabord en remarquant que laprobabiliteacute drsquooccurrence drsquoune espegravece est 1 moins la sommede celle des autres drsquoougrave
1119867 = minus sum119904
119901119904 ln (1 minus sum119905ne119904
119901119905) (96)
1 minus sum119905ne119904 119901119905 est la banaliteacute de lrsquoespegravece 119904 si on mesure ladiversiteacute neutre De faccedilon plus geacuteneacuterale (Zp)119904 peut exprimercette banaliteacute Enfin lrsquoentropie HCDT peut geacuteneacuteraliser lrsquoentro-pie de Shannon pour deacutefinir une mesure 119876120572 que nous noterons119902119867Z pour la coheacuterence de nos notations (119902 = 120572)
119902119867Z = sum119904
119901119904 ln1199021
(Zp)119904 (97)
De faccedilon plus rigoureuse on peut remarquer que (Zp)119904deacutecroicirct quand 119901119904 deacutecroicirct parce que la similariteacute drsquoune espegraveceavec elle-mecircme est maximale Une entropie deacutefinie agrave partirdrsquoune fonction drsquoinformation de 119901119904 reste donc une entropiequand on utilise la mecircme fonction drsquoinformation sur (Zp)119904 la fonction reste deacutecroissante et vaut 0 pour 119901119904 = 1 puisque(Zp)119904 = 1 dans ce cas 119902119867Z est donc bien une entropie La
95 Deacutefinition de la similariteacute 143
6M Nei laquo Genetic Distance bet-ween Populations raquo In The Ameri-can Naturalist 106949 (1972) p 283-292 doi 1023072459777 JSTOR 2459777
7Chiu et Chao laquo Distance-BasedFunctional Diversity Measures andTheir Decomposition A FrameworkBased on Hill Numbers raquo cf note 62p 131
fonction drsquoinformation ln119902(1119901119904) de lrsquoentropie HCDT (417)est simplement remplaceacutee par ln119902(1(Zp)119904)
Lrsquoentropie de Ricotta et Szeidl eacutetend lrsquoentropie HCDT enutilisant une fonction drsquoinformation plus geacuteneacuterale deacutependantde la banaliteacute de lrsquoespegravece plutocirct que de sa seule probabiliteacuteles deux eacutetant eacutegales dans le cas particulier de la diversiteacuteneutre Lrsquoordre de la diversiteacute 119902 permet de donner un plusou moins grand poids aux espegraveces banales (et non aux espegravecesfreacutequentes 119901119904 est agrave la puissance 1) La freacutequence et la banaliteacutese confondent seulement pour la diversiteacute neutre
Le logarithme drsquoordre 119902 de 119902119863Z est 119902119867Z
ln119902119902119863Z =119902 119867Z (98)
95 Deacutefinition de la similariteacuteLa transformation drsquoune matrice de dissimilariteacute en une
matrice de similariteacute neacutecessite une fonction strictement deacute-croissante dont le reacutesultat est compris entre 0 et 1 La plussimple est
119911119904119905 = 1 minus 119889119904119905max (119889119904119905)
Leinster et Cobbold argumentent en faveur drsquoune transforma-tion exponentielle neacutegative deacutejagrave utiliseacutee par Nei6
000
025
050
075
100
000 025 050 075 100r
xr
a
0
10
20
30
000 025 050 075 100r
xr
b
Fig 92 Approximation de(Zp)119902minus1
119904 par son deacuteveloppementlimiteacute au premier ordre pour (a)119902 = 15 (119903 = 119902 minus 1) et (b) 119902 = 05
Le problegraveme majeur de la diversiteacute 119902119863Z est qursquoelle four-nit souvent des valeurs presque indeacutependantes de 119902 quand onlrsquoapplique agrave une matrice de similariteacute fonctionnelle7 De nom-breux exemples y compris dans lrsquoarticle original de Leinster etCobbold montrent une tregraves faible deacutecroissance de la diversiteacutede 119902 = 0 agrave 119902 = 2 Ce nrsquoest pas un problegraveme theacuteorique maisnumeacuterique Si la banaliteacute de lrsquoespegravece 119904 est proche de 1 sa puis-sance 119902 peut ecirctre approcheacutee par son deacuteveloppement limiteacute aupremier ordre
(Zp)119902minus1119904 asymp 1 + (119902 minus 1)[(Zp)119904 minus 1]
144 Diversiteacute de Leinster et Cobbold
8Leinster laquo The Magnitude ofMetric Spaces raquo cf note 1 p 139
Cette approximation lineacuteaire implique que
sum119904
119901119904(Zp)119902minus1119904 asymp [sum
119904119901119904(Zp)119904]119902minus1
La puissance 119902 minus1 disparaicirct donc dans le calcul de la diversiteacuteet lrsquoeacutequation (93) devient
119902119863Z asymp 119911
ougrave 119911 = sum119904 119901119904(Zp)119904 Dans les faits cette approximation vautpour des valeurs de banaliteacute assez eacuteloigneacutees de 1 (Figure 92)
Si une majoriteacute des espegraveces (au sens de la somme de leursprobabiliteacutes respectives) a une banaliteacute supeacuterieure agrave 05 lrsquoap-proximation lineacuteaire est assez bonne et la moyenne geacuteneacuteraliseacuteede la banaliteacute est proche de sa moyenne arithmeacutetique Ce nrsquoestpas un problegraveme pour la comparaison de profils de diversiteacute decommunauteacutes diffeacuterentes calculeacutes agrave partir de la mecircme matricede similariteacute mais lrsquointerpreacutetation de la diversiteacute en termesde nombres effectifs drsquoespegraveces deacutependant de 119902 nrsquoest pas tregravesintuitive
Le code R neacutecessaire pour reacutealiser la figure est
r lt- 05seqZp lt- seq(0 1 0001)gga lt- ggplot(dataframe(r = seqZp xr = seqZp^r) aes(r xr)) +
geom_line() + geom_abline(intercept = 1 - r slope = r col = redlty = 2) + labs(y = expression(x^r)) + labs(tag = a)
r lt- -05ggb lt- ggplot(dataframe(r = seqZp xr = seqZp^r) aes(r xr)) +
geom_line() + geom_abline(intercept = 1 - r slope = r col = redlty = 2) + labs(y = expression(x^r)) + labs(tag = b)
gridarrange(gga ggb ncol = 2)
La transformation exponentielle neacutegative
119911119904119905 = 119890minus119906 119889119904119905max (119889119904119905)
est justifieacutee par Leinster8 119906 est une constante positive Plus 119906est grand plus la transformation est convexe les similariteacutessont tasseacutees vers 0 (figure 93)
Le code R neacutecessaire pour reacutealiser la figure est
ggplot(dataframe(x = seq(0 1 by = 01)) aes(x)) +stat_function(fun = function(x) exp(-x)) +stat_function(fun = function(x) exp(-2x) lty = 2) +stat_function(fun = function(x) exp(-10x) lty = 3) +labs(y = expression(exp(-ux)))
Augmenter la valeur de 119906 diminue les similariteacutes et donc labanaliteacute des espegraveces ce qui regravegle (arbitrairement) le problegravemede la faible sensibiliteacute de la diversiteacute au paramegravetre 119902
Du point de vue theacuteorique lrsquoordre des valeurs de la ma-trice des distances est justifieacute (par les diffeacuterences entre traits
96 Estimation 145
000
025
050
075
100
000 025 050 075 100x
exp(
minusux
)
Fig 93 Transformation desdistances (en abscisse) ensimilariteacutes (en ordonneacutees) selon lavaleur de 119906 Trait plein 119906 = 1 pointilleacutes longs 119906 = 2 pointilleacutes 119906 = 10 Plus 119906 est grand plus lessimilariteacutes sont tasseacutees vers 0
9E Marcon et al laquo The Decom-position of Similarity-Based Diversityand Its Bias Correction raquo In HAL00989454 (version 3 2014)
10Chao et T-J Shen laquo Nonpara-metric Estimation of Shannonrsquos Indexof Diversity When There Are UnseenSpecies in Sample raquo cf note 84 p 52
fonctionnels par exemple) mais leur distribution ne lrsquoest pas elle nrsquoest que la conseacutequence de la meacutethode de calcul Le choixde 119906 ne change pas lrsquoordre des distances mais deacuteforme la dis-tribution des similariteacutes La distance eacutetant normaliseacutee 119906 fixelrsquoeacutechelle des distances avant la transformation
Leinster relie la valeur de 119902119863Z agrave la magnitude de lrsquoespacedes espegraveces (espace dans lequel les espegraveces sont des points dontles distances deux agrave deux sont deacutecrites par la matrice Δ quidoit ecirctre euclidienne) la magnitude de lrsquoespace est la valeurmaximale que peut atteindre la diversiteacute La magnitude estune proprieacuteteacute qui deacutecrit la taille drsquoun espace dans le cadre dela theacuteorie des cateacutegories Modifier 119906 modifie la magnitude delrsquoespace selon une relation non triviale 119906 est un paramegravetreau mecircme titre que 119902 Quand 119906 rarr +infin Z rarr I119904 la diversiteacutetend vers la diversiteacute neutre Leinster et Cobbold suggegraverentde comparer les profils de diversiteacute en fonction agrave la fois de 119902et de 119906
96 EstimationComme les autres mesures de diversiteacute 119902119863Z est sujette
au biais drsquoestimation Deux estimateurs reacuteduisant le biaisexistent9 Le premier utilise la technique de Chao et T-JShen10 deacutejagrave vue pour la correction du biais de lrsquoentropie deShannon (339) Lrsquoestimateur de 119902119867Z est
119902Z = sum119904
119862 119901119904 ln1199021
(Zp)119904
1 minus (1 minus 119862 119901119904)119899 (99)
ougrave
(Zp)119904
= sum119905
119862 119901119905119911119904119905 + (1 minus 119862) 119911 (910)
146 Diversiteacute de Leinster et Cobbold
11Z Zhang et Grabchak laquo Entro-pic Representation and Estimation ofDiversity Indices raquo cf note 59 p 73
Lrsquoestimateur de la diversiteacute est 119902Z = 119890119902Z119902
Lrsquoautre estimateur suppose que la similariteacute des espegravecesnon observeacutees avec toutes les autres est la similariteacute moyenneobserveacutee Lrsquoestimation utilise la technique de Z Zhang etGrabchak11 qui consiste agrave deacutevelopper lrsquoestimateur en seacuterieentiegravere au voisinage de 119901119904 = 1 Lrsquoestimateur de 119902119863Z est pour119902 ne 1
119902Z =⎧⎨⎩
+ 119881 minus sum119904le119904ne0
119862 119901119904[ 119911 (1 minus 119862 119901119904) + 119862 119901119904]119902minus1⎫
⎬⎭
11minus119902
(911)ougrave
= sum119904le119904ne0
119862 119901119904⎡⎢⎣
⎛⎜⎝
sum119905le119904ne0
119862 119901119905119911119904119905⎞⎟⎠
+ (1 minus 119862) 119911⎤⎥⎦
119902minus1
(912)
et
119881 = 1+ sum119904le119904ne0
119899119904119899
119899minus119899119904
sum119907=1
(1 minus 119911)119907 [119907
prod119894=1
119894 minus 119902119894 ] [
119907prod119895=1
(1 minus 119899119904 minus 1119899 minus 119895 )]
(913)Lrsquoestimateur de 119902119867Z est
119902Z = + 119881 minus sum119904le119904ne0
119862 119901119904[ 119911 (1 minus 119862 119901119904) + 119862 119901119904]119902minus1
minus 11 minus 119902
(914)Pour 119902 = 1
1Z = + + sum119904le119904ne0
119862 119901119904 ln [ 119911 (1 minus 119862 119901119904) + 119862 119901119904] (915)
1Z = 1198901Z (916)
ougrave
= minus sum119904le119904ne0
119862 119901119904 ln ⎡⎢⎣
⎛⎜⎝
sum119905le119904ne0
119862 119901119895119911119904119905⎞⎟⎠
+ (1 minus 119862) 119911⎤⎥⎦
(917)
= sum119904le119904ne0
119899119904119899
119899minus119899119904
sum119907=1
(1 minus 119911)119907
119907 [119907
prod119895=1
(1 minus 119899119904 minus 1119899 minus 119895 )] (918)
97 Diversiteacute phylogeacuteneacutetique 147
Tab 91 Matrice de similariteacute correspondant agrave lrsquoarbre phylogeacuteneacutetique enexemple Les noms des lignes et colonnes sont les couples (espegravece actuelle branche ancestrale)
(1 11988711)(1 11988731)(2 11988712)(2 11988731)(3 11988713)(3 11988723)(4 11988714)(4 11988723)(5 11988715)(5 11988723)(1 11988711) 1 1 0 0 0 0 0 0 0 0(1 11988731) 1 1 1 1 0 0 0 0 0 0(2 11988712) 0 0 1 1 0 0 0 0 0 0(2 11988731) 1 1 1 1 0 0 0 0 0 0(3 11988713) 0 0 0 0 1 1 0 0 0 0(3 11988723) 0 0 0 0 1 1 1 1 1 1(4 11988714) 0 0 0 0 0 0 1 1 0 0(4 11988723) 0 0 0 0 1 1 1 1 1 1(5 11988715) 0 0 0 0 0 0 0 0 1 1(5 11988723) 0 0 0 0 1 1 1 1 1 1
12Leinster et Cobbold laquo Measu-ring Diversity The Importance ofSpecies Similarity raquo cf note 107p 58 proposition A7
Le package entropart fournit les fonctions Dqz et HqZ pourcalculer ces estimateurs
data(Paracou618) Matrice de distances fonctionnellesDistanceMatrix lt- asmatrix(Paracou618dist) Matrice de similariteacuteZ lt- 1 - DistanceMatrixmax(DistanceMatrix) Calcul de la diversiteacuteDqz(Paracou618MC$Ns q = 1 Z)
Best 1488083
97 Diversiteacute phylogeacuteneacutetique
1198791 1199011 1199015 1199012 1199013 1199014
1198792
1198793 b31
b23
b11 b12 b13 b14 b15
Fig 94 Arbre phylogeacuteneacutetique oufonctionnel hypotheacutetique 5espegraveces sont preacutesentes (119878 = 5)leurs probabiliteacutes noteacutees 1199011 agrave 1199015Les noms des branches sontafficheacutes
La diversiteacute phylogeacuteneacutetique 119902(119879 ) appliqueacutee agrave un arbre ul-trameacutetrique est un cas particulier de 119902119863Z pour une matrice Zdont les lignes et colonnes sont la similariteacute des laquo espegraveces his-toriques raquo12 crsquoest-agrave-dire les couples (espegravece actuelle brancheancestrale)
Par exemple lrsquoespegravece 1 et les branches 11988711 et 11988731 four-nissent les deux premiegraveres lignes et colonnes de la matrice lrsquoespegravece 5 et les branches 11988715 et 11988723 les deux derniegraveres
148 Diversiteacute de Leinster et Cobbold
La diversiteacute phylogeacuteneacutetique 119902(119879 ) est obtenue quand leseacuteleacutements de la matrice Z suivent les regravegles suivantes leseacuteleacutements de toutes les colonnes correspondant agrave une espegravecedonneacutee (par exemple les deux premiegraveres colonnes qui corres-pondent agrave lrsquoespegravece 1) valent 1 pour toutes les lignes corres-pondant agrave une branche dont lrsquoespegravece descend (les trois lignescorrespondant aux branches 11988711 et 11988731) les eacuteleacutements dont lrsquoes-pegravece en colonne ne descend pas de la branche en ligne valent 0La matrice nrsquoest donc pas symeacutetrique mais crsquoest une matricede similariteacute dont la diagonale vaut 1
La probabiliteacute de chaque espegravece historique est la sommede celles des espegraveces actuelles qui en descendent multiplieacuteepar la longueur de la branche normaliseacutee par la hauteur delrsquoarbre Dans lrsquoexemple la hauteur totale de lrsquoarbre est 119879 =1198791 + 1198792 + 1198793 Les probabiliteacutes des espegraveces historiques sont
(1199011119897(11988711)
119879 (1199011 + 1199012) 119897(11988731)119879 1199012
119897(11988712)119879 hellip (1199013 + 1199014 + 1199015) 119897(11988723)
119879 )
Les dimensions de la matrice de similariteacute et du vecteur deprobabiliteacutes deviennent rapidement tregraves grandes et leur eacutecri-ture peacutenible il est bien plus simple de calculer la diversiteacutephylogeacuteneacutetique agrave partir des distances dans lrsquoarbre et des pro-babiliteacutes des espegraveces Cette eacutequivalence de meacutethodes nrsquoa doncpas drsquointeacuterecirct pratique mais montre que la diversiteacute de Leinsteret Cobbold geacuteneacuteralise la diversiteacute phylogeacuteneacutetique Cependantle calcul de 119902Z agrave partir drsquoune matrice Z qui serait la simpletransformation des distances de lrsquoarbre phylogeacuteneacutetique crsquoest-agrave-dire 1 moins les distances normaliseacutees par la hauteur delrsquoarbre ne donne pas la valeur de la diversiteacute phylogeacuteneacutetique119902(119879 ) sauf dans le cas particulier de la diversiteacute de Rao 119902 = 2
Pour un arbre non ultrameacutetrique il est possible de deacutefinirune matrice Z similaire agrave celle de la table 91 mais ses va-leurs non nulles ne sont pas eacutegales agrave 1 Elles sont eacutegales aurapport de 119879 la longueur moyenne des branches pondeacutereacutee parla freacutequence des espegraveces sur la longueur de la branche ellesdeacutependent donc des freacutequences des espegraveces et empecircchent parconseacutequent la comparaison de la diversiteacute entre communauteacutesdiffeacuterentes
98 Diversiteacute individuelleLa diversiteacute 119902119863Z et tous ses cas particuliers (phylodiversiteacute
et diversiteacute neutre) peuvent ecirctre envisageacutes au niveau indivi-duel plutocirct qursquoau niveau de lrsquoespegravece
Le calcul de la diversiteacute nrsquoest pas affecteacute par le remplace-ment drsquoune espegravece par deux espegraveces identiques La ligne et lacolonne de la matrice Z correspondant agrave lrsquoespegravece 119904 sont rem-placeacutees par deux lignes et colonnes identiques correspondant
98 Diversiteacute individuelle 149
13S Pavoine et C Ricottalaquo Functional and Phylogenetic Simi-larity among Communities raquo In Me-thods in Ecology and Evolution 57(2014) p 666-675 doi 10 1111 2041 - 210X 12193 Chiu et Chaolaquo Distance-Based Functional Diversi-ty Measures and Their Decomposi-tion A Framework Based on HillNumbers raquo cf note 62 p 131
aux espegraveces 119904prime et 119904Prime dont la similariteacute avec les autres espegravecesest la mecircme que celle de lrsquoespegravece 119904 et la similariteacute entre elleseacutegale agrave 1 les probabiliteacutes veacuterifiant 119901119904 = 119901119904prime + 119901119904Prime Lrsquoopeacutera-tion peut ecirctre reacutepeacuteteacutee jusqursquoagrave la deacutesagreacutegation complegravete dela matrice ougrave chaque ligne correspondrait agrave un individu et lesprobabiliteacutes seraient eacutegales agrave 1119873 Il nrsquoy donc pas de diffeacuterenceentre la mesure de la diversiteacute individuelle et celle de la diversi-teacute speacutecifique qui nrsquoest qursquoune faccedilon pratique de regrouper desindividus ayant la mecircme banaliteacute Dit autrement lrsquoentropiedrsquoune communauteacute est la somme des entropie de ses espegravecesqui nrsquoest que la somme pondeacutereacutee des entropies individuelles sitous les individus drsquoune espegravece ont la mecircme entropie
La variabiliteacute intraspeacutecifique peut ecirctre traiteacutee par un rai-sonnement similaire Lrsquoideacutee drsquointeacutegrer aux mesures de diversi-teacute la possibiliteacute que tous les individus drsquoune espegravece ne soientpas semblables eacutemerge dans la litteacuterature13 Mais si des indi-vidus de la mecircme espegravece ne sont pas totalement similaires ilsne peuvent pas ecirctre regroupeacutes en prenant pour similariteacute delrsquoespegravece avec elle-mecircme une valeur unique qui reacutesumerait la si-milariteacute entre les individus (au lieu de 1) pour tous les ordresde diversiteacute
Formellement si lrsquoespegravece 119904 est composeacutee de deux groupes119904prime et 119904Prime la banaliteacute du groupe 119904prime est
(Zp)119904prime = sum119905ne119904prime119904Prime
119901119905119911119904prime119905 + 119901119904prime + 119901119904Prime119911119904prime119904Prime
celle du groupe 119904Prime est
(Zp)119904Prime = sum119905ne119904prime119904Prime
119901119905119911119904Prime119905 + 119901119904prime119911119904prime119904Prime + 119901119904Prime
Les similariteacutes avec les autres espegraveces sont identiques 119911119904119905 =119911119904prime119905 = 119911119904Prime119905 La contribution agrave la diversiteacute des deux groupes
sum119904prime
119901119904prime(Zp)119902minus1119904prime + sum
119904Prime119901119904Prime(Zp)119902minus1
119904Prime
est remplaceacutee apregraves regroupement par
sum119904
119901119904(Zp)119902minus1119904
Puisque 119901119904 = 119901119904prime +119901119904Prime le regroupement nrsquoest possible quel quesoit 119902 que si les banaliteacutes des deux groupes sont identiques cequi interdit toute variabiliteacute intraspeacutecifique 119911119904prime119904Prime est obliga-toirement eacutegal agrave 1 La non-lineacuteariteacute de la moyenne geacuteneacuteraliseacuteene permet pas de deacutefinir une matrice de similariteacute inteacutegrantla variabiliteacute intraspeacutecifique
Dans le cas de la diversiteacute de Rao (119902 = 2) on peut chercherla valeur de 119911119904119904 diffeacuterente de 1 deacutefinissant la similariteacute de
150 Diversiteacute de Leinster et Cobbold
lrsquoespegravece avec elle mecircme pour prendre en compte sa variabiliteacuteLa reacutesolution de lrsquoeacutequation
sum119904prime
119901119904prime(Zp)119904prime + sum119904Prime
119901119904Prime(Zp)119904Prime = sum119904
119901119904(Zp)119904
permet de trouver
119911119904119904 = 1 + 2119901119904prime119901119904Prime(119911119904prime119904Prime minus 1)1199012119904
Dans le cas le plus simple ougrave 119901119904prime = 119901119904Prime la similariteacute intras-peacutecifique est (1 + 119911119904prime119904Prime)2 La valeur de 119911119904119904 peut ecirctre cher-cheacutee pour nrsquoimporte quelle valeur de 119902 mais la reacutesolution delrsquoeacutequation est en geacuteneacuteral impossible analytiquement et 119911119904119904varie avec 119902 Se limiter agrave 119902 = 2 simplifie le problegraveme
Lrsquoexemple suivant considegravere deux espegraveces dont une com-prenant deux groupes
Similariteacute entre les deux groupeszs12 lt- 09 Probabiliteacutes des deux groupesps1 lt- 15ps2 lt- 15 Matrice de similariteacute(Z2s lt- matrix(c(1 zs12 05 zs12 1 05 05 05 1) nrow = 3))
[1] [2] [3] [1] 10 09 05 [2] 09 10 05 [3] 05 05 10
Probabiliteacutes(P2s lt- c(ps1 ps2 1 - ps1 - ps2))
[1] 02 02 06
DiversiteacuteDqz(P2s 2 Z2s)
None 1329787
Similariteacute intraspeacutecifique apregraves regroupement(zss lt- 1 + 2 ps1 ps2(ps1 + ps2)^2 (zs12 - 1))
[1] 095
Matrice de similariteacute apregraves regroupement(Z1s lt- matrix(c(zss 05 05 1) nrow = 2))
[1] [2] [1] 095 05 [2] 050 10
99 Diversiteacute des valeurs propres 151
14S Pavoine et J Izsaacutek laquo NewBiodiversity Measure That IncludesConsistent Interspecific and Intraspe-cific Components raquo In Methods inEcology and Evolution 52 (2014)p 165-172 doi 1011112041-210X12142
15D Campos et J F Isaza laquo AGeometrical Index for Measuring Spe-cies Diversity raquo In Ecological Indi-cators 94 (2009) p 651-658 doi 101016jecolind200807007
Probabiliteacute apregraves regroupement(P1s lt- c(ps1 + ps2 1 - ps1 - ps2))
[1] 04 06
DiversiteacuteDqz(P1s 2 Z1s)
None 1329787
En pratique si les similariteacutes entre individus ou groupessont connues le regroupement nrsquoa aucun inteacuterecirct Mais en ab-sence de donneacutees individuelles il est possible de choisir arbi-trairement une similariteacute intraspeacutecifique diffeacuterente de 1 (ou defaccedilon eacutequivalente une distance diffeacuterente de 0) pour calculerune diversiteacute drsquoordre fixeacute de preacutefeacuterence 2
99 Diversiteacute des valeurs propresLrsquoapproche de Pavoine et Izsaacutek14 permet de prendre en
compte la variabiliteacute intraspeacutecifique de faccedilon rigoureuse Pourmesurer la diversiteacute neutre les espegraveces sont placeacutees dans unespace multidimensionnel de dimension 119878 Chaque espegravece estrepreacutesenteacutee par un vecteur de longueur 119901119904 sur son axe Cetterepreacutesentation a eacuteteacute utiliseacutee par Campos et Isaza15 qui ont relieacutela diversiteacute de Simpson au volume de la sphegravere sur laquelle setrouve le point deacutefinissant la communauteacute (figure 95)
that ranges in interval 0 D 1 while the Gini-Simpson index
DGS frac14 1 D frac14PS
nfrac141 pneth1 pnTHORN is a measure of heterogeneity or
diversity in that values of D near zero representing high diver-
sity and values near one corresponding to low diversity While
Simpson index D describes the probability that two organisms
drawn randomly and independently from a population belong-
ing to the same species DGS is the probability that two randomly
sampled individuals are of two different classes
In this paper we propose a new set of biodiversiy indices
BkethS rTHORN by using the fact that (1) describes a sphere of radius
r frac14ffiffiffiffiDp
in an euclidian space of S dimensions with coordinate
axes p1 p2 pS The conditions 0 pn 1 andPnfrac14S
nfrac141 pn frac14 1
on the probability distribution p frac14 f p1 p2 pSg also imply
the existence of an hyperplane in S dimensions This hyper-
plane intersects each coordinate axis at the point 1 and the
point P frac14 eth p1 p2 pSTHORN representing p always lies in the first
quadrant of S-dimensional space on a sphere of radius r 1
centered at origin (see Fig 1)
Note that almost six decades after Edward H Simpson
(1949) proposedD as a measure of species concentration as far
as we know no person has taken advantage of the fact that
Eq (1) represents a S-dimensional sphere for which the
formula for finding its volume is known (Kubo 1974) There-
fore the major contribution of this paper consists in using this
property for introducing a new biodiversity index that is based
on a mathematical comparison of the volumes of two spheres
both having the same Simpson index D but differing in the
number of species S and S thorn k respectively (k a non-negative
integer)
A major practical advantage of index BkethS rTHORN frac14 akethSTHORN bkethrTHORN is
that it can be partitioned as the product of two components a
function akethSTHORN dependent of species richness and a function
bkethr frac14ffiffiffiffiDpTHORN dependent of the Simpson index It follows the
relation ln BkethS rTHORN frac14 ln akethSTHORN thorn ln bkethrTHORN that allows to interpret
changes in biodiversity as the combination of two contribu-
tions species richness and abundance distribution
We are also able to get a visual and geometrical
representation of biodiversity by using a cartesian bidimen-
sional plane hereafter called biodiversity plane It has r frac14ffiffiffiffiDp
as
x-axis biodiversity index BkethS rTHORN as y-axis Biodiversity
conditions of the region under study can be always summar-
ized in a standard diagram as those shown in examples below
(see Figs 3 and 4) In similarity to thermodynamical isothermal
curves (Greek isos equal thermos heat) the r- BkethS rTHORNbiodiversity plane is arranged in layers of lsquolsquoisonumberrsquorsquo of
species curves (S-curves) resulting in an onion-like structure
(structure composed of a set of S-curves) This feature allows
for comparison of communities eg if they have the same
species richness all BkethS rTHORN values belong to same S-curve
Other means of measuring biological diversity is the
Shannon index also called Shannon entropy or Shannon
information index (Izsak and Papp 2000)
Heth pTHORN frac14 Hethp1 p2 pSTHORN frac14 XSnfrac141
pnln pn (2)
where if any pn is assumed to be zero then 0ln 0 is to be
interpreted as zero The quantity HethpTHORN is a function of dis-
tribution p and the unit depends on the base b of logarithm
used (ln frac14 ln b) b frac14 2 bit b frac14 e nat b frac14 3 trit b frac14 10 hartley
Heth pTHORN is the information gained on the biological diversity
in the region assuming that the total number of species Sand the probability distribution p of them are known As
0 HethpTHORN lnS there are two extreme situations (i) minimum
biological diversity occurs when only one species exists (all pn
are zero but one takes value 1 HethpTHORN frac14 0) (ii) Maximum biolo-
gical diversity occurs when the probability distribution p is
homogeneous (all pn take the same value pn frac14 1=S and there-
fore Hmax ethpTHORN frac14 lnS)
Further motivation for introducing a new biological
diversity index is concerned with a remark by Kolasa and
Biesladka (1984) Computing the Shannon index or Simpson
index constitutes an error because they combine levels
(number of species and distribution of their abundances) into
one value of unknown ecological meaning and in this
procedure information is lost By taking advantage of the
descomposition ln BkethS rTHORN frac14 ln akethSTHORN thorn ln bkethrTHORN we conclude
that this is not the case with the index introduced in present
paper In fact for a given numerical couple ethS rTHORN the BkethS rTHORN-value (say g) is located on a well-defined unique S-curve (eg
see Figs 3 and 4) The reverse process that in the bidodiversity
plane starts from a fixed S-curve and the value g also leads to
a unique value r Another way of preserving the full
information is to record the couple ethakethSTHORNbkethrTHORNTHORNIndex BkethS rTHORN is also an ordering system Index value
associated with ethS pTHORN be greater than the value corresponding
to ethS0 p0THORN if either D frac14 D0 (same value of r) and SgtS0 (S-curve
above S0 curve) or S frac14 S0 (just the same S-curve) and DltD0
(that is rlt r0)
In Section 2 the promised diversity index BkethS rTHORN is
introduced and the method is illustrated by considering
examples with hypothetical communities For a practical
application of the method a full example is developed (Section
3) by using data from the weevil (Coleoptera Curculionidae)
species richness published by Ohsawa (2005) and discussed
further by Ito (2007) In Section 4 we conclude with some
Fig 1 ndash Geometrical interpretation of Eq (1) for the case of
three species S frac14 3 The plane passing through the points
eth100THORN eth010THORN and eth001THORN is given by p1 thorn p2 thorn p3 frac14 1
e c o l o g i c a l i n d i c a t o r s 9 ( 2 0 0 9 ) 6 5 1 ndash 6 5 8652
Fig 95 Repreacutesentation drsquounecommunauteacute dans un espacemultidimensionnel dont chaqueaxe correspond agrave une espegravece Lacommunauteacute est composeacutee de troisespegraveces Le point repreacutesentant lacommunauteacute se trouve sur lasphegravere de rayon 119903 = radicsum119904 1199012119904 Leplan (qui est en reacutealiteacute unhyperplan de dimension 119878 minus 1)drsquoeacutequation sum119904 119901119904 = 1 estrepreacutesenteacute par un triangle
La matrice de similariteacute entre les espegraveces Z permet drsquoaf-finer la repreacutesentation Soit la matrice C =
radicZ Chaque es-
pegravece 119904 est maintenant repreacutesenteacutee par le vecteur dont la coor-donneacutee sur lrsquoaxe 119905 est radic119901119904119901119905119888119904119905 Les axes correspondent auxespegraveces laquo pures raquo totalement dissimilaires les vecteurs des es-pegraveces reacuteelles prennent en compte la similariteacute Dans le cas ex-trecircme de la diversiteacute neutre C = I chaque espegravece est situeacuteeuniquement sur son axe Dans lrsquoautre cas extrecircme de totale
152 Diversiteacute de Leinster et Cobbold
similariteacute ougrave C ne contient que des 1 toutes les espegraveces sontcolineacuteaires
Il est possible de calculer les 119878 valeurs propres noteacutees 120582119904de la matrice des coordonneacutees des espegraveces et de les normaliser 120583119904 = 120582119904sum119904 120582119904 La communauteacute peut maintenant ecirctre repreacute-senteacutee par ses valeurs propres 120583119904 correspondant agrave la proportiondrsquoune laquo espegravece composite raquo pure sur chaque axe geacuteneacutereacute par lesvecteurs propres cette transformation est une ACP non cen-treacutee non reacuteduite La diversiteacute HCDT des valeurs propres estla diversiteacute de la communauteacute qui sera noteacutee ici 119902119863Z(Λ)
La deacutefinition de cette diversiteacute autorise toute matrice Csymeacutetrique dont les valeurs de similariteacute sont positives ounulles strictement positives sur la diagonale Si C est la racinecarreacutee drsquoune matrice de similariteacute au sens strict Z crsquoest-agrave-dire contenant des valeurs comprises entre 0 et 1 et dont leseacuteleacutements de la diagonale sont tous eacutegaux agrave 1 alors 2119863Z(Λ)est eacutegale agrave la diversiteacute de Rao appliqueacutee agrave une matrice dedistances D = 1 minus Z La deacutefinition de C comme racine carreacuteede Z se justifie par des raisons geacuteomeacutetriques la norme dechaque vecteur repreacutesentant une espegravece est la racine carreacutee dela somme des carreacutes de ses coordonneacutees Le carreacute de la normedu vecteur de lrsquoespegravece 119904 est donc 119901119904 multiplieacute par la banaliteacutede lrsquoespegravece
Si Z = I119904 lrsquoACP ne modifie pas le nuage de points originalet 119902119863Z(Λ) = 119902119863
Lrsquoexemple suivant calcule la diversiteacute de la meacuteta-communauteacute Paracou618 selon la matrice de distancesParacou618dist
ProbabiliteacutesPs lt- Paracou618MC$Ps[Paracou618MC$Ps gt 0] Matrice de distances fonctionnellesDistanceMatrix lt- asmatrix(Paracou618dist) Mise en correspondance de la matrice et du vecteur de probabiliteacutesD lt- DistanceMatrix[names(Ps) names(Ps)] NormalisationD lt- Dmax(D) Transformation en matrice de similariteacuteZ lt- 1 - D Matrice diagonale contenant les probabiliteacutesQ lt- diag(Ps) Matrice des espegraveces (les lignes de Sp sont les coordonneacutees des vecteurs)Sp lt- sqrt(Q) sqrt(Z) sqrt(Q) Valeurs propres normaliseacuteesLambda lt- svd(Sp)$dMu lt- Lambdasum(Lambda) Comparaison des valeurs agrave q=2Diversity(Mu 2)
None 1540061
99 Diversiteacute des valeurs propres 153
Diversiteacute de RaoDqz(Ps 2 Z)
None 1490786
La valeur agrave q=0 est le nombre despegravecesDiversity(Mu 0)
None 229
length(Ps)
[1] 229
La valeur de la diversiteacute des valeurs propres est diffeacuterentede celle de la diversiteacute de Rao agrave cause des approximationsnumeacuteriques lieacutees au calcul des valeurs propres (qui neacutecessitentlrsquoinversion drsquoune matrice carreacutee de dimension 119878) La valeurexacte est celle donneacutee par Dqz()
Le profil de diversiteacute se trouve en figure 96
3
10
30
100
00 05 10 15 20Ordre de diversiteacute
Div
ersi
teacute
Fig 96 Profil de diversiteacute desvaleurs propres de lameacuteta-communauteacute Paracou618
Code R pour la figure
DqZLambda lt- CommunityProfile(Diversity Mu)Xlab lt- Ordre de diversiteacuteYlab lt- Diversiteacuteautoplot(DqZLambda xlab = Xlab ylab = Ylab) + scale_y_log10()
La diversiteacute des valeurs propres permet de ramener le pro-blegraveme de la diversiteacute drsquoespegraveces partiellement similaires au cal-cul de la diversiteacute neutre drsquoune communauteacute drsquoespegraveces compo-sites totalement dissimilaires
Les eacuteleacutements de la diagonale de la matrice de similariteacute nesont pas forceacutement eacutegaux agrave 1 des valeurs infeacuterieures corres-pondent agrave la variabiliteacute intraspeacutecifique selon le meacutecanisme de
154 Diversiteacute de Leinster et Cobbold
regroupement traiteacute au paragraphe preacuteceacutedent Les raisons quiempecircchent drsquoutiliser des valeurs de similariteacute intraspeacutecifiquediffeacuterentes de 1 dans le calcul de la diversiteacute de Leinster etCobbold ne srsquoappliquent pas ici quelle que soit la valeur de119902 les valeurs propres sont les mecircmes
Les limites de la diversiteacute des valeurs propres sont cepen-dant nombreuses La premiegravere est numeacuterique son calcul estimpreacutecis dans des communauteacutes tregraves riches Lrsquoinversion drsquounematrice de dimension 200 ou plus est toujours probleacutematique
Les espegraveces non eacutechantillonneacutees entraicircnent un biais drsquoesti-mation le nombre de dimensions est sous-estimeacute Comme lesespegraveces manquantes ont une faible probabiliteacute leur vecteur estpetit et nrsquoinflue pas beaucoup sur la diagonalisation de la ma-trice Les valeurs propres manquantes sont donc petites Ellesinfluent sur la diversiteacute pour les faibles valeurs de 119902 notam-ment la diversiteacute drsquoordre 0 qui est le nombre de dimensionsde la matrice des espegraveces (en geacuteneacuteral le nombre drsquoespegraveces ouune valeur infeacuterieure si des espegraveces sont colineacuteaires) Il nrsquoexistepas de technique pour corriger ce biais drsquoestimation
La composition de la communauteacute en espegraveces compositesdeacutepend agrave la fois de la matrice de similariteacute et des probabiliteacutesdes espegraveces reacuteelles Elle est donc unique pour chaque com-munauteacute ce qui empecircche toute deacutecomposition de la diversiteacuteselon les meacutethodes preacutesenteacutees plus loin
910 Synthegravese119902119863(119879 ) est lrsquoexponentielle drsquoordre 119902 de la moyenne pondeacute-
reacutee de lrsquoentropie HCDT calculeacutee agrave chaque peacuteriode de lrsquoarbrephylogeacuteneacutetique
119902119863Z est lrsquoexponentielle drsquoordre 119902 de lrsquoentropie de Ricotta etSzeidl mais aussi lrsquoinverse de la banaliteacute moyenne des espegravecesde la communauteacute
119902119863Z et 119902119863 sont des nombres effectifs drsquoespegraveces respectenttoutes les proprieacuteteacutes demandeacutees agrave une mesure de diversiteacute dontle principe de reacuteplication Leurs valeurs sont identiques pour119902 = 2 (diversiteacute de Rao) 119902119863Z est moins sensible au paramegravetre119902 que 119902119863(119879 ) la figure 97 compare les deux mesures
Le rocircle du paramegravetre est assez diffeacuterent dans 119902119863Z la ba-naliteacute des espegraveces est agrave la puissance 119902 alors que leur probabiliteacuteest agrave la puissance 1 Le paramegravetre deacutetermine lrsquoimportance don-neacutee aux espegraveces originales crsquoest-agrave-dire dont la banaliteacute est pe-tite et non aux espegraveces rares Les deux notions se confondentquand la diversiteacute neutre est consideacutereacutee la banaliteacute drsquouneespegravece se reacuteduit alors agrave sa freacutequence
Le code R neacutecessaire pour reacutealiser la figure est
910 Synthegravese 155
50
100
0 1 2 3q
Div
ersi
teacute
Fig 97 Diversiteacute phylogeacuteneacutetique(lrsquoarbre est une taxonomie) drsquoordre119902 de deux hectares de forecirct deParacou 119902119863Z (trait plein) et119902(119879 ) (pointilleacute)
16Pavoine et al laquo Is the Origina-lity of a Species Measurable raquo cfnote 30 p 105 Podani et Schmeralaquo On Dendrogram-Based Measures ofFunctional Diversity raquo cf note 25p 104 Podani et Schmera laquo HowShould a Dendrogram-Based Measureof Functional Diversity Function ARejoinder to Petchey and Gaston raquocf note 30 p 105
q lt- c(seq(0 3 01)) Reacuteutilisation de Paracou618Taxonomy au format phylog (cf calcul de FAD)DistanceMatrix lt- asmatrix(Tree$Wdist^22)Z lt- 1 - DistanceMatrixmax(DistanceMatrix)Divqz lt- sapply(q function(q) Dqz(Paracou618MC$Ps q Z))Divq lt- sapply(q function(q) ChaoPD(Paracou618MC$Ps q = q
PhyloTree = Paracou618Taxonomy))ggplot(dataframe(q Divq Divqz) aes(q)) + geom_line(aes(y = Divqz)) +
geom_line(aes(y = Divq) lty = 2) + labs(y = Diversiteacute)
119902119863Z est particuliegraverement inteacuteressante pour mesurer la di-versiteacute fonctionnelle souvent deacutefinie agrave partir drsquoune matrice dedistances entre les espegraveces La transformation drsquoune matriceen un arbre phylogeacuteneacutetique deacuteforme les donneacutees16 La diversi-teacute de Leinster et Cobbold est calculeacutee directement agrave partir dela matrice
Si lrsquoarbre phylogeacuteneacutetique nrsquoest pas ultrameacutetrique le calculde la diversiteacute est possible mais la matrice Z contient alors desvaleurs comprises entre 0 et 1 qui deacutependent des effectifs desespegraveces actuelles (ils interviennent dans le calcul de la hauteurde lrsquoarbre qui est la moyenne de la longueur des branches) Ladeacutependance entre similariteacute et freacutequence des espegraveces constitueun problegraveme theacuteorique qui empecircche drsquointerpreacuteter la diversiteacutecalculeacutee agrave partir drsquoun arbre non ultrameacutetrique
Enfin il est possible de deacutesagreacuteger les donneacutees jusqursquoauniveau individuel si la distance entre paires drsquoindividus estconnue En revanche la prise en compte de la variabiliteacute in-traspeacutecifique par une similariteacute intraspeacutecifique infeacuterieure agrave 1nrsquoest possible que pour un ordre de diversiteacute fixeacute il nrsquoest paspossible drsquoobtenir un profil de diversiteacute de cette faccedilon
Quatriegraveme partie
Diversiteacute beta etdeacutecomposition
157
1Whittaker laquo Vegetation of theSiskiyou Mountains Oregon and Ca-lifornia raquo cf note 8 p 5
2M J Anderson et al laquo Naviga-ting the Multiple Meanings of Diver-sity A Roadmap for the PracticingEcologist raquo In Ecology Letters 141(2011) p 19-28 doi 101111j1461-0248201001552x
Chapitre 10
Cadre
La diversiteacute 120573 deacutesigne la diffeacuterentiation entre communauteacutes crsquoest-agrave-direune mesure de divergence de composition speacutecifique entre elle ou bienla divergence entre elles et leur assemblage appeleacutee diversiteacute propor-tionnelle La conciliation de ces deux deacutefinitions fait toujours lrsquoobjet derecherches
Lrsquoessentiel
La notion de diversiteacute 120573 a eacuteteacute introduite par Whittaker1page 320 comme le niveau de changement dans la compositiondes communauteacutes ou le degreacute de diffeacuterenciation des commu-nauteacutes en relation avec les changements de milieu La traduc-tion de cette notion intuitive en une deacutefinition sans ambiguiumlteacuteest encore une question de recherche et de deacutebats
Anderson et al2 fournissent une revue des analyses utilesde la diversiteacute 120573 en forme de guide agrave destination des eacutecologuesreprise ici en introduction La distinction entre diversiteacute de dif-feacuterenciation et diversiteacute proportionnelle est preacutesenteacutee ensuite
Pour simplifier lrsquoexposeacute les individus seront eacutechantillonneacutesdans des communauteacutes appartenant agrave une meacuteta-communauteacuteLe tableau 101 reacutesume les notations
Des exemples montrent comment calculer cette diversi-teacute principalement agrave lrsquoaide du package entropart Le packagecontient les donneacutees drsquoinventaire de deux hectares du disposi-tif de Paracou Les donneacutees sont organiseacutees dans le packagesous la forme drsquoun objet MetaCommunity qui contient notam-ment la matrice des 119899119904119894 Les parcelles de Paracou sont danslrsquoobjet Paracou618MC
library(entropart)summary(Paracou618MC)
Meta-community (class MetaCommunity) made of 1124 individuals in 2 communities and 425 species Its sample coverage is 092266748426447 Community weights are
159
160 Cadre
Tab 101 Notations des effectifs tableau espegraveces-communauteacutes
Communauteacute 119894 hellip Total meacuteta-communauteacute
Espegravece 119904 119899119904119894 nombredrsquoindividus delrsquoespegravece 119904 dans lacommunauteacute 119894119904|119894 = 119899119904119894119899+119894 estlrsquoestimateur de laprobabiliteacute 119901119904|119894qursquoun individu de lacommunauteacute 119894 soitde lrsquoespegravece 119904
119899119904+ = sum119894 119899119904119894119901119904 = sum119894 119908119894119901119904|119894
hellipTotal 119899119904+ = sum119894 119899119904119894
119901119904 = sum119894 119908119894119901119904|119894
119899 nombre totaldrsquoindividuseacutechantillonneacutes
3Anderson et al laquo Navigatingthe Multiple Meanings of Diversity A Roadmap for the Practicing Ecolo-gist raquo cf note 2 p 159
4M Vellend laquo Do CommonlyUsed Indices of -Diversity MeasureSpecies Turnover raquo In Journal ofVegetation Science 12 (2001) p 545-552 doi 1023073237006
5Anderson et al laquo Navigatingthe Multiple Meanings of Diversity A Roadmap for the Practicing Ecolo-gist raquo cf note 2 p 159
[1] 05720641 04279359 Community sample numbers of individuals are P006 P018 643 481 Community sample coverages are P006 P018 08943859 08463782
101 Deacutefinition de la diversiteacute 120573 parobjectifs
Anderson et al3 proposent une revue des deacutefinitions dela diversiteacute 120573 selon les analyses eacutecologiques auxquelles ellespeuvent contribuer plutocirct que selon leurs proprieacuteteacutes matheacute-matiques
Deux types de diversiteacute 120573 peuvent ecirctre deacutefinies4 en accordavec les notions originales de Whittaker le remplacement (tur-nover) des espegraveces le long drsquoun gradient environnemental spa-tial ou temporel et la variation de la composition speacutecifiqueentre communauteacutes qui diffegraverent de la meacuteta-communauteacute etentre elles Ces deux deacutefinitions sont preacutesenteacutees sur les figures101 et 1025
Les mesures de remplacement ne sont pas traiteacutees en deacutetaildans ce chapitre mais simplement preacutesenteacutees ici
La plus simple (figure 101 T1) est la dissimilariteacute entredeux communauteacutes noteacutee Δ119910 De nombreuses mesures de dissi-milariteacute existent elles sont deacutetailleacutees dans le chapitre 11 Whit-taker nrsquoenvisageait que la preacutesence ou lrsquoabsence des espegravecesmais leur abondance peut ecirctre prise en compte
Cette dissimilariteacute peut ecirctre analyseacutee en fonction du gra-dient de reacutefeacuterence La dissimilariteacute entre des paires de com-munauteacutes preacutesentant la mecircme diffeacuterence (par exemple ayant
101 Deacutefinition de la diversiteacute 120573 par objectifs 161
d frac14 1m
Pi jlti dij (eg Whittaker 1960 1972 Vellend et al 2007) or the average distance-
to-centroid of the N points in the space defined by the resemblance measure (here
referred to as dcen see Anderson 2006 Anderson et al 2006 for further details)
For Euclidean distances and one species (p = 1) r2 is the classical unbiased estimate of
the univariate sample variance Legendre et al (2005) suggested SS(Y) the sum of the
individual sum of squares across all species as a measure of b diversity For Euclidean
distances r2 frac14 SSethYTHORN=ethN 1THORN that is r2 frac14 trethRTHORN the sum of the estimated variances
across all species where R is the estimated variancendashcovariance matrix of dimension
p middot p More generally for non-Euclidean measures (Jaccard Soslashrensen BrayndashCurtis
etc) r2 frac14 trethGTHORN=ethN 1THORN where G is Gowers centred matrix obtained directly from
matrix D (McArdle amp Anderson 2001) Taking the square root r frac14ffiffiffiffiffir2p
yields a
measure of variation expressed in the same units as the chosen resemblance measure
MISSION STATEMENTS AND ASSOCIATED ANALYSES
We articulate a series of mission statements regarding the analysis of b diversity These
are numbered and discussed in two separate groups by reference to the two conceptual
types of b diversity turnover and variation (Fig 2) Figures 3 and 4 show schematic
representations of the relevant sampling designs and associated analyses in each case
Surnover
T1 Measure the turnover in community structure between two communities The focus here is on
simply estimating Dy between two communities
T2 Measure the turnover in community structure between two communities and model this along an
environmental gradient or other factor For example if we estimate the turnover in
community structure between serpentine and non-serpentine soils (Dy) does this
change with latitude (x) Interest lies in modelling Dy vs x directly which can be done
by fitting a linear or nonlinear model Note that each Dy value is obtained
independently in this scenario with one (or more if one has independent replicates of
such pairs) for each value of x Note these are not all possible pairwise values in a
distance matrix
T3 Explore and model the relationship between pairwise dissimilarities in community structure
and pairwise differences in space time or environment Here interest lies in modelling all
pairwise Dy values as a function of Dx For example are differences in insect
community structure related to differences in precipitation The Mantel test (Mantel
1967) may be used to test statistical significance of such relationships This approach
unwinds the dissimilarity matrix into a single vector of k frac14 1 m values but
permutations are done correctly by treating the N sample units (not the m pairs) as
TURNOVER
Figure 3 Schematic representation and appropriate analyses of ecolog-
ical b diversity for each of a series of mission statements with a focus on
turnover along one or more spatial temporal or environmental
gradients
Idea and Perspective Roadmap for beta diversity 21
2010 Blackwell Publishing LtdCNRS
Fig 101 Diversiteacute 120573 lieacutee auremplacement des espegraveces le longdrsquoun gradient Δ119910 est la mesure dela dissimilariteacute entre deuxcommunauteacutes x est un gradientenvironnemental spatial outemporel Δ119909 est lrsquoeacutecart entredeux points du gradient
6J C Nekola et P S Whitelaquo The Distance Decay of Similarityin Biogeography and Ecology raquo In Journal of Biogeography 264 (1999)p 867-878 doi 101046j1365-2699199900305x
7P Legendre et M J Andersonlaquo Distance-Based Redundancy Analy-sis Testing Multispecies Responsesin Multifactorial Ecological Experi-ments raquo In Ecological Monographs691 (1999) p 1-24 doi 1018900012-9615(1999)069[0001DBRATM]20CO2
8P Legendre et E Gallagherlaquo Ecologically Meaningful Transfor-mations for Ordination of Spe-cies Data raquo In Oecologia 1292(2001) p 271-280 doi 10 1007 s004420100716
9P Legendre et al laquo AnalyzingBeta Diversity Partitioning the Spa-tial Variation of Community Compo-sition Data raquo In Ecological Mono-graphs 754 (2005) p 435-450 doi 10189005-0549
10Pavoine et al laquo From Dissimi-larities among Species to Dissimilari-ties among Communities A DoublePrincipal Coordinate Analysis raquo cfnote 51 p 126
subi ou non un traitement) situeacutees le long drsquoun gradient (parexemple la fertiliteacute du sol) peut ecirctre analyseacutee en fonction de cegradient (figure 101 T2) Plus classiquement la diversiteacute 120573peut ecirctre reacutegresseacutee contre la valeur du gradient (T3) La dissi-milariteacute de chaque paire de communauteacutes est confronteacutee agrave soneacutecart sur le gradient Les deux analyses preacuteceacutedentes peuventecirctre combineacutees pour mesurer le remplacement des espegraveces se-lon deux gradients emboicircteacutes (T6)
Une variation sur le modegravele T2 consiste agrave le repreacutesentersous la forme drsquoun modegravele de deacutecroissance en fonction de ladistance6 eacuteventuellement pour plusieurs groupes de commu-nauteacutes (figure 101 T4 et T5) Lrsquoindice de Simpson spatiale-ment explicite (Section 231) entre dans ce cadre bien qursquoilsoit construit diffeacuteremment
Les mesures de variation (figure 102 V1) concernent la dis-similariteacute entre plusieurs communauteacutes ou entre chaque com-munauteacute et la meacuteta-communauteacute Lrsquoeacutequivalence de ces deuxconcepts nrsquoest pas eacutevidente elle a eacuteteacute montreacutee pour les me-sures de dissimilariteacute entre paires de communauteacutes par P Le-gendre et Anderson 7 P Legendre et Gallagher 8 P Legendreet al9 et pour lrsquoentropie de Rao par Pavoine et al10 mais resteune question ouverte pour lrsquoentropie HCDT en geacuteneacuteral
162 Cadre
Fig 102 Diversiteacute 120573 lieacutee agrave lavariation de la composition
speacutecifique 120573119882 est le rapport entrela diversiteacute 120574 et la diversiteacute 120572
120573119860119889119889 leur diffeacuterence 119889119894119895 est ladissimilariteacute entre les
communauteacutes 119894 et 119895 2 est lavariance de cette dissimilariteacute 119889 sa
moyenne Si 119889 est une distanceeuclidienne 119889119888119890119899 est la distance
moyenne des communauteacutes agrave leurcentre de graviteacute
exchangeable under the null hypothesis of no relationship between Dy and Dx
(Legendre amp Legendre 1998) These m values are not independent of one another so
one cannot use classical regression methods (partitioning and associated tests) directly
on the Dy values (Manly 2007) Note that the Mantel test which may be useful for
analysing a single gradient is not recommended for investigating more than one
gradient at a time (such as spatial gradients in two dimensions) due to the omni-
directional nature of dissimilarities and lack of power (Legendre amp Fortin 2010)
T4 Estimate the rate of turnover in community structure along a spatial temporal or
environmental gradient Interest lies in modelling Interest lies in modelling Dy vs Dx
which is essentially the same thing as T3 but specifically now with the goal of
estimating the rate of turnover (paray frasl parax) as in a distancendashdecay model (Qian amp Ricklefs
2007) In most cases similarity [(1 ) Dy) where 0 pound Dy pound 1] is modelled as a linear or
nonlinear function of Dx (usually an exponential decay) for simplicity we shall refer to
the estimated slope as paray frasl parax One might also consider the relative strength of the
relationship (r2) which is not necessarily monotonic on the estimated slope Thus we
recommend that both the r2 and slope values be reported in comparative studies of
distancendashdecay models A potential issue arises when there is no evidence against the
null hypothesis of the slope being zero (tested using the Mantel test as in T3 above)
It is unlikely that this corresponds to there being zero b diversity Rather there may
well be variation that is simply unrelated to the measured gradient
T5 Compare turnover along a specific gradient for two different sets of species or taxonomic groups
For example is the rate of species turnover along a gradient in soil type different for
native species than it is for exotic species Here one examines two rates along a
common gradient Interest lies in comparing (say) paraynative frasl parax with parayexotic frasl parax This can
be done visually by looking at plots of the models but note that lack of independence
among the Dy values precludes the use of a classical ANCOVA A test of the null
hypothesis of no difference in the slopes may be done however by randomly
re-allocating the species into the groups (native vs exotic) but leaving x fixed to
generate a null distribution for the difference in slopes The concept of halving distance
(Soininen et al 2007) might also be considered here
T6 Explore and model the rate of turnover along a gradient across different levels of another
factor or along another gradient For example is the rate of turnover in marine benthic
invertebrates along a depth gradient different for different latitudes or through time
Here the response variable is turnover (paray frasl parax) along a chosen gradient and one may
model this in response to a complex experimental design (eg with several factors and
their interactions) or sets of other continuous predictor variables (eg temperature
salinity nutrients etc) There are no limitations on the types of models that could be
used here (linear or nonlinear classical or nonparametric) provided independent (and
preferably replicated) values of paray frasl parax are estimated at each point within the sampling
design For example separate independent estimates of turnover along a depth
Figure 4 Schematic representation and appropriate analyses of ecolog-
ical b diversity for each of a series of mission statements with a focus on
variation among sample units
22 M J Anderson et al Idea and Perspective
2010 Blackwell Publishing LtdCNRS
La diversiteacute 120573 peut ecirctre mesureacutee pour un assemblage decommunauteacutes au choix comme la moyenne des dissimilariteacutesentre les paires de communauteacutes ou agrave partir des diversiteacutes 120574et 120572 crsquoest-agrave-dire en tant que mesure deacuteriveacutee Cette derniegravereapproche est traiteacutee dans ce chapitre ougrave il sera montreacute quela mesure deacuteriveacutee est aussi une dissimilariteacute moyenne entrecommunauteacutes et meacuteta-communauteacute
Si la diversiteacute est mesureacutee comme moyenne des dissimila-riteacutes elle peut ecirctre analyseacutee par des meacutethodes drsquoordinationindirectes (figure 102 V2) ou directes (V3) Elle peut aussiecirctre compareacutee entre meacuteta-communauteacutes ou modeacuteliseacutee en fonc-tion drsquoun gradient environnemental (V4) de faccedilon similaireau modegravele T6
La diversiteacute 120573 peut ecirctre deacutecomposeacutee en niveaux hieacuterar-chiques emboicircteacutes (V5) Des tests statistiques sont neacutecessairespour comparer les niveaux par exemple montrer que la diver-siteacute (inter) entre des communauteacutes supposeacutees diffeacuterentes estsignificativement plus grande que celle (intra) des placettesdrsquoeacutechantillonnage de chacune drsquoentre elles agrave la maniegravere drsquouneanalyse de variance (V6) Drsquoautres analyses sont bien sucircr envi-sageables comme la comparaison de la forme de la courbe de
102 Typologie des mesures 163
11M Reacutejou-Meacutechain et al laquo Spa-tial Aggregation of Tropical Trees atMultiple Spatial Scales raquo In Journalof Ecology 996 (2011) p 1373-1381doi 101111j1365-2745201101873x
12G Jurasinski et al laquo InventoryDifferentiation and Proportional Di-versity A Consistent Terminology forQuantifying Species Diversity raquo In Oecologia 1591 (2009) p 15-26 doi 101007s00442-008-1190-z
13Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
14Whittaker laquo Vegetation of theSiskiyou Mountains Oregon and Ca-lifornia raquo cf note 8 p 5
15Fisher et al laquo The Relationbetween the Number of Species andthe Number of Individuals in a Ran-dom Sample of an Animal Popula-tion raquo cf note 23 p 16
16H-R Gregorius laquo Effec-tive Numbers in the Partitioningof Biological Diversity raquo In Journal of Theoretical Biology409 (2016) p 133-147 doi 101016jjtbi201608037
17H Tuomisto laquo A Diversity ofBeta Diversities Straightening up aConcept Gone Awry Part 1 DefiningBeta Diversity as a Function of Al-pha and Gamma Diversity raquo In Eco-graphy 331 (2010) p 2-22 doi 101111j1600-0587200905880x
dissimilariteacute moyenne entre paires de communauteacutes en fonc-tion de la distance agrave des patrons connus issus de simulationde processus agrave identifier11
102 Typologie des mesuresCette approche utilitaire est compleacuteteacutee par le cadre theacuteo-
rique de Jurasinski et al12 qui distinguent plusieurs types demesures de diversiteacute
bull La diversiteacute drsquoinventaire (inventory diversity) qui traitedes donneacutees reacutecolteacutees sur une uniteacute spatiale ce qui cor-respond agrave la deacutefinition des diversiteacutes 120572 et 120574
bull La diversiteacute de diffeacuterenciation (differentiation diversity)qui mesure agrave quel point les uniteacutes spatiales sont diffeacute-rentes ce qui correspond agrave la deacutefinition litteacuterale de ladiversiteacute 120573 de Whittaker
bull La diversiteacute proportionnelle (proportional diversity) di-versiteacute 120573 qui se construit par diffeacuterence ou rapport desdiversiteacutes 120574 et 120572 Marcon et al13 ont montreacute qursquoavecune deacutecomposition approprieacutee de la diversiteacute la diver-siteacute proportionnelle est aussi la divergence entre la dis-tribution des communauteacutes locales et celle de la meacuteta-communauteacute la diversiteacute 120573 mesure alors agrave quel pointles uniteacutes spatiales sont diffeacuterentes de leur assemblageplutocirct qursquoentre elles
Dans son article fondateur Whittaker14 deacutefinit la diversi-teacute 120573 comme le niveau de changement dans la composition descommunauteacutes la nomme laquo diversiteacute secondaire raquo et lui attri-bue la lettre 120573 en reacutefeacuterence agrave la diversiteacute laquo primaire raquo mesu-rable par lrsquoindice 120572 de Fisher15 voir le chapitre 20 Il illustrecette deacutefinition par une mesure de diffeacuterentiation lrsquoindice deJaccard mais utilise ensuite une mesure proportionnelle lerapport des indice 120572 de lrsquoassemblage des communauteacutes agrave samoyenne sur les communauteacutes La conciliation des deux ap-proches nrsquoest pas simple Gregorius16 montre notamment queles mesures habituelles de diversiteacute proportionnelle ne rendentpas compte correctement de la diffeacuterentiation
103 Deacutecomposition de la diversiteacuteLa faccedilon de deacutecomposer la diversiteacute aboutissant donc agrave
une diversiteacute 120573 proportionnelle ne fait pas consensus Les eacuteleacute-ments du deacutebat sont preacutesenteacutes ici
Deacutefinitions de la diversiteacute 120573 mesure deacuteriveacuteeTuomisto17 passe en revue lrsquoensemble des deacutefinitions de la
164 Cadre
18Jost laquo Entropy and Diversity raquocf note 34 p 67 Jost laquo PartitioningDiversity into Independent Alpha andBeta Components raquo cf note 34 p 67
19H Tuomisto laquo Commentary Do We Have a Consistent Termino-logy for Species Diversity Yes If WeChoose to Use It raquo In Oecologia1674 (2011) p 903-911 doi 10 1007s00442-011-2128-4
20Whittaker laquo Vegetation of theSiskiyou Mountains Oregon and Ca-lifornia raquo cf note 8 p 5 Whittakerlaquo Evolution and Measurement of Spe-cies Diversity raquo cf note 24 p 16
21Lande laquo Statistics and Partitio-ning of Species Diversity and Simila-rity among Multiple Communities raquocf note 73 p 49
diversiteacute 120573 deacuteriveacutee des diversiteacutes 120574 et 120572 Toutes ont en com-mun
bull Une deacutefinition de la mesure de diversiteacute appliqueacutee agrave ladiversiteacute 120574 qui est geacuteneacuteralement une des mesures vuesdans le chapitre 3
bull Une deacutefinition de la diversiteacute 120572 qui peut ecirctre parexemple
ndash La diversiteacute locale mesureacutee dans chaque communau-teacute indeacutependamment de toute reacutefeacuterence hors de lacommunauteacute
ndash De faccedilon eacutequivalente le nombre drsquoespegraveces effectivesdans les communauteacutes
ndash Une faccedilon de combiner les diversiteacutes 120574 et 120572 pourobtenir la diversiteacute 120573 par exemple
lowast 120573 = 120574120572 lowast 120573 = 120574 minus 120572
Lrsquoutilisation des nombres de Hill la mesure locale de ladiversiteacute 120572 et la deacutefinition de la diversiteacute 120573 comme rapportdes diversiteacutes 120574 et 120572 permet de deacutefinir la laquo vraie diversiteacute raquo18
120573 qui est un nombre de communauteacutes eacutequivalentes (composi-tionnal units) similaire au nombre drsquoespegraveces eacutequivalentes desdiversiteacutes 120572 et 120574 Tuomisto19 milite pour que le terme diversiteacutesoit reacuteserveacute agrave la vraie diversiteacute (homogegravene agrave un nombre drsquoes-pegraveces) et que les autres mesures soient appeleacutees diffeacuteremment laquo entropie raquo de Shannon ou laquo probabiliteacute raquo de Gini-Simpson no-tamment
Le deacutebat sur la deacutecompositionLrsquoobjectif est de deacutecomposer la diversiteacute totale noteacutee 120574
en une composante inter-groupes noteacutee 120573 et une composanteintra-groupes noteacutee 120572
Whittaker20 est lrsquoauteur de ce concept Il a poseacute le principeque la diversiteacute 120574 devait ecirctre le produit des diversiteacutes 120572 et 120573
Lande21 a une approche additive et postule que les me-sures de diversiteacute doivent ecirctre concaves la diversiteacute drsquoun jeude donneacutees regroupant plusieurs communauteacutes doit ecirctre su-peacuterieure ou eacutegale agrave la somme pondeacutereacutee des diversiteacutes danschaque communauteacute De cette faccedilon il est possible de deacutefinirune diversiteacute totale eacutegale agrave la somme pondeacutereacutee des diversiteacutes120572 (intra-communauteacutes) et 120573 (inter-communauteacutes) toutes lesdiversiteacutes eacutetant positives ou nulles Il note que laquo la partitionserait plus facilement interpreacutetable si les diffeacuterentes compo-santes de la diversiteacute pouvaient ecirctre exprimeacutes au moyen de lamecircme formule raquo (ce qui nrsquoest en fait jamais le cas) Une revue
103 Deacutecomposition de la diversiteacute 165
22J A Veech et al laquo The Addi-tive Partitioning of Species Diversi-ty Recent Revival of an Old Idea raquoIn Oikos 991 (2002) p 3-9 doi 101034j1600-07062002990101x
23C Ricotta laquo On HierarchicalDiversity Decomposition raquo In Jour-nal of Vegetation Science 162(2009) p 223-226 doi 101111j1654-11032005tb02359x
24A Baselga laquo MultiplicativePartition of True Diversity YieldsIndependent Alpha and Beta Compo-nents Additive Partition Does Not raquoIn Ecology 917 (2010) p 1974-1981 doi doi 10189009- 03201 J A Veech et T O Crist laquo DiversityPartitioning without Statistical Inde-pendence of Alpha and Beta raquo In Ecology 917 (2010) p 1964-1969doi doi10189008-17271
25A Chao et al laquo Proposing a Re-solution to Debates on Diversity Par-titioning raquo In Ecology 939 (2012)p 2037-2051 doi 10189011-18171
26Marcon et al laquo The Decompo-sition of Shannonrsquos Entropy and aConfidence Interval for Beta Diversi-ty raquo cf note 11 p 64
27C Ricotta et M Marignanilaquo Computing -Diversity with RaorsquosQuadratic Entropy A Change ofPerspective raquo In Diversity and Dis-tributions 132 (2007) p 237-241doi 101111j1472-4642200700316x
28Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
29Jost laquo Partitioning Diversityinto Independent Alpha and BetaComponents raquo cf note 34 p 67
30Chao et al cf note 25
31S Pavoine et al laquo lsquoEquivalentNumbersrsquo for Species Phylogenetic orFunctional Diversity in a Nested Hie-rarchy of Multiple Scales raquo In Me-thods in Ecology and Evolution 710(2016) p 1152-1163 doi 1011112041-210X12591
32M V Wilson et A Shmi-da laquo Measuring Beta Diversity withPresence-Absence Data raquo In TheJournal of Ecology 723 (1984)p 1055 doi 1023072259551 JS-TOR 2259551 Gregorius laquo LinkingDiversity and Differentiation raquo cfnote 43 p 70
sur les avantages de la deacutecomposition additive est proposeacuteepar Veech et al22
Un deacutebat assez steacuterile a deacutecouleacute de lrsquoopposition entre lesdeux approches principalement ducirc agrave la transformation loga-rithmique23 agrave des deacutefinitions impreacutecises et des deacutemonstrationsempiriques remises en question24 Il reste que la deacutecompositionmultiplicative permet seule la deacutefinition de la diversiteacute 120573 entant que diversiteacute au sens strict25
Marcon et al26 montrent que lrsquoentropie de Shannon 119867120573est une mesure de diversiteacute de diffeacuterenciation en donnant sadeacutefinition indeacutependamment de 119867120572 et 119867120574 comme lrsquoavaient faitRicotta et Marignani pour lrsquoentropie quadratique de Rao27
Crsquoest eacutegalement une diversiteacute proportionnelle comme toutesles mesures passeacutees en revue par Tuomisto la diversiteacute deShannon permet drsquounifier les deux approches
Lrsquoindice de Shannon coupleacute agrave son expression sous forme denombre de Hill respecte finalement tous les critegraveres imposeacutesou souhaiteacutes Sa deacutecomposition est deacutetailleacutee ci-dessous EnfinMarcon et al28 geacuteneacuteralisent ce reacutesultat agrave toutes les mesuresde diversiteacutes deacuteriveacutees de lrsquoentropie geacuteneacuteraliseacutee de Tsallis
Deacutecomposition multiplicative de la diversiteacuteJost29 et Chao et al30 ont montreacute que la deacutecomposition des
nombres de Hill en eacuteleacutements indeacutependants est multiplicative
119902119863120574 =119902 119863119902120572119863120573 (101)
119902119863120572 et 119902119863120574 sont les nombres de Hill drsquoordre 119902 eacutegaux auxdiversiteacutes 120572 et 120574 Ce sont des nombres eacutequivalents drsquoespegraveces119902119863120573 est le laquo nombre de communauteacutes effectives raquo ou laquo nombreeacutequivalent de communauteacutes raquo crsquoest-agrave-dire le nombre de com-munauteacutes de poids eacutegal ne posseacutedant aucune espegravece en com-mun (et dont la dissimilariteacute entre les espegraveces de communauteacutesdiffeacuterentes est maximale quand la diversiteacute est phylogeacuteneacutetiqueou fonctionnelle)31 qui fourniraient la mecircme valeur de diver-siteacute 120573
La diversiteacute 120573 est indeacutependante de la diversiteacute 120572 si lespoids des communauteacutes sont eacutegaux Lrsquoindeacutependance signifieque la valeur de 119902119863120573 nrsquoest pas contrainte par celle de 119902119863120572Cette proprieacuteteacute est souvent consideacutereacutee comme importante32
et sera discuteacutee largement ici
Deacutefinitions de la diversiteacute 120572La diversiteacute 120572 est calculeacutee pour chaque communauteacute et
noteacutee 119902119894 119863120572 (lrsquoentropie correspondante est noteacutee 119902
119894119867120572) La diver-siteacute 120572 de la meacuteta-communauteacute est intuitivement la moyenne
166 Cadre
33Chao et al laquo Proposing a Reso-lution to Debates on Diversity Parti-tioning raquo cf note 25 p 165
34R D Routledge laquo Diversity In-dices Which Ones Are Admissible raquoIn Journal of Theoretical Biology764 (1979) p 503-515 doi 1010160022-5193(79)90015-8
35Jost laquo Partitioning Diversityinto Independent Alpha and BetaComponents raquo cf note 34 p 67
36Ibid
37C Ricotta laquo Computing Para-metric Beta Diversity with UnequalPlot Weights A Solution Based onResampling Methods raquo In Theoreti-cal Ecology 21 (2009) p 13-17 doi 101007s12080-008-0028-y
38C-H Chiu et al laquo PhylogeneticBeta Diversity Similarity and Dif-ferentiation Measures Based on HillNumbers raquo In Ecological Mono-graphs 841 (2014) p 21-44 doi 10189012-09601
de celle des communauteacutes En raison de leurs proprieacuteteacutes ma-theacutematiques il est plus simple de consideacuterer la moyenne desentropies 120572
Le poids de chaque groupe est 119908119894 souvent choisi eacutegal aunombre drsquoindividus de la communauteacute diviseacute par le nombretotal ou agrave la surface de chaque groupe mais qui peut ecirctrearbitraire tant que 119901119904 = sum119894 119908119894119901119904|119894 Deux faccedilons de pondeacutererla somme eacutemergent de la litteacuterature33 La deacutefinition classiqueest selon Routledge34
119902119867120572 = sum119894
119908119894119902119894119867120572 (102)
119902119863120572 = (sum119904
sum119894
119908119894119901119902119904|119894)
1(1minus119902)
(103)
La pondeacuteration proposeacutee par Jost35 est
119902119867120572 = sum119894
119908119902119894
sum119894 119908119902119894
119902119894119867120572 (104)
119902119863120572 = (sum119904
sum119894
119908119902119894
sum119894 119908119902119894119901119902
119904|119894)1(1minus119902)
(105)
La premiegravere est la pondeacuteration naturelle La seconde quiutilise les poids agrave la puissance 119902 donne donc drsquoautant moinsdrsquoimportance que 119902 est grand aux communauteacutes dont le poidsest faible Les deux deacutefinitions se confondent pour 119902 = 1
Si les poids sont diffeacuterents Jost36 a montreacute que lrsquoindeacutepen-dance nrsquoest possible que si la diversiteacute 120572 est deacutefinie selon sapondeacuteration En revanche cette pondeacuteration ne garantit pasque la diversiteacute 120574 soit supeacuterieure agrave la diversiteacute 120572 si 119902 nrsquoest eacutegalni agrave 0 ni agrave 1 Jost conclut donc que la deacutecomposition nrsquoestpossible que pour des communauteacutes de mecircme poids ou pour119902 = 0 ou 119902 = 1 Ricotta37 contourne cette difficulteacute en propo-sant une meacutethode de reacute-eacutechantillonnage qui permet drsquoeacutegaliserles poids
Chiu et al38 eacutetablissent une nouvelle deacutefinition de la diver-siteacute 120572 qui permet drsquoassurer lrsquoindeacutependance et garantit que ladiversiteacute 120573 est positive quels que soient les poids des commu-nauteacutes
119902119863120572 = 1119868 (sum
119904sum
119894(119908119894119901119904|119894)
119902)1(1minus119902)
(106)
Cette deacutefinition pose problegraveme alors que le choix de 119902 apour but de donner une importance plus ou moins grande aux
103 Deacutecomposition de la diversiteacute 167
39Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
espegraveces rares son effet est le mecircme sur la taille des commu-nauteacutes La diversiteacute deacutependra essentiellement des espegraveces raresdans les communauteacutes de faible poids si 119902 est petit deacutefinissantune diversiteacute bi-dimensionnelle Cette question est traiteacutee endeacutetail au chapitre 18
Marcon et al39 preacutefegraverent la deacutefinition de Routledge quiest plus intuitive et garantit que la diversiteacute 120574 est supeacuterieureagrave la diversiteacute 120572 La deacutependance entre 119902119863120573 et 119902119863120572 est le prix agravepayer
1H Wolda laquo Similarity IndicesSample Size and Diversity raquo In Oe-cologia 503 (1981) p 296-302 doi 101007BF00344966
2P Jaccard laquo Eacutetude Compara-tive de La Distribution Florale DansUne Portion Des Alpes et Du Jura raquoIn Bulletin de la Socieacuteteacute Vaudoisedes Sciences Naturelles 37 (1901)p 547-579 doi httpdxdoiorg105169seals-266450
3J Czekanowski Zarys MetodStatystycznych w Zastosowaniu DoAntropologii Warsaw TowarzystwoNaukowe Warszawskie 1913 L RDice laquo Measures of the Amount ofEcologic Association between Spe-cies raquo In Ecology 263 (1945) p 297-302 doi 1023071932409 T Soslash-rensen laquo A Method of EstablishingGroups of Equal Amplitude in PlantSociology Based on Similarity of Spe-cies Content and Its Application toAnalyses of the Vegetation on DanishCommons raquo In Biologiske SkrifterBiologiske Skrifter 54 (1948) p 1-34
Chapitre 11
Diversiteacute de diffeacuterentiation
La diversiteacute 120573 de diffeacuterentiation mesure la dissimilariteacute entre commu-nauteacutes geacuteneacuteralement consideacutereacutees par paires Les dissimilariteacutes les plusconnues sont celles de Jaccard ou de Soslashrensen Ces mesures peuventprendre en compte la seule preacutesence ou absence des espegraveces leur abon-dance ou mecircme la similariteacute entre les espegraveces peuvent ecirctre traiteacutees parlrsquoanalyse multivarieacutee et ecirctre testeacutees contre lrsquohypothegravese de nulliteacute de ladissimilariteacute
Lrsquoessentiel
La litteacuterature des indices de similariteacute est bien anteacuterieure agravecelle de la biodiversiteacute De nombreuses mesures de dissimilariteacuteentre paires de communauteacutes existent donc et leurs proprieacuteteacutesont eacuteteacute bien eacutetudieacutees Elles seront preacutesenteacutees ici en fonctiondes types de donneacutees qursquoelles traitent preacutesence-absence abon-dance ou abondance et similariteacute des espegraveces Enfin des testsstatistiques ont eacuteteacute construits pour rejeter lrsquohypothegravese que lescommunauteacutes sont issues drsquoune mecircme meacuteta-communauteacute parun simple tirage multinomial des espegraveces
Une limite importante des mesures de dissimilariteacute estqursquoelles sont tregraves sensibles agrave la taille des communauteacutes eacutechan-tillonneacutees1
111 Donneacutees de preacutesence-absence
Indices de similariteacute
Les indices les plus simples et probablement les plus connuspour calculer la diversiteacute 120573 sont lrsquoindice de Jaccard2 et de Soslash-rensen3 Ils sont deacutefinis pour deux communauteacutes et comptentla proportion drsquoespegraveces qursquoelles partagent Plus elle est faiblemoins la composition speacutecifique des communauteacutes est sem-blable plus la diversiteacute 120573 est consideacutereacutee comme grande
Preacuteciseacutement notons 11990411 les espegraveces observeacutees dans lesdeux communauteacutes 11990410 celles observeacutees dans la premiegravere com-munauteacute mais pas la deuxiegraveme (et de mecircme 11990401) Lrsquoindice de
169
170 Diversiteacute de diffeacuterentiation
4J C Gower et P Legendrelaquo Metric and Euclidean Properties ofDissimilarity Coefficients raquo In Jour-nal of classification 48 (1986) p 5-48 doi 101007BF01896809
5R R Sokal et P H A SneathPrinciples of Numerical TaxonomySan Francisco W H Freeman amp Co1963
6A Ochiai laquo Zoogeographic Stu-dies on the Soleoid Fishes Foundin Japan and Its Neighbouring Re-gions raquo In Bulletin of the JapaneseSociety of Scientific Fisheries 229(1957) p 526-530 doi 10 2331 suisan22526
Jaccard est le rapport entre le nombre drsquoespegraveces communes etle nombre drsquoespegraveces total
1198783 = 1199041111990411 + 11990410 + 11990401
(111)
Lrsquoindice de Soslashrensen vaut deux fois le nombre drsquoespegravecescommunes diviseacute par la somme du nombre drsquoespegraveces des deuxcommunauteacutes
1198787 = 211990411211990411 + 11990410 + 11990401
(112)
Les notations 119878119899 correspondent agrave celles de lrsquoarticle de reacutefeacute-rence de Gower et P Legendre4 qui fait la revue de ces indicesde similariteacute (13 autres sont traiteacutes) et en eacutetudie les proprieacuteteacutesCertains indices prennent en compte les espegraveces absentes desdeux communauteacutes mais qui auraient pu ecirctre observeacutees 11990400
Deux autres indices sont mentionneacutes ici celui de Sokal etSneath5 et celui drsquoOchiai 6
1198785 = 1199041111990411 + 2 (11990410 + 11990401) (113)
11987812 = 11990411
radic(11990411 + 11990410) (11990411 + 11990401) (114)
Une proprieacuteteacute importante est la possibiliteacute de comparerplusieurs communauteacutes en calculant la matrice de leurs dis-similariteacutes deux agrave deux et en en faisant une repreacutesentationgraphique Pour cela la similariteacute est transformeacutee en dissimi-lariteacute 119863119899 = 1 minus 119878119899 (les similariteacutes sont construites pour ecirctrecomprises entre 0 et 1) 119863119899 nrsquoest pas toujours une distance eu-clidienne mais radic119863119899 lrsquoest pour la majoriteacute des indices On uti-lisera donc geacuteneacuteralement la matrice de distances euclidiennesΔ dont chaque eacuteleacutement 119889119894119895 est la racine de la dissimilariteacuteradic119863119899 calculeacutee entre les communauteacutes 119894 et 119895
Exemple lrsquoindice de Jaccard peut ecirctre calculeacute pourtous les carreacutes de BCI compareacutes deux agrave deux La fonctiondistbinary du package ade4 calcule radic119863119899 pour 10 indicesde similariteacute eacutetudieacutes par Gower et Legendre (voir lrsquoaide de lafonction) Le reacutesultat est une demi-matrice de distances declasse distlibrary(vegan)data(BCI)library(ade4)DistJaccard lt- distbinary(BCI method = 1)
La distribution des valeurs de lrsquoindice de Jaccard 1198783 =1minus1198632
3 est en figure 111 Le mode est proche de 05 la moitieacutedes espegraveces sont communes entre deux carreacutes
111 Donneacutees de preacutesence-absence 171
0
2
4
6
8
04 05 06Jaccard
dens
ity
Fig 111 Distribution des indicesde Jaccard calculeacutes pour les 50carreacutes de BCI deux agrave deux
7A Chao et al laquo A New Statis-tical Approach for Assessing Simila-rity of Species Composition with In-cidence and Abundance Data raquo In Ecology Letters 82 (2004) p 148-159 doi 101111j1461-0248200400707x
Code R pour la figure
ggplot(dataframe(Jaccard = asnumeric(1 - DistJaccard^2))) +geom_density(aes(x = Jaccard))
Pour afficher lrsquoindice de Jaccard entre les carreacutes 1 et 2 ilfaut transformer la demi-matrice des distances en matrice desimilariteacute
Jaccard lt- 1 - (asmatrix(DistJaccard))^2Jaccard[1 2]
[1] 05663717
Biais drsquoestimationTous les indices de similariteacute vus plus haut sont sensibles
au biais drsquoestimation Chao et al7 fournissent un estimateurde la probabiliteacute qursquoun individu de la premiegravere communauteacuteappartienne agrave une espegravece commune aux deux communauteacutes
119880 =11990411
sum119904
1198991199041119899 + 119899+2 minus 1
119899+2
119904(2)1
2119904(2)2
11990411
sum119904
119899119904119899 1 (1198991199042 = 1) (115)
Les sommes srsquoentendent pour toutes les espegraveces communesindiceacutees de 1 agrave 11990411 Le premier terme de la somme est doncla probabiliteacute qursquoun individu de la premiegravere communauteacute ap-partienne agrave une espegravece commune aux deux communauteacutes 119899+2est le nombre drsquoindividus de la deuxiegraveme communauteacute 119904(2)
1 et119904(2)
2 sont le nombre drsquoespegraveces communes qui sont des single-tons et doubletons dans la deuxiegraveme communauteacute Lrsquoindica-trice 1(1198991199042 = 1) vaut 1 si lrsquoespegravece 119904 est un singleton dans ladeuxiegraveme communauteacute la derniegravere somme est donc la proba-biliteacute qursquoun individu de la premiegravere communauteacute appartienne
172 Diversiteacute de diffeacuterentiation
agrave une espegravece commune qui soit un singleton dans la deuxiegravemecommunauteacute Srsquoil nrsquoy a pas de doubletons dans la deuxiegravemecommunauteacute leur nombre est remplaceacute par 1 Enfin il estpossible que lrsquoestimateur soit supeacuterieur agrave 1 il est alors fixeacute agrave1
Lrsquoestimateur de la probabiliteacute qursquoun individu de ladeuxiegraveme communauteacute appartienne agrave une espegravece communeest noteacute 119881 et est calculeacute de faccedilon symeacutetrique agrave 119880 Le nombredrsquoespegraveces communes 11990411 est estimeacute par 119880 119881 11990410 par (1minus 119880) 119881et 11990410 par 119880(1 minus 119881 ) Lrsquoestimateur de lrsquoindice de Jaccard estdonc
1198783 =119880 119881
119880 + 119881 minus 119880 119881 (116)
Lrsquoestimateur de lrsquoindice de Soslashrensen est
1198787 = 2 119880 119881119880 + 119881
(117)
La matrice de dissimilariteacute corrigeacutee est assez diffeacuterente delrsquooriginale Lrsquoindice de Jaccard entre les deux premiers carreacutesdevient
Calcul de U et V N2Col est une matrice ou un dataframe de deux colonnes contenant les effectifs de chaque parcelleChaoUV lt- function(N2Col)
NCommunity lt- colSums(N2Col)Common lt- (N2Col[ 1] gt 0) amp (N2Col[ 2] gt 0)Single lt- N2Col == 1NSingleCommon lt- colSums(Common amp Single)Double lt- N2Col == 2NDoubleCommon lt- colSums(Common amp Double)NsCommon lt- N2Col[Common ]PsCommon lt- t(t(NsCommon)colSums(N2Col))U lt- sum(PsCommon[ 1]) + (NCommunity[2] - 1)NCommunity[2]
NSingleCommon[2]2max(NDoubleCommon[2] 1) sum(PsCommon[1][(NsCommon == 1)[ 2]])
V lt- sum(PsCommon[ 2]) + (NCommunity[1] - 1)NCommunity[1] NSingleCommon[1]2max(NDoubleCommon[1] 1) sum(PsCommon[2][(NsCommon == 1)[ 1]])
return(list(U = U V = V)) Indice de Jaccard corrigeacutebcJaccard lt- function(N2Col)
ChaoEst lt- ChaoUV(N2Col)return(min(ChaoEst$U ChaoEst$V(ChaoEst$U + ChaoEst$V -
ChaoEst$U ChaoEst$V) 1)) Calcul de lindice entre les carreacutes i et j de BCI iltjBCIjaccard lt- function(i j)
if (i gt= j)return(NA) else return(bcJaccard(t(BCI[c(i j) ])))
Calcul de la matrice de dissimilariteacute entre les 50 carreacutesChaoJaccard lt- sapply(150 function(i)
sapply(150 function(j) BCIjaccard(i j)))
111 Donneacutees de preacutesence-absence 173
8J B Plotkin et H C Muller-Landau laquo Sampling the Species Com-position of a Landscape raquo In Ecolo-gy 8312 (2002) p 3344-3356 doi 10 1890 0012 - 9658(2002 ) 083[3344 STSCOA]20CO2
9J C Gower laquo Some DistanceProperties of Latent Root and VectorMethods Used in Multivariate Ana-lysis raquo In Biometrika 533 (1966)p 325-338 doi 101093biomet533-4325
Indice de Jaccard carreacutes 1 et 2 corrigeacuteBCIjaccard(1 2)
[1] 09391222
La distribution des valeurs de lrsquoindice corrigeacute se trouve enfigure 112
0
1
2
3
4
06 08 10ChaoJaccard
dens
ity
Fig 112 Distribution des indicesde Jaccard corrigeacutes du biaisdrsquoetimation pour les 50 carreacutes deBCI deux agrave deux
La majoriteacute des paires de carreacutes a une similariteacute supeacuterieureagrave 08 apregraves correction
Code R pour la figure
ggplot(dataframe(ChaoJaccard = asnumeric(ChaoJaccard))) +geom_density(aes(x=ChaoJaccard))
Plotkin et Muller-Landau8 founissent des estimateurs de lasimilariteacute de Soslashrensen pour les SAD les plus courantes lognor-male broken-stick geacuteomeacutetrique log-seacuteries et mecircme gammaune geacuteneacuteralisation de la distibution broken-stick Ils traitentle cas drsquoun eacutechantillonnage dans lequel les individus sont indeacute-pendants les uns des autres et le cas de lrsquoagreacutegation spatialeIls montrent que la similariteacute augmente beaucoup avec la tailledes placettes eacutechantillonneacutees et est nettement plus faible encas drsquoagreacutegation spatiale
Repreacutesentation graphiqueLa matrice de distances peut ecirctre repreacutesenteacutee par une ana-
lyse en coordonneacutees principales (PCoA) 9
DistChaoJaccard lt- asdist(sqrt(1 - ChaoJaccard))PcoChaoJaccard lt- dudipco(DistChaoJaccard scannf = FALSE)
La repreacutesentation de lrsquoanalyse est en figure 113 Les 50 car-reacutes de BCI sont repreacutesenteacutes sur le plan des deux premiers fac-teurs Les valeurs propres sont repreacutesenteacutees dans le cartouche
174 Diversiteacute de diffeacuterentiation
Fig 113 Repreacutesentation des 50carreacutes de BCI dans une analyse encoordonneacutees principale fondeacutee sur
les distances de Jaccard
d = 01
1
2
3
4 5
6
7 8 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 24
25
26
27
28
29
30
31 32 33
34
35
36
37
38 39
40 41
42
43 44
45
46
47
48
49 50
Eigenvalues
10Dissimilariteacute 1198631 de Gower etP Legendre laquo Metric and Eucli-dean Properties of Dissimilarity Co-efficients raquo cf note 4 p 170
11J Motyka O Celach i Meto-dach Badan Geobotanicznych SurLes Buts et Les Meacutethodes Des Re-cherches Geacuteobotaniques Lublin Po-land Nakladem universytftu MariiCurie-Sklodowskiej 1947
12E P Odum laquo Bird Populationsof the Highlands (North Carolina)Plateau in Relation to Plant Succes-sion and Avian Invasion raquo In Eco-logy 314 (1950) p 587-605 doi 10 2307 1931577 J R Bray etJ T Curtis laquo An Ordination of theUpland Forest Communities of Sou-thern Wisconsin raquo In EcologicalMonographs 274 (1957) p 325-349doi 1023071942268
13P Legendre et L Legendre Nu-merical Ecology cf note 28 p 104
14O Renkonen laquo Statisch-Oumlkologische Untersuchungen UumlberDie Terrestrische Kaumlferwelt DerFinnischen Bruchmoore raquo In An-nales botanici Societatis ZoologicaeligBotanicaelig Fennicaelig Vanamo 6 (1938)p 1-231
15Gower laquo A General Coefficientof Similarity and Some of Its Proper-ties raquo cf note 22 p 104
en haut agrave gauche de la figure Les distances entre les pointssont les valeurs de radic1198633 projeteacutees sur le plan La matrice dedistances nrsquoest pas euclidienne agrave cause des approximations delrsquoestimation mais les conseacutequences sont faibles sur les premiersaxes
Code R pour la figure
scatter(PcoChaoJaccard posieig = bottomright)
112 Donneacutees drsquoabondanceLa distance la plus eacutevidente entre communauteacutes quand
les effectifs des espegraveces sont connus est simplement la dis-tance euclidienne eacuteventuellement normaliseacutee par le nombredrsquoespegraveces10 Son problegraveme principal est qursquoelle est tregraves sensibleaux ordres de grandeurs relatifs des variables
La dissimilariteacute de Steinhaus11 est plus connue sous le nomde Bray-Curtis12 voir lrsquoanalyse historique de P Legendre etL Legendre13 note de bas de page eq 758 et pourrait ecirctreattribueacutee agrave Renkonen14 Elle est tregraves utiliseacutee par deacutefaut dansplusieurs analyses du package vegan par exemple
1198638 = sum119904 ∣1198991199041 minus 1198991199042∣sum119904 (1198991199041 + 1198991199042) (118)
1198991199041 et 1198991199042 sont le nombre drsquoindividus de lrsquoespegravece 119904 dansla premiegravere et la deuxiegraveme communauteacute La racine carreacutee dela dissimilariteacute de Bray-Curtis est euclidienne
Gower15 propose une extension de la dissimilariteacute de Bray-Curtis
119863119866 = sum119904 119908119904 ∣1198991199041 minus 1198991199042∣119877119904 sum119904 119908119904
(119)
113 Emboicirctement et substitution 175
16M J Anderson et al laquo Multi-variate Dispersion as a Measure ofBeta Diversity raquo In Ecology letters96 (2006) p 683-93 doi 101111j 1461- 0248 2006 00926 x PMID 16706913
17M Ružička laquo AnwendungMathematisch-Statisticher Methodenin Der Geobotanik (SynthetischeBearbeitung von Aufnahmen) raquoIn Biologia Bratislava 13 (1958)p 647-661
18A Baselga laquo Partitioning theTurnover and Nestedness Compo-nents of Beta Diversity raquo In Glo-bal Ecology and Biogeography 191(2010) p 134-143 doi 101111j1466-8238200900490x
119877119904 est lrsquoeacutetendue ou lrsquoeacutecart-type de lrsquoabondance de lrsquoespegravece119904 qui permet de ne pas surpondeacuterer lrsquoeffet des espegraveces tregravesabondantes 119908119904 est le poids attribueacute agrave lrsquoespegravece 119904 qui peut ecirctreutiliseacute pour eacuteliminer les doubles absences (119908119904 = 0 si lrsquoespegraveceest absente des deux communauteacutes 1 sinon)
Anderson et al16 proposent une mesure de dissimilariteacute(de Gower modifieacutee) donnant le mecircme poids agrave une diffeacuterencedrsquoun ordre de grandeur entre les abondances qursquoagrave la diffeacuterenceentre preacutesence et absence qui permet donc de se passer dela normalisation par 119877119904 Les effectifs sont transformeacutes de lafaccedilon suivante 119909119904 = log 119899119904 + 1 si 119899119904 ne 0 119909119904 = 1 sinon (lelogarithme est deacutecimal) La dissimilariteacute est
119863MG = sum119904 119908119904 ∣1199091199041 minus 1199091199042∣sum119904 119908119904
(1110)
Elle nrsquoest pas euclidienneLes dissimilariteacutes de Jaccard et de Soslashrensen se geacuteneacutera-
lisent aux donneacutees drsquoabondance Le nombre drsquoespegraveces com-munes aux deux sites 11990411 est remplaceacute par le nombre drsquoin-dividus de mecircme espegravece preacutesents sur les deux sites 11989911 =sum119904 min(1198991199041 1198991199042) le nombre drsquoespegraveces seulement preacutesentessur le premier site 11990410 est remplaceacute par le nombre drsquoindividussommeacute sur toutes les espegraveces preacutesents uniquement sur le site 11989910 = sum119904 max(0 1198991199041 minus 1198991199042) de mecircme 11990401 est remplaceacute par11989901 = sum119904 max(0 1198991199042 minus 1198991199041)
La dissimilariteacute de Ružička17 geacuteneacuteralise celle de Jaccard
1198633 = 1 minus 1198991111989911 + 11989910 + 11989901
(1111)
La diffeacuterence de pourcentage (percentage difference) geacuteneacute-ralise la dissimilariteacute de Soslashrensen
1198637 = 1 minus 211989911211989911 + 11989910 + 11989901
(1112)
La plupart des dissimilariteacutes sont impleacutementeacutees par la fonc-tion distldc du package adespatial
113 Emboicirctement et substitutionLrsquoindice de Soslashrensen et les indices similaires prennent en
compte deux types de dissimilariteacute lrsquoemboicirctement des com-position speacutecifiques (nestedness) et la substitution drsquoespegraveces(turnover) On parle drsquoemboicirctement quand une communau-teacute diffegravere drsquoune autre parce que sa composition est un sous-ensemble des espegraveces de lrsquoautre La substitution correspondau remplacement de certaines espegraveces drsquoune communauteacute par
176 Diversiteacute de diffeacuterentiation
19G G Simpson laquo Mammals andthe Nature of Continents raquo In Ame-rican Journal of Science 241 (1943)p 1-31 doi 102475ajs24111
20A Baselga laquo The Relationshipbetween Species Replacement Dis-similarity Derived from Nestednessand Nestedness raquo In Global Ecolo-gy and Biogeography 2112 (2012)p 1223-1232 doi 101111j1466-8238201100756x
21J Podani et D Schmera laquo ANew Conceptual and Methodologi-cal Framework for Exploring and Ex-plaining Pattern in Presence - Ab-sence Data raquo In Oikos 12011 (2011)p 1625-1638 doi 101111j1600-0706201119451x
de nouvelles espegraveces Baselga18 montre que la diversiteacute 120573 delongicornes en Europe du nord est similaire agrave celle observeacutee enEurope du sud mais pour des raisons totalement diffeacuterentesEn Europe du nord les communauteacutes perdent des espegraveces avecla latitude leur dissimilariteacute est due principalement agrave lrsquoemboicirc-tement En Europe du sud les communauteacutes sont composeacuteesdrsquoespegraveces diffeacuterentes la diversiteacute 120573 est due agrave la substitutiondes espegraveces Baselga deacutecompose lrsquoindice de dissimilariteacute de Soslash-rensen 1 minus 1198787 en un terme mesurant la substitution et unmesurant lrsquoemboicirctement
Le premier composant est lrsquoindice de dissimilariteacute de G GSimpson 19
119863119904119894119898 = min(11990410 11990401)11990411 + min(11990410 11990401) (1113)
Il vaut 0 quand les communauteacutes sont emboicircteacutees Son com-pleacutement 119863119899119890119904 prend en compte la partie de la dissimilariteacute dueagrave lrsquoemboicirctement
119863119899119890119904 = 11990410 + 11990401211990411 + 11990410 + 11990401
minus 119863119904119894119898 (1114)
Ces mesures de dissimilariteacute sont geacuteneacuteraliseacutees au-delagrave dedeux communauteacutes les formules sont disponibles dans lrsquoar-ticle de Baselga
Baselga20 eacutetend cette deacutecomposition agrave la dissimilariteacute deJaccard
1198633 = 119863119904119894119898 + 119863119899119890119904 (1115)
= 2 min(11990410 11990401)11990411 + 2 min(11990410 11990401) + 11990411
11990411 + 2 min(11990410 11990401)|11990410 minus 11990401|
11990411 + 11990410 + 11990401
(1116)
Le premier terme de la somme est le terme lieacute agrave la substi-tution et le second celui lieacute agrave lrsquoemboicirctement
Podani et Schmera21 deacutefendent un point de vue diffeacuterentsur la faccedilon de comptabiliser les deux composantes de la deacute-composition de la dissimilariteacute de Jaccard Le terme de substi-tution comptabilise les espegraveces preacutesentes sur un seul site ennombre eacutegal 2 min(11990410 11990401) plutocirct que lrsquoindice de dissimila-riteacute de Simpson Ainsi le terme drsquoemboicirctement comptabilisela diffeacuterence de richesse entre les deux sites |11990410 minus 11990401|
Apregraves normalisation par le nombre total drsquoespegravece la deacute-composition est
1198633 = 2 min(11990410 11990401)11990411 + 11990410 + 11990401
+ |11990410 minus 11990401|11990411 + 11990410 + 11990401
(1117)
114 Donneacutees drsquoabondance et similariteacute des espegraveces 177
22J Podani et D Schmera laquo OnceAgain on the Components of PairwiseBeta Diversity raquo In Ecological In-formatics 32 (2016) p 63-68 doi 101016jecoinf201601002
23Podani et Schmera cf note 21
24J Podani et al laquo A General Fra-mework for Analyzing Beta DiversityNestedness and Related Community-Level Phenomena Based on Abun-dance Data raquo In Ecological Com-plexity 15 (2013) p 52-61 doi 101016jecocom201303002
25P Legendre laquo Interpreting theReplacement and Richness DifferenceComponents of Beta Diversity raquo In Global Ecology and Biogeography2311 (2014) p 1324-1334 doi 101111geb12207
26C Ricotta et G Bacaro laquo OnPlot-to-Plot Dissimilarity MeasuresBased on Species Functional Traits raquoIn Community Ecology 111 (2010)p 113-119 doi 101556ComEc112010116
La controverse entre les deux deacutecompositions perdure22
1628
These are used to calculate means on the 1D simplices namely
Mean relativized beta diversity βrel D Rrel rel
Mean relativized richness agreement A S Rrel Jac rel= +
and
Mean relativized nestedness
N S Drel Jac rel
if 0 and j k=
minus=
lt
sum
2 | | b c njk jk jk
jk ajk
mm m2 minus
in which the last term is called the anti-nestedness fraction of mean relativized richness difference which does not contrib-ute to nestedness This derives from the sum of richness dif-ference values for pairs of sites with no species in common If nestedness is understood to exist for unequally rich sites only then another term is also subtracted which is called the richness identity fraction calculated from similarities of pairs of sites with equal species richness as seen below
Mean relativized strict nestedness
Nrsquo Nrel rel
jk if and j k= minus
minuslt
sum2
2
a n
m
jk jk
b cjk jk
mm
Note that the above fraction includes site pairs that are com-pletely identical (points on the bottom right corner) As said above percentage contributions are obtained by multiplying the mean values by 100
Computer program SDRSimplex was written by the first author for calculating simplex scores and the above-defined percentages from presencendashabsence data The application and the user manual may be downloaded from httprameteltehusimpodani The output scores were graphically illus-trated by the Ternary Plot option in the NonHier routine of the SYN-TAX 2000 package (Podani 2001)
pairs to the an corner the higher their similarity while closeness to the opposing side of the triangle implies high beta diversity If site pairs fall close to the |b ndash c|n corner it means that they have larger relativized differences in species number whereas closeness to the opposing side of the tri-angle reflects great similarity in species number of the sites This relates to the concept of alpha diversity if all site pairs are at the A-end of the A-simplex then they are identical in species richness (although its exact value is not seen) On the third 1D simplex the N-simplex we see the antagonistic relationship between species replacement and nestedness
In addition to graphical illustration numerical results are also useful because many points may coincide on the ternary plot especially if the number of sites is large relative to the number of species As a measure of the relative contribu-tion of similarity for example we suggest to sum up all SJac values and then divide this sum by (m2 ndash m)2 (averaging pairwise similarities or dissimilarities is a common pratice in diversity studies Whittaker 1972 Vellend 2001 Schmera et al 2009 and is also used in nestedness measures such as NODF Almeida-Neto et al 2008) To obtain a percentage this mean value SJac
is multiplied by 100 Percentages for the relative contribution of richness difference and species replacement in shaping the dissimilarity structure of sites are obtained in a similar way More formally if ajk bjk cjk and njk denote the contingency table frequencies for site pair j k then the averages are obtained as
Mean similarity SJac =minus
sum2
2
a n
m m
jk jk
j k
Mean relativized richness difference
Drel =minus
sum2
2
| | b c n
m m
jk jk jk
j k
Mean relativized species replacement
R rel =minus
sum4
2
min b c n
m m
jk jk jk
j k
Random
Species replacement
Perfect nestedness
Richnessdifference
Species shared(similarity)
Beta diversity(species turnoverdissimilarity)
Richnessagreement
Nestedness
Anti-
neste
dnes
s Perfect gradient
(a)
Nrel = (a + |bndashc|) n | agt0Nrsquorel = (a + |bndashc|) n | agt0 and bnec
Rrel = 2minbc n
SJac = a nDrel = |bndashc| n
βrel = (b+c) n Arel = (n ndash|bndashc|) n
(b)
N-sim
plex
β-simplexA-simplex
Figure 2 Conceptual framework (a) and measurement (b) of different ecological phenomena in presence-absence data matrices based on the suggested decomposition of pairwise (a b c) values via 2D and 1D simplices
Fig 114 Triangle du simplexSimilariteacute-Substitution-Emboicirctement (a) Similariteacuteemboicirctement et substitutionsomment agrave 1 donc les troiscomposantes peuvent ecirctrerepreacutesenteacutees dans un triangle etcombineacutees deux agrave deux Ladissimilariteacute est par exemplerepreacutesenteacutee par la proximiteacute aucocircteacute gauche du triangle somme delrsquoemboicirctement et de la substitution(ses sommets adjacents) etcompleacutement agrave 1 de la dissimilariteacute(le sommet opposeacute) (b) Lesformules de calcul dont donneacuteespour la similariteacute de Jaccard Avecces notations classiques 119886 est lenombre drsquoespegraveces communes 11990411119887 et 119888 sont les espegraveces propres agravechaque communauteacute 11990401 et 11990410et 119899 est le nombre total drsquoespegraveces119886 + 119887 + 119888
Comme la dissimilariteacute est la somme de lrsquoemboicirctement etde la substitution et que la dissimilariteacute est le compleacutement agrave1 de la similariteacute la somme de la similariteacute de lrsquoemboicirctementet de la substitution vaut 1 Podani et Schmera23 repreacutesententcette eacutegaliteacute dans un triangle dont les sommets correspondentaux trois termes (Figure 114)
Podani et al24 eacutetendent cette approche agrave des mesuresde dissimilariteacute prenant en compte les abondances particu-liegraverement la dissimilariteacute de Ružička La deacutecomposition estidentique agrave celle de lrsquoeacutequation (1117) apregraves remplacement dechaque terme
P Legendre25 considegravere cette deacutecomposition de la diversiteacute120573 en emboicirctement et substitution comme une deacutecompositionde variance et lui applique des meacutethodes drsquoordination pour larelier aux variables environnementales par exemple
Les mesures de diversiteacute 120573 fondeacutees sur lrsquoentropie HCDT(chapitre 12) ne permettent pas de distinguer directement em-boicirctement et substitution La variabiliteacute des contributions 119902
119894119867120573des communauteacutes agrave lrsquoentropie 120573 augmente avec lrsquoemboicirctementmais cette voie nrsquoa pas eacuteteacute exploreacutee
114 Donneacutees drsquoabondance et similariteacutedes espegraveces
Dissimilariteacute minimale moyenneRicotta et Bacaro26 deacutefinissent une mesure de dissimilariteacute
parameacutetrique entre deux communauteacutes Une matrice de dissi-milariteacute est deacutefinie entre toutes les paires drsquoespegraveces min 1198891199042
178 Diversiteacute de diffeacuterentiation
27C Ricotta et S Burrascanolaquo Beta Diversity for Functional Eco-logy raquo In Preslia 801 (2008) p 61-72
28K R Clarke et R M Warwicklaquo Quantifying Structural Redundancyin Ecological Communities raquo In Oe-cologia 1132 (1998) p 278-289 doi 101007s004420050379
29Ricotta et Burrascano cfnote 27
30C Izsak et A R G Pricelaquo Measuring -Diversity Using a Taxo-nomic Similarity Index and Its Re-lation to Spatial Scale raquo In MarineEcology Progress Series 215 (2001)p 69-77 doi 103354meps215069
31C O Webb et al laquo Phylocom Software for the Analysis of Phyloge-netic Community Structure and TraitEvolution raquo In Bioinformatics 2418(2008) p 2098-2100 doi 101093bioinformaticsbtn358
32Pavoine et Ricotta laquo Functionaland Phylogenetic Similarity amongCommunities raquo cf note 13 p 149
deacutesigne la dissimilariteacute entre lrsquoespegravece 119904 preacutesente dans la pre-miegravere communauteacute et lrsquoespegravece la plus proche drsquoelle dans ladeuxiegraveme communauteacute min 1198891199051 est la mecircme notation pourlrsquoespegravece 119905 de la deuxiegraveme communauteacute et lrsquoespegraveces la plusproche dans la communauteacute 1 Ces valeurs sont nulles pourtoutes les espegraveces communes
120587119904(119899) deacutesigne la contribution de lrsquoespegravece 119904 agrave lrsquoindice deHurlbert deacutejagrave vue dans le cadre de lrsquooriginaliteacute taxonomique(Section 72) La contribution des espegraveces rares augmenteavec le paramegravetre 119899 (figure 73) Pour chaque communauteacute lamoyenne des dissimilariteacutes minimales entre chaque espegravece etlrsquoautre communauteacute est calculeacutee pondeacutereacutee par la contributionde lrsquoespegravece agrave lrsquoindice de Hurlbert
La dissimilariteacute pondeacutereacutee (W pour weighted) entre les deuxcommunauteacutes (C pour community) en est la moyenne entre lesdeux communauteacutes
119889CW(119899) = 12 (sum
119904120587119904(119899) min 1198891199042 + sum
119905120587119905(119899) min 1198891199051) (1118)
Sa version non pondeacutereacutee (U pour unweighted) par les abon-dances est27
119889CU = sum119904 min 1198891199042 + sum119905 min 1198891199051211990411 + 11990410 + 11990401
(1119)
Ces mesures sont des eacutevolutions de mesures plus anciennesavec des pondeacuterations diffeacuterentes Dans lrsquoindice de Clarke etWarwick28 la moyenne est calculeacutee dans chaque communauteacutesans pondeacuteration
119889CW = 12 (sum119904 min 1198891199042
11990411 + 11990410+ sum119905 min 1198891199051
11990411 + 11990401) (1120)
mais avec pondeacuteration par lrsquoabondance des espegraveces chezRicotta et Burrascano29
119889RB = 12 (sum
119904119901119904|1 min 1198891199042 + sum
119905119901119905|2 min 1198891199051) (1121)
alors qursquoelle lrsquoest globalement dans lrsquoindice de Izsak etPrice30
119889IP = sum119904 min 1198891199042 + sum119905 min 119889119905111990411 + 11990410 + 11990411 + 11990401
(1122)
redeacutecouvert et nommeacute COMDISTNN par Webb et al31
Similariteacute moyenne entre individusPavoine et Ricotta32 deacutefinissent une famille de similari-
114 Donneacutees drsquoabondance et similariteacute des espegraveces 179
teacutes entre communauteacutes construite agrave partir de la similariteacutemoyenne entre les paires drsquoindividus de chaque communauteacuteet les paires intercommunautaires Une matrice de similariteacuteZ est deacutefinie entre les paires drsquoespegraveces 119911119904119905 est la similari-teacute entre lrsquoespegravece 119904 et lrsquoespegravece 119905 comprise entre 0 et 1 de lamecircme faccedilon que pour le calcul de la diversiteacute 119902119863Z (chapitre9) La matrice Z doit de plus ecirctre semi-deacutefinie positive ce quiimplique que
radic1 minus Z est euclidienne de cette faccedilon les es-
pegraveces peuvent ecirctre repreacutesenteacutees graphiquement par une PCoALes freacutequences des espegraveces dans les deux communauteacutes sontp et q La similariteacute moyenne dans chaque communauteacute estsum119904119905 119901119904119901119905119911119904119905 et sum119904119905 119902119904119902119905119911119904119905 La similariteacute moyenne des pairesdrsquoindividus de communauteacutes diffeacuterentes est sum119904119905 119901119904119902119905119911119904119905
La dissimilariteacute entre communauteacutes de Rao (Section 125)peut ecirctre normaliseacutee (en la divisant par sa valeur maximalepour qursquoelle soit comprise entre 0 et 1) puis transformeacutee ensimilariteacute (en prenant son compleacutement agrave 1) pour obtenir
119878Sorensen =sum119904119905 119901119904119902119905119911119904119905
12 sum119904119905 119901119904119901119905119911119904119905 + 1
2 sum119904119905 119902119904119902119905119911119904119905 (1123)
Les probabiliteacutes peuvent ecirctre remplaceacutees par nrsquoimportequel vecteur de valeurs positives par exemple les abondancesou des valeurs 1 et 0 pour des donneacutees de preacutesence-absenceDans ce dernier cas et si Z est la matrice identiteacute I (la simila-riteacute de deux espegraveces diffeacuterentes est nulle et 119911119904119904 = 1) 119878Sorensense reacuteduit agrave lrsquoindice de Soslashrensen vu plus haut
La geacuteneacuteralisation de lrsquoindice de Jaccard aux donneacuteesdrsquoabondances est
119878Jaccard =sum119904119905 119901119904119902119905119911119904119905
sum119904119905 119901119904119901119905119911119904119905 + sum119904119905 119902119904119902119905119911119904119905 minus sum119904119905 119901119904119902119905119911119904119905
(1124)Il se reacuteduit agrave lrsquoindice de Jaccard original pour les donneacutees
de preacutesence-absence et Z = ILrsquoindice de Sokal et Sneath se geacuteneacuteralise par
119878Sokal =sum119904119905 119901119904119902119905119911119904119905
2 sum119904119905 119901119904119901119905119911119904119905 + 2 sum119904119905 119902119904119902119905119911119904119905 minus 3 sum119904119905 119901119904119902119905119911119904119905
(1125)celui drsquoOchiai par
119878Ochiai =sum119904119905 119901119904119902119905119911119904119905
radicsum119904119905 119901119904119901119905119911119904119905radicsum119904119905 119902119904119902119905119911119904119905 (1126)
180 Diversiteacute de diffeacuterentiation
33C Ricotta et al laquo A Cautiona-ry Note on Some Phylogenetic Dissi-milarity Measures raquo In Journal ofPlant Ecology 81 (2014) p 12-16doi 101093jpertu008
34Ibid
35Rao laquo Diversity and Dissimi-larity Coefficients A Unified Ap-proach raquo cf note 5 p 101
36N G Swenson et al laquo Determi-nistic Tropical Tree Community Tur-nover Evidence from Patterns ofFunctional Beta Diversity along anElevational Gradient raquo In Procee-dings of the Royal Society of Lon-don Series B Biological Sciences2781707 (2011) p 877-884 doi 101098rspb20101369
37C J F ter Braak laquo PrincipalComponents Biplots and Alpha andBeta Diversity raquo In Ecology 643(1983) p 454-462 doi 10 2307 1939964 JSTOR 1939964
38K Pearson laquo On Lines andPlanes of Closest Fit to Systems ofPoints in Space raquo In PhilosophicalMagazine 2 (1901) p 559-572
Ces quatre similariteacutes permettent une repreacutesentation descommunauteacutes par PCoA de la mecircme faccedilon que lrsquoindice deJaccard traiteacute plus haut
Ricotta et al33 ont aussi proposeacute de mesurer la dissimilari-teacute par la somme des diffeacuterences (en valeur absolue) de banaliteacutedes espegraveces des deux communauteacutes normaliseacutee par la banaliteacutetotale
119863RBP = sum119904 | sum119905 (119901119904 minus 119902119905)119911119904119905|sum119904 sum119905 (119901119904 + 119902119905)119911119904119905
(1127)
Drsquoautres similariteacutes ont eacuteteacute proposeacutees mais ont des pro-prieacuteteacutes qui empecircchent de les utiliser 34 leur valeur nrsquoest pastoujours nulle pour deux communauteacutes identiques Ce sontlrsquoindice proposeacute par Rao35
11987612 = sum119904119905
119901119904119902119905119911119904119905 (1128)
comme les indices de Swenson et al 36
119889pw = 12 ( sum119904
119889119904211990411 + 11990410
+ sum1199051198891199051
11990411 + 11990401) (1129)
et
119889primepw = 1
2 (sum119904
119901119904 1198891199042 + sum119905
119902119905 1198891199051) (1130)
ougrave 1198891199042 est la dissimilariteacute moyenne entre lrsquoespegravece 119904 de lacommunauteacute 1 et toutes les espegraveces de la communauteacute 2
115 Distance entre paires decommunauteacutes et diversiteacute 120573proportionnelle
Dans certains cas preacutesenteacutes ici la diversiteacute de diffeacuterentia-tion est parfaitement conciliable avec la diversiteacute proportion-nelle
Diversiteacute de Simpsonter Braak37 a le premier rapprocheacute lrsquoentropie de Simpson et
lrsquoAnalyse en Composantes Principales38 En repreacutesentant lescommunauteacutes dans lrsquoespace des espegraveces la norme du vecteurde la communauteacute 119894 est sum119904 1199012
119904|119894 crsquoest-agrave-dire 1 moins lrsquoentro-pie de Simpson La repreacutesentation graphique de lrsquoACP (noncentreacutee non reacuteduite) montre les communauteacutes les moins di-verses (les plus eacuteloigneacutees de lrsquoorigine du repegravere) Ter Braakdeacutefinit la diversiteacute 120573 comme la distance entre deux commu-nauteacutes (et la moyenne des distances entre paires de commu-nauteacutes si leur nombre est supeacuterieur agrave 2) Cette laquo deacutefinition raquo
115 Distance entre paires de communauteacutes et diversiteacute 120573 proportionnelle 181
est valide puisque cette distance est la composante inter de ladeacutecomposition de lrsquoentropie 120573 de Simpson (1212)
d = 01
1 2
3 4
5 6
7 8
9
10 11
12 13
14 15 16
17
18 19 20
21
22
23 24
25
26
27 28 29
30
31
32 33
34
35
36
37
38
39
40
41 42
43
44
45
46 47
48 49 50
Abaremamacradenia Vachelliamelanoceras Acalyphadiversifolia
Acalyphamacrostachya Adeliatriloba
Aegiphilapanamensis Alchorneacostaricensis Alchornealatifolia
Alibertiaedulis Allophyluspsilospermus
Alseisblackiana
Amaiouacorymbosa Anacardiumexcelsum Andirainermis Annonaspraguei Apeibaglabra Apeibatibourbou Aspidospermadesmanthum Astrocaryumstandleyanum Astroniumgraveolens Attaleabutyracea Banaraguianensis
Beilschmiediapendula Brosimumalicastrum Brosimumguianense Calophyllumlongifolium Caseariaaculeata Caseariaarborea
Caseariacommersoniana Caseariaguianensis Caseariasylvestris Cassipoureaguianensis Cavanillesiaplatanifolia Cecropiainsignis Cecropiaobtusifolia Cedrelaodorata Ceibapentandra Celtisschippii Cespedesiaspathulata Chamguavaschippii Chimarrhisparviflora Macluratinctoria Chrysochlamyseclipes Chrysophyllumargenteum Chrysophyllumcainito Coccolobacoronata Coccolobamanzinellensis Colubrinaglandulosa Cordiaalliodora
Cordiabicolor Cordialasiocalyx Coussareacurvigemma Crotonbillbergianus Cupaniacinerea Cupanialatifolia Cupaniarufescens Cupaniaseemannii Dendropanaxarboreus Desmopsispanamensis Diospyrosartanthifolia Dipteryxoleifera
Drypetesstandleyi
Elaeisoleifera Enterolobiumschomburgkii Erythrinacostaricensis
Erythroxylummacrophyllum Eugeniaflorida Eugeniagalalonensis Eugenianesiotica Eugeniaoerstediana Farameaoccidentalis Ficuscolubrinae Ficuscostaricana Ficusinsipida Ficusmaxima Ficusobtusifolia Ficuspopenoei
Ficustonduzii Ficustrigonata Ficusyoponensis Garciniaintermedia Garciniamadruno Genipaamericana Guapiramyrtiflora Guareafuzzy Guareagrandifolia
Guareaguidonia Guatteriadumetorum
Guazumaulmifolia Guettardafoliacea
Gustaviasuperba
Hampeaappendiculata Hasseltiafloribunda Heisteriaacuminata Heisteriaconcinna Hirtellaamericana
Hirtellatriandra
Huracrepitans Hieronymaalchorneoides Ingaacuminata Ingacocleensis Ingagoldmanii Ingalaurina Ingasemialata Inganobilis Ingaoerstediana Ingapezizifera Ingapunctata Ingaruiziana Ingasapindoides Ingaspectabilis Ingaumbellifera
Jacarandacopaia Lacistemaaggregatum Lacmelleapanamensis Laetiaprocera Laetiathamnia Lafoensiapunicifolia Licaniahypoleuca
Licaniaplatypus Lindackerialaurina Lonchocarpusheptaphyllus Lueheaseemannii
Macrocnemumroseum
Maquiraguianensiscostaricana Margaritarianobilis Marilalaxiflora Maytenusschippii Miconiaaffinis Miconiaargentea Miconiaelata Miconiahondurensis Mosannonagarwoodii Myrciagatunensis
Myrospermumfrutescens Nectandracissiflora
Nectandralineata Nectandrapurpurea Ochromapyramidale Ocoteacernua Ocoteaoblonga Ocoteapuberula
Ocoteawhitei Oenocarpusmapora
Ormosiaamazonica Ormosiacoccinea
Ormosiamacrocalyx Pachiraquinata Pachirasessilis
Perebeaxanthochyma Cinnamomumtriplinerve Picramnialatifolia Piperreticulatum Platymisciumpinnatum Platypodiumelegans Posoquerialatifolia
Poulseniaarmata
Pouroumabicolor Pouteriafossicola Pouteriareticulata Pouteriastipitata Prioriacopaifera Protiumcostaricense Protiumpanamense Protiumtenuifolium
Pseudobombaxseptenatum Psidiumfriedrichsthalianum Psychotriagrandis Pterocarpusrohrii
Quararibeaasterolepis
Quassiaamara Randiaarmata Sapiumbroadleaf
Sapiumglandulosum Schizolobiumparahyba Sennadariensis Simaroubaamara Siparunaguianensis Siparunapauciflora Sloaneaterniflora
Socrateaexorrhiza
Solanumhayesii Soroceaaffinis
Spacheamembranacea Spondiasmombin Spondiasradlkoferi Sterculiaapetala Swartziasimplexvargrandiflora Swartziasimplexcontinentalis Symphoniaglobulifera
Handroanthusguayacan Tabebuiarosea Tabernaemontanaarborea Tachigaliversicolor Talisianervosa Talisiaprinceps Terminaliaamazonia Terminaliaoblonga Tetragastrispanamensis
Tetrathylaciumjohansenii Theobromacacao Thevetiaahouai Tocoyenapittieri Trattinnickiaaspera Tremamicrantha Trichantheragigantea Trichiliapallida Trichiliatuberculata Trichospermumgaleottii
Triplariscumingiana Trophiscaucana
Trophisracemosa Turpiniaoccidentalis Unonopsispittieri
Virolamultiflora Virolasebifera Virolasurinamensis
Vismiabaccifera Vochysiaferruginea
Xylopiamacrantha Zanthoxylumekmanii Zanthoxylumjuniperinum Zanthoxylumpanamense Zanthoxylumsetulosum Zuelaniaguidonia
Eigenvalues
Fig 115 Repreacutesentation desdeux premiers axes factoriels delrsquoACP des 50 carreacutes de BCI Lesdonneacutees sont les probabiliteacutes desespegravece ni centreacutees ni reacuteduites pourlrsquoACP Les carreacutes sont repreacutesenteacutesavec les espegraveces Les carreacutes 35 et40 ont une diversiteacute faible et sontassocieacutes aux espegraveces Gustaviasuperba et Alseis blackiana
LrsquoACP non centreacutee des 50 carreacutes de BCI est en figure 115Code R pour la figure
pcaBCI lt- dudipca(BCIrowSums(BCI) scannf = FALSE nf = 2center = FALSE scale = FALSE)
scatter(pcaBCI posieig = bottomleft)
d = 01
1
2 3 4
5
6
7 8
9
10
11
12
13
14 15
16
17 18 19
20
21
22
23 24
25
26
27
28 29
30
31
32 33
34
35
36
37
38
39
40
41 42
43
44 45
46 47
48
49 50
Eigenvalues
Fig 116 ACP centreacutee des 50carreacutes de BCI pour visualiser ladiversiteacute 120573
LrsquoACP centreacutee (mais non reacuteduite figure 116) permet demieux repreacutesenter la diversiteacute 120573 la distance de chaque carreacuteau centre du repegravere est sa contribution
182 Diversiteacute de diffeacuterentiation
39P Legendre et Andersonlaquo Distance-Based RedundancyAnalysis Testing Multispecies Res-ponses in Multifactorial EcologicalExperiments raquo cf note 7 p 161
40P Legendre et al laquo AnalyzingBeta Diversity Partitioning the Spa-tial Variation of Community Compo-sition Data raquo cf note 9 p 161
41P Legendre et Gallagher laquo Eco-logically Meaningful Transformationsfor Ordination of Species Data raquo cfnote 8 p 161
Code R
pcaBCI lt- dudipca(BCIrowSums(BCI) scannf = FALSE nf = 2center = TRUE scale = FALSE)
scatter(pcaBCI clabcol = 0)
GeacuteneacuteralisationP Legendre et Anderson39 ont montreacute plus largement que
si les communauteacutes sont repreacutesenteacutees dans lrsquoespace vectorieldes espegraveces la moyenne des carreacutes des distances euclidiennesentre communauteacutes eacutegale la somme des carreacutes des eacutecarts agrave lamoyenne des distributions des espegraveces
1119868
119868minus1sum119894=1
119868sum
119895=119894+11198892
119894119895 =119878
sum119904=1
119868sum119894=1
(119910119904|119894 minus 119910119904)2 (1131)
119910119904|119894 peut ecirctre le nombre drsquoindividus 119899119904119894 ou la probabiliteacute119901119904|119894 Les communauteacutes ont ici le mecircme poids 119910119904 est la moyennedes valeurs de lrsquoespegravece 119904 dans chaque communauteacute La sommedes carreacutes des eacutecarts est une mesure de diversiteacute 120573 Si 119910119904|119894 estla probabiliteacute 119901119904|119894 il srsquoagit de lrsquoentropie 120573 de Simpson
Ce reacutesultat peut ecirctre eacutetendu agrave toute matrice de distanceseuclidiennes entre communauteacutes40 lrsquoargument est qursquoil existeune matrice de 119910119904|119894 transformation des 119901119904|119894 telle que la dis-tance entre les communauteacutes est cette matrice de distancesLa moyenne des dissimilariteacutes 119863119899 ou des compleacutements agrave 1des similariteacutes de Pavoine et Ricotta (qui sont les carreacutes desdistances euclidiennes de la PCoA) est donc une mesure dediversiteacute 120573
Pour un certain nombre de distances la transformation de119901119904|119894 en 119910119904|119894 est bien connue41
Fig 117 Distance de corde entredeux communauteacutes repreacutesenteacuteesdans lrsquoespace engendreacute par deux
espegraveces La distance 11988912 entre lesdeux communauteacutes est la longueurde la corde qui relie leurs vecteurs
de composition normaliseacutes sur lecercle de rayon 1 Crsquoest aussi deux
fois le sinus de lrsquoangle 120572122formeacute par les deux vecteurs decomposition des communauteacutes
1199011|2 1199012|2
1199011|22 + 1199012|2
2
Espegravece 2
Espegravece 1
11988912
1199011|1 1199012|1
1199011|12 + 1199012|1
2
12057212
115 Distance entre paires de communauteacutes et diversiteacute 120573 proportionnelle 183
42Ter Braak laquo Principal Compo-nents Biplots and Alpha and Beta Di-versity raquo cf note 37 p 180
43Jost laquo Partitioning Diversityinto Independent Alpha and BetaComponents raquo cf note 34 p 67
44P Legendre et M De Caacutecereslaquo Beta Diversity as the Variance ofCommunity Data Dissimilarity Co-efficients and Partitioning raquo In Eco-logy Letters 168 (2013) p 951-963doi 101111ele12141
45C R Rao laquo The Use and In-terpretation of Principal ComponentAnalysis in Applied Research raquo In Sankhyā The Indian Journal ofStatistics 264 (1964) p 329-358 JS-TOR 25049339
46C J F ter Braak laquo CanonicalCorrespondence Analysis A New Ei-genvector Technique for MultivariateDirect Gradient Analysis raquo In Eco-logy 675 (1986) p 1167-1179 doi 1023071938672
47P Legendre et De Caacuteceres cfnote 44
La distance de corde (Figure 117) est obtenue par la trans-formation
119910119904|119894 =119901119904|119894
radicsum119904 1199012119904|119894
(1132)
Les communauteacutes sont repreacutesenteacutees dans lrsquoespace des es-pegraveces par un vecteur dont les composantes sont proportion-nelles aux probabiliteacutes des espegraveces mais dont la norme est 1La distance entre communauteacutes est donc la longueur de lacorde qui relie les extrecircmiteacutes de leurs vecteurs sur la sphegravere agrave119878 dimensions de rayon 1
La distance de Hellinger est obtenue par
119910119904|119894 = radic119901119904|119894 (1133)
La distance euclidienne entre les profils de communauteacutes(119910119904|119894 = 119901119904|119894) utiliseacutee par ter Braak42 nrsquoest pas optimale parceqursquoelle souffre des deacutefauts de lrsquoentropie de Simpson43 qursquoellerepreacutesente P Legendre et De Caacuteceres44 annexe S3 ont eacuteta-bli une liste de bonnes proprieacuteteacutes que doivent respecter lesmesures de distance entre communauteacutes pour analyser la di-versiteacute de diffeacuterentiation La fonction distldc du packageadespatial permet de calculer toutes les distances preacutesenteacuteesdans lrsquoarticle Les distance de corde et de Hellinger (qui est ladistance entre les racines carreacutees des profils de communauteacutes)les respectent toutes
La diversiteacute 120573 exprimeacutee de cette faccedilon peut faire lrsquoobjetdrsquoanalyses par les meacutethodes drsquoordination classiques (RDA Analyse de Redondance 45 CCA Analyse Canonique de Cor-respondance46) pour la relier agrave des variables environnemen-tales par exemple47
La diversiteacute 120573 de BCI (figure 116) est mieux repreacutesenteacuteepar une analyse en coordonneacutees principales appliqueacutee agrave la dis-tance de corde entre les communauteacutes (figure 118) La limitede la meacutethode est que lrsquoorigine du repegravere ne repreacutesente plusici la meacuteta-communauteacute sa position correspond agrave la moyennedes probabiliteacutes des espegraveces transformeacutees 119910119904|119894 pas agrave celle des119901119904|119894
Code R
library(adespatial)dCorde lt- distldc(BCI method = chord)pcoaBCI lt- dudipco(dCorde scannf = FALSE nf = 2)scatter(pcoaBCI)
184 Diversiteacute de diffeacuterentiation
Fig 118 PCoA appliqueacutee agrave ladistance de corde des 50 carreacutes deBCI pour visualiser la diversiteacute 120573
d = 02
1
2
3
4
56
7
8
910
1112
13
14
15
16
17
18
19
20
21
22
23
24
2526
27 2829
3031
3233
34
35
3637 38
39
4041
42
43
44
45
464748
49
50
Eigenvalues
48J M Chase et al laquo Using NullModels to Disentangle Variation inCommunity Dissimilarity from Varia-tion in -Diversity raquo In Ecosphere22 (2011) art 24 doi 10 1890 ES10-001171
49C M Tucker et al laquo Differen-tiating between Niche and NeutralAssembly in Metacommunities UsingNull Models of -Diversity raquo In Oi-kos 1256 (2016) p 778-789 doi 101111oik02803
116 Tests de significativiteacute
Test de non-nulliteacute
Chase et al48 testent la valeur de diversiteacute 120573 observeacuteecontre sa valeur attendue sous lrsquohypothegravese nulle drsquoune distri-bution aleacuteatoire des individus dans les communauteacutes
Leur motivation principale est drsquoeacuteliminer la deacutependancede la diversiteacute 120573 agrave la diversiteacute 120572 due agrave la mesure de diver-siteacute qursquoils utilisent lrsquoindice de Jaccard appliqueacute aux don-neacutees de preacutesence-absence Des communauteacutes theacuteoriques sonttireacutees selon le modegravele nul (selon une distribution multino-miale correspondant aux probabiliteacutes des espegraveces dans la meacuteta-communauteacute et la taille de chaque communauteacute dans le casle plus courant) La distribution de la diversiteacute 120573 sous lrsquohy-pothegravese nulle est obtenue en reacutepeacutetant les simulations La dif-feacuterence entre la diversiteacute 120573 reacuteelle et la moyenne simuleacutee estnormaliseacutee par la moyenne simuleacutee pour obtenir une valeurcomprise entre -1 et +1 (lrsquoindice de Jaccard est compris entre0 et 1) compareacutee agrave sa distribution sous lrsquohypothegravese nulle poureacutevaluer sa significativiteacute
Tucker et al49 eacutetendent cette meacutethode aux donneacutees drsquoabon-dance en utilisant la dissimilariteacute de Bray-Curtis et testentagrave partir de communauteacutes simuleacutees sa capaciteacute agrave distinguerles meacutecanismes drsquoassemblage des communauteacutes niche contremodegravele neutre et modegraveles deacuteterministes contre stochastiques(crsquoest-agrave-dire dont les paramegravetres varient aleacuteatoirement) Cesdeux oppositions peuvent ecirctre traiteacutees indeacutependamment poureacuteviter la confusion entre niche et deacuteterminisme et entre neu-traliteacute et stochasticiteacute Ils concluent qursquoune valeur de diversiteacute
116 Tests de significativiteacute 185
50J M Chase et J A Myerslaquo Disentangling the Importance ofEcological Niches from StochasticProcesses across Scales raquo In Philoso-phical Transactions of the Royal So-ciety of London Series B Biologi-cal Sciences 3661576 (2011) p 2351-2363 doi 101098rstb20110063
51Anderson et al laquo MultivariateDispersion as a Measure of Beta Di-versity raquo cf note 16 p 175
52C Ricotta et S Burrascanolaquo Testing for Differences in Beta Di-versity with Asymmetric Dissimilari-ties raquo In Ecological Indicators 94(2009) p 719-724 doi 101016jecolind200809003
53G Bacaro et al laquo Testing forDifferences in Beta Diversity fromPlot-to-Plot Dissimilarities raquo In Ecological Research 272 (2012)p 285-292 doi 101007s11284-011-0899-z
120573 significativement diffeacuterente de celle du modegravele nul permetde deacutetecter le meacutecanisme de niche (alors que le modegravele neutredonne une valeur identique agrave celle de lrsquohypothegravese nulle 0 eacutetantdonneacute la normalisation) Chase et Myers50 interpreacutetait les va-leurs significatives comme preuve de deacuteterminisme (par oppo-sition agrave la stochasticiteacute) Tucker et al montrent que ce nrsquoestpas le cas le niveau de stochasticiteacute influe peu sur les reacutesul-tats quand la diversiteacute est mesureacutee agrave partir de donneacutees drsquoabon-dance En revanche la meacutethode nrsquoest pas fiable quand elle estutiliseacutee avec des donneacutees de preacutesence-absence la stochasticiteacutene permet alors plus de distinguer les meacutecanismes
Analyse de la variabiliteacuteAnderson et al51 fournissent un test drsquoeacutegaliteacute de la diver-
siteacute 120573 entre groupes de communauteacutes Les communauteacutes sontplaceacutees dans un espace euclidien dans lequel les distancesentre elles sont une mesure de dissimilariteacute preacutesenteacutee dansce chapitre Si les dissimilariteacutes ne sont pas euclidiennes unePCoA permet de les placer dans un espace euclidien dont cer-tains axes sont imaginaires sans que cette difficulteacute invalidela meacutethode
Dans chaque groupe la distance entre chaque communau-teacute et le centre de graviteacute du groupe est calculeacutee Une Ano-va est reacutealiseacutee agrave partir de ces distances La statistique F delrsquoAnova suit une loi de Fisher si la distribution des distancesaux centres de graviteacute est normale Si ce nrsquoest pas le cas letest peut ecirctre reacutealiseacute par permutation des distances entre lesgroupes La statistique de test de lrsquoAnova est le rapport de ladispersion des centres de graviteacute des groupes agrave celle des disper-sion des communauteacutes dans chaque groupe Elle est compareacuteeagrave sa distribution obtenue par permutation
Une alternative consiste agrave utiliser la distance aux meacutedianesspatiales des groupes La meacutediane spatiale est le point quiminimise la somme des distances entre les points et lui (alorsque le centre de graviteacute minimise la somme des carreacutes de cesdistances)
La fonction betadisper du package vegan impleacutemente cetest
Ricotta et Burrascano52 utilisent comme point centralde chaque groupe celui repreacutesentant lrsquoassemblage de sescommunauteacutes Ils deacutefinissent ainsi la diversiteacute 120573 commela dissimilariteacute moyenne entre chaque communauteacute et lameacuteta-communauteacute
Bacaro et al53 preacutefegraverent tester la distribution des dissimi-lariteacutes entre paires des communauteacutes plutocirct que la dissimila-riteacute entre chaque communauteacute et un point de reacutefeacuterence Unestatistique F est calculeacutee agrave partir de ces dissimilariteacutes et com-
186 Diversiteacute de diffeacuterentiation
54G Bacaro et al laquo Beta Diversi-ty Reconsidered raquo In Ecological Re-search 283 (2013) p 537-540 doi 101007s11284-013-1043-z
pareacutee agrave sa distribution obtenue par permutation La meacutethodede permutation originale est inapproprieacutee et donc corrigeacutee 54
les dissimilariteacutes doivent ecirctre redistribueacutees aleacuteatoirement entreles groupes
1A M Ellison laquo Partitioning Di-versity raquo In Ecology 917 (2010)p 1962-1963 doi doi10189009-16921
2Baselga laquo Multiplicative Parti-tion of True Diversity Yields In-dependent Alpha and Beta Compo-nents Additive Partition Does Not raquocf note 24 p 165 L Jost laquo Indepen-dence of Alpha and Beta Diversities raquoIn Ecology 917 (2010) p 1969-1994 doi 10189009-03681 Veechet Crist laquo Diversity Partitioning wi-thout Statistical Independence of Al-pha and Beta raquo cf note 24 p 165
3Chao et al laquo Proposing a Reso-lution to Debates on Diversity Parti-tioning raquo cf note 25 p 165
4Tuomisto laquo A Diversity of Be-ta Diversities Straightening up aConcept Gone Awry Part 1 DefiningBeta Diversity as a Function of Alphaand Gamma Diversity raquo cf note 17p 163 H Tuomisto laquo A Diversity ofBeta Diversities Straightening up aConcept Gone Awry Part 2 Quanti-fying Beta Diversity and Related Phe-nomena raquo In Ecography 331 (2010)p 23-45 doi 101111j1600-0587200906148x
5Marcon et al laquo The Decompo-sition of Shannonrsquos Entropy and aConfidence Interval for Beta Diversi-ty raquo cf note 11 p 64
6C R Rao et T K Nayaklaquo Cross Entropy Dissimilarity Mea-sures and Characterizations of Qua-dratic Entropy raquo In IEEE Tran-sactions on Information Theory 315(1985) p 589-593 doi 101109tit19851057082
Chapitre 12
Deacutecomposition de lrsquoentropie HCDT
Lrsquoentropie HCDT 120574 peut ecirctre deacutecomposeacutee en somme de lrsquoentropie 120572 etla moyenne de la divergence entre la distribution de chaque communau-teacute et celle de la meacuteta-communauteacute Lrsquoentropie 120573 est donc interpreacutetablecomme le gain drsquoinformation apporteacute par la connaissance de la distribu-tion deacutetailleacutee des communauteacutes en plus de celle aggreacutegeacutee de la meacuteta-communauteacute Lrsquoentropie 120573 va de pair avec le nombre effectif de com-munauteacutes crsquoest-agrave-dire le nombre de communauteacutes de mecircme poids sansaucune espegravece commune qui fourniraient la mecircme valeur drsquoentropie 120573que les communauteacutes reacuteelles La diversiteacute 120574 se deacutecompose donc en pro-duit du nombre effectif drsquoespegraveces de la diversiteacute 120572 et du nombre effectifde communauteacutes
Lrsquoessentiel
Ce chapitre traite de la diversiteacute proportionnelle qui me-sure agrave quel point les communauteacutes diffegraverent de leur assemblageDans la litteacuterature la diversiteacute 120573 est geacuteneacuteralement une mesuredeacuteriveacutee1 crsquoest-agrave-dire calculeacutee agrave partir des diversiteacutes 120572 et 120574 drsquoougraveun abondant deacutebat sur lrsquoindeacutependance souhaiteacutee mais pas tou-jours observeacutee entre les valeurs de diversiteacute 120572 et 1205732 Un foruma eacuteteacute consacreacute agrave la question dans la revue Ecology conclu parChao et al3 et une revue a eacuteteacute faite par Tuomisto4
La deacutecomposition de lrsquoentropie HCDT constitue un cadrecoheacuterent dans lequel la diversiteacute 120573 est non seulement unemesure deacuteriveacutee mais eacutegalement une mesure de la divergenceentre les distributions des communauteacutes et celle de la meacuteta-communauteacute
121 Deacutecomposition de lrsquoindice deShannon
DeacutefinitionLa deacutecomposition explicite (tableau 121) est due agrave Mar-
con et al5 mais avait eacuteteacute eacutetablie plus ou moins clairement plu-sieurs fois dans la litteacuterature notamment par Rao et Nayak6 la diversiteacute 120573 est la divergence de Kullback-Leibler entre la
187
188 Deacutecomposition de lrsquoentropie HCDT
Tab 121 Deacutefinition explicite de la diversiteacute de Shannon en tant que diver-gence entre une distribution observeacutee et une distribution attendue Les indices119867120572 et 119867120574 sont les compleacutements au logarithme du nombre drsquoespegraveces de cettedivergence
Indice Distributionobserveacutee
Distributionattendue
Formule
119867120572 Freacutequence desespegraveces dans lacommunauteacute
Freacutequenceseacutegales horsformule
119894119867120572 =sum119904 119901119904|119894 ln 119901119904|119894119867120572 =sum119894 119908119894 119894119867120572
119867120573 Freacutequence desespegraveces dans lacommunauteacute
Freacutequencetotale desespegraveces
119894119867120573 =sum119904 119901119904|119894 ln 119901119904|119894119901119904119867120573 =sum119894 119908119894 119894119867120573
119867120574 Freacutequence desespegraveces dans lameacuteta-communauteacute
Freacutequenceseacutegales horsformule
119867120574 =sum119904 119901119904 ln 119901119904
7J Lin laquo Divergence MeasuresBased on the Shannon Entropy raquo In IEEE Transactions on InformationTheory 371 (1991) p 145-151 doi 1011091861115
8R Lewontin laquo The Apportion-ment of Human Diversity raquo In Evo-lutionary Biology Sous la dir de TDobzhansky et al T 6 Springer US1972 p 381-398 doi 101007978-1-4684-9063-3_14
9C Ricotta et G C Avena laquo AnInformation-Theoretical Measure ofBeta-Diversity raquo In Plant Biosys-tems 1371 (2003) p 57-61 doi 10108011263500312331351331
10A Ludovisi et M I Tatic-chi laquo Investigating Beta Diversity byKullback-Leibler Information Mea-sures raquo In Ecological Modelling1921-2 (2006) p 299-313 doi 101016jecolmodel200505022
distribution des espegraveces dans chaque parcelle et la distribu-tion moyenne appeleacutee divergence de Jensen-Shannon7 Lesdiversiteacutes 120572 et 120574 sont les compleacutements agrave ln 119878 des indices dedissimilariteacute de Theil (41) divergences de Kullback-Leiblerentre les distributions des espegraveces et leur eacutequiprobabiliteacute
Lewontin8 dans son ceacutelegravebre article sur la diversiteacute geacuteneacute-tique humaine deacutefinit la diversiteacute de Shannon inter-groupecomme la diffeacuterence entre la diversiteacute totale et la diversiteacutemoyenne intra-groupe mais ne cherche pas agrave explorer ses pro-prieacuteteacutes
La forme de 119867120573 a eacuteteacute eacutetablie par Ricotta et Avena9 sansla relier agrave celle de 119867120572 et 119867120574 Enfin lrsquoideacutee de la deacutecompositionde la divergence de Kullback-Leibler mais avec une approchediffeacuterente sans rapprochement avec lrsquoindice de Shannon a eacuteteacutepublieacutee par Ludovisi et Taticchi10
Les meacuteta-communauteacutes peuvent agrave leur tour ecirctre regrou-peacutees agrave un niveau supeacuterieur la diversiteacute 120574 du niveau infeacuterieurdevenant diversiteacute 120572 pour le niveau supeacuterieur La deacutecomposi-tion ou le regroupement peuvent ecirctre effectueacutes sur un nombrequelconque de niveaux
Calcul sous R La fonction BetaEntropy calcule lrsquoentropie120573 de la meacuteta-communauteacute (lrsquoargument 119902 = 1 permet de choisirlrsquoentropie de Shannon)
Pas de correction du biais destimationsummary(BetaEntropy(Paracou618MC q = 1 Correction = None))
Neutral beta entropy of order 1 of metaCommunity Paracou618MC with correction None Entropy of communities P006 P018 03499358 05771645 Average entropy of the communities
121 Deacutecomposition de lrsquoindice de Shannon 189
11Chao et al laquo Entropy and theSpecies Accumulation Curve A No-vel Entropy Estimator via DiscoveryRates of New Species raquo cf note 94p 53
[1] 04471751
Biais drsquoestimationLrsquoestimateur du taux de couverture de la communauteacute 119894
est noteacute 119862119894 le taux de couverture total 119862 Lrsquoestimateur corrigeacutede 119894119867120573 est
119894120573 =119904ne0
sum119894=1
119862119894 119901119904|119894 ln119862119894119904|119894119862119904
1 minus (1 minus 119862119894 119901119904|119894)119899 (121)
Calcul sous R BetaEntropy applique cette correction
summary(BetaEntropy(Paracou618MC q = 1 Correction = ChaoShen))
Neutral beta entropy of order 1 of metaCommunity Paracou618MC with correction ChaoShen Entropy of communities P006 P018 02949188 04514132 Average entropy of the communities [1] 03618884
Chao et al11 utilisent une approche diffeacuterente pour corri-ger le biais drsquoestimation lrsquoinformation mutuelle Les donneacuteessont organiseacutees comme dans le tableau 101 mais les probabili-teacutes qursquoun individu appartienne agrave la communauteacute 119894 et agrave lrsquoespegravece119904 sont calculeacutees pour que leur somme soit eacutegale agrave 1 sur lrsquoen-semble du tableau sum119904 sum119894 119904119894 = 1 (au lieu de sum119894 119901119904|119894 = 1)
Lrsquoinformation mutuelle est la divergence de Kullback-Leibler entre la distribution de 119901119904119894 et celle du produit desdistributions marginales 119901119904 et 119901119894 Si les distributions mar-ginales sont indeacutependantes la probabiliteacute 119901119904119894 qursquoun individuappartienne agrave lrsquoespegravece 119904 et se trouve dans la communauteacute 119894est donneacutee par le produit des probabiliteacutes marginales 119901119904 et 119901119894et lrsquoinformation mutuelle est nulle
Lrsquoinformation mutuelle se calcule comme la diffeacuterenceentre lrsquoentropie de Shannon calculeacutee sur lrsquoensemble dutableau 119867(119901119904119894) et les entropies marginales 119867(119901119904) et119867(119901119894) 119867(119901119904) est lrsquoentropie 120574 de la meacuteta-communauteacuteSi on choisit de pondeacuterer les communauteacutes par leurs effectifs(119908119894 = 119901119894) alors 119867(119901119904119894) minus 119867(119901119894) est lrsquoentropie 120572 de lameacuteta-communauteacute crsquoest-agrave-dire la moyenne pondeacutereacutee desentropies 120572 des communauteacutes Dans ce cas lrsquoentropie 120573 esteacutegale agrave lrsquoopposeacutee de lrsquoinformation mutuelle Comme chaqueterme du calcul est une entropie 120572 il peut ecirctre corrigeacute selonlrsquoeacutequation ref(eq Chao2013 pour obtenir un estimateurmoins biaiseacute de 119867120573
Calcul sous R
190 Deacutecomposition de lrsquoentropie HCDT
12Z Zhang et M Grabchaklaquo Nonparametric Estimation ofKullback-Leibler Divergence raquoIn Neural computation 2611(2014) p 2570-2593 doi 10 1162NECO_a_00646 PMID 25058703
Shannon(Paracou618MC$Ns) + Shannon(colSums(Paracou618MC$Nsi)) -Shannon(Paracou618MC$Nsi)
UnveilJ 03439827
Cet estimateur est le moins biaiseacute agrave ce jour mais nrsquoestapplicable qursquoagrave lrsquoentropie de Shannon sous la condition quela pondeacuteration des communauteacutes soit donneacutee par les effectifs
Z Zhang et Grabchak12 proposent un estimateur de ladivergence de Kullback-Leibler avec un biais reacuteduit selon lamecircme meacutethode que pour lrsquoestimation de lrsquoentropie HCDT oude lrsquoentropie de Shannon
119894120573 =119904ne0
sum119904=1
119899119904119894119899 (122)
119899minus119899119904
sum119907=1
1119907
119907prod119895=1
(1 minus 119899119904119899 minus 119895 + 1) minus
119899119894minus119899119904119894
sum119907=1
1119907
119907prod119895=1
(1 minus 119899119904119894 minus 1119899119894 minus 119895 )
(123)
Cette correction est incluse dans la fonction ShannonBetade entropart
Divergence de Kullback-Leibler entre chaque communauteacute de Paracou618MC et la meacutetacommunauteacute(Beta lt- apply(Paracou618MC$Nsi 2 ShannonBeta Nexp = Paracou618MC$Ns
Correction = ZhangGrabchak))
P006 P018 01442318 02994995
Entropie betasum(Paracou618MC$Wi Beta)
[1] 02106764
La correction de Zhang et Grabchak reacuteduit beaucoup plusfortement lrsquoestimation que celle de Chao et Shen Le meilleurestimateur peut ecirctre eacutevalueacute agrave partir de la diffeacuterence entre lesentropies 120574 et 120572 corrigeacutees par le meilleur estimateur disponible(celui de Chao Wang et Jost voir section 33)
Entropie alpha de chaque communauteacute de Paracou618MC(Alpha lt- apply(Paracou618MC$Nsi 2 Shannon CheckArguments = FALSE))
P006 P018 4427559 4772981
Entropie beta estimeacutee par diffeacuterencebcShannon(Paracou618MC$Ns) - sum(Paracou618MC$Wi Alpha)
122 Deacutecomposition de lrsquoentropie geacuteneacuteraliseacutee 191
13Lande laquo Statistics and Partitio-ning of Species Diversity and Simila-rity among Multiple Communities raquocf note 73 p 49
14F Bourguignon laquo Decompo-sable Income Inequality Measures raquoIn Econometrica 474 (1979) p 901-920 doi 1023071914138 JSTOR 1914138
15Lande laquo Statistics and Partitio-ning of Species Diversity and Simila-rity among Multiple Communities raquocf note 73 p 49
16Jost laquo Partitioning Diversityinto Independent Alpha and BetaComponents raquo cf note 34 p 67
17Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
18Jost laquo Partitioning Diversityinto Independent Alpha and BetaComponents raquo cf note 34 p 67
UnveilJ 03526572
Lrsquoestimateur de Chao et Shen est apparemment le meilleurla correction de celui de Zhang et Grabchak est trop forte
122 Deacutecomposition de lrsquoentropiegeacuteneacuteraliseacutee
La deacutecomposition additive de lrsquoentropie selon Lande13 doitecirctre la suivante
119902119867120574 = 119902119867120572 + 119902119867120573 (124)
Bourguignon14 comme Lande15 deacutefinissent une mesuredrsquoineacutegaliteacute deacutecomposable comme respectant les proprieacuteteacutessuivantes
bull La population totale eacutetant partitionneacutee chaque parti-tion recevant un poids 119908119894 la composante intra-groupede la mesure 119867120572 est eacutegale agrave la somme pondeacutereacutee des me-sures dans chaque-groupe 119867120572 = sum119894 119908119894119894119867120572
bull La composante intergroupe 119867120573 est la mesure drsquoineacutegaliteacuteentre les groupes
bull La mesure totale 119867120574 est la somme des mesures intra etintergroupes
En passant par les nombres de Hill Jost16 montre quelrsquoindice de Shannon est le seul pouvant ecirctre deacutecomposeacute decette faccedilon
La deacutemonstration de Jost repose sur le postulat que latransformation de lrsquoentropie en nombre de Hill deacutefinie pourla diversiteacute 120572 doit avoir la mecircme forme pour la diversiteacute 120573La remise en cause de ce postulat17 permet de deacutecomposer ladiversiteacute drsquoordre quelconque quel que soit le poids des commu-nauteacutes
La deacutecomposition de lrsquoentropie est faite en eacutecrivant le loga-rithme drsquoordre 119902 de la deacutecomposition de la diversiteacute eacutequation(101)
119902119867120574 = 119902119867120572 + ln119902119902119863120573 minus (119902 minus 1) 119902119867120572 ln119902
119902119863120573 (125)
Ceci est la deacutecomposition de Jost18 Jost deacutesigne sous lenom de laquo composante 120573 de lrsquoentropie raquo le logarithme drsquoordre119902 de la diversiteacute qursquoil note 119867119861 La deacutecomposition nrsquoest pasadditive mais 119867119861 est indeacutependant de lrsquoentropie 120572
192 Deacutecomposition de lrsquoentropie HCDT
19L Borland et al laquo InformationGain within Nonextensive Thermo-statistics raquo In Journal of Mathema-tical Physics 3912 (1998) p 6490-6501 doi 1010631532660 C Tsal-lis et al laquo The Role of Constraints wi-thin Generalized Nonextensive Statis-tics raquo In Physica A-statistical Me-chanics and Its Applications 2613(1998) p 534-554 doi 10 1016 S0378-4371(98)00437-3
20Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
21N Cressie et Read laquo Multi-nomial Goodness-of-Fit Tests raquo cfnote 100 p 82
22P W Lamberti et A PMajtey laquo Non-Logarithmic JensenndashShannon Divergence raquo In PhysicaA-statistical Mechanics and Its Ap-plications 3291ndash2 (2003) p 81-90doi http dx doi org 10 1016 S0378-4371(03)00566-1
23Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
Les deux derniers termes peuvent ecirctre regroupeacutes et reacutear-rangeacutes pour obtenir 119902119867120573 conformeacutement agrave la deacutecomposition ad-ditive de lrsquoeacutequation (124)
119902119867120573 = sum119894
119908119894 sum119904
119901119902119904|119894 ln119902
119901119904|119894119901119904
(126)
Lrsquoentropie 120573 est la somme pondeacutereacutee par 119908119894 (et pas autre-ment) des contributions de chaque communauteacute
119902119894119867120573 = sum
119904119901119902
119904|119894 ln119902119901119904|119894119901119904
(127)
119902119894119867120573 est une divergence de Kullback-Leibler geacuteneacuteraliseacutee19
119902119867120573 en est la moyenne sur lrsquoensemble des communauteacutes crsquoestdonc une geacuteneacuteralisation de la divergence de Jensen-Shannon20
119902119867120574 peut srsquoeacutecrire sous la forme 119902119867120574 = minus sum119904 119901119902119904 ln119902 119901119904 la for-
malisation de la deacutecomposition est une geacuteneacuteralisation de ladeacutecomposition de lrsquoentropie de Shannon reacutesumeacutee dans le ta-bleau 122
Il est inteacuteressant drsquoeacutecrire 119902119894119867120573 et 119902119867120574 sous la forme drsquoentro-
pies pour faire apparaicirctre leur fonction drsquoinformation Pour 119902diffeacuterent de 1 lrsquoentropie 120574 est
119902119867120574 = sum119904
1199011199041 minus 119901119902minus1
119904119902 minus 1 = sum
119904119901119904 ln119902
1119901119904
(128)
Sa fonction drsquoinformation a eacuteteacute traceacutee figure 41Lrsquoentropie 120573 est
119902119894119867120573 = sum
119904119901119904|119894
119901119902minus1119904|119894 minus 119901119902minus1
119904119902 minus 1 = sum
119904119901119904|119894 (ln119902
1119901119904
minus ln1199021
119901119904|119894)
(129)La forme de lrsquoentropie 120573 eacutevoque la divergence de puis-
sance21 qui est une statistique qui mesure la divergence entredeux distributions dont les proprieacuteteacutes asymptotiques sontconnues La divergence de puissance peut ecirctre eacutecrite sousla forme 119868119902 = minus2
119902 sum119904 119901119904|119894 ln119902119901119904
119901119904|119894 Elle est eacutegale agrave (deux fois)
la divergence de Kullback-Leibler pour 119902 = 1 mais diffegraverede lrsquoentropie 120573 pour les autres valeurs de 119902 La divergencenon-logarithmique de Jensen-Shannon22 est identique agrave unenormalisation pregraves 119870119902 = minus sum119904 119901119904|119894 ln119902
119901119904119901119904|119894
Elle mesurelrsquoeacutecart entre la diversiteacute 120572 et la valeur de sum119904 119908119894119901119902
119904|119894 ln119902 119901119904119902
qui nrsquoest pas la diversiteacute 12057423
Calcul sous R La fonction DivPart calcule entropie etdiversiteacute en mecircme temps
123 Deacutecomposition du nombre drsquoespegraveces 193
DivPart(q = 1 Paracou618MC Biased = FALSE)
$MetaCommunity [1] Paracou618MC $Order [1] 1 $Biased [1] FALSE $Correction [1] UnveilJ $Normalized [1] TRUE $TotalAlphaDiversity [1] 9706467 $TotalBetaDiversity UnveilJ 1422843 $GammaDiversity UnveilJ 1381078 $CommunityAlphaDiversities P006 P018 837268 1182713 $TotalAlphaEntropy [1] 4575378 $TotalBetaEntropy UnveilJ 03526572 $GammaEntropy UnveilJ 4928035 $CommunityAlphaEntropies P006 P018 4427559 4772981 $CommunityBetaEntropies [1] NA $Method [1] HCDT attr(class) [1] DivPart
123 Deacutecomposition du nombredrsquoespegraveces
Les reacutesultats geacuteneacuteraux se simplifient pour 119902 = 0 Lrsquoentropie120574 est le nombre drsquoespegraveces de la meacuteta-communauteacute moins un(0119867120574 = 119878minus1) lrsquoentropie 120572 est la moyenne pondeacutereacutee du nombre
194 Deacutecomposition de lrsquoentropie HCDT
24Chao et al laquo Proposing a Reso-lution to Debates on Diversity Parti-tioning raquo cf note 25 p 165
25Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
26Whittaker laquo Vegetation of theSiskiyou Mountains Oregon and Ca-lifornia raquo cf note 8 p 5
drsquoespegraveces des communauteacutes moins un (0119867120572 = 119878minus1) lrsquoentropie120573 est la diffeacuterence 0119867120573 = 119878 minus 119878
En termes de diversiteacute
0119863120573 = 119878119878 (1210)
0119863120573 peut ecirctre supeacuterieur au nombre de communauteacutes24 siles poids sont tregraves ineacutegaux ce qui complique son interpreacuteta-tion La pondeacuteration de Jost donne pour le nombre drsquoespegravecesle mecircme poids agrave toutes les communauteacutes et garantit 0119863120573 le 119868 ce qui constitue pour Chao et al un argument en faveur deson utilisation Un contre-argumentaire est fourni par Marconet al25 Quel que soit la distribution des poids des commu-nauteacutes il est toujours possible de ramener les donneacutees agrave unensemble de communauteacutes de poids identiques dont certainessont reacutepeacuteteacutees La communauteacute dont le poids 119908119898119894119899 est le plusfaible est repreacutesenteacutee une seule fois les autres 119908119894119908119898119894119899 foisLrsquoindeacutependance entre les diversiteacutes 120572 et 120573 est donc bien veacuteri-fieacutee Le diversiteacute 120573 maximale theacuteorique est 1119908119898119894119899 (et non 119868)Elle nrsquoest pas atteinte parce que plusieurs communauteacutes sontidentiques
La deacutefinition de la diversiteacute 120573 par Whittaker26 srsquoappliquaitaux donneacutees de preacutesence-absence La diversiteacute 120573 eacutetait le rap-port entre le nombre drsquoespegraveces total de lrsquoassemblage des com-munauteacutes (diversiteacute 120574) et le nombre moyen drsquoespegraveces danschaque communauteacute (diversiteacute 120572) Crsquoest preacuteciseacutement la deacutefini-tion de 0119863120573 (1210)
124 Deacutecomposition de lrsquoindice deGini-Simpson
Lrsquoentropie de Simpson peut aussi ecirctre deacutecomposeacutee commeune variance La probabiliteacute qursquoun individu appartienne agrave lrsquoes-pegravece 119904 est 119901119904 Elle suit une loi de Bernoulli dont la variance est119901119904 (1 minus 119901119904) Cette variance peut ecirctre deacutecomposeacutee entre les com-munauteacutes ougrave la probabiliteacute est 119901119904|119894 La deacutecomposition entrevariance intra et inter-communauteacutes est
119901119904 (1 minus 119901119904) = sum119894
119908119894 [119901119904|119894 (1 minus 119901119904|119894) + (119901119904|119894 minus 119901119904)2] (1211)
Cette eacutegaliteacute peut ecirctre sommeacutee sur toutes les espegraveces pourdonner
119864120574 = sum119894
119908119894119864120572119894 + sum119894
119908119894 sum119904
(119901119904|119894 minus 119901119904)2 = 119864120572 + 119864120573 (1212)
124 Deacutecomposition de lrsquoindice de Gini-Simpson 195
27M Nei laquo Analysis of Gene Di-versity in Subdivided Populations raquoIn Proceedings of the NationalAcademy of Sciences of the Uni-ted States of America 7012 (1973)p 3321-3323 doi 101073pnas70123321
28Jost laquo Partitioning Diversityinto Independent Alpha and BetaComponents raquo cf note 34 p 67 LJost laquo GST and Its Relatives Do NotMeasure Differentiation raquo In Mole-cular Ecology 1718 (2008) p 4015-4026 doi 101111j1365-294X200803887x
29R Heller et H R Siegis-mund laquo Relationship between ThreeMeasures of Genetic DifferentiationG(ST) D-EST and Grsquo(ST) HowWrong Have We Been raquo In Mole-cular Ecology 1810 (2009) p 2080-2083 doi 101111j1365-294X200904185 x N Ryman et O Leimarlaquo G(ST) Is Still a Useful Measure ofGenetic Differentiation - a Commenton Jostrsquos D raquo In Molecular Ecolo-gy 1810 (2009) p 2084-2087 doi 101111j1365- 294X200904187x L Jost laquo D vs GST Response toHeller and Siegismund (2009) and Ry-man and Leimar (2009) raquo In Mole-cular Ecology 1810 (2009) p 2088-2091 doi 101111j1365-294X200904186x M C Whitlock laquo GrsquoST andd Do Not Replace FST raquo In Mole-cular Ecology 206 (2011) p 1083-1091 doi 101111j1365-294X201004996x
30Gregorius laquo Partitioning of Di-versity The rdquowithin CommunitiesrdquoComponent raquo cf note 24 p 66
Lrsquoentropie 120574 de Simpson peut ecirctre deacutecomposeacutee en sa di-versiteacute 120572 somme pondeacutereacutee des entropies 120572 des communauteacuteset son entropie 120573 eacutegale agrave la somme pondeacutereacutee des distances 1198972entre la distribution des freacutequences dans chaque communauteacuteet celle de lrsquoensemble de la communauteacute
En geacuteneacutetique lrsquoeacutegaliteacute srsquoeacutecrit27 119867119905 = 119867119904 + 119863119904119905 119867119905 estlrsquoheacuteteacuterozygotie totale deacutecomposeacutee en 119867119904 lrsquoheacuteteacuterozygotiemoyenne des populations et 119863119904119905 la diffeacuterenciation absolueentre populations 119866119904119905 = 119863119904119905119867119905 est la diffeacuterenciationrelative
Lrsquoentropie 119864120573 calculeacutee de cette maniegravere est eacutegale agrave 2119867120573calculeacutee agrave lrsquoeacutequation (129) pour le cas geacuteneacuteral mais la contri-bution de chaque communauteacute est diffeacuterente la deacutecomposi-tion de la variance est une faccedilon alternative de deacutecomposerlrsquoentropie valable uniquement pour lrsquoentropie de Simpson
Cette deacutecomposition est remise en cause par Jost28 qui ageacuteneacutereacute le deacutebat29 119864120574 eacutetant infeacuterieure ou eacutegale agrave 1 119864120573 nrsquoest pasindeacutependante de 119864120572 seule la deacutecomposition multiplicativepermet lrsquoindeacutependance et Jost propose drsquoutiliser une transfor-mation de 2119863120573 comme mesure de diffeacuterenciation (voir section127) Gregorius30 montre que ce problegraveme nrsquoest pas limiteacute agravelrsquoentropie de Simpson mais srsquoapplique agrave toutes les entropiesHCDT drsquoordre supeacuterieur agrave 1
Jost postule que la diversiteacute 120573 de Simpson a la mecircme rela-tion agrave 119864120573 que les diversiteacutes 120572 et 120574
119902119863120574 = 119902119863120572119902119863120573 hArr 1
1 minus 119864120574= 1
1 minus 119864120572
11 minus 119864120573
(1213)
drsquoougrave une deacutecomposition additive diffeacuterente qui correspondagrave sa deacutecomposition geacuteneacuterale (125)
119864120574 = 119864120572 + 119864120573 minus 119864120572119864120573 (1214)
Il nrsquoy a en reacutealiteacute aucune raison pour que le nombre eacutequi-valent de la diversiteacute 120573 ait la mecircme forme que celle de la di-versiteacute 120572 les deux diversiteacutes sont par nature tregraves diffeacuterenteset Hill ne traitait pas la diversiteacute 120573 La diversiteacute de Shannonest exceptionnelle parce que pour des raisons diffeacuterentes sonnombre de Hill est lrsquoexponentielle de lrsquoentropie et lrsquoexponen-tielle de la deacutecomposition additive (124) est la deacutecompositionmultiplicative (101)
Le nombre eacutequivalent de communauteacutes a une forme leacutegegrave-rement diffeacuterente drsquoun nombre de Hill (tableau 122)
196 Deacutecomposition de lrsquoentropie HCDT
Tab 122 Entropie diversiteacute et deacutecomposition Lrsquoentropie 120572 de chaque com-munauteacute se calcule comme lrsquoentropie 120574
Mesure de diversiteacute Entropie geacuteneacuteraliseacutee Shannon
Entropie 120574 119902119867120574 = minus sum119904 119901119902119904 ln119902 119901119904 1119867120574 = minus sum119904 119901119904 ln 119901119904
Entropie 120573 119902119867120573 =sum119894 119908119894 sum119904 119901119904|119894 (ln119902 1
119901119904 minus ln119902 1119901119904|119894
)
1119867120573 =sum119894 119908119894 sum119904 119901119904|119894 ln
119901119904|119894119901119904
Diversiteacute 120574 (nombre deHill)
119902119863120574 = 119890119902119867120574119902 1119863120574 = 1198901119867120574
Diversiteacute 120573 (nombreeacutequivalent
119902119863120573 = 119890
1199021198671205731minus(119902minus1)119902119867120572119902 1119863120573 = 119890
1119867120573
31Pavoine et al laquo From Dissimi-larities among Species to Dissimilari-ties among Communities A DoublePrincipal Coordinate Analysis raquo cfnote 51 p 126
125 Deacutecomposition de lrsquoindice de RaoLes notations sont celles de la preacutesentation de lrsquoindice de
Rao section 76La diversiteacute de la meacuteta-communauteacute peut ecirctre deacutecompo-
seacutee en une somme (pondeacutereacutee) de diversiteacutes intra et une diver-siteacute inter31 en deacutefinissant une dissimilariteacute entre les commu-nauteacutes 119894 et 119895
119863119867Δ(p119894 p119895) = 2119867Δ (p119894 + p119895
2 ) minus 119867Δ (p119894) minus 119867Δ (p119895) (1215)
Elle est deacutefinie par Rao comme la diffeacuterence entre lrsquoentro-pie quadratique du meacutelange des deux communauteacutes et cellesdes deux communauteacutes prises individuellement Elle peut ecirctreutiliseacutee pour calculer un indice de diversiteacute entre communau-teacutes de la mecircme faccedilon qursquoon calcule la diversiteacute entre espegravecesdrsquoune communauteacute
119867Δ (p) = sum119894
119908119894119867Δ (p119894) + sum119894
sum119895
119908119894119908119895119863119867Δ(p119894 p119895) (1216)
Le deuxiegraveme terme de la somme est la diversiteacute inter-communauteacutes Crsquoest un indice de Rao les poids descommunauteacutes sont eacutequivalents aux tableaux de freacutequences etles dissimilariteacutes entre communauteacutes sont eacutequivalentes auxdissimilariteacutes entre espegraveces de lrsquoeacutequation (723) La divergenceentre communauteacutes est construite agrave partir des entropies dechacune lrsquoentropie 120573 est deacutefinie comme la diffeacuterence entreles entropies 120574 et 120572
Lrsquoexemple suivant utilise les communauteacutes du fichierraoeffectifscsv
Vecteur contenant 8 espegraveces(readcsv2(dataraoeffectifscsv rownames = 1 header = T) -gt
effectifs)
P1 P2 P3 P4
125 Deacutecomposition de lrsquoindice de Rao 197
Ess 97 36 34 61 Me 62 24 49 4 S1 4 6 6 75 Sr 71 78 99 36 Vm 76 29 34 2 Bg 58 49 47 19 Ef 9 34 91 35 Dg 98 14 95 14
Lecture des donneacutees traits pour 34 espegravecesreadcsv2(dataraotraitscsv rownames = 1 header = T) -gt
traits ACP sur les traits foliairespcaf lt- dudipca(traits scale = T scannf = FALSE nf = 2) CAH Ward des traits foliaireshf lt- hclust(dist(pcaf$tab) wardD) Transformation de larbre du format hclust au format phylogphyf lt- hclust2phylog(hf)
Il contient 4 communauteacutesPour obtenir tous les eacuteleacutements de lrsquoeacutequation (1216)
bull 119867Δ (p) diversiteacute totale Calculer p en sommant les com-munauteacutes Calculer ensuite lrsquoentropie quadratique avecdivc
(tabF lt- apply(effectifs[names(phyf$leaves) ] MARGIN = 1 sum))
Sr Ess Me S1 Bg Ef Vm Dg 284 228 139 91 173 169 141 221
divc(asdataframe(tabF) phyf$Wdist)
diversity tabF 5870667
bull 119867Δ (p119894) diversiteacute de chaque communauteacute fournie pardivc
divc(effectifs[names(phyf$leaves) ] phyf$Wdist)
diversity P1 5816719 P2 5897210 P3 5744483 P4 4790586
bull La variabiliteacute inter-communauteacutes peut ecirctre calculeacutee pardivc en utilisant la distance fournie par disc en deacutefi-nissant la matrice des poids (eacutegale aux effectifs)
divc(asdataframe(colSums(effectifs)) disc(effectifs[names(phyf$leaves)] phyf$Wdist))
diversity colSums(effectifs) 02362187
198 Deacutecomposition de lrsquoentropie HCDT
32Pavoine et al laquo From Dissimi-larities among Species to Dissimilari-ties among Communities A DoublePrincipal Coordinate Analysis raquo cfnote 51 p 126
33Gower laquo Some Distance Pro-perties of Latent Root and Vector Me-thods Used in Multivariate Analysis raquocf note 9 p 173
34C Ricotta et al laquo A ClassicalMeasure of Phylogenetic Dissimilarityand Its Relationship with Beta Diver-sity raquo In Basic and Applied Ecology161 (2015) p 10-18 doi 101016jbaae201410003
35Rao laquo Diversity and Dissimi-larity Coefficients A Unified Ap-proach raquo cf note 5 p 101 S Villeacute-ger et D Mouillot laquo Additive Parti-tioning of Diversity Including SpeciesDifferences A Comment on Hardyamp Senterre (2007) raquo In Journal ofEcology 965 (2008) p 845-848 doi 101111j1365-2745200701351x
36O J Hardy et B Senterrelaquo Characterizing the PhylogeneticStructure of Communities by anAdditive Partitioning of PhylogeneticDiversity raquo In Journal of Ecology953 (2007) p 493-506 doi 101111j1365-2745200701222x
37O J Hardy et L Jost laquo In-terpreting and Estimating Measuresof Community Phylogenetic Structu-ring raquo In Journal of Ecology 965(2008) p 849-852 doi 101111j1365-2745200801423x
38F de Bello et al laquo The Partitio-ning of Diversity Showing Theseusa Way out of the Labyrinth raquo In Journal of Vegetation Science 215(2010) p 992-1000 doi 101111j1654-1103201001195x
39R C Guiasu et S Guiasulaquo The Weighted Quadratic Index ofBiodiversity for Pairs of Species AGeneralization of Raorsquos Index raquo cfnote 61 p 130
40Champely et Chessel laquo Measu-ring Biological Diversity Using Eucli-dean Metrics raquo cf note 50 p 126
La fonction disc calcule radic2119863119867Δ(p119894 p119895)
disc(effectifs[names(phyf$leaves) ] phyf$Wdist)
P1 P2 P3 P2 04698121 P3 04888729 06487916 P4 10018983 08776582 13157902
Une interpreacutetation geacuteomeacutetrique de la deacutecomposition estla suivante32 Les espegraveces peuvent ecirctre placeacutees dans un es-pace multidimensionnel construit par une Analyse en Coor-donneacutees Principales33 de la matrice de dissimilariteacute D telleque = D∘22 (les distances dans lrsquoespace multidimensionnelsont radic2120575119904prime119904Prime autrement dit la dissimilariteacute entre deux es-pegraveces est la moitieacute du carreacute de la distance entre elles dans larepreacutesentation geacuteomeacutetrique) Chaque communauteacute se trouveau centre de graviteacute des espegraveces qursquoelle contient pondeacutereacuteespar leur freacutequence La moitieacute du carreacute de la distance entredeux communauteacutes dans ce mecircme espace est le coefficient dedissimilariteacute entre communauteacutes de Rao La distance entrecommunauteacutes est donc interpreacutetable directement comme unemesure de diversiteacute 12057334 dans la tradition de lrsquoutilisation de ladissimilariteacute entre paires de communauteacutes (chapitre 11)
Cette partition suppose que les poids des communauteacutessont proportionnels agrave leur nombre drsquoindividus35 O J Har-dy et Senterre36 deacutecomposent (par diffeacuterence entre 120574 et 120572)lrsquoindice de Rao de communauteacutes de poids eacutegaux O J Har-dy et Jost37 montrent que les deux pondeacuterations sont validesmais lrsquoabsence de cadre geacuteneacuteral assurant que la diversiteacute 120574de Rao est supeacuterieure agrave la diversiteacute 12057238 motive R C Guiasuet S Guiasu39 agrave proposer une alternative agrave lrsquoindice de Raolrsquoindice de Gini-Simpson quadratique pondeacutereacute (727) dont laconcaviteacute est deacutemontreacutee (ce qui implique que 120574 ge 120572) La pon-deacuteration peut en fait ecirctre quelconque tant que la matrice dontles eacuteleacutements sont la racine carreacute des eacuteleacutements de la matrice dedissimilariteacute est euclidienne40 Ce reacutesultat a eacuteteacute obtenu pourles arbres ultrameacutetriques dans le cadre plus geacuteneacuteral de la deacute-composition de lrsquoentropie phylogeacuteneacutetique (voir chapitre 12
La partition peut ecirctre faite avec la fonction DivPart
Creacuteation dune meacuteta-communauteacute poids eacutegaux aux effectifsMC lt- MetaCommunity(effectifs colSums(effectifs))summary(DivPart(q = 2 MC Tree = phyf Normalize = FALSE))
HCDT diversity partitioning of order 2 of metaCommunity MC Phylogenetic or functional diversity was calculated according to the tree phyf Diversity is not normalized
126 Synthegravese 199
41Ricotta et Szeidl laquo DiversityPartitioning of Raorsquos Quadratic En-tropy raquo cf note 7 p 136
42Ricotta et Burrascano laquo Tes-ting for Differences in Beta Diversi-ty with Asymmetric Dissimilarities raquocf note 52 p 185
43T O Crist et al laquo PartitioningSpecies Diversity across Landscapesand Regions A Hierarchical Analy-sis of Alpha Beta and Gamma Di-versity raquo In The American Natu-ralist 1626 (2003) p 734-743 doi 101086378901 Marcon et al laquo TheDecomposition of Shannonrsquos Entropyand a Confidence Interval for Beta Di-versity raquo cf note 11 p 64
44Marcon et al laquo The Decompo-sition of Shannonrsquos Entropy and aConfidence Interval for Beta Diversi-ty raquo cf note 11 p 64 J Beck etal laquo Undersampling and the Measure-ment of Beta Diversity raquo In Methodsin Ecology and Evolution 44 (2013)p 370-382 doi 1011112041-210x12023
45Marcon et al laquo Generalizationof the Partitioning of Shannon Di-versity raquo cf note 37 p 69 Mar-con et al laquo The Decomposition ofSimilarity-Based Diversity and ItsBias Correction raquo cf note 9 p 145
Alpha diversity of communities P1 P2 P3 P4 2419203 2470000 2375363 1916686 Total alpha diversity of the communities 9 2311553 Beta diversity of the communities 9 1061198 Gamma diversity of the metacommunity 9 2453015
La deacutecomposition de la diversiteacute (et non seulement de lrsquoen-tropie) de Rao a eacuteteacute eacutetablie par Ricotta et Szeidl41
126 Synthegravese
La diversiteacute mesureacutee par lrsquoentropie geacuteneacuteraliseacutee peut ecirctredeacutecomposeacutee dans tous les cas de figure y compris lorsque lespoids des communauteacutes ne sont pas eacutegaux Les formules drsquoen-tropie et de diversiteacute sont reacutesumeacutees dans le tableau 122 Lrsquoen-tropie 120573 est une mesure de divergence entre la distribution dechaque communauteacute et celle de la meacuteta-communauteacute commelrsquoavaient suggeacutereacute Ricotta et Burrascano42
Lrsquoentropie de Shannon est un cas particulier dans lequeltoutes les controverses disparaissent lrsquoentropie 120573 est indeacutepen-dante de lrsquoentropie 120572 et la pondeacuteration de Jost se confondavec celle de Routledge
Lrsquoentropie de Simpson peut ecirctre deacutecomposeacutee de deux fa-ccedilons comme une variance quand les poids des communauteacutessont donneacutes par leurs effectifs ou selon le cas geacuteneacuteral Lesdeux deacutecompositions produisent les mecircmes valeurs drsquoentropie120573 mais la contribution de chaque communauteacute nrsquoest pas lamecircme
Lrsquoentropie peut ecirctre deacutecomposeacutee hieacuterarchiquement sur plu-sieurs niveaux43
Les probabiliteacutes drsquooccurrence des espegraveces ne sont pasconnues mais estimeacutees agrave partir des donneacutees Les diversiteacutes 120572et 120574 sont sous-estimeacutees et la diversiteacute 120573 surestimeacutee44 drsquoautantplus que lrsquoordre de diversiteacute est faible (le biais est neacutegligeableau-delagrave de lrsquoindice de Simpson) Des meacutethodes de correctionexistent mais pas pour lrsquoentropie 120573 agrave lrsquoexception de ShannonLa meacutethode geacuteneacuterale consiste donc agrave corriger les entropies 120572et 120574 calculer lrsquoentropie 120573 par diffeacuterence et transformer lesreacutesultats en nombres eacutequivalents45
200 Deacutecomposition de lrsquoentropie HCDT
46Jost laquo Partitioning Diversityinto Independent Alpha and BetaComponents raquo cf note 34 p 67
127 NormalisationLa mesure de diversiteacute 119902119863120573 est le nombre eacutequivalent de
communauteacutes totalement distinctes qui fourniraient ce niveaude diversiteacute
Neacutecessiteacute de normaliser la diversiteacute 120573Selon une premiegravere approche cette mesure nrsquoa de sens que
compareacutee agrave nombre de communauteacutes La diversiteacute entre unhectare de forecirct tropicale et un hectare de forecirct tempeacutereacutee (demecircme poids sans espegravece commune) est eacutegale agrave 2 quel que soit119902 La diversiteacute entre un nombre suffisant drsquoeacutechantillons de forecircttropicale relativement homogegravene (avec de nombreuses espegravecescommunes) peut facilement deacutepasser 2 crsquoest le cas des 50carreacutes de BCI pour 119902 = 0 Pour ne pas conclure de faccedilon er-roneacutee que les carreacutes de BCI sont plus diffeacuterents entre eux queBCI et la forecirct de Fontainebleau Jost46 suggegravere de diviser ladiversiteacute 120573 par le nombre de communauteacutes pour la normali-ser Ce raisonnement a un sens quand la diversiteacute maximaleenvisageable est effectivement eacutegale au nombre de communau-teacutes par exemple si les communauteacutes sont choisies dans deshabitats diffeacuterents la diversiteacute 120573 mesure cette diffeacuterence
Un autre cas est envisageable les communauteacutes peuventecirctre des eacutechantillons drsquoune meacuteta-communauteacute clairement deacutefi-nie La diversiteacute 120573 mesure alors la variabiliteacute de lrsquoeacutechantillon-nage agrave lrsquointeacuterieur de la meacuteta-communauteacute agrave une eacutechelle donneacuteePour une taille drsquoeacutechantillon fixeacutee (par exemple un hectare deforecirct) la diversiteacute 120573 ne deacutepend pas du nombre de commu-nauteacutes lrsquoentropie 120573 est lrsquoespeacuterance (estimeacutee par la moyenneeacutequation (126) de la divergence de Jensen-Shannon entre ladistribution des espegraveces drsquoune communauteacute et celle de la meacuteta-communauteacute fixe Cette variabiliteacute deacutepend de lrsquoeacutechelle delrsquoeacutechantillonnage dans le sens ougrave elle diminue si les eacutechantillonssont de taille plus grande lrsquoentropie 120572 de deux hectares deforecircts est la diversiteacute 120572 moyenne de chacun des deux hectaresplus lrsquoentropie 120573 entre eux Lrsquoentropie 120573 entre les eacutechantillonsde deux hectares est donc diminueacutee de cette entropie 120573 laquo in-tra raquo qui est absorbeacutee par la nouvelle entropie 120572 quand la tailledes eacutechantillons augmente
La figure 121 preacutesente les valeurs estimeacutees de diversiteacuteneutre 120573 entre carreacutes de BCI tireacutes aleacuteatoirement en fonctiondu nombre de carreacutes
Code pour reacutealiser la figure
Metacommunauteacute de BCIMC lt- MetaCommunity(asdataframe(t(BCI)))
Creacuteation dune meacuteta-communauteacute agrave partir de n carreacutes de BCISamplePlots lt- function (n q)
127 Normalisation 201
10
12
14
16
0 10 20 30Nombre de carreacutes
Div
ersi
teacute β
Fig 121 Estimation de ladiversiteacute 120573 entre carreacutes de BCI Ladiversiteacute est calculeacutee agrave partir dunombre de carreacutes en abscisse de 2agrave 30 tireacutes aleacuteatoirement La valeuren ordonneacutee est la diversiteacute drsquoordre2 moyenne sur 100 tirages lesbarres repreacutesentent lrsquoeacutecart-typeAux erreurs drsquoestimation pregraves etdegraves 5 carreacutes (neacutecessaires pourrepreacutesenter lrsquoensemble dudispositif) la valeur de la diversiteacute120573 ne deacutepend pas du nombre decarreacutes La ligne horizontalerepreacutesente la diversiteacute 120573 entre tousles carreacutes
Plots lt- sample(150 n)Nsi lt- MC$Nsi[ Plots] MCsample lt- MetaCommunity(Nsi)dp lt- DivPart(q MCsample Biased = FALSE) Retourne la diversiteacute betareturn(dp$TotalBetaDiversity)
Calcul de la diversiteacute moyenne agrave partir des simulationsBetaPlots lt- function (q nPlots nSimulations) buiw lt- b lt- vector(numeric length(nPlots)) i lt- 1for (Size in nPlots)
Sims lt- replicate(nSimulations SamplePlots(Size q))b[i] lt- mean(Sims)buiw[i] lt- sd(Sims)i lt- i+1
Retour dun dataframereturn(dataframe(x=nPlots y=b ymin=b-buiw ymax=b+buiw))
Echantillonnage de la diversiteacute betaBetaD lt- BetaPlots(q = 2 nPlots=c(2 5 10 15 20 25 30)
nSimulations = 100) Diversiteacute beta totaledpBCI lt- DivPart(q = 2 MC Biased = FALSE) Figureggplot(BetaD) +
geom_point(aes(x=x y=y)) +geom_errorbar(aes(x=x ymin=ymin ymax=ymax)) +geom_hline(yintercept = dpBCI$TotalBetaDiversity lty=2) +labs(x=Nombre de carreacutes
y=expression(paste(Diversiteacute beta)))
Lrsquoestimation de la diversiteacute preacutesente les difficulteacutes clas-siques dues au biais drsquoestimation la diversiteacute 120574 est sous-estimeacutee si lrsquoeacutechantillonnage est trop faible la diversiteacute 120573 aug-mente avec le nombre de communauteacutes comme la diversiteacute 120574augmente avec la taille de lrsquoeacutechantillon il srsquoagit drsquoun problegravemedrsquoestimation pas de normalisation
La diversiteacute 120573 ne doit donc pas ecirctre normaliseacutee systeacutemati-quement mais seulement dans le premier cas
202 Deacutecomposition de lrsquoentropie HCDT
47A Chao et al laquo A Two-StageProbabilistic Approach to Multiple-Community Similarity Indices raquo In Biometrics 644 (2008) p 1178-1186doi 101111j1541-0420200801010x
48Chao et al laquo Proposing a Reso-lution to Debates on Diversity Parti-tioning raquo cf note 25 p 165
Lrsquoindice de chevauchement 119862119902119873
Plutocirct qursquoune simple normalisation Chao et al47 deacutefi-nissent un indice de chevauchement crsquoest-agrave-dire la proportiondrsquoespegraveces partageacutees en moyenne par une communauteacute Si 119873communauteacutes (le nombre de communauteacutes est noteacute 119873 ici etnon 119868 pour conserver le nom de lrsquoindice eacutetabli dans la litteacutera-ture) de mecircmes diversiteacutes 120572 et 120574 que les donneacutees contenaientchacune 119878 espegraveces eacutequifreacutequentes dont 119860 seraient communesagrave toutes les communauteacutes et les autres repreacutesenteacutees dans uneseule 119860119878 serait cet indice de chevauchement
Pour 119902 ne 1
119862119902119873 = [( 1119902119863120573
)119902minus1
minus ( 1119873 )
119902minus1][1 minus ( 1
119873 )119902minus1
] (1217)
et
1198621119873 = 1ln 119873
119878sum119904=1
119873sum119894=1
119901119904|119894119873 ln (1 +
sum119895ne119894 119901119904119895119901119904|119894
) = 1 minus 119867120573ln 119873
(1218)119862119902119873 a eacuteteacute deacutefini agrave lrsquoorigine pour 119902 ge 2 Chao et al48
lrsquoeacutetendent sans preacutecaution agrave 119902 quelconque Sa valeur peut ecirctreneacutegative pour 119902 lt 1 on se limitera donc agrave 119902 ge 1
1Marcon et Heacuterault laquo Decompo-sing Phylodiversity raquo cf note 56p 130
Chapitre 13
Deacutecomposition de la diversiteacutephylogeacuteneacutetique et fonctionnelle
Lrsquoentropie phylogeacuteneacutetique et lrsquoentropie de Ricotta et Szeidl se deacutecom-posent comme lrsquoentropie HCDT La diversiteacute 120573 phylogeacuteneacutetique et la di-versiteacute 120573 de Leinster et Cobbold sont des nombres effectifs de commu-nauteacutes crsquoest-agrave-dire des communauteacutes de mecircme poids et dont les espegravecesseraient totalement dissimilaires qui fourniraient la mecircme entropie 120573 queles communauteacutes reacuteelles
Lrsquoessentiel
Lrsquoentropie phylogeacuteneacutetique est une combinaison lineacuteaire delrsquoentropie HCDT donc sa deacutecomposition est identique1
131 Deacutecomposition de la diversiteacutephylogeacuteneacutetique
En combinant lrsquoeacutequation (81) et le tableau 122 on obtient
119902120574 (119879 ) =119902 120572 (119879 ) +119902120573 (119879 ) (131)
Lrsquoentropie 120574 est celle de la meacuteta-communauteacute lrsquoentropie120572 est la somme pondeacutereacutee de celles des communauteacutes la pon-deacuteration est libre mais doit respecter 119901119904 = sum119894 119908119894119901119904|119894
119902120572 (119879 ) = sum119894
119908119894119902119894120572 (119879 ) (132)
Lrsquoentropie 120573 est
203
204 Deacutecomposition de la diversiteacute phylogeacuteneacutetique et fonctionnelle
2Allen et al laquo A New Phylo-genetic Diversity Measure Generali-zing the Shannon Index and Its Ap-plication to Phyllostomid Bats raquo cfnote 66 p 132
3M A Mouchet et D Mouillotlaquo Decomposing Phylogenetic Entropyinto and Components raquo In Bio-logy Letters 72 (2011) p 205-209doi 101098rsbl20100769
4Pavoine et al laquo lsquoEquivalentNumbersrsquo for Species Phylogeneticor Functional Diversity in a NestedHierarchy of Multiple Scales raquo cfnote 31 p 165
119902120573 (119879 ) = sum119894
119908119894119902119894120573 (119879 ) (133)
= sum119894
119908119894 sum119896
119879119896119879
119902
119894119896119867120573 (134)
= sum119894
119908119894 sum119896
119879119896119879 sum
119906119901119902
119896119906119894 ln119902119901119896119906119894119901119896119906
(135)
ougrave 119901119896119906 est la probabiliteacute drsquoobserver une des espegraveces dela branche 119906 de lrsquoarbre agrave la peacuteriode 119896 (figure 77) dans lameacuteta-communauteacute et 119901119896119906119894 la mecircme probabiliteacute dans la com-munauteacute 119894
La deacutecomposition de lrsquoentropie phylogeacuteneacutetique au sens deAllen et al2 crsquoest-agrave-dire dans la cas particulier 119902 = 1 a eacuteteacuteeacutetablie par Mouchet et Mouillot3
La fonction DivPart de entropart permet de deacutecomposerlrsquoentropie Les reacutesultats contiennent la valeur de la diversiteacute
data(Paracou618)summary(DivPart(q = 1 Paracou618MC Biased = FALSE
Tree = Paracou618Taxonomy))
HCDT diversity partitioning of order 1 of metaCommunity Paracou618MC with correction UnveilJ UnveilJ UnveilJ Phylogenetic or functional diversity was calculated according to the tree Paracou618Taxonomy Diversity is normalized Alpha diversity of communities P006 P018 3742057 5373643 Total alpha diversity of the communities [1] 436882 Beta diversity of the communities [1] 1273686 Gamma diversity of the metacommunity [1] 5564502
La figure 131 donne une repreacutesentation graphique de ladeacutecomposition de la diversiteacute La diffeacuterence de taille entre lesrectangles hachureacutes et les rectangles transparents est due agrave laprise en compte de la phylogeacutenie La diversiteacute 120574 (rectanglesde hauteur 1) est eacutegale au produit des diversiteacutes 120572 et 120573 (cocircteacutesdu rectangle plus haut) Si les communauteacutes eacutetaient de mecircmepoids et complegravetement diffeacuterentes crsquoest agrave dire contenant desespegraveces totalement dissimilaires entre communauteacutes4 la hau-teur du rectangle serait eacutegale agrave leur nombre (2 ici)
Code pour reacutealiser la figure
132 Partitionnement de la diversiteacute de Leinster et Cobbold 205
0 20 40 60 80 100 120 140
00
05
10
15
20
α γ diversity
β di
vers
ityFig 131 Repreacutesentationgraphique de la diversiteacute des deuxparcelles du jeu de donneacuteesParacou618 Les rectanglestransparents repreacutesentent ladiversiteacute neutre les rectangleshachureacutes la diversiteacutephylogeacuteneacutetique (lrsquoarbre est lataxonomie des espegraveces 119902 = 1)Dans chaque cas le rectangle leplus large de hauteur 1repreacutesente la diversiteacute119892119886119898119898119886 Le rectangle plus haut apour largeur et longueur lesdiversiteacutes 120572 et 120573 Les surfaces desdeux rectangles sont identiques
5Marcon et al laquo The Decompo-sition of Similarity-Based Diversityand Its Bias Correction raquo cf note 9p 145
6Ricotta et Szeidl laquo Towards aUnifying Approach to Diversity Mea-sures Bridging the Gap between theShannon Entropy and Raorsquos Quadra-tic Index raquo cf note 26 p 67
q lt- 1Neutre lt- DivPart(q Paracou618MC Biased = FALSE)plot(c(0 Neutre$GammaDiversity) c(0 Paracou618MC$Ncommunities)
type = nxlab = expression(paste(alpha gamma diversity))ylab = expression(paste(beta diversity)))
rect(0 0 Neutre$GammaDiversity 1 lty=2)rect(0 0 Neutre$TotalAlphaDiversity Neutre$TotalBetaDiversity
lty = 2)Phylo lt- DivPart(q Paracou618MC Biased = FALSE
Tree = Paracou618Taxonomy)rect(0 0 Phylo$GammaDiversity 1 angle=135 density=10)rect(0 0 Phylo$TotalAlphaDiversity Phylo$TotalBetaDiversity
density = 10)
132 Partitionnement de la diversiteacute deLeinster et Cobbold
Selon les mecircmes principes que pour la deacutecomposition delrsquoentropie HCDT Marcon et al5 ont deacutecomposeacute lrsquoentropie deRicotta et Szeidl6 Lrsquoentropie 120572 de la communauteacute 119894 est
119902119894119867Z
120572 =1 minus sum119904 119901119904|119894(Zp)119902minus1
119904|119894119902 minus 1 (136)
Lrsquoentropie 120572 est la somme pondeacutereacutee des entropies des com-munauteacutes
119902119867Z120572 = sum
119894119908119894
119902119894119867Z
120572 =1 minus sum119894 119908119894 sum119904 119901119904|119894(Zp)119902minus1
119904|119894119902 minus 1 (137)
Lrsquoentropie 120573 est similaire agrave lrsquoentropie 120573 HCDT crsquoest la di-vergence geacuteneacuteraliseacutee de Jensen-Shannon entre les distributionsde Zp des communauteacutes Formellement
206 Deacutecomposition de la diversiteacute phylogeacuteneacutetique et fonctionnelle
119902119867Z120573 = sum
119894119908119894 sum
119904119901119904|119894 (ln119902
1(Zp)119904
minus ln1199021
(Zp)119904|119894) (138)
La diversiteacute 120573 est obtenue en calculant lrsquoexponentielle deacute-formeacutee de la deacutecomposition additive de lrsquoentropie
119902119863Z120573 = 119890
119902119867Z1+(1minus119902) 119902119867Z120572119902 (139)
La deacutecomposition de la diversiteacute peut ecirctre faite directe-ment sans passer par lrsquoentropie
Lrsquoinverse de 119902119863Z120574 est la moyenne geacuteneacuteraliseacutee drsquoordre 119902 minus 1
de (Zp)119904
1119902119863Z120574
= [sum119904
119901119904(Zp)119904119902minus1]
1119902minus1
(1310)
Partant de 119902119863120574 = 119902119863120572119902119863120573 et de la deacutefinition de Routledge
de la diversiteacute 120572 on obtient
119902119863Z120573 = ⎡⎢
⎣sum
119894119908119894(
1119902119894119863Z
1205721119902119863Z120574
)119902minus1
⎤⎥⎦
1119902minus1
(1311)
De la mecircme faccedilon que 1119902119863Z120574 est la banaliteacute moyenne des
espegraveces 119902119863Z120573 est la banaliteacute moyenne normaliseacutee des commu-
nauteacutes ougrave la banaliteacute normaliseacutee de la communauteacute 119894 est deacutefi-nie comme (1119902
119894119863Z120572)(1119902119863Z
120574 ) crsquoest-agrave-dire la banaliteacute moyennede ses espegraveces diviseacutee par celle de la meacuteta-communauteacute
La fonction DivPart (comme les autres fonctions avanceacuteesde entropart) supporte la deacutecomposition de la diversiteacute deLeinster et Cobbold quand une matrice de similariteacute lui estpasseacutee comme argument agrave la place drsquoun arbre phylogeacuteneacutetiquepour le calcul de la phylodiversiteacute HCDT
Matrice de distances fonctionnellesDistanceMatrix lt- asmatrix(Paracou618dist) Transformation en matrice de similariteacuteZ lt- 1 - DistanceMatrixmax(DistanceMatrix) Partition de la diversiteacutesummary(DivPart(q = 1 Paracou618MC Z = Z Biased = FALSE))
Similarity-based diversity partitioning of order 1 of metaCommunity Paracou618MC with correction Best Phylogenetic or functional entropy was calculated according to the similarity matrix Z Alpha diversity of communities P006 P018
132 Partitionnement de la diversiteacute de Leinster et Cobbold 207
1483722 1482119 Total alpha diversity of the communities [1] 1483036 Beta diversity of the communities Best 1003403 Gamma diversity of the metacommunity Best 1488083
Le partitionnement de la diversiteacute fonctionnelle de la meacuteta-communauteacute Paracou618MC selon la matrice de distances destraits fonctionnels montre que la diversiteacute 120573 est extrecircmementfaible entre les deux parcelles
1Crist et al laquo Partitioning Spe-cies Diversity across Landscapes andRegions A Hierarchical Analysis ofAlpha Beta and Gamma Diversity raquocf note 43 p 199
2D Jones et N Matloff laquo Statis-tical Hypothesis Testing in Biology A Contradiction in Terms raquo In Jour-nal of Economic Entomology 795(1986) p 1156-1160 doi 101093jee7951156
3Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
Chapitre 14
Tests de significativiteacute
Les tests de significativiteacute permettent drsquoaffirmer que des communauteacutessont reacuteellement diffeacuterentieacutees En compleacutement les intervalles de confiancedes mesures de diversiteacute peuvent ecirctre calculeacutes sous lrsquohypothegravese drsquounedistribution multinomiale
Lrsquoessentiel
La diversiteacute 120573 calculeacutee entre plusieurs eacutechantillons succes-sifs drsquoune mecircme communauteacute nrsquoest pas nulle par simplefluctuation des effectifs due au hasard les distributions deseacutechantillons ne sont pas identiques Des tests statistiques onteacuteteacute deacuteveloppeacutes pour rejeter cette hypothegravese nulle agrave partir dedonneacutees drsquoinventaires
Ce chapitre ne traite pas de la diversiteacute de diffeacuterentiation les tests correspondants ont eacuteteacute preacutesenteacutes en section 116
141 Test de non-nulliteacuteLrsquoobjectif est de tester si deux communauteacutes ne sont pas
simplement deux eacutechantillons drsquoune mecircme communauteacute dontles diffeacuterences ne sont que des fluctuations dues au hasardSous lrsquohypothegravese nulle les observations 119902119904|119894 sont des reacutealisa-tions des mecircmes probabiliteacutes 119901119904 Il est possible1 mais contro-verseacute2 de tester la significativiteacute de la diffeacuterence entre commu-nauteacutes Une meilleure approche consiste agrave calculer lrsquointervallede confiance de la diversiteacute 120573 due agrave lrsquoincertitude sur les esti-mateurs de probabiliteacutes
Le test est reacutealiseacute de la faccedilon suivante 3
bull Les effectifs de chaque communauteacute 119894 sont tireacutes dans uneloi multinomiale ℳ(119899+119894 119899119904119894119899+119894) et 120573 est estimeacute
bull La simulation est reacutepeacuteteacutee un grand nombre de fois parexemple 10000 et les valeurs extrecircmes sont eacutelimineacuteesAu seuil de risque 120572 = 5 les 251e et 9750e valeurs
209
210 Tests de significativiteacute
4D Jones et Matloff laquo Statisti-cal Hypothesis Testing in Biology AContradiction in Terms raquo cf note 2p 209
5Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69
simuleacutees deacutefinissent les bornes de lrsquointervalle de confiancede lrsquohypothegravese nulle
Lrsquohypothegravese nulle est rejeteacutee si la valeur observeacutee de 120573nrsquoest pas dans cet intervalle en geacuteneacuteral au-delagrave de la bornesupeacuterieure Il peut arriver que les deux communauteacutes soientplus semblables que sous lrsquohypothegravese nulle crsquoest-agrave-dire que lesfreacutequences varient moins que dans le tirage drsquoune loi multino-miale si deux communauteacutes ont eacuteteacute creacuteeacutees artificiellement avecle mecircme nombre drsquoindividus de chaque espegravece par exemple
Lorsque les donneacutees sont issues de communauteacutes reacuteelles lesens mecircme de ce type de test est remis en question4 les com-munauteacutes reacuteelles ne pouvant pas ecirctre exactement identiques ilsuffit drsquoaugmenter la taille de lrsquoeacutechantillonnage pour prouverleur diffeacuterence
Intervalle de confianceLrsquointervalle de confiance de lrsquoestimateur de 119867120573
5 peut ecirctrecalculeacute en simulant les communauteacutes par des tirages dans deslois multinomiales suivant leurs freacutequences ℳ (119899+119894 119899119904119894119899+119894)
Si lrsquointervalle de confiance ne contient pas 0 lrsquoeacutegaliteacute desdistributions est rejeteacutee
Fig 141 Estimation de ladiversiteacute de la meacuteta-communauteacute
Paracou618
65 70 75 80
000
010
Alpha Diversity
Simulated Values
Den
sity
150 155 160 165
05
10
Beta Diversity
Simulated Values
Den
sity
100 110 120 130
000
006
Gamma Diversity
Simulated Values
Den
sity
010
010
Null DistributionTrue Estimate95 confidence interval
Calcul sous R la fonction DivEst produit un graphiqueavec lrsquointervalle de confiance (figure 141)
Code R
de lt- DivEst(q = 1 Paracou618MC Simulations = 1000)plot(de)
142 Analyse de la variabiliteacute 211
6Marcon et al laquo The Decompo-sition of Shannonrsquos Entropy and aConfidence Interval for Beta Diversi-ty raquo cf note 11 p 64
7Chao et Jost laquo Estimating Di-versity and Entropy Profiles via Dis-covery Rates of New Species raquo cfnote 63 p 74
8C Richard-Hansen et allaquo Landscape Patterns InfluenceCommunities of Medium- to Large-Bodied Vertebrate in UndisturbedTerra Firme Forests of FrenchGuiana raquo In Journal of TropicalEcology 315 (2015) p 423-436 doi 101017S0266467415000255
Par deacutefaut DivEst ne corrige pas les biais drsquoestimationLes reacutesultats sont preacutesenteacutes sous forme de diversiteacute et nondrsquoentropie la valeur attendue en cas drsquoeacutegaliteacute des communau-teacutes est 1
Correction des biaisLes simulations neacutecessaires aux tests creacuteent un biais drsquoesti-
mation les espegraveces les plus rares dans les communauteacutes sontsouvent eacutelimineacutees par les tirages La correction du biais destirages recentre leur distribution autour des valeurs originalesdes communauteacutes non deacutebiaiseacutees Il nrsquoexiste pas de correctionanalytique pour corriger successivement le biais ducirc aux simula-tions (ducirc agrave la perte des espegraveces rares des communauteacutes reacuteelles)puis celui ducirc agrave lrsquoeacutechantillonnage des communauteacutes elles-mecircmes(ducirc agrave la non-observation des espegraveces rares de la communauteacute)Marcon et al6 comme Chao et Jost7 effectuent la deuxiegravemecorrection par un recentrage de la distribution de 119867120573 simuleacuteeautour de sa valeur observeacutee deacutebiaiseacutee ce qui permet drsquoobtenirlrsquointervalle de confiance de lrsquoestimateur de 119867120573
142 Analyse de la variabiliteacuteOn se place maintenant dans un cadre un peu diffeacuterent
les communauteacutes sont elles-mecircmes obtenues par regroupementde placettes drsquoeacutechantillonnage Pour tester la significativiteacutede la diversiteacute 120573 entre communauteacutes lrsquoapproche pourrait ecirctrecelle de lrsquoanalyse de variance lrsquoentropie totale de la meacuteta-communauteacute est la somme des entropies des sites de lrsquoentro-pie 120573 entre sites des communauteacutes et de lrsquoentropie 120573 entrecommunauteacutes Lrsquoentropie 120573 inter-communauteacutes pourrait ecirctrecompareacutee agrave lrsquoentropie 120573 intra-communauteacutes en calculant unestatistique F Cette approche souffre de la deacutependance de lrsquoen-tropie 120573 agrave lrsquoentropie 120572 si une communauteacute est plus diverseque lrsquoautre son entropie 120573 sera forceacutement plus faible
Le test correct porte sur la diversiteacute plutocirct que sur lrsquoen-tropie8 La statistique de test est le ratio de la diversiteacute 120573inter-communauteacutes sur la la diversiteacute 120573 intra-communauteacutesSa valeur observeacutee est compareacutee agrave la distribution de sa valeursimuleacutee en redistribuant les placettes aleacuteatoirement dans lescommunauteacutes
1R Peacutelissier et P Couteronlaquo An Operational Additive Frame-work for Species Diversity Partitio-ning and Beta-Diversity Analysis raquoIn Journal of Ecology 952 (2007)p 294-300 doi 101111j1365-2745200701211x
2R Peacutelissier et al laquo Consistencybetween Ordination Techniques andDiversity Measurements Two Stra-tegies for Species Occurrence Data raquoIn Ecology 841 (2003) p 242-251 doi 1018900012- 9658(2003)084[0242 CBOTAD ] 2 0 CO 2 P Couteron et R Peacutelissier laquo Addi-tive Apportioning of Species Diversi-ty Towards More Sophisticated Mo-dels and Analyses raquo In Oikos 1071(2004) p 215-221 doi 101111j0030-1299200412766x
Chapitre 15
Autres approches
Des deacutefinitions diffeacuterentes de la diversiteacute 120573 ou du parti-tionnement de la diversiteacute sont preacutesenteacutees ici parce qursquoellessont importantes dans la litteacuterature mecircme si elles nrsquoentrentpas dans le cadre preacuteceacutedent
151 Le partitionnement de la diversiteacuteselon Peacutelissier et Couteron
CadreUn cadre geacuteneacuteral de partitionnement de la diversiteacute appli-
cable aux trois indices classiques est proposeacute par Peacutelissier etCouteron1 en conclusion drsquoune seacuterie drsquoarticles2
Les donneacutees sont deacutesagreacutegeacutees jusqursquoau niveau de lrsquoindividuSuivant les notations preacuteceacutedentes les placettes sont consideacute-reacutees comme le regroupement drsquoarbres indiceacutes par ℎ
Le tableau 151 est appeleacute tableau drsquooccurrence des espegravecesIl ne contient que des 0 et des 1 Chaque arbre (colonne) a uneseule valeur 1 dans la cellule correspondant agrave son espegravece
Un arbre moyen srsquoil pouvait exister appartiendrait partiel-lement agrave chaque espegravece proportionnellement agrave son effectif
Tab 151 Tableau drsquooccurrence des espegraveces
Forecirct 119896Parcelle 119895Placette 119894Arbre ℎ
hellip Total
Famille 119906 Genre 119905 Espegravece 119904 119899119904ℎ = 1 silrsquoarbre ℎappartient agravelrsquoespegravece 119904 0sinon 119899119904sdot =119899119904+119899
hellip hellip hellipTotal 119902+ℎ =
119901+ℎ = 11
213
214 Autres approches
Chaque arbre ℎ apporte une quantiteacute drsquoinformation eacutegale agravela somme sur toutes les espegraveces des eacutecarts quadratiques entrela valeur 119899119904ℎ indicatrice de son appartenance agrave lrsquoespegravece 119904 etla valeur 119899119904sdot correspondant agrave lrsquoarbre moyen sum119904 (119899119904ℎ minus 119899119904sdot)
2La somme peut ecirctre pondeacutereacutee pour donner une importanceplus ou moins grande des espegraveces selon leur freacutequence sum119904 119908119904 (119899119904ℎ minus 119899119904sdot)
2 La mesure totale sommeacutee sur tous lesarbres est noteacutee TSS
TSS = sum119904
119908119904 sumℎ
(119899119904ℎ minus 119899119904sdot)2 (151)
Si le poids 119908119904 vaut toujours 1 TSS119899 est lrsquoindice de Simp-son
Si 119908119904 = ln (1119899119904sdot)(1 minus 119899119904sdot) on obtient lrsquoindice de Shan-non et 119908119904 = 1119908119904sdot donne le nombre drsquoespegraveces moins 1
Deacutecomposition
Lrsquointeacuterecirct de la meacutethode est de permettre lrsquoutilisation demodegraveles lineacuteaires et des outils informatiques associeacutes classiquespour deacutecomposer la diversiteacute de diffeacuterentes maniegraveres Nousnous inteacuteresserons ici agrave la deacutecomposition de la diversiteacute totale120574 en diversiteacutes 120572 et 120573 Dans ce cadre la diversiteacute 120573 est la partieexpliqueacutee par le modegravele (les diffeacuterentes communauteacutes sont lesparamegravetres explicatifs) noteacutee MSS alors que la diversiteacute 120572est reacutesiduelle noteacutee RSS
La diversiteacute totale est TSS119899 La diversiteacute 120572 est calculeacuteede la mecircme maniegravere en prenant pour reacutefeacuterence la freacutequencedes espegraveces agrave lrsquointeacuterieur de chaque placette Dans la placette119894
RSS119894 = sum119904
119908119904 sumℎisinℐ
(119899119904ℎ minussumℎisinℐ 119899119904ℎ
119899 )2 (152)
La diversiteacute 120573 est calculeacutee de faccedilon similaire par la diffeacute-rence entre les freacutequences des espegraveces dans chaque placette(sumℎisinℐ 119899119904ℎ)119899 et leur freacutequence apregraves regroupement 119899119904sdot
Le problegraveme est que le poids attribueacute agrave chaque espegravece119908119904 deacutepend de la distribution totale des espegraveces RSS nrsquoestdonc pas une diversiteacute 120572 puisque sa valeur deacutepend de donneacuteesexteacuterieures agrave la placette
Le poids 119908119904 = 1 pour toutes les espegraveces regravegle le problegravemeLe modegravele est alors celui de la deacutecomposition de lrsquoindice deSimpson preacutesenteacute plus haut
152 Diversiteacute de Kosman 215
3E Kosman laquo Measuring Diver-sity From Individuals to Popula-tions raquo In European Journal ofPlant Pathology 1383 (2013) p 467-486 doi 101007s10658-013-0323-3
4E Kosman et K J Leonardlaquo Similarity Coefficients for Molecu-lar Markers in Studies of Genetic Re-lationships between Individuals forHaploid Diploid and Polyploid Spe-cies raquo In Molecular ecology 142(2005) p 415-24 doi 10 1111 j 1365 - 294X 2005 02416 x PMID 15660934
5E Kosman laquo Difference and Di-versity of Plant Pathogen Popula-tions A New Approach for Mea-suring raquo In Phytopathology 8611(1996) p 1152-1155 E Kosman etK J Leonard laquo Conceptual Analy-sis of Methods Applied to Assess-ment of Diversity within and Distancebetween Populations with Asexual orMixed Mode of Reproduction raquo In The New phytologist 1743 (2007)p 683-96 doi 101111j1469-8137200702031x PMID 17447922
6R Bellman et al AlgorithmsGraphs and Computers New York Academic Press Inc 1970
152 Diversiteacute de KosmanKosman3 nomme diversiteacute geacuteneacutetique la diversiteacute des indi-
vidus drsquoune population (non regroupeacutes par espegraveces) pour les-quels une mesure de dissimilariteacute a eacuteteacute choisie Les mesuresde dissimilariteacute acceptables4 sont par exemple les mecircmes quecelles utiliseacutees pour la diversiteacute 120573 des communauteacutes appliqueacuteesaux preacutesencesabsences de bandes de profils AFLP
La mesure de dissimilariteacute moyenne entre les individus no-teacutee 119860119863119882120588 pour Average Dissimilarity Within ougrave 120588 repreacutesentela dissimilariteacute choisie est simplement lrsquoentropie quadratiquede Rao Si la dissimilariteacute nrsquoest pas euclidienne la concaviteacutede 119860119863119882120588 nrsquoest pas garantie ce qui motive Kosman agrave proposerune autre mesure5 119870119882 120588 qui est la dissimilariteacute moyenne des119899 paires drsquoindividus les plus dissimilaires (au lieu de toutes les119899(119899 minus 1)2 paires) Les 119899 paires drsquoindividus sont construitesde faccedilon que chaque individu apparaisse une fois en tant quepremier et une fois en tant que second membre de la paire se-lon un algorithme non trivial6 Tous les individus contribuentdonc agrave la mesure de la diversiteacute
Pour un assemblage de 119868 populations la diversiteacute de Kos-man 119870119882 120588 de lrsquoassemblage des populations est toujours plusgrande que la moyenne des diversiteacutes intra-populations 119870119882 120588pondeacutereacutees par le poids des populations (crsquoest-agrave-dire la diver-siteacute 120572 selon la deacutefinition de Routledge) parce que 119870119882 120588 estconcave La diffeacuterence est la diversiteacute entre populations inter-preacutetable comme une diversiteacute 120573 selon la deacutefinition additive dela deacutecomposition
Pour obtenir une diversiteacute 120573 indeacutependante des diversiteacutes120572 et 120574 Kosman deacutefinit 119870119860119889 comme la moyenne des distancesentre les 119868 paires de populations assigneacutees selon le mecircme al-gorithme que preacuteceacutedemment La distance entre populations119889 est de preacutefeacuterence la distance de Kosman entre populations119870119861120588 la moyenne des 119899 paires drsquoindividus appartenant chacunagrave une population les plus dissimilaires (si la taille des popu-lations nrsquoest pas identique un eacutechantillon de la plus grandepopulation de la taille de la plus petite est tireacute aleacuteatoirementla valeur moyenne de la distance obtenue sur plusieurs tiragesest calculeacutee) La diversiteacute 120574 est la somme de la moyenne desdiversiteacutes intra-populations 119870119882 120588 pondeacutereacutees par le poids despopulations et de la diversiteacute inter-populations 119870119860119889 Ce nrsquoestpas la diversiteacute 119870119882 120588 de lrsquoassemblage des populations ce quilimite fortement lrsquointeacuterecirct de cette approche
Cinquiegraveme partie
Diversiteacute jointediversiteacute structurelle
217
1Gregorius laquo Linking Diversityand Differentiation raquo cf note 43p 70 Gregorius laquo Partitioning of Di-versity The rdquowithin CommunitiesrdquoComponent raquo cf note 24 p 66
2E Cutrini laquo Specialization andConcentration from a Twofold Geo-graphical Perspective Evidence fromEurope raquo In Regional Studies 443(2010) p 315-336 doi 10 1080 00343400802378743
3Chiu et al laquo Phylogenetic Be-ta Diversity Similarity and Differen-tiation Measures Based on Hill Num-bers raquo cf note 38 p 166
4G Bacaro et al laquo Using Shan-nonrsquos Recursivity to Summarize Fo-rest Structural Diversity raquo In Fo-rests Trees and Livelihoods 233(2014) p 211-216 doi 10 1080 147280282013844933
5J K Das et J Nautiyal laquo Fo-rest Variability Index A VectorQuantifying Forest Stand Diversityand Forest Compactness raquo In ForestPolicy and Economics 63-4 (2004)p 271-288 doi 10 1016 j forpol 200403003
Chapitre 16
Cadre
Gregorius1 argumente en faveur de la prise en compte dece qursquoil deacutefinit comme la laquo diversiteacute jointe raquo dans le cadreclassique ougrave les classes sont des communauteacutes pour des rai-sons fondamentales de deacutefinition de la diversiteacute Son approcheconsiste agrave traiter de faccedilon symeacutetrique lrsquoappartenance agrave uneclasse ou agrave une espegravece contrairement aux chapitres preacuteceacute-dents ougrave lrsquoeacutechantillonnage des individus avait lieu seacutepareacutementdans chaque communauteacute lrsquoeacutechantillonnage a lieu ici globa-lement dans la meacuteta-communauteacute et lrsquoappartenance drsquoun in-dividu agrave une communauteacute apporte autant drsquoinformation queson appartenance agrave une espegravece Cette approche convient bienagrave des questions de choix de localisation traiteacutes en eacuteconomie(voir par exemple la deacutefinition de la localisation globale2 quitraite de faccedilon symeacutetrique le secteur drsquoactiviteacute et la reacutegiondrsquoimplantation des firmes) Lrsquoentropie des lignes est alors ladiversiteacute de localisation des firmes son compleacutement agrave la va-leur maximale est une mesure de concentration spatiale (lrsquoin-dice de Theil pour 119902 = 1) En eacutecologie cette entropie permetpar exemple de caracteacuteriser le niveau de speacutecialisation drsquouneespegravece si les communauteacutes sont de mecircme taille (plus preacuteciseacute-ment de mecircme probabiliteacute de choix a priori) et situeacutees dansdes environnements diffeacuterents
La deacutecomposition de la diversiteacute jointe apporte en plus dela deacutecomposition de la diversiteacute 120574 une information sur lrsquoubi-quiteacute des espegraveces La deacutecomposition de Chiu et al3 se situeen reacutealiteacute dans ce cadre
La notion de diversiteacute structurelle a eacuteteacute deacutefinie par les fo-restiers4 En plus des espegraveces drsquoautres critegraveres (par exempleles classes de diamegravetres) sont pris en compte pour deacutefinir lastructure forestiegravere Une revue des approches utiliseacutees pourdeacutecrire cette structure et plus particuliegraverement sa complexi-teacute est fournie par Bacaro et al Certaines se sont attacheacuteesagrave deacutefinir une mesure de diversiteacute structurelle notammentDas et Nautiyal5 deacutefinissent un indice qui prend en compte la
219
220 Cadre
Tab 161 Notations des effectifs tableau espegraveces-classes
Classe 119894 hellip Total Communauteacute
Espegravece 119904 119899119904119894 nombredrsquoindividus delrsquoespegravece 119904 dans laclasse 119894119904|119894 = 119899119904119894119899+119894 estlrsquoestimateur de laprobabiliteacute 119901119904|119894qursquoun individu de laclasse 119894 soit delrsquoespegravece 119904
119899119904+ = sum119894 119899119904119894119901119904 = sum119894 119908119894119901119904|119894
hellipTotal 119899+119894 nombre
drsquoindividus de laclasse 119899+119894119899 = 119908119894 poids de la classe
119899 nombre totaldrsquoindividuseacutechantillonneacutes
variabiliteacute des diamegravetresBacaro et al suggegraverent drsquoutiliser lrsquoentropie de Shannon
pour mesurer la diversiteacute structurelle Cette ideacutee est exploreacuteeici pour deacutefinir une mesure de diversiteacute bidimensionnelle (croi-sant par exemple les espegraveces et les classes de diamegravetres) eteacutetendue agrave la diversiteacute HCDT
Pour la suite les donneacutees sont organiseacutees comme dans letableau 161 les individus appartiennent agrave lrsquoespegravece 119904 et agrave laclasse 119894 avec la probabiliteacute 119901119904119894 telle que sum119904 sum119894 119901119904119894 = 1 (aulieu de sum119894 119901119904|119894 = 1 dans les chapitres preacuteceacutedents)
1Bacaro et al laquo Using Shan-nonrsquos Recursivity to Summarize Fo-rest Structural Diversity raquo cf note 4p 219
2J C Baez et al laquo A Characte-rization of Entropy in Terms of In-formation Loss raquo In Entropy 1311(2011) p 1945-1957 doi 103390e13111945
3D K Faddeev laquo On theConcept of Entropy of a FiniteProbabilistic Scheme raquo In Rossiis-kaya Akademiya Nauk MoskovskoeMatematicheskoe ObshchestvoUspekhi Matematicheskikh Nauk167 (1956) p 227-231
Chapitre 17
Information mutuelle
La reacutecursiviteacute est une proprieacuteteacute importante de lrsquoentropie de Shannon quipermet drsquoenvisager la diversiteacute de faccedilon multidimensionnelle par exemplela diversiteacute des espegraveces et des classes de diamegravetre des arbres drsquoune forecirct(appeleacutee diversiteacute structurelle) La reacutecursiviteacute apporte des reacutesultats net-tement moins inteacuteressants quand lrsquoentropie HCDT est consideacutereacuteeLe nombre effectif drsquohabitats occupeacutes par une espegravece peut ecirctre interpreacuteteacutecomme la taille de sa niche eacutecologique la mesure de la diversiteacute descommunauteacutes peut apporter une information aussi inteacuteressante que ladiversiteacute des espegraveces
Lrsquoessentiel
Plusieurs mesures de diversiteacute ont eacuteteacute construite autourde lrsquoinformation mutuelle Elles sont preacutesenteacutees ici apregraves leurproprieacuteteacute matheacutematique fondamentale la reacutecursiviteacute de lrsquoen-tropie
171 Reacutecursiviteacute de lrsquoentropieEntropie de Shannon
Lrsquoentropie de Shannon (et ses multiples) sont les seulesfonctions 119867 telles que
119867 (119901119904119894) minus 119867 (119901119894) = sum119894
119901119894119867 (119901119904119894119901119894
) (171)
et
119867 (119901119904119894) minus 119867 (119901119904) = sum119904
119901119904119867 (119901119904119894119901119904
) (172)
Cette proprieacuteteacute est appeleacutee reacutecursiviteacute1 Le premier termede chaque eacutequation est la diffeacuterence entre lrsquoentropie de la dis-tribution complegravete (119901119904119894) crsquoest-agrave-dire la diversiteacute jointe de Gre-gorius qui sera appeleacutee plutocirct entropie jointe ici et celle de ladistribution marginale (lrsquoentropie de la distribution des classes
221
222 Information mutuelle
4J Aczeacutel et Z Daroacuteczy On Mea-sures of Information and Their Cha-racterizations New York AcademicPress 1975 p 234 Reacutenyi laquo On Mea-sures of Entropy and Information raquocf note 14 p 65 Bourguignon laquo De-composable Income Inequality Mea-sures raquo cf note 14 p 191
5Baez et al laquo A Characteriza-tion of Entropy in Terms of Informa-tion Loss raquo cf note 2 p 221
6H Suyari laquo Generalization ofShannon ndash Khinchin Axioms to theNonextensive Entropy raquo In IEEETransactions on Information Theo-ry 508 (2004) p 1783-1787 doi 101109TIT2004831749
7V M Ilić et al laquo Comments onrdquoGeneralization of Shannon-KhinchinAxioms to Nonextensive Systems andthe Uniqueness Theorem for the No-nextensive Entropyrdquo raquo In IEEETransactions on Information Theo-ry 5910 (2013) p 6950-6952 doi 101109TIT20132259958
ou celle des espegraveces) Une deacutemonstration rigoureuse est fourniepar Baez et al2 drsquoapregraves Faddeev3 mais il srsquoagit drsquoun reacutesultatassez reacutepandu dans la litteacuterature sous des formes diverses4119867(119901119904119894)minus119867(119901119894)minus119867(119901119904) est lrsquoinformation mutuelle vueen section 121
Le terme de droite de lrsquoeacutequation (171) est lrsquoentropie 120572 delrsquoensemble des classes si on les pondegravere par 119901119894 car 119901119904119894119901119894 = 119901119904|119894Par ailleurs 119867(119901119904) est lrsquoentropie 120574 En combinant les eacutequa-tions (171) et (172) on voit que lrsquoentropie 120573 est lrsquoopposeacutee delrsquoinformation mutuelle Lrsquoinformation mutuelle est nulle quandles distributions des lignes et des colonnes sont indeacutependantes(119901119904119894 = 119901119904119901119894) autrement dit quand les distributions marginales119901119904 et 119901119894 suffisent agrave deacutecrire la meacuteta-communauteacute lrsquoinfor-mation contenue par chaque communauteacute se limite agrave son poidsLrsquoeacutecart agrave lrsquoindeacutependance implique que les distributions de pro-babiliteacutes sont diffeacuterentes dans les communauteacutes ce qui deacutefinitla diversiteacute 120573
Si les colonnes sont les classes de diamegravetre par exempleles informations fournies par la deacutecomposition de la diversiteacutesont nombreuses
bull Les diversiteacutes des colonnes sont les classiques diversiteacutesspeacutecifiques par classe de diamegravetre (120572) globale (120574) etinter-classes (120573)
bull La diversiteacute des lignes renseigne sur lrsquohomogeacuteneacuteiteacute desdiamegravetres de chaque espegravece et globalement
bull La diversiteacute jointe est le nombre effectif de cateacutegories(espegraveces times classes de diamegravetre) de la communauteacute
Entropie HCDTBaez et al5 geacuteneacuteralisent la reacutecursiviteacute agrave lrsquoentropie HCDT
et montrent que
119902119867 (119901119904119894) minus 119902119867 (119901119894) = sum119894
119901119902119894
119902119867 (119901119904119894119901119894
) (173)
et
119902119867 (119901119904119894) minus 119902119867 (119901119904) = sum119904
119901119902119904
119902119867 (119901119904119894119901119904
) (174)
Ce reacutesultat avait deacutejagrave eacuteteacute obtenu par Suyari6 corrigeacute parIlić et al7 Par le mecircme raisonnement que pour lrsquoentropie deShannon on trouve donc que lrsquoentropie entre les classes estlrsquoopposeacutee de lrsquoinformation mutuelle calculeacutee dans le cadre delrsquoentropie HCDT agrave condition de deacutefinir les poids des classeseacutegaux agrave 119901119894 et lrsquoentropie intraclasse comme la somme des en-tropies des classes pondeacutereacutees par leur poids agrave la puissance 119902
172 Taille de niche 223
8J D Allan laquo Components ofDiversity raquo In Oecologia 184(1975) p 359-367 doi 10 1007 BF00345855 JSTOR 4215087
9R Levins Evolution in Chan-ging Environments Some Theoreti-cal Explorations Princeton Universi-ty Press 1968
10R K Colwell et D J Futuy-ma laquo On the Measurement of NicheBreadth and Overlap raquo In Ecology524 (1971) p 567-576 doi 1023071934144 JSTOR 1934144
11E C Pielou laquo Niche Width andNiche Overlap A Method for Measu-ring Them raquo In Ecology 534 (1972)p 687-692 doi 1023071934784
Inteacuterecirct de lrsquoinformation mutuelleSi les individus sont classeacutes dans une matrice selon deux
critegraveres et non dans un simple vecteur drsquoespegraveces lrsquoentropieHCDT de la distribution appeleacutee entropie jointe est calculeacuteepar 119902119867(119901119904119894)
Lrsquoentropie jointe peut ecirctre deacutecomposeacutee en la somme desentropies marginales et de lrsquoinformation mutuelle Lrsquoentropieintra-lignes (respectivement intra-colonnes) est deacutefinie commela moyenne pondeacutereacutee par le poids des lignes (resp des co-lonnes) agrave la puissance 119902 de lrsquoentropie de chaque ligne (respcolonne) Les lignes et les colonnes jouent un rocircle interchan-geable
119902119867intra = sum119894
119901119902119894
119902119867(119901119904119894) (175)
119902119867inter = minus [119902119867 (119901119904119894) minus119902119867 (119901119904) minus119902119867 (119901119894)] (176)
et119902119867marginale =119902 119867 (119901119904) (177)
Le rocircle symeacutetrique des lignes et des colonnes signifie que lataille des communauteacutes nrsquoest pas un choix arbitraire drsquoeacutechan-tillonnage la distribution des poids des communauteacutes est eacutequi-valente agrave celle des probabiliteacutes des espegraveces De la mecircme faccedilonque lrsquoordre de la diversiteacute 119902 donne plus ou moins drsquoimpor-tance aux espegraveces rares dans le calcul de la diversiteacute intra etmarginale il donne plus ou moins drsquoimportance aux commu-nauteacutes de petite taille dans le calcul des diversiteacutes intra etinter
Lrsquoentropie ne peut ecirctre transformeacutee en diversiteacute que pour119902 = 1 (diversiteacute de Shannon) Pour 119902 ne 1 lrsquoentropie intra-classes nrsquoest pas une entropie 120572 (elle nrsquoest pas eacutegale agrave lrsquoentropiede chacune des classes si toutes les classes sont identiques) lenombre effectif drsquoespegraveces correspondant nrsquoest pas deacutefini Lrsquoin-formation mutuelle de lrsquoentropie HCDT nrsquoa donc qursquoun inteacuterecirctlimiteacute pour mesurer la diversiteacute
172 Taille de nicheAllan8 preacutesente plusieurs deacutecompositions de lrsquoentropie
jointe (de Shannon) fondeacutees sur lrsquoinformation mutuelle dansune matrice en trois dimensions microhabitats times sites timesespegraveces
Apregraves Levins9 Colwell et Futuyma10 et Pielou11 Allansrsquointeacuteresse notamment agrave la taille de la niche (niche width) desespegraveces Si les classes de la matrice espegraveces-classes (Table 161)
224 Information mutuelle
12Pielou laquo Niche Width andNiche Overlap A Method forMeasuring Them raquo cf note 11p 223
13Levins Evolution in ChangingEnvironments Some TheoreticalExplorations cf note 9 p 223
14Colwell et Futuyma laquo On theMeasurement of Niche Breadth andOverlap raquo cf note 10 p 223
sont des habitats distincts les uns des autres la diversiteacute deshabitats occupeacutes par une espegravece est la taille de sa niche etla diversiteacute 120574 mesureacutee sur lrsquoensemble des habitats peut ecirctrecomprise comme le chevauchement des niches12 La taille de laniche peut ecirctre mesureacutee par lrsquoentropie de Shannon mais aussile nombre de Hill drsquoordre 2 qui est donc le nombre effectifdrsquohabitats de Simpson13
Cette approche est tregraves similaire agrave celle des eacuteconomistesqui utilisent lrsquoindice de Theil comme mesure de concentrationspatiale en inteacutegrant une signification eacutecologique si les locali-sations possibles correspondent agrave des habitats diffeacuterents uneespegravece preacutesente dans tous les habitats avec la mecircme probabi-liteacute est aussi geacuteneacuteraliste que possible
Colwell et Futuyma14 traitent le problegraveme poseacute par lefait que les habitats pris en compte dans lrsquoeacutechantillonnagene sont pas totalement distincts Si les habitats eacutetaient tousidentiques la distribution des espegraveces serait proportionnelleagrave la taille de chaque habitat et lrsquoinformation mutuelle seraitnulle Elle ne lrsquoest pas et sa valeur peut ecirctre deacutecomposeacutee ensomme des contributions de chaque habitat Ces contributionssont utiliseacutees pour pondeacuterer les habitats un habitat original(contribuant plus agrave lrsquoinformation mutuelle) a un poids plusgrand Pour revenir au cas simple dans lequel les habitats ontdes poids eacutegaux les colonnes de la matrice sont dupliqueacutees unnombre de fois proportionnel agrave leur poids suffisamment grandpour les proportions des nombres de colonnes (forceacutement en-tiers) soient identiques ou tregraves proches des poids
1H-R Gregorius laquo Distributionof Variation over Populations raquo In Theory in Biosciences 1283 (2009)p 179-89 doi 101007s12064-009-0064-1 Gregorius laquo Linking Diversi-ty and Differentiation raquo cf note 43p 70
2Gregorius laquo Partitioning of Di-versity The rdquowithin CommunitiesrdquoComponent raquo cf note 24 p 66
Chapitre 18
Deacutecomposition de la diversiteacute jointe
La diversiteacute jointe peut ecirctre deacutecomposeacutee en diversiteacute 120574 (elle-mecircme deacute-composable en diversiteacutes 120572 et 120573) et reacuteplication eacutegale au nombre effectifde reacutepeacutetitions de lrsquoassemblage des communauteacutes neacutecessaire pour obtenirla diversiteacute jointe reacuteelle
Lrsquoessentiel
La deacutecomposition de la diversiteacute jointe1 complegravete cellede la diversiteacute 120574 vue dans les parties preacuteceacutedentes On seplace dans le cadre drsquoun eacutechantillonnage global de la meacuteta-communauteacute dans lequel le poids de chaque communauteacute esteacutegal agrave la probabiliteacute qursquoun individu lui appartienne et nonun choix arbitraire
181 DeacutefinitionsLa diversiteacute 120573 mesure la divergence entre la distribution
moyenne des espegraveces dans les communauteacutes et leur distribu-tion dans la meacuteta-communauteacute Gregorius la qualifie de laquo di-versiteacute de reacutepartition raquo (apportionment)2 Lrsquoexemple suivantmesure la diversiteacute 120573 dans une meacuteta-communauteacute tregraves simple(figure 181)
q lt- 2df1 lt- dataframe(Co1 = c(10 20 30 10) Co2 = c(50 20 20
5) rownames = c(S1 S2 S3 S4))library(entropart)MC1 lt- MetaCommunity(df1)
Le code R neacutecessaire pour reacutealiser la figure est
plot(MC1)
summary(DivPart(q MC1) -gt dp1)
HCDT diversity partitioning of order 2 of metaCommunity MC1 Alpha diversity of communities
225
226 Deacutecomposition de la diversiteacute jointe
Fig 181 Meacuteta-communauteacutesimple
Co1 Co2 Metacommunity
Spe
cies
freq
uenc
ies
00
02
04
06
08
10
Co1 Co2 3266667 2714286 Total alpha diversity of the communities [1] 2964968 Beta diversity of the communities None 1182674 Gamma diversity of the metacommunity None 3506591
Reacutepliquer les communauteacutes agrave lrsquoidentique nrsquoa aucun effetsur la diversiteacute la diversiteacute 120572 est la moyenne des diversi-teacutes des communauteacutes et la diversiteacute 120574 est celle de leur assem-blage dont les proportions ne changent pas Lrsquoexemple suivantconcerne une meacuteta-communauteacute contenant les mecircmes commu-nauteacutes mais en double (figure 182)
df2 lt- cbind(df1 df1)MC2 lt- MetaCommunity(df2)
Fig 182 Meacuteta-communauteacutedoublant les communauteacutes de la
preacuteceacutedente
Co1 Co2 Co11 Metacommunity
Spe
cies
freq
uenc
ies
00
02
04
06
08
10
Le code R neacutecessaire pour reacutealiser la figure est
181 Deacutefinitions 227
plot(MC2)
summary(DivPart(q MC2) -gt dp2)
HCDT diversity partitioning of order 2 of metaCommunity MC2 Alpha diversity of communities Co1 Co2 Co11 Co21 3266667 2714286 3266667 2714286 Total alpha diversity of the communities [1] 2964968 Beta diversity of the communities None 1182674 Gamma diversity of the metacommunity None 3506591
La diversiteacute jointe 119902119863119895 = 119902119863(119901119904119894) est en revanche dou-bleacutee au cours de lrsquoopeacuteration elle mesure le nombre effectif decateacutegories (combinaison de lrsquoespegravece et de la communauteacute) dutableau de donneacutees Meacuteta-communauteacute simpleDiversity(asProbaVector(df1) q)
None 5642487
Meacuteta-communauteacute doubleDiversity(asProbaVector(df2) q)
None 1128497
La distribution de reacutefeacuterence pour deacutefinir ce nombre effectifcorrespond agrave lrsquoeacutequitabiliteacute maximale 119878 espegraveces eacutequiprobablessont reacuteparties dans 119868 communauteacutes eacutequiprobables Le nombreeffectif est alors 119878119868 Si nombre effectif drsquoespegraveces est eacutegal agrave ladiversiteacute 120574 le rapport entre la diversiteacute jointe et la diversi-teacute 120574 noteacute 119902119877119888 est le nombre effectif de meacuteta-communauteacutesidentiques produisant la diversiteacute jointe observeacutee Il mesurela reacuteplication des communauteacutes et complegravete la diversiteacute 120574 enfournissant un niveau drsquoinformation suppleacutementaire Grego-rius le qualifie de laquo diversiteacute de diffeacuterenciation raquo (differentia-tion) parce que 119902119877119888 compare la distribution reacuteelle agrave une dis-tribution de reacutefeacuterence et pas seulement les distributions descommunauteacutes entre elles En reacutesumeacute
bull Le nombre effectif drsquoespegraveces 119902119894119863 de la communauteacute i
est le nombre drsquoespegraveces eacutequifreacutequentes neacutecessaires pourobtenir la diversiteacute observeacutee dans la communauteacute Ladiversiteacute 120572 est le nombre drsquoespegraveces eacutequifreacutequentes neacuteces-saires dans chaque communauteacute pour obtenir la diversiteacuteobserveacutee
228 Deacutecomposition de la diversiteacute jointe
bull La diversiteacute 120573 est le nombre de communauteacutes totalementdistinctes (chaque espegravece nrsquoest preacutesente que dans uneseule communauteacute) de mecircme poids et de mecircme diversi-teacute (cette diversiteacute eacutetant eacutegale agrave la diversiteacute 120572) eacutegal aurapport entre la diversiteacute 120574 et la diversiteacute 120572
bull La diversiteacute 120574 est le nombre effectif drsquoespegraveces de lrsquoassem-blage des communauteacutes
bull La reacuteplication des communauteacutes est le nombreeffectif drsquoassemblages identiques constituant la meacuteta-communauteacute
La deacutecomposition complegravete de la diversiteacute jointe srsquoeacutecrit
119902119863119895 =119902 119863120572 times119902119863120573 times119902119877119888 (181)
La meacuteta-communauteacute suivante illustre cette deacutecomposi-tion elle contient 119877119888 = 3 reacutepliques identiques de 119863120573 =2 communauteacutes eacutequiprobables totalement distinctes compre-nant chacune 119863120572 = 2 espegraveces eacutequiprobables (figure 183) Sadiversiteacute jointe est 12 (le nombre de cellules non nulles dansla matrice)
q lt- 2 Peu importe qdf1 lt- dataframe(Co1 = c(10 10 0 0) Co2 = c(0 0 10 10)
rownames = c(S1 S2 S3 S4))df3 lt- cbind(df1 df1 df1)MC lt- MetaCommunity(df3)
Fig 183 Meacuteta-communauteacuteillustrant la deacutecomposition
complegravete de la diversiteacute jointe
Co1 Co11 Co12 Metacommunity
Spe
cies
freq
uenc
ies
00
02
04
06
08
10
Le code R neacutecessaire pour reacutealiser la figure est
plot(MC)
summary(DivPart(q MC) -gt dp)
HCDT diversity partitioning of order 2 of metaCommunity MC Alpha diversity of communities
182 Relations avec drsquoautres mesures de diversiteacute 229
3Chiu et al laquo Phylogenetic Be-ta Diversity Similarity and Differen-tiation Measures Based on Hill Num-bers raquo cf note 38 p 166
Co1 Co2 Co11 Co21 Co12 Co22 2 2 2 2 2 2 Total alpha diversity of the communities [1] 2 Beta diversity of the communities None 2 Gamma diversity of the metacommunity None 4
(Diversity(asProbaVector(df3) q) -gt Djointe)
None 12
(Dis lt- Djointedp$GammaDiversity)
None 3
La deacutefinition de la diversiteacute 120572 de Chiu et al3 eacutequation(106) est la diversiteacute jointe normaliseacutee par le nombre de com-munauteacutes
119902119863120572 = 1119868 (sum
119904sum
119894(119908119894119901119904|119894)
119902)1(1minus119902)
= 1119868
119902119863119895 (182)
182 Relations avec drsquoautres mesures dediversiteacute
En introduisant la deacutefinition preacuteceacutedente dans la deacutecompo-sition de la diversiteacute jointe eacutequation (181) il vient
119902119863120573 =119902119863120574119902119863120572
= 119868119902119877119888
(183)
La deacutefinition de la diversiteacute 120572 de Chiu et al implique quela diversiteacute 120573 soit le rapport entre le nombre de communauteacuteset leur reacuteplication Ce nrsquoest pas une mesure de diversiteacute 120573 dereacutepartition
En inversant le rocircle des lignes et des colonnes de la matrice119901119904119894 on peut calculer la reacuteplication des espegraveces en divisantla diversiteacute jointe par la diversiteacute des poids des communauteacutes
119902119877119904 =119902119863119895
119902119863 (119901119894) (184)
Gregorius montre que 119902119877119904 eacutegale la diversiteacute 120572 selon Jost(104)
230 Deacutecomposition de la diversiteacute jointe
119902119877119904 = (sum119904
sum119894
119901119902119894
sum119894 119901119902119894119901119902
119904|119894)1(1minus119902)
(185)
Sixiegraveme partie
Diversiteacute spatialementexplicite
231
1E F Menhinick laquo A Compari-son of Some Species-Individuals Di-versity Indices Applied to Samplesof Field Insects raquo In Ecology 454(1964) p 859-861 doi 10 2307 1934933
2R Margalef laquo Temporal Suc-cession and Spatial Heterogeneity inPhytoplankton raquo In Perspectives inMarine Biology Sous la dir drsquoABuzzati-Traverso Berkeley Califor-nia University of California Press1958 p 323-349
3H A Gleason laquo On the Rela-tion between Species and Area raquo In Ecology 32 (1922) p 158-162 doi 1023071929150
4A E Magurran MeasuringBiological Diversity Oxford Black-well Publishing 2004 p 77
5Fisher et al laquo The Relationbetween the Number of Species andthe Number of Individuals in a Ran-dom Sample of an Animal Popula-tion raquo cf note 23 p 16
6Hubbell The Unified NeutralTheory of Biodiversity and Biogeo-graphy cf note 27 p 16
Chapitre 19
Cadre
De faccedilon eacutevidente la richesse augmente avec la surfaceou le nombre drsquoindividus pris en compte Cette constatationpeut ecirctre interpreacuteteacutee de deux faccedilons diffeacuterentes lrsquoaugmen-tation progressive de lrsquoeffort drsquoeacutechantillonnage permet drsquoat-teindre une asymptote quand la diversiteacute est complegravetementinventorieacutee ou au contraire lrsquoaugmentation de la diversiteacuteavec la surface prise en compte est une proprieacuteteacute intrinsegravequeet aucune asymptote nrsquoexiste
Dans une communauteacute de taille deacutefinie avec une distri-bution des espegraveces et un nombre drsquoindividus deacutefinis mecircmesrsquoils sont inconnus lrsquoaugmentation de lrsquoeacutechantillonnage per-met lrsquoaccumulation de la deacutecouverte de nouvelles espegraveces jus-qursquoagrave une asymptote Lrsquoaccumulation de la diversiteacute locale deacute-crite par une courbe drsquoaccumulation (SAC) est preacutesenteacutee auchapitre 21
Il est tentant dans ce cadre de chercher un indicateur dela richesse indeacutependant de la surface ou du nombre drsquoindivi-dus Lrsquoapproche la plus simple consiste agrave normaliser le nombredrsquoespegraveces observeacutees Menhinick1 a proposeacute lrsquoindice 119878119899radic119899 agravepeu pregraves constant dans des communauteacutes drsquoinsectes Lrsquoindicede Margalef2 est 119878119899 minus 1ln 119899 adapteacute agrave une communauteacute deplancton Les deux supposent implicitement une forme de lacourbe drsquoaccumulation des espegraveces dans le premier cas pro-portionnelle agrave la racine du nombre drsquoindividus dans le secondagrave son logarithme (comme dans la relation de Gleason3 page222) Aucune de ces normalisations ne fonctionne en geacuteneacuteral4Lrsquoindice de Fisher5 construit agrave partir drsquoun modegravele explicite dedistribution des probabiliteacutes des espegraveces a nettement plus desuccegraves Il est preacutesenteacute au chapitre suivant Son problegraveme estqursquoil est souvent utiliseacute pour deacutecrire la diversiteacute locale commesrsquoil permettait de normaliser lrsquoeffort drsquoeacutechantillonnage alorsque sa validiteacute est plutocirct agrave lrsquoeacutechelle reacutegionale6
A cette eacutechelle plusieurs communauteacutes sont prises encompte simultaneacutement Il est possible de rechercher une nou-
233
234 Cadre
7Ter Steege et al laquo Hyperdomi-nance in the Amazonian Tree Flora raquocf note 62 p 47
8F W Preston laquo Time andSpace and the Variation of Species raquoIn Ecology 414 (1960) p 611-627doi 1023071931793
9Hubbell The Unified NeutralTheory of Biodiversity and Biogeo-graphy cf note 27 p 16
velle asymptote atteinte quand toutes les communauteacutes sontincluses (par exemple la totaliteacute de la forecirct amazonienne7)ou de raisonner en termes de relation aire-espegraveces sansrechercher une richesse totale hypotheacutetique8 Lagrave encore 120572de Fisher est ambigu puisqursquoil peut provenir agrave la fois drsquouneinfiniteacute drsquoespegraveces dans son modegravele original ou ecirctre compriscomme le nombre fondamental de la theacuteorie neutre eacutegal agravedeux fois le taux de speacuteciation fois le nombre total drsquoespegraveces(fini) de la meacuteta-communauteacute9
Enfin la diversiteacute 120573 spatialement explicite est introduiteau chapitre 23
1Fisher et al laquo The Relationbetween the Number of Species andthe Number of Individuals in a Ran-dom Sample of an Animal Popula-tion raquo cf note 23 p 16
2Hubbell The Unified NeutralTheory of Biodiversity and Biogeo-graphy cf note 27 p 16
Chapitre 20
Indice 120572 de Fisher
LrsquoIndice 120572 de Fisher est la pente de la relation lineacuteaire entre le nombredrsquoespegraveces observeacutees et le logarithme du nombre drsquoindividus inventorieacutesCette relation correspond agrave une distribution drsquoabondance des espegraveces enlog-seacuteries valide agrave lrsquoeacutechelle de la meacuteta-communauteacute Son utilisation agravelrsquoeacutechelle locale est discutable
Lrsquoessentiel
Le modegravele de Fisher1 aboutissant agrave la SAD en log-seacuteriesa marqueacute lrsquohistoire de lrsquoeacutecologie Il lie le nombre drsquoespegraveces aulogarithme du nombre drsquoindividus de faccedilon lineacuteaire degraves quelrsquoeffectif est suffisant la pente de la droite est le bien connuindice 120572 tombeacute en deacutesueacutetude pendant quelques deacutecennies maisremis en vedette par la theacuteorie neutre de Hubbell2 Il est utiliseacuteagrave lrsquoeacutechelle locale (probablement agrave tort) et agrave lrsquoeacutechelle reacutegionalecrsquoest pourquoi il est preacutesenteacute en premier
201 ConstructionLe nombre drsquoespegraveces eacutechantillonneacutees deacutepend de lrsquoeffort
drsquoeacutechantillonnageFisher a relieacute le nombre drsquoespegraveces 119878119899 au nombre drsquoindivi-
dus 119899 eacutechantillonneacutes agrave partir du modegravele suivant
bull Le nombre drsquoindividus 119873 de lrsquoeacutechantillon suit une loi dePoisson de paramegravetre 120582 par hypothegravese la surface estfixeacutee eacutegale agrave 1 et les individus sont distribueacutes totale-ment aleacuteatoirement (avec la mecircme probabiliteacute partoutet indeacutependamment les uns des autres)
bull Eacutetant donneacute la taille de lrsquoeacutechantillon 119873 et la probabili-teacute 119901119904 drsquoeacutechantillonner lrsquoespegravece 119904 lrsquoespeacuterance du nombredrsquoindividus eacutechantillonneacutes dans lrsquoespegravece 119904 est 119873119901119904
bull Le nombre drsquoindividus reacuteellement observeacute fluctue aleacutea-toirement Il suit une loi de Poisson drsquoespeacuterance 120582119904 ougrave120582119904 = 120582119901119904
235
236 Indice 120572 de Fisher
3M Greenwood et G U Yulelaquo An Inquiry into the Nature of Fre-quency Distributions Representativeof Multiple Happenings with Parti-cular Reference to the Occurrence ofMultiple Attacks of Disease or of Re-peated Accidents raquo In Journal of theRoyal Statistical Society 832 (1920)p 255-279 doi 1023072341080
bull La probabiliteacute drsquoobserver 120584 individus de lrsquoespegravece 119904 estnoteacutee 120587119904120584
bull La distribution de 120582119904 retenue par Fisher est une loi gam-ma de paramegravetres 119896 et 119901 choisie pour ses proprieacuteteacutesmatheacutematiques qui impliquent que 120587119904120584 suit une loi bi-nomiale neacutegative de paramegravetres 119896 et 1(119901 + 1)
bull Lrsquoespeacuterance du nombre drsquoespegraveces observeacutees 120584 fois estsum119904 120587119904120584
bull Le paramegravetre 119896 = 0 deacutecrit bien les donneacutees de Fisheret permet de calculer lrsquoespeacuterance du nombre drsquoespegravecesdans un eacutechantillon de taille 119899
Le raisonnement est deacutetailleacute ici La loi gamma a deux pa-ramegravetres positifs noteacutes 119896 et 119901 par Fisher le premier fixe saforme le second lrsquoeacutechelle Les valeurs de forme infeacuterieures agrave 1donnent une distribution deacutecroissante preacutesenteacutee sur la figure201 La distribution obtenue est celle de 120582119904 lrsquoespeacuterance dunombre drsquoindividus de lrsquoespegravece 119904 Le paramegravetre de drsquoeacutechellepermet drsquoajuster les nombres drsquoindividus agrave la taille de lrsquoeacutechan-tillon Il est forceacutement tregraves supeacuterieur agrave 1 Plus le paramegravetre deforme 119896 est proche de 0 plus la deacutecroissance des probabiliteacutesest rapide
Fig 201 Densiteacute de probabiliteacutedrsquoune loi gamma de paramegravetres
0 2 et 100 Seules les valeursinfeacuterieures agrave 50 sont afficheacutees
00
01
02
03
0 10 20 30 40 50λs
Den
siteacute
de
prob
ablit
eacute
Le code R neacutecessaire pour reacutealiser la figure est
library(GoFKernel)k lt- 02p lt- 100d lt- densityreflected(rgamma(10000 shape = k scale = p) lower = 0)ggplot(dataframe(d$x d$y) aes(dx dy)) +
geom_line() +xlim(0 50) +labs(x = expression(lambda[s]) y = Densiteacute de probabliteacute)
Les effectifs de la communauteacute sont un meacutelange de lois dePoisson de paramegravetres aleacuteatoires suivant tous la mecircme loi gam-ma La distribution des probabiliteacutes qui en reacutesulte est une loi
201 Construction 237
4Izsaacutek et Pavoine laquo Links bet-ween the Species Abundance Distri-bution and the Shape of the Cor-responding Rank Abundance Curve raquocf note 20 p 15
binomiale neacutegative3 La probabiliteacute qursquoune espegravece soit repreacute-senteacutee par 120584 individus noteacutee 120587119904120584 suit donc une loi binomialeneacutegative de paramegravetres 119896 et 1119901 + 1 repreacutesenteacutee sur la figure202
00
01
02
03
04
0 10 20 30 40 50Abondance ν
Pro
babi
liteacute
Fig 202 Reacutealisation drsquoune loigamma de paramegravetres 0 2 et 100Lrsquohistogramme repreacutesente laproportion (qui estime laprobabiliteacute) des valeurs infeacuterieuresagrave 50 Les espegraveces drsquoabondancenulle ne sont pas observeacutees danslrsquoeacutechantillon
Le code R neacutecessaire pour reacutealiser la figure est
nbin lt- rnbinom(10000 size = k prob = 1(p+1))ggplot(dataframe(nbin) aes(x = nbin y = prop)) +
geom_bar(width = 1 color = black fill = white) +xlim(-05 50) +labs(x = expression(paste(Abondance nu)) y = Probabiliteacute)
On notera que la distribution de 120587119904120584 deacutecrit pour une es-pegravece la probabiliteacute drsquoecirctre repreacutesenteacutee par 120584 individus Ce nrsquoestpas la distribution des probabiliteacutes 119901119904 qui donnent la probabi-liteacute qursquoun individu appartienne agrave lrsquoespegravece 119904 Une courbe repreacute-sentant les valeurs de 120587119904120584 en fonction de leur rang nrsquoest doncpas un diagramme rang-abondance mais un laquo pseudo-RAC raquo4
La variance de la loi binomiale neacutegative varie en sens in-verse du paramegravetre 119896 En appliquant son modegravele agrave des don-neacutees Fisher remarque que 119896 rarr 0 ce qui correspond agrave unedistribution comprenant de nombreuses espegraveces de freacutequencestregraves variables donc un pseudo-RAC deacutecroissant rapidementet retient cette proprieacuteteacute pour la suite de son raisonnementLa valeur nulle de 119896 simplifie les calculs et permet de calculerpour une valeur arbitraire de 120584 la somme sur toutes les espegravecesdes valeurs de 120587119904120584 Dans ce cas lrsquoespeacuterance du nombre drsquoes-pegraveces repreacutesenteacutees par 120584 individus est en posant 119909 = 119901(119901+1)et 120572 une constante
120124 (119878119899120584 ) = 120572
120584 119909120584 (201)
Lrsquoespeacuterance du nombre drsquoespegraveces en est la somme pour
238 Indice 120572 de Fisher
5D Alonso et A J McKanelaquo Sampling Hubbellrsquos Neutral Theoryof Biodiversity raquo In Ecology Letters710 (2004) p 901-910 doi 101111j1461-0248200400640x
6R K S Hankin laquo IntroducingUntb an r Package for SimulatingEcological Drift under the UnifiedNeutral Theory of Biodiversity raquo In Journal of Statistical Software 2212(2007) p 1-15 doi 10 18637jss v022i12
7Hubbell The Unified NeutralTheory of Biodiversity and Biogeo-graphy cf note 27 p 16 page 122
toutes les valeurs de 120584
120124 (119878119899) =infin
sum120584=1
120124 (119878119899120584 ) = minus120572 ln(1 minus 119909) (202)
Le nombre drsquoespegraveces est obtenu par la somme du deacutevelop-pement en seacuterie entiegravere du logarithme de 1 minus 119909 drsquoougrave le nomde log-seacuterie
De mecircme le nombre total drsquoindividus est
119899 =infin
sum120584=1
120584120124 (119878119899120584 ) =
infinsum120584=1
120572119909120584 = 1205721199091 minus 119909 (203)
La combinaison des deux eacutequations permet drsquoeacuteliminer 119909 etdrsquoobtenir lrsquoespeacuterance du nombre drsquoespegraveces observeacutees en fonc-tion de la taille de lrsquoeacutechantillon
120124 (119878119899) = 120572 ln (1 + 119899120572) (204)
120572 est un indicateur de la biodiversiteacute qui peut ecirctre inter-preacuteteacute comme le nombre drsquoespegraveces nouvelles deacutecouvertes quandle nombre drsquoindividus eacutechantillonneacutes est multiplieacute par 119890 crsquoesten effet la pente de la courbe de 119878119899 en fonction de ln 119899 quise stabilise agrave partir drsquoune valeur de 119899 suffisante Crsquoest aussile nombre de singletons attendus dans lrsquoeacutechantillon de taille 119899comme le montre lrsquoeacutequation (201) sachant que 119909 asymp 1
120572 est aussi eacutegal agrave 120579 le nombre fondamental de la biodi-versiteacute de Hubbell quand le nombre drsquoespegraveces est grand 5 laSAD de la meacuteta-communauteacute (pas celle de la communauteacutelocale si la dispersion est limiteacutee) du modegravele neutre est enlog-seacuteries 120572 est le produit du nombre total drsquoindividus de lameacuteta-communauteacute noteacute classiquement 119869119898 et du taux de speacute-ciation individuel noteacute 120584 119909 est le rapport entre les taux denaissance 119887 et de mortaliteacute 119889 dans la meacuteta-communauteacute tregravesleacutegegraverement infeacuterieur agrave 1 parce que les espegraveces existantes sontappeleacutees agrave disparaicirctre par deacuterive et remplaceacutees par les nou-velles espegraveces (119887 + 120584)119889 = 1
Dans R les fonctions fisheralpha de la librairie veganet fishersalpha de la librairie untb6 effectuent une reacutesolu-tion numeacuterique de lrsquoeacutequation (204) pour estimer 120572 La fonc-tion optimaltheta dans untb eacutevalue la valeur de 120579 par lameacutethode du maximum de vraisemblance7 en utilisant toutelrsquoinformation de la distribution Le reacutesultat est tregraves diffeacuterentparce que lrsquoapproximation de lrsquoeacutegaliteacute de 120572 et 120579 ne tient pasdans ce cas
library(vegan)data(BCI) Ns est un vecteur contenant les effectifs de chaque espegravece
202 Variantes 239
8Ibid9Engen laquo Exponential and Lo-
garithmic Species-Area Curves raquo cfnote 20 p 92
10B G Bordenave et J-J DeGranville laquo Les Mesures de La Bio-diversiteacute Un Outil de Conserva-tion En Forecirct Guyanaise raquo In JAT-BA Revue drsquoEthnobiologie 401-2(1998) p 433-446 B G Bordenaveet al laquo Quantitative Botanical Di-versity Descriptors to Set Conserva-tion Priorities in Bakhuis MountainsRainforest Suriname raquo In Botani-cal Journal of the Linnean Society1671 (2011) p 94-130 doi 101111j1095-8339201101163x
11R P O Schulte et al laquo A NewFamily of Fisher-Curves EstimatesFisherrsquos Alpha More Accurately raquo In Journal of Theoretical Biology 2323(2005) p 305-313 doi 101016jjtbi200408014
Ns lt- colSums(BCI)fisheralpha(Ns)
[1] 3505475
library(untb)
Registered S3 method overwritten by untb method from plotpreston vegan
Attaching package untb
The following objects are masked from packagedplyr count select
fishersalpha(sum(Ns) length(Ns))
[1] 3505477
optimaltheta(Ns)
[1] 8095173
Le modegravele de Fisher (204) peut ecirctre eacutecrit sous la forme119878119899 = 120572ln (120572 + 119899)minus120572 ln (120572) Pour 119899 assez grand et sous lrsquohypo-
thegravese de saturation de Hubbell8 119860 est proportionnel agrave 120572 + 119899et le modegravele de Fisher est eacutequivalent au modegravele de Gleason9
Bordenave10 propose un indice de richesse speacutecifique (IRSou SDI Species Diversity Index) eacutegal agrave la pente de la relationde Gleason Dans le cadre de lrsquoapproximation preacuteceacutedente ilest eacutegal agrave 120572
202 VariantesSchulte et al11 ont eacutetendu le modegravele de Fisher pour
prendre en compte un nombre drsquoespegraveces fini 119878 et une distri-bution non indeacutependante des individus prise en compte parun paramegravetre drsquoagreacutegation spatiale 119888 valable pour toutes lesespegraveces
119878119899 = 120572119888 ln ( 1 + 119899119888 119902
1 + 119899119888 119902 119890minus119888119878120572 ) (205)
ougrave
119902 = 119890119888120572 minus 11 minus 119890119888(1minus119878)120572 (206)
240 Indice 120572 de Fisher
Fig 203 Courbes nombredrsquoindividus-espegraveces-simuleacutees pour
illustrer lrsquoimportance desparamegravetres 119888 (concentration
spatiale) et 119878max (nombre totaldrsquoespegraveces 119878 dans nos notations)dans le modegravele de Fisher 120572 est
fixeacute agrave 100 pour toutes les courbes(a) et (b) la concentration
spatiale (119888 lt 1) changedrastiquement le nombre drsquoespegravecesattendu En pratique seuls 119878 et 119873(119904119899
ne0 et 119899 dans nos notations) sontobserveacutes Si 119888 est supposeacute eacutegal agrave 1par erreur 120572 est sous-estimeacute (a)et (c) le nombre drsquoespegraveces nrsquoest
eacutevidemment pas infini ce quichange fortement la forme de la
courbe Si le nombredrsquoobservations est grand 120572 sera
aussi tregraves sous-estimeacute
Note that for c frac14 1 (no clustering) Eq (5) can befurther reduced to
S frac14 a lneth1thorn N ethe1=a 1THORNTHORN (6)
The term e1=a can be written as the following infiniteseries
e1=a frac14 1thorn1
athorn
1
a2 2thorn
1
a3 3thorn
1
a4 4thorn (7)
For a410 this series is progressively approached byits first two terms
e1=a a410
1thorn1
a(8)
and therefore Eq (6) too ultimately returns to theoriginal Fisher curve In practice for a410 Eq (6) isindistinguishable from the original Fisher curve withthis (academic) difference that Eq (6) always exactlyincludes both the points S frac14 0 for N frac14 0 and S frac14 1 for
N frac14 1 whereas the latter point is only approximated byFisherrsquos original curve
42 Model dynamics
Fig 4a presents the SndashN curves generated by Eqs (4)and (5) for a range of values of c and Smax In Fig 4bthe same equations have been used to simulate theextended Fisher curves of Figs 2a and b This illustratesthat Eqs (4) and (5) accurately describe the extendedFisher curve using the same number of parametersEach of these parameters reflects a distinct ecologicaltrait of the community in contrast to the more complexinterpretability of the parameters used by Plotkin et al(2000) and to the interactions between the parametersof the lognormal model (Kempton and Taylor 1974)and the beta model (Kempton 1975) The parametera remains the scale-independent quantification of
ARTICLE IN PRESS
0
50
100
150
200
250
0 1 2 3 4 5 6 7 8 9 10Ln (N)
S
0
50
100
150
200
250
0 1 2 3 4 5 6 7 8 9 10Ln (N)
S
Smax gtgt (= Fisher)
Smax = 297
Smax =143
Smax =101
1200
1000
800
600
400
200
00 2 4 6 8 10 12 14 16 18 20
S
Ln (N)
c = 1 (= Fisher)
c = 09
c = 1 (= Fisher)c = 0963c = 0933
c = 0887
c = 0732
c = 08
c = 07
c = 06
c = 1 Smax= 500
c = 06 Smax= 250
(a)
(b)
Fig 4 SndashN curves produced by Eq (4) and (5) (a) Presents SndashN curves for a frac14 100 and for a range of values of c and Smax (Smax frac14 1 unless stated
otherwise) (b) The SndashN curves of the extended Fisher model (Figs 2a and b) are simulated using Eq (4) and (5) S and N are the numbers of species
and individuals respectively
RPO Schulte et al Journal of Theoretical Biology 232 (2005) 305ndash313 309
12Jost laquo Partitioning Diversityinto Independent Alpha and BetaComponents raquo cf note 34 p 67
13R A Kempton et L R Taylorlaquo Models and Statistics for Species Di-versity raquo In Nature 2625571 (1976)p 818-820 doi 101038262818a0
14R A Kempton et R W MWedderburn laquo A Comparison ofThree Measures of Species Diversi-ty raquo In Biometrics 341 (1978)p 25-37 doi 1023072529585 JS-TOR 2529585
Si 119878 = infin et 119888 = 1 lrsquoeacutequation (205) se simplifie pourretrouver lrsquoeacutequation (204)
Leurs reacutesultats (figure 203) montrent que la non prise encompte de ces deux paramegravetres aboutit agrave une sous-estimationsysteacutematique de 120572 diffeacuterente selon les sites ce qui invalide lescomparaisons inter-sites
Appliqueacute agrave des donneacutees reacuteelles (figure 204) le modegravele deFisher eacutetendu srsquoajuste forceacutement mieux (il possegravede trois pa-ramegravetres au lieu drsquoun) Lrsquoapproximation du nombre drsquoespegravecesinfini paraicirct ecirctre la plus peacutenalisante parce qursquoelle exclut lrsquoin-flexion de la courbe pour les grandes valeurs de 119873 mecircme sices valeurs sont rarement atteinte dans les faits (11989010 gt 20000)
Lrsquoindice de Fisher repose lourdement sur lrsquohypothegravese que ladistribution reacuteelle des espegraveces est conforme au modegravele Jost12
montre par un exemple que des interpreacutetations absurdes delrsquoindice peuvent ecirctre faites si lrsquohypothegravese nrsquoest pas respecteacutee
Kempton et Taylor13 et Kempton et Wedderburn14 ontdeacutefini lrsquoindice 119876 comme la pente de la courbe de 119878119899 en fonctionde log 119899 mesureacutee entre le premier et le troisiegraveme quartile dunombre drsquoespegraveces observeacutees quelle que soit la distribution desespegraveces 119876 = 120572 si la distribution est en log-seacuteries et 119876 = 119888119878120590si elle est log-normale (119888 est une constante deacutependant de laproportion des espegraveces eacutechantillonneacutee 119878 le nombre drsquoespegravecestotal et 120590 lrsquoeacutecart-type de la distribution du logarithme desprobabiliteacutes)
La simulation suivante tire 10000 arbres dans le jeu de don-neacutees BCI indeacutependamment et selon les freacutequences des espegravecesLrsquoindice Q est calculeacute
202 Variantes 241
biodiversity the maximum slope of the curve thatcorresponds to its empirical counterpart the Q-statisticSmax equals the maximum number of species and isinversely related to kF in the extended Fisher curveSimilar to knb in the extended Fisher curve parameter c
(0oco1) inversely quantifies the effects of clusteringwhich is maximum if c frac14 0 (knb frac14 0) and absent if c frac14 1(knb frac14 1) in which case Eq (5) follows Fisherrsquosoriginal curve (Fig 4) The precise relationship betweenc and knb could not be derived algebraically since theextended Fisher curve is an unsolved double integralHowever in Fig 5 we visualized this relationship byfitting the extended Fisher curve with Eq (5) (R2 valuesbetween 0974 and 1000 for all fits) for a range ofvalues of knb and a It shows that the clusteringparameter c is only reduced at strong degrees of spatialaggregation ie generally for values of knbo1
5 Results
51 Spatial data
In contrast to the extended Fisher curve Eqs (4) and(5) can be readily calibrated to accurately describeempirically observed SndashN data As examples we fittedFisherrsquos original curve and our Eqs (4) and (5) to SndashNobservations on trees (diameter410mm) made byCondit et al (1996) on Barro Colorado Island Panama(Fig 6a) Mudumalai India (Fig 6b) and PasohMalaysia (Fig 6c) We assumed a Poisson distributionfor the number of species and fitted the various SndashNequations by the method of maximum likelihood usingthe NLMIXED procedure in SAS Version 8 Eq (5) wascompared with Fisherrsquos equation to test the extent of theevidence in favour of augmenting Fisherrsquos equation with
ARTICLE IN PRESS
Fig 5 Relationship between the clustering parameters c (Eqs (4) and
(5)) and knb (extended Fisher model) for a range of values of aobtained by fitting SndashN curves of the extended Fisher model with
Eq (5)
Pasoh
0
200
400
600
800
1000
1200
Ln(N)
S
observations (Condit et al 1996)
Fisher
Equation 5
Equation 4
Barro Colorado Island
0
100
200
300
400
0 2 4 6 8 10 12 14
0 2 4 6 8 10 12 14
0 2 4 6 8 10 12 14
Ln(N)
S
observations (Condit et al 1996)
Fisher
Equation 5
Equation 4
Mudumalai
0
20
40
60
80
100
120
Ln(N)
S
observations (Condit et al 1996)
Fisher
Equation 5
Equation 4
(a)
(b)
(c)
Fig 6 Maximum likelihood fits of Fisherrsquos original model (grey line)
Eq (5) (black line) and Eq (4) (bold line) applied to distribution data
of trees (diameter410mm) at Barro Colorado Island (Fig 5a)
Mudumalai (Fig 5b) and Pasoh (Fig 5c) Observations taken from
Condit et al (1996) S and N are the numbers of species and
individuals respectively
RPO Schulte et al Journal of Theoretical Biology 232 (2005) 305ndash313310
Fig 204 Comparaison entre lemodegravele de Fisher et le modegraveleeacutetendu dans trois parcellesforestiegraveres connues Les modegravelessont ajusteacutes aux donneacutees Lescourbes leacutegendeacutees Equation 4correspondent au modegravele de Fishereacutetendu par Schulte alors quelrsquoEquation 5 est le modegraveleintermeacutediaire supposant lenombre total drsquoespegraveces infini
242 Indice 120572 de Fisher
Ns lt- colSums(BCI)Inventaire lt- rmultinom(10000 1 Nssum(Ns)) Cumul de linventaireCumul lt- apply(Inventaire 1 cumsum) Nombre despegraveces cumuleacuteesnEspeces lt- apply(Cumul 1 function(x) length(x[x gt 0])) Nombre total despegravecesS lt- max(nEspeces) Premier et troisiegravemes quartilesQ13 lt- which(nEspeces gt= max(nEspeces)4 amp nEspeces lt= max(nEspeces)
34)nq1 lt- min(Q13)nq3 lt- max(Q13)Sq1 lt- nEspeces[nq1]Sq3 lt- nEspeces[nq3] Indice Q(Q lt- (Sq3 - Sq1)log(nq3nq1))
[1] 3371977
La SAC correspondante est traceacutee en figure 205
Fig 205 SAC drsquoun inventairesimuleacute de 10000 arbres de BCI Lenombre drsquoespegraveces cumuleacute est traceacute
en fonction du logarithme dunombre drsquoindividus eacutechantillonneacutes119876 est la pente de la droite passant
par les points de la courbecorrespondant aux premier ettroisiegraveme quartiles du nombre
drsquoespegraveces
0
50
100
150
200
00 25 50 75log(n)
Nom
bre
des
pegravece
s
Code R pour reacutealiser la figure
ggplot(dataframe(x = log(1ncol(Inventaire)) y = nEspeces)) +geom_line(aes(x = x y = y)) +geom_vline(xintercept = log(nq1) lty = 3) +geom_vline(xintercept = log(nq3) lty = 3) +geom_hline(yintercept = Sq1 lty = 3) +geom_hline(yintercept = Sq3 lty = 3) +geom_abline(intercept = Sq1-Qlog(nq1) slope = Q) +labs(x = log(n) y = Nombre despegraveces)
1Gotelli et Colwell laquo Quanti-fying Biodiversity Procedures andPitfalls in the Measurement and Com-parison of Species Richness raquo cfnote 92 p 81
Chapitre 21
Accumulation de la diversiteacute locale
La courbe drsquoaccumulation (SAC) deacutecrit comment la richesse ou la diver-siteacute augmente en fonction de lrsquoeffort drsquoeacutechantillonnage Sous lrsquohypothegravesedrsquoun tirage multinomial des individus observeacutes les formules de rareacutefac-tion (estimation du nombre drsquoespegraveces pour une surface infeacuterieure agrave celleinventorieacutee) sont bien contenues La structure spatiale rend les observa-tions deacutependantes entre elles et doit ecirctre prise en compte
Lrsquoessentiel
Les proprieacuteteacutes des courbes drsquoaccumulation ont eacuteteacute large-ment eacutetudieacutees dans la litteacuterature notamment pour preacutedire larichesse speacutecifique (section 31)
Lrsquoinfluence de la structure spatiale est consideacuterable maissouvent neacutegligeacutee parce que difficile agrave prendre en compteQuelques meacutethodes sont pourtant applicables
211 Courbes drsquoaccumulationOn suppose que la communauteacute locale est de taille fixe et
contient donc un nombre fixe drsquoespegraveces et que leur deacutecouverteprogressive aboutira agrave une asymptote de la SAC
In principle for a survey of some well-deregned spatial
scope an asymptote will eventually be reached and no
further taxa will be added
We distinguish four kinds of taxon sampling curves based on
two dichotomies (Fig 1) Although we will present these
curves in terms of species richness they apply just as well to
richness of higher taxa
The regrst dichotomy concerns the sampling protocol used
to assess species richness Suppose one wishes to compare
the number of tree species in two contrasting 10-ha forest
plots One approach is to examine some number of
individual trees at random within each plot recording
sequentially the species identity of one tree after another
We refer to such an assessment protocol as individual-based
(Fig 1) Alternatively one could establish a series of quadrats
in each plot record the number and identity of all the trees
within each and accumulate the total number of species as
additional quadrats are censused (eg Cannon et al 1998
Chazdon et al 1998 Hubbell et al 1999 Vandermeer et al
2000) This is an example of a sample-based assessment
protocol (Fig 1) The relative merit of these approaches for
estimating species richness of trees is not the point here
Rather we emphasize that species richness censuses can be
validly based on datasets consisting either of individuals or of
replicated multi-individual samples The key distinction is
the unit of replication the individual vs a sample of
individuals plusmn a distinction that turns out to be far from trivial
Examples of individual-based protocols include birders
``life lists (eg Howard amp Moore 1984) Christmas bird
counts (eg Robbins et al 1989) time-based ``collectors
curves (eg Clench 1979 Lamas et al 1991) and taxon-
richness counts (often families or genera) from palaeonto-
logical sites (eg Raup 1979) In addition when an
unreplicated mass sample (such as a deep-sea dredge
sample eg Sanders 1968) is treated as if it were set of
randomly captured individuals from the source habitat an
individual-based taxon-sampling curve can be produced for
the sample Examples of sample-based protocols using
sampling units other than quadrats include replicated mist-
net samples for birds (Melhop amp Lynch 1986) and replicated
trap data for arthropods (eg Stork 1991 Longino amp Colwell
1997 Gotelli amp Arnett 2000)
A ``hybrid between individual-based and sample-based
taxon sampling curves is produced by the ``m-species list
method in current use by some ornithologists (eg Poulsen
et al 1997) A list is kept of the regrst m (usually 20) species
observed (disregarding abundances) in a sampling area plusmn an
individual-based list Then additional ``samples each based
on a new list of m species from the same area are
successively pooled The cumulative number of species
observed is plotted as a function of the number of m-species
lists pooled to produce a curve that reaches an asymptote
when all species have been observed
Sample- and individual-based data sets are sometimes
treated interchangeably in statistical analyses For example
depending upon the scale of interest or the focus of a
hypothesis (in the sense of Scheiner et al 2000) a group of
individual-based datasets or mass samples can be analysed as
if they were replicate samples from the same statistical
universe (eg Grassle amp Maciolek 1992) Likewise a set of
replicated samples can usually be pooled and treated as a
single individual-based dataset for some purposes
(Engstrom amp James 1981) (This is not possible with
m-species-list curves since abundances are not recorded)
The second dichotomy distinguishes accumulation curves
from rarefaction curves A species (or higher taxon) accumulation
curve records the total number of species revealed during the
process of data collection as additional individuals or
sample units are added to the pool of all previously observed
or collected individuals or samples (Fig 1) Accumulation
curves may be either individual-based (eg Clench 1979
Robbins et al 1989) or sample-based (eg Novotny amp Basset
2000)
Figure 1 Sample- and individual-based rarefaction and accumula-
tion curves Accumulation curves (jagged curves) represent a single
ordering of individuals (solid-line jagged curve) or samples (open-
line jagged curve) as they are successively pooled Rarefaction
curves (smooth curves) represent the means of repeated
re-sampling of all pooled individuals (solid-line smooth curve) or
all pooled samples (open-line smooth curve) The smoothed
rarefaction curves thus represent the statistical expectation for the
corresponding accumulation curves The sample-based curves lie
below the individual-based curves because of the spatial aggrega-
tion of species All four curves are based on the benchmark
seedbank dataset of Butler amp Chazdon (1998) analysed by Colwell
amp Coddington (1994) and available online with EstimateS (Colwell
2000a) The individual-based accumulation curve shows one par-
ticular random ordering of all individuals pooled The individual-
based rarefaction curve was computed by EstimateS using the
Coleman method (Coleman 1981) The sample-based accumulation
curve shows one particular random ordering of all samples in the
dataset The sample-based rarefaction curve was computed by
repeated re-sampling using EstimateS For both sample-based
curves the patchiness parameter in EstimateS set to 08 to
emphasize the effect of spatial aggregation
380 NJ Gotelli and RK Colwell
Oacute2001 Blackwell Science LtdCNRS
Fig 211 Courbesdrsquoaccumulation et de rareacutefactionobtenues par inventairesindividuels ou groupeacutes (samples)Les courbes de rareacutefactionpermettent de lisser les courbesdrsquoaccumulation Les courbesobtenues par inventaire groupeacutesont en geacuteneacuteral en dessous descourbes individuelles agrave cause delrsquoagreacutegation spatiale
Gotelli et Colwell1 proposent une revue des problegravemes lesplus communeacutement rencontreacutes dans lrsquoestimation et la com-paraison de la richesse speacutecifique Ils suggegraverent notamment
243
244 Accumulation de la diversiteacute locale
2K I Ugland et al laquo TheSpecies-Accumulation Curve and Es-timation of Species Richness raquo In Journal of Animal Ecology 725(2003) p 888-897 doi 101046j1365-2656200300748x
3Oksanen et al laquo Vegan Community Ecology Package raquo cfnote 21 p xi
4B D Coleman laquo On Ran-dom Placement and Species-Area Re-lations raquo In Mathematical Bios-ciences 543-4 (1981) p 191-215doi 1010160025-5564(81)90086-9
5E C Pielou An Introductionto Mathematical Ecology New York Wiley 1969 pages 204-205
de calculer la courbe de rareacutefaction (figure 211) plutocirct quedrsquoutiliser la courbe drsquoaccumulation obtenue en traccedilant simple-ment le nombre drsquoespegraveces deacutecouvert en fonction de lrsquoeffortdrsquoeacutechantillonnage La courbe de rareacutefaction est obtenue ensous-eacutechantillonnant dans lrsquoinventaire complet des effectifs detoutes tailles et en calculant le nombre moyen drsquoespegraveces trouveacutepour chacun ce qui permet de la lisser La formulation exactede la courbe de rareacutefaction et de sa variance est connue2
Fig 212 Courbe drsquoaccumulationdes espegraveces drsquoarbres de Barro
Colorado Island Calcul parspecaccum accumulation des 50
carreacutes avec permutations
0 10 20 30 40 50
050
100
150
200
Sites
rand
om
La fonction specaccum de la librairie vegan3 permet detracer les SAC (figure 212) selon diffeacuterentes meacutethodes avecun intervalle de confiance obtenu par permutation de lrsquoordredrsquoajout des donneacutees ou agrave partir des formules de rareacutefaction
Le code R neacutecessaire pour reacutealiser la figure est
data(BCI)SAC lt- specaccum(BCI random)plot(SAC citype = poly lwd = 2 cilty = 0 cicol = lightgray)
Pour une surface donneacutee le nombre drsquoindividus est unevariable aleacuteatoire Dans ce cas la SAC (deacutependant de lasurface) est diffeacuterente de la courbe de rareacutefaction (fonctiondu nombre drsquoindividus) de Gotelli et Colwell que Coleman4
nomme laquo courbe du collecteur raquoLa SAC theacuteorique en fonction de la surface contient une
incertitude concernant le nombre drsquoindividus Si la densiteacute 120582119904(nombre drsquoindividus par uniteacute de surface) des espegraveces peutecirctre connue (estimeacutee en comptant les individus) ou si les pro-babiliteacutes 119901119904 sont issues drsquoun modegravele (log-seacuteries log-normalhellip)le nombre drsquoindividus observeacutes de lrsquoespegravece 119904 suit une loi dePoisson drsquoespeacuterance 119860119904 ou de faccedilon eacutequivalente5 119899119901119904 (dansce deuxiegraveme cas 119899 est lrsquoestimateur de 119873 la variable aleacuteatoirecorrespondant agrave la taille de lrsquoeacutechantillon)
La SAC theacuteorique en fonction du nombre drsquoindividus necontient pas cet aleacutea Le nombre drsquoindividus de lrsquoespegravece 119904 suit
211 Courbes drsquoaccumulation 245
6G D Steel laquo Relation betweenPoisson and Multinomial Distribu-tions raquo In Biometrics Unit Techni-cal Reports Cornell University Bio-metrics Unit 1953 p 1-2
7R K Colwell et al laquo Modelsand Estimators Linking Individual-Based and Sample-Based RarefactionExtrapolation and Comparison of As-semblages raquo In Journal of PlantEcology 51 (2012) p 3-21 doi 101093jpertr044
8Chao et al laquo Entropy and theSpecies Accumulation Curve A No-vel Entropy Estimator via DiscoveryRates of New Species raquo cf note 94p 53
9Z Zhang et Zhou laquo Re-Parameterization of MultinomialDistributions and Diversity Indices raquocf note 60 p 73
10L Cao et M Grabchak laquo En-tropyEstimation Estimation of En-tropy and Related Quantities raquo In (2014)
alors une loi binomiale drsquoespeacuterance 119899119901119904 et la distribution drsquouneacutechantillon de taille 119899 suit la loi multinomiale correspondanteLes deux approches se reacuteconcilient en fixant arbitrairement lenombre drsquoindividus eacutechantillonneacutes dans la courbe aire-espegravece conditionnellement au nombre total drsquoindividus la distribu-tion des abondances des espegraveces issues de lois de Poisson deparamegravetres 120582119904 suit une loi multinomiale6 dont les probabiliteacutessont proportionnelles agrave 120582119904
La SAC deacutefinie en fonction du nombre drsquoindividus est ausens strict une succession de points (agrave chaque valeur de 119899)pas une courbe continue Elle est toutefois toujours preacutesen-teacutee comme une courbe lisseacutee passant par les points pour ecirctrecontinue et deacuterivable
0
50
100
150
200
0 5000 10000 15000 20000Nombre dindividus
Nom
bre
des
pegravece
s
Fig 213 Courbe drsquoaccumulationdes espegraveces drsquoarbres de BarroColorado Island Somme desentropies de Simpson geacuteneacuteraliseacutees
Une difficulteacute suppleacutementaire consiste agrave prendre en compteles espegraveces non eacutechantillonneacutees en appliquant des techniquesstatistiques pour reacuteduire le biais qursquoelles induisent7 Dans cebut la SAC theacuteorique peut ecirctre construite8 comme la sommedes entropies de Simpson geacuteneacuteraliseacutees9 preacutesenteacutees en section47
La courbe obtenue (figure 213) est la mecircme que par ra-reacutefaction sans les problegravemes drsquoestimation Son intervalle deconfiance nrsquoest pas repreacutesenteacute lrsquoestimation est sans biais et aune variance tregraves petite drsquoautre part la variabiliteacute de lrsquoeacutechan-tillonnage prise en compte dans la figure 212 est ignoreacutee iciLa fonction GenSimpz est fournie par le package EntropyEs-timation10
Code pour la figure library(EntropyEstimation)data(BCI)Ns lt- colSums(BCI)gsValues lt- sapply(1(sum(Ns)-1) function(r) GenSimpz(Ns r))SAC lt- cumsum(gsValues)ggplot(dataframe(x = 0(sum(Ns)-1)
y = c(0 SAC))aes(x = x y = y)) +
246 Accumulation de la diversiteacute locale
11J Beacuteguinot laquo When Reasona-bly Stop Sampling How to Estimatethe Gain in Newly Recorded SpeciesAccording to the Degree of Supple-mentary Sampling Effort raquo In An-nual Research amp Review in Biology75 (2015) p 300-308 doi 109734ARRB201518809
12Beacuteguinot laquo An Algebraic De-rivation of Chaorsquos Estimator of theNumber of Species in a Commu-nity Highlights the Condition Allo-wing Chao to Deliver Centered Esti-mates raquo cf note 14 p 28
13Beacuteguinot cf note 11
14T-J Shen et al laquo Predictingthe Number of New Species in aFurther Taxonomic Sampling raquo cfnote 39 p 38
geom_line() +labs(x = Nombre dindividus y = Nombre despegraveces)
212 ExtrapolationLrsquoextrapolation de la SAC est un cas particulier de celle
de la diversiteacute deacutejagrave vue en section 46Beacuteguinot11 a une approche diffeacuterente Il considegravere la SAC
comme une fonction continue et infiniment deacuterivable de lataille de lrsquoeacutechantillon Le nombre drsquoespegraveces non observeacutees dansun eacutechantillon de taille 119899 est noteacute 119904119899
0 Le nombre drsquoespegraveces ob-serveacutees dans la SAC est 119904119899
gt0 = 119878 minus 1199041198990 Quand 119899 est assez
grand la pente de la SAC varie peu entre 119899 minus 1 et 119899 + 1 in-dividus Beacuteguinot12 approxime la deacuteriveacutee de 119904119899
0 par 1199041198990 minus 119904119899minus1
0 La deacuteriveacutee est en reacutealiteacute plus grande la pente de la SACqui est lrsquoopposeacutee de la pente de 119904119899
0 deacutecroicirct avec 119899 mais lrsquoap-proximation est acceptable quand 119899 est assez grand De mecircmeles deacuteriveacutees successives par exemple seconde sont approcheacuteespar la variation de la deacuteriveacutee drsquoordre infeacuterieur par exemplepremiegravere entre 119899 minus 1 et 119899 En combinant ces approximationsavec lrsquoespeacuterance du nombre drsquoespegraveces observeacutees 120584 fois dans uneacutechantillon de taille 119899 eacutequation (32) on obtient
120124 (119904119899120584 ) = (minus1)120584minus1 (119899
120584)120597120584119904119899gt0
120597119899120584 120584 = 1 2 hellip (211)
Lrsquoespeacuterance du nombre drsquoespegraveces observeacutees 120584 fois deacutependdirectement de la deacuteriveacutee 120584e de la SAC
Beacuteguinot13 eacutecrit lrsquoaccroissement du nombre drsquoespegraveces ob-serveacutees quand lrsquoeacutechantillon augmente de 119899 agrave 119899 + 120575119899 sous laforme drsquoune seacuterie entiegravere qursquoil combine avec lrsquoeacutequation preacuteceacute-dente pour en obtenir une approximation
119904119899+120575119899 asymp 119904119899 + sum120584
(minus1)120584minus1 119904119899120584 (120575119899
119899 )120584 (212)
La somme est infinie mais ses termes deacutecroissent rapide-ment Le nombre de termes agrave prendre en compte est drsquoautantplus grand que 120575119899
119899 le niveau drsquoextrapolation est grand Lrsquoau-teur conseille de ne pas pousser lrsquoextrapolation au delagrave dudouble de 119899
Cette meacutethode est compareacutee agrave lrsquoextrapolation de la diver-siteacute drsquoordre 0 (section 46) et agrave lrsquoestimateur de T-J Shen etal14 (section 31) dans lrsquoillustration suivante
Une communauteacute theacuteorique log-normale de 300 espegraveces estcreacuteeacutee Des inventaires de 1000 individus sont simuleacutes et lestrois meacutethodes drsquoextrapolation de la richesse speacutecifique sont
212 Extrapolation 247
appliqueacutees pour estimer la richesse drsquoun eacutechantillon de 1800 in-dividus Les reacutesultats obtenus sont compareacutes agrave des inventairesdirects de 1800 individus
000
002
004
006
160 180 200Nombre despegraveces
Den
siteacute
de
prob
abili
teacute
Fig 214 Distribution de larichesse obtenue par extrapolationagrave 1800 individus de 500 inventairesde 1000 individus selon lesmeacutethodes de Shen et al (pointilleacutesalterneacutes vert) Beacuteguinot (tiretsrouges) ou avec le package iNEXT(pointilleacutes bleu) La distributionde la richesse de 500 inventaires demecircme taille est repreacutesenteacutee par lacourbe noire
La figure 214 montre que les extrapolations sont bonneset tregraves similaires avec les trois meacutethodes La distribution des500 simulations drsquoextrapolation est proche de celle des 500inventaires avec une plus grande variabiliteacute due agrave la quantiiteacuteplus faible de donneacutees disponibles
Le code R neacutecessaire pour reacutealiser la figure est
Ecart-type de la communauteacute log-normalesdlog lt- 2 Nombre despegravecesS lt- 300 Tirage des probabiliteacutes log-normales (lespeacuterance est sans importance)Ps lt- asProbaVector(rlnorm(S 0 sdlog)) Taille de linventairen lt- 1000 Niveau dextrapolationextra lt- 08 Nombre de simulationsnSim lt- 500 Creacuteation de nSim inventaires de n individusSamples lt- rmultinom(nSim n Ps) Richesse observeacuteeS0 lt- colSums(Samples gt 0) Fonction dextrapolation selon BeacuteguinotExtrapolateB lt- function(Ns)
Creacuteation dun tableau contenant le nombre despegraveces par abondancef lt- AbdFreqCount(Ns) Calcul des termes de la sommes lt- sapply(1nrow(f) function(i)
(-1)^(f[i 1]-1) f[i2] extra^f[i 1])return(sum(s))
Extrapolation des inventaireseB lt- apply(Samples 2 ExtrapolateB) + S0 Extrapolation par iNextlibrary(iNEXT)ei lt- iNEXT(asdataframe(Samples) q = 0 endpoint = n(1+extra)
knots = 4 se = FALSE)$iNextEst Extraction des reacutesultats de lobjet obtenuei lt- sapply(ei function(x) x[[4]][4]) Fonction dextrapolation selon Shen et al
248 Accumulation de la diversiteacute locale
15Beacuteguinot laquo Extrapolation ofthe Species Accumulation Curve forIncomplete Species Samplings ANew Nonparametric Approach to Es-timate the Degree of Sample Comple-teness and Decide When to Stop Sam-pling raquo cf note 37 p 37
library(SPECIES)ExtrapolateS lt- function(Ns)
Nombre despegraveces non observeacuteessink(tempfile()) Suppression des messages de jacknife()S0 lt- jackknife(AbdFreqCount(Ns))$Nhat -sum(Ns gt 0)sink() restauration de laffichage normal Taux de couvertureC lt- Coverage(Ns) Espegraveces nouvellesreturn(S0(1 -(1 -(1 -C)S0)^(nextra)))
Extrapolation des inventaireseS lt- apply(Samples 2 ExtrapolateS) + S0 Tirage de nSim communauteacutes de taille n(1+extra)Communities lt- rmultinom(nSim n(1 + extra) Ps)richCommunities lt- colSums(Communities gt 0) Distribution des reacutesultatsdeCommunities lt- density(richCommunities)deB lt- density(eB)dei lt- density(ei)deS lt- density(eS) FigureXlab lt- Nombre despegravecesYlab lt- Densiteacute de probabiliteacuteggplot(dataframe(richCommunities eB ei eS)) +
geom_density(aes(richCommunities)) +geom_density(aes(eB) lty = 2 col = red) +geom_density(aes(ei) lty = 3 col = blue) +geom_density(aes(eS) lty = 4 col = darkgreen) +labs(x = Xlab y = Ylab)
Beacuteguinot15 propose eacutegalement une forme analytique de laSAC extrapoleacutee en combinant lrsquoeacutequation (211) agrave lrsquoestimateurjackknife drsquoordre 2 Alors dans le domaine de validiteacute de lrsquoesti-mateur jackknife 2 crsquoest-agrave-dire quand le nombre de singletonsest supeacuterieur agrave 06 fois le nombre de doubletons la richessepour 119899 individus est
119904119899 = 1199041198990 +211990411989901 minus1199041198990
2 minus(311990411989901 minus 21199041198990
2 )lowast1198990119899 minus(1199041198990
2 minus 11990411989901 )lowast(1198990
119899 )2
(213)
ougrave 1198990 est la taille de lrsquoinventaire de deacutepartLa meacutethode est testeacutee ici sur la mecircme communauteacute log-
normale 500 inventaires de 5000 individus sont reacutealiseacutes etchacun est extrapoleacute jusqursquoagrave 25000 individus
Extrapolation jusquagraveNmax lt- 25000 SAC reacuteelle obtenue par la somme des entropies de Simpson geacuteneacuteraliseacutees Calcul de p(1-p)^r pour toutes les espegraveces (en lignes) et tous les r (en colonnes)GSsr lt- Ps sapply(1Nmax function(r) (1 - Ps)^r) Simpson geacuteneacuteraliseacute pour tous les rGSr lt- colSums(GSsr) SAC somme cumuleacutee des entropies de Simpson geacuteneacuteraliseacuteesSAC lt- cumsum(GSr) Fonction dextrapolation de la SACExtraSAC lt- function(Ns N)
Ns est le vecteur des abondances de leacutechantillon N est le vecteur des tailles agrave extrapolern0 lt- sum(Ns)Sn0 lt- sum(Ns gt 0)f1 lt- sum(Ns == 1)
212 Extrapolation 249
f2 lt- sum(Ns == 2) Extrapolation agrave chaque taillevapply(N function(n) Sn0 + 2 f1 - f2 - (3 f1 - 2 f2)
n0n - (f2 - f1) (n0n)^2 0) Taille de leacutechantillonn lt- 5000 Tirage de nSim inventaires dans la communauteacute log-normaleSamples lt- rmultinom(nSim n Ps) Extrapolation des inventairesExtraSACs lt- apply(Samples 2 ExtraSAC nNmax) Moyenne et intervalle de confiance agrave 95Moyenne lt- apply(ExtraSACs 1 mean)Max lt- apply(ExtraSACs 1 quantile probs = 0975)Min lt- apply(ExtraSACs 1 quantile probs = 0025) Taille deacutechantillon reacuteduitenReduit lt- 1000 Tirage de nSim inventaires dans la communauteacute log-normaleSamples lt- rmultinom(nSim nReduit Ps) Extrapolation des inventairesExtraSACs lt- apply(Samples 2 ExtraSAC nReduitNmax) MoyenneMoyenneReduit lt- apply(ExtraSACs 1 mean)
Agrave titre de comparaison lrsquoextrapolation drsquoun seul inven-taire de 1000 individus est eacutegalement tenteacutee
0
100
200
0 5000 10000 15000 20000 25000Nombre dindividus
Nom
bre
des
pegravece
s
Fig 215 Extrapolation de 500inventaires de 5000 individus(valeurs moyenne en tireteacute rougeet enveloppe de confiance agrave 95en gris) superposeacutee agrave la SAC reacuteelledrsquoune communauteacute log-normale de300 espegraveces Lrsquoextrapolation (enpointlleacutes bleu) drsquoun inventairelimiteacute agrave 1000 individus estseacutevegraverement sous-estimeacutee
Lrsquoextrapolation fonctionne assez bien (figure 215) tant quelrsquoeacutechantillonnage nrsquoest pas trop faible Avec un inventaire de5000 individus dans cet exemple lrsquoestimation de la richesseasymptotique par lrsquoestimateur jackknife 2 est correcte lrsquoextra-polation de la SAC lrsquoest aussi En limitant lrsquoinventaire agrave 1000individus lrsquoinformation disponible est trop limiteacutee
Le code R neacutecessaire pour reacutealiser la figure est
ggplot() +geom_ribbon(aes(x ymin = Min ymax = Max)
dataframe(x = nNmax Min Max) alpha = 03) +geom_line(aes(x y) dataframe(x = 0Nmax y = c(0 SAC))) +geom_line(aes(x y) dataframe(x = nNmax y = Moyenne)
col = red lty = 2) +geom_line(aes(x y) dataframe(x = nReduitNmax y = MoyenneReduit)
col = blue lty = 3) +labs(x = Nombre dindividus y = Nombre despegraveces)
250 Accumulation de la diversiteacute locale
16J A Veech laquo Analyzing Pat-terns of Species Diversity as Depar-tures from Random Expectations raquoIn Oikos 1081 (2005) p 149-155doi 101111j0030-1299200513506x
17J B Plotkin et al laquo Species-Area Curves Spatial Aggregationand Habitat Specialization in Tropi-cal Forests raquo In Journal of Theore-tical Biology 2071 (2000) p 81-99doi 101006jtbi20002158
18J Neyman et E L Scott laquo Sta-tistical Approach to Problems of Cos-mology raquo In Journal of the RoyalStatistical Society Series B (Statis-tical Methodology) 201 (1958) p 1-43 doi 101111j2517- 61611958tb00272x JSTOR 2983905
19N Picard et al laquo Species-AreaCurve and Spatial Pattern raquo In Ecoscience 111 (2004) p 45-54 doi 10108011956860200411682808
213 Influence de la structure spatiale
Les modegraveles classiques de courbes aire-espegraveces supposentun tirage indeacutependant des individus Sur le terrain parexemple en forecirct lrsquoeacutechantillonnage est continu srsquoil existeune structure spatiale comme des agreacutegats la probabiliteacuteque lrsquoarbre suivant soit drsquoune espegravece donneacutee deacutepend deses voisins donc de lrsquoarbre preacuteceacutedent Intuitivement oncomprend bien que le nouvel arbre de la mecircme espegravece apportemoins drsquoinformation ce qui revient agrave surestimer la taillede lrsquoeacutechantillon ou sous-estimer la richesse pour une tailledrsquoeacutechantillon fixeacutee16
Plotkin et al17 traitent un problegraveme un peu diffeacuterent connaissant le nombre total drsquoespegraveces dans les dispositifs dela figure 222 ils tracent la courbe de rareacutefaction theacuteorique quiconsidegravere simplement que la probabiliteacute de ne pas rencontrerune espegravece suit une loi binomiale les tirages eacutetant indeacutepen-dants Ce modegravele surestime largement la diversiteacute pour les pe-tites surfaces la probabiliteacute de ne pas rencontrer une espegraveceagreacutegative est sous-estimeacutee Le biais diminue quand la surfacedrsquoeacutechantillonnage augmente parce que la taille relative desagreacutegats diminue
Les effets de lrsquoagreacutegation peuvent donc ecirctre opposeacutes selonla question poseacutee Dans tous les cas il suffit de consideacutererqursquoun agreacutegat surestime le nombre drsquoarbres de son espegravece quidevrait ecirctre pris en compte dans le cadre drsquoun modegravele agrave tiragesindeacutependants
Plotkin et al proposent une meacutethode permettant deprendre en compte la structure spatiale pour fournir des mo-degraveles de courbes aire-espegraveces fiables dans un cadre particulierougrave le nombre total drsquoespegraveces et leur structure spatiale sontconnus La meacutethode neacutecessite une carte des individus Lesemis de point est consideacutereacute comme le reacutesultat drsquoun processusde Neyman-Scott 18 des centres drsquoagreacutegats sont tireacutes de faccediloncomplegravetement aleacuteatoire et les individus sont reacutepartis autourdes centres selon une loi normale en deux dimensions Lesparamegravetres du processus sont estimeacutes agrave partir du semis depoints puis la courbe aire-espegraveces est obtenue par simulationdu processus
Le problegraveme est traiteacute de faccedilon plus approfondie par Pi-card et al19 qui srsquoappuient sur la theacuteorie des processus ponc-tuels En supposant que la distribution spatiale des espegravecesest homogegravene (crsquoest-agrave-dire stationnaire et isotrope) la formedu domaine eacutechantillonneacute nrsquoa pas drsquoimportance lrsquoaire 119860 peutecirctre repreacutesenteacutee par un cercle de rayon 119903 = radic119860120587 La probabi-liteacute drsquoobserver lrsquoespegravece 119904 dans 119860 est identique agrave la probabiliteacuteque la distance entre un individu de lrsquoespegravece 119904 et un pointarbitrairement choisi soit infeacuterieure agrave 119903 Cette probabiliteacute a
213 Influence de la structure spatiale 251
20P J Diggle Statistical Analy-sis of Spatial Point Patterns Lon-don Academic Press 1983
21N A Cressie Statistics forSpatial Data New York John Wileyamp Sons 1993 D Stoyan et H StoyanFractals Random Shapes and PointFields Methods of Geometrical Sta-tistics Chichester John Wiley ampSons 1994 doi 978-0-471-93757-9
22B Mateacutern laquo Spatial Varia-tion raquo In Meddelanden fraringn StatensSkogsforskningsinstitut 495 (1960)p 1-144
eacuteteacute largement eacutetudieacutee et est connue sous le nom de fonction119865 de Diggle20 ou empty space function 119865119904(119903) est la fonctiondrsquoespace vide de lrsquoespegravece 119904 dont lrsquoargument est la distance119903 Le nombre drsquoespegraveces peut ecirctre eacutecrit comme la somme desfonctions 119865119904
120124 (119878119860) = sum119904
119865119904 (119903) (214)
La fonction 119865119904(119903) est connue pour les processus ponctuelscourants21 Le processus de Poisson place les individus indeacute-pendamment les uns des autres avec la mecircme probabiliteacute par-tout Son seul paramegravetre est lrsquointensiteacute 120582119904 qui donne lrsquoespeacute-rance du nombre drsquoindividus de lrsquoespegravece 119904 par uniteacute de sur-face Si toutes les espegraveces sont distribueacutees selon un processusde Poisson la courbe aire-espegravece est deacutecrite par
120124 (119878119860) = 119878 minus sum119904
119890minus120582119904119860 (215)
Lrsquoeacutequation (215) est identique au modegravele de distributionaleacuteatoire de Coleman en remplaccedilant la distribution observeacuteedes effectifs par espegravece par lrsquointensiteacute du processus de PoissonLes formes de 119865119904 sont connues aussi pour des processus agreacute-gatifs notamment le processus de Mateacutern22 ou des distribu-tions reacuteguliegraveres La courbe aire-espegravece peut donc ecirctre eacutevalueacuteeagrave partir drsquoinventaires fournissant la position des individus Leprocessus ponctuel correspondant agrave chaque espegravece peut ecirctreinfeacutereacute pour fournir une forme analytique de la courbe commedans lrsquoeacutequation (215) ou bien la fonction drsquoespace vide dechaque espegravece peut ecirctre estimeacutee agrave partir des donneacutees par lafonction Fest du package spatstat et sommeacutee pour toutes lesespegraveces selon lrsquoeacutequation (214)
La relation aire-espegravece contient au moins autant de para-megravetres que drsquoespegraveces lrsquointensiteacute 120582119904 si lrsquoespegravece 119904 est distri-bueacutee spatialement selon un processus de Poisson deux para-megravetres suppleacutementaires pour le processus de Mateacutern Cettecomplexiteacute peut ecirctre reacuteduite si la distribution des freacutequencesdes espegraveces (la SAD) est connue Picard et al fournissent lesrelations pour une SAD en log-seacuteries et une SAD geacuteomeacutetriqueavec une distribution spatiale suivant un processus de Poisson elles ne contiennent que deux paramegravetres un lieacute au nombretotal drsquoindividus et un propre agrave chaque SAD Les formules secompliquent quand la distribution spatiale nrsquoest pas poisson-nienne et ne sont pas disponibles quand la SAD (log-normalepar exemple) ne preacutevoit pas le nombre exact drsquoindividus parespegravece
Enfin il est possible de prendre en compte les espegraveces nonobserveacutees La relation aire-espegravece (214) srsquoentend pour toutes