Mesures de la Biodiversité

Mesures de laBiodiversiteacute

Eric Marcon

26012022

Ce document est reacutealiseacute de faccedilon dynamique et reproductible gracircce agrave

bull LATEX dans sa distribution Miktex (httpmiktexorg) et la classe memoir(httpwwwctanorgpkgmemoir)

bull R (httpwwwr-projectorg) et RStudio (httpwwwrstudiocom)

bull bookdown (httpbookdownorg)

Son code source est sur GitHub httpsgithubcomEricMarconMesuresBioDiv2Le texte mis agrave jour en continu peut ecirctre lu sur httpsericmarcongithubioMesuresBioDiv2 Les versions drsquoeacutetape sont deacuteposeacutees sur HAL httpshal-agroparistecharchives-ouvertesfrcel-01205813

Uniteacute Mixte de Recherche

ECOlogie

FOrecircts

Guyane

Photographie en couverture Hadrien Lalaguumle

Table des matiegraveres

Table des matiegraveres iii

Motivation ix

Calculs et donneacutees xi

Notations xiii

I mdash Notions 1

1 Notions de Diversiteacute 311 Composantes 3

Richesse 3Eacutequitabiliteacute 4Dispariteacute 4Agreacutegation 5

12 Niveaux de lrsquoeacutetude 5Diversiteacute 120572 120573 et 120574 5Deacutecomposition 6

13 Le problegraveme de lrsquoespegravece 7

2 Outils 921 Courbes drsquoaccumulation 922 Diversiteacute asymptotique 1023 Taux de couverture 11

Formule des freacutequences de Good-Turing 11Taux de couverture et deacuteficit de couverture 12Compleacutetude 14

24 Distribution de lrsquoabondance des espegraveces (SAD) 15La distribution en log-seacuteries 16La distribution Broken Stick 16La distribution log-normale 17La distribution geacuteomeacutetrique 18Synthegravese 18

iv Table des matiegraveres

II mdash Diversiteacute neutre drsquoune communauteacute 23

3 Mesures neutres de la diversiteacute 120572 ou 120574 2531 Richesse speacutecifique 26

Techniques drsquoestimation non parameacutetrique 26Infeacuterence du nombre drsquoespegraveces agrave partir de la SAD 39Infeacuterence du nombre drsquoespegraveces agrave partir de

courbes drsquoaccumulation 41Diversiteacute geacuteneacuterique 45Combien y a-t-il drsquoespegraveces diffeacuterentes sur Terre 46

32 Indice de Simpson 47Deacutefinition 47Estimation 48

33 Indice de Shannon 49Deacutefinition 49Estimation 51

34 Indice de Hurlbert 57Deacutefinition 57Estimation 58

4 Entropie 6141 Deacutefinition de lrsquoentropie 6142 Entropie relative 6343 Lrsquoappropriation de lrsquoentropie par la biodiversiteacute 6444 Entropie HCDT 67

Logarithmes deacuteformeacutes 67Entropie et diversiteacute 69Synthegravese 71

45 Profils de diversiteacute 7146 Estimation de lrsquoentropie 73

Zhang et Grabchak 73Chao et Jost 74Autres meacutethodes 76Biais des estimateurs 77Intervalle de confiance des estimateurs 78Pratique de lrsquoestimation 79MSOM et MSAM 81Rareacutefaction et extrapolation 81

47 Autres approches 81Lrsquoentropie de Reacutenyi 81Lrsquoentropie geacuteneacuteraliseacutee des mesures drsquoineacutegaliteacute 82Lrsquoentropie de Simpson geacuteneacuteraliseacutee 83Lrsquoentropie par cas 86

5 Eacutequitabiliteacute 8951 Approche axiomatique 8952 Indice classiques 91

Indice de Bulla 91Indice de Gini 91

Table des matiegraveres v

Rapports de moyennes 91Ratios de Hill 91Synthegravese 91

53 Indice alternatifs 92Variance de la rareteacute 92Non-speacutecificiteacute 92

54 Indice de Pielou 9255 Geacuteneacuteralisation de lrsquoindice de Pielou 93

Mendes et al 93Tuomisto 93Jost 93Synthegravese 94

56 Relations empiriques entre richesse et eacutequitabiliteacute 95

III mdash Diversiteacute fonctionnelle et phylogeacuteneacute-tique 99

6 Cadre 10161 Dissimilariteacute et distance 10262 Distance phylogeacuteneacutetique 10363 Distance fonctionnelle 10364 Eacutequivalence des deux diversiteacutes 10565 Typologie des mesures 106

7 Mesures particuliegraveres 10971 Richesse eacutequitabiliteacute et divergence fonctionnelle 109

Richesse fonctionnelle 110Equitabiliteacute fonctionnelle 111Divergence fonctionnelle 112

72 Originaliteacute richesse et eacutequitabiliteacute phylogeacuteneacute-tique 114Mesures speacutecifiques drsquooriginaliteacute 114Originaliteacute taxonomique de Ricotta 115Richesse phylogeacuteneacutetique 116Indices de Cadotte 117

73 Diversiteacute de Scheiner 11974 Diversiteacute de Solow et Polasky 12275 FD et PD 12376 Indice de Rao 125

Principe 125Formalisation 125Proprieacuteteacutes 125Calcul sous R 126Maximum theacuteorique 127

77 Diversiteacute et moyenne 13078 Variations sur lrsquoentropie quadratique 13079 Diversiteacute fonctionnelle de Chiu et Chao 131710 119867119901 et 1198681 132

vi Table des matiegraveres

8 Entropie phylogeacuteneacutetique 13381 Geacuteneacuteralisation de lrsquoentropie HCDT 13382 Estimation 13483 Entropie et diversiteacute 13584 Diversiteacute individuelle 13785 Arbres non ultrameacutetriques 137

9 Diversiteacute de Leinster et Cobbold 13991 Deacutefinitions 13992 Diversiteacute neutre 14193 Diversiteacute non neutre 14194 Entropie de Ricotta et Szeidl 14295 Deacutefinition de la similariteacute 14396 Estimation 14597 Diversiteacute phylogeacuteneacutetique 14798 Diversiteacute individuelle 14899 Diversiteacute des valeurs propres 151910 Synthegravese 154

IV mdash Diversiteacute beta et deacutecomposition 157

10 Cadre 159101 Deacutefinition de la diversiteacute 120573 par objectifs 160102 Typologie des mesures 163103 Deacutecomposition de la diversiteacute 163

Deacutefinitions de la diversiteacute 120573 mesure deacuteriveacutee 163Le deacutebat sur la deacutecomposition 164Deacutecomposition multiplicative de la diversiteacute 165Deacutefinitions de la diversiteacute 120572 165

11 Diversiteacute de diffeacuterentiation 169111 Donneacutees de preacutesence-absence 169

Indices de similariteacute 169Biais drsquoestimation 171Repreacutesentation graphique 173

112 Donneacutees drsquoabondance 174113 Emboicirctement et substitution 175114 Donneacutees drsquoabondance et similariteacute des espegraveces 177

Dissimilariteacute minimale moyenne 177Similariteacute moyenne entre individus 178

115 Distance entre paires de communauteacutes et diver-siteacute 120573 proportionnelle 180Diversiteacute de Simpson 180Geacuteneacuteralisation 182

116 Tests de significativiteacute 184Test de non-nulliteacute 184Analyse de la variabiliteacute 185

Table des matiegraveres vii

12 Deacutecomposition de lrsquoentropie HCDT 187121 Deacutecomposition de lrsquoindice de Shannon 187

Deacutefinition 187Biais drsquoestimation 189

122 Deacutecomposition de lrsquoentropie geacuteneacuteraliseacutee 191123 Deacutecomposition du nombre drsquoespegraveces 193124 Deacutecomposition de lrsquoindice de Gini-Simpson 194125 Deacutecomposition de lrsquoindice de Rao 196126 Synthegravese 199127 Normalisation 200

Neacutecessiteacute de normaliser la diversiteacute 120573 200Lrsquoindice de chevauchement 119862119902119873 202

13 Deacutecomposition de la diversiteacute phylogeacuteneacutetiqueet fonctionnelle 203131 Deacutecomposition de la diversiteacute phylogeacuteneacutetique 203132 Partitionnement de la diversiteacute de Leinster et

Cobbold 205

14 Tests de significativiteacute 209141 Test de non-nulliteacute 209

Intervalle de confiance 210Correction des biais 211

142 Analyse de la variabiliteacute 211

15 Autres approches 213151 Le partitionnement de la diversiteacute selon Peacutelis-

sier et Couteron 213Cadre 213Deacutecomposition 214

152 Diversiteacute de Kosman 215

V mdash Diversiteacute jointe diversiteacute structurelle 217

16 Cadre 219

17 Information mutuelle 221171 Reacutecursiviteacute de lrsquoentropie 221

Entropie de Shannon 221Entropie HCDT 222Inteacuterecirct de lrsquoinformation mutuelle 223

172 Taille de niche 223

18 Deacutecomposition de la diversiteacute jointe 225181 Deacutefinitions 225182 Relations avec drsquoautres mesures de diversiteacute 229

viii Table des matiegraveres

VI mdash Diversiteacute spatialement explicite 231

19 Cadre 233

20 Indice 120572 de Fisher 235201 Construction 235202 Variantes 239

21 Accumulation de la diversiteacute locale 243211 Courbes drsquoaccumulation 243212 Extrapolation 246213 Influence de la structure spatiale 250

22 Diversiteacute reacutegionale 253221 La relation drsquoArrhenius 254

Loi de puissance 254Le modegravele de Plotkin 255

222 Le modegravele de Gleason 257223 Le modegravele de placement aleacuteatoire 258224 Synthegravese 259225 Estimation de la richesse agrave partir de placettes

distantes 261

23 Diversiteacute 120573 spatialement explicite 263231 Lrsquoindice de Simpson spatialement explicite 263232 Le variogramme de compleacutementariteacute 264

VII mdash Conclusion 267

24 Synthegravese 269241 Entropie et diversiteacute 269242 Ordres particuliers de diversiteacute 270

Estimation 270Partition 271Eacutegaliteacute des diversiteacutes 271

243 Limites 271

Bibliographie 273

1C Meine et al laquo rdquoA Mission-Driven Disciplinerdquo The Growth ofConservation Biology raquo In Conser-vation Biology 203 (2006) p 631-651 doi 101111j1523-1739200600449x

2E O Wilson et F M Peter eacutedBiodiversity Washington DC TheNational Academies Press 1988

3P Blandin laquo La Diversiteacute DuVivant Avant (et Apregraves) La Biodi-versiteacute Repegraveres Historiques et Eacutepis-teacutemologiques raquo In La Biodiversi-teacute En Question Enjeux Philoso-phiques Eacutethiques et ScientifiquesSous la dir drsquoE Casetta et J De-lord Paris Editions Mateacuteriologiques2014 p 31-68

4J Delord laquo La Biodiversiteacute Imposture Scientifique Ou Ruse Eacutepis-teacutemologique raquo In La Biodiversi-teacute En Question Enjeux Philoso-phiques Eacutethiques et ScientifiquesSous la dir drsquoE Casetta et J De-lord Paris Editions Mateacuteriologiques2014 p 83-118 doi 103917edmatdelor2014010083

5D C J DeLong laquo Defining Bio-diversity raquo In Wildlife Society Bul-letin 244 (1996) p 738-749 JSTOR 3783168

6J G Speth et al laquo Foreword raquoIn Global Biodiversity StrategySous la dir de K Courrier Washing-ton DC WRI IUCN UNEP 1992p v-vi

7M Loreau laquo Discours de Clocirc-ture raquo In Actes de La ConfeacuterenceInternationale Biodiversiteacute Scienceet Gouvernance Sous la dir deR Barbault et J-P Le Duc ParisFrance IRD Editions 2005 p 254-256

Motivation

Le terme biodiversity est attribueacute1 agrave Walter Rosen unmembre du National Research Council ameacutericain qui a com-menceacute agrave contracter les termes biological diversity pendant lapreacuteparation drsquoun colloque dont les actes seront publieacutes sousle titre laquo Biodiversity raquo2 La question de la diversiteacute biologiqueinteacuteressait les eacutecologues bien avant lrsquoinvention de la biodiversi-teacute mais le neacuteologisme a connu un succegraves fulgurant3 en mecircmetemps qursquoil devenait une notion floue dans lequel chacun peutplacer ce qursquoil souhaite y trouver au point de lui retirer soncaractegravere scientifique4 Une cause de ce glissement est que labiodiversiteacute a eacuteteacute nommeacutee pour attirer lrsquoattention sur son eacutero-sion en lien avec la biologie de la conservation Cette eacuterosionconcernant potentiellement de nombreux aspects du monde vi-vant la deacutefinition de la biodiversiteacute fluctue selon les besoins DeLong5 en recense 85 dans les dix premiegraveres anneacutees de lit-teacuterature Les indicateurs de la biodiversiteacute peuvent engloberbien drsquoautres choses que la diversiteacute du vivant le nombredrsquoespegraveces menaceacutees (par exemple la liste rouge de lrsquoIUCN) lataille des populations ou la surface des eacutecosystegravemes preacuteserveacutesla deacutegradation des habitats la menace pesant sur des espegravecesembleacutematiqueshellip Une mesure rigoureuse et coheacuterente de la di-versiteacute peut pourtant ecirctre construite pour clarifier beaucoup(mais pas tous) des concepts qui constituent la biodiversiteacute

Dans lrsquointroduction du premier chapitre des actes de cequi eacutetait devenu le laquo Forum sur la Biodiversiteacute raquo Wilson uti-lise le mot dans le sens eacutetroit de nombres drsquoespegraveces Lrsquoeacutelargis-sement de la notion aux laquo systegravemes naturels raquo et agrave lrsquoopposeacute agravela diversiteacute geacuteneacutetique intraspeacutecifique est venu du monde de laconservation6 La deacuteclaration de Michel Loreau preacutesident dudu comiteacute scientifique de la confeacuterence de Paris en 20057 endonne une deacutefinition aboutie

La Terre abrite une extraordinaire diversiteacutebiologique qui inclut non seulement les espegravecesqui habitent notre planegravete mais aussi la diversiteacutede leurs gegravenes la multitude des interactionseacutecologiques entre elles et avec leur environnementphysique et la varieacuteteacute des eacutecosystegravemes complexes

x Table des matiegraveres

8autre concept flou J Heylaquo The Mind of the Species Problem raquoIn Trends in Ecology amp Evolution167 (2001) p 326-329 doi 101016S0169-5347(01)02145-0

9Z Jizhong et al laquo An Index ofEcosystem Diversity raquo In EcologicalModelling 59 (1991) p 151-163 doi 1010160304-3800(91)90176-2

10F S I Chapin et al laquo Conse-quences of Changing Biodiversity raquoIn Nature 4056783 (2000) p 234-242 doi 10103835012241

11B J Cardinale et al laquo Biodi-versity Loss and Its Impact on Hu-manity raquo In Nature 4867401 (2012)p 59-67 doi 101038nature11148

12G Ceballos et al laquo BiologicalAnnihilation via the Ongoing SixthMass Extinction Signaled by Ver-tebrate Population Losses and De-clines raquo In Proceedings of the Na-tional Academy of Sciences (2017)p 201704949 doi 10 1073 pnas 1704949114

13A Purvis et A Hector laquo Get-ting the Measure of Biodiversity raquoIn Nature 4056783 (2000) p 212-9doi 10103835012221

14C Ricotta laquo Through theJungle of Biological Diversity raquo In Acta Biotheoretica 531 (2005) p 29-38 doi 101007s10441-005-7001-6

qursquoelles constituent Cette biodiversiteacute qui est leproduit de plus de 3 milliards drsquoanneacutees drsquoeacutevolutionconstitue un patrimoine naturel et une ressourcevitale dont lrsquohumaniteacute deacutepend de multiples faccedilons

Aujourdrsquohui encore le terme biodiversiteacute concerne le plussouvent la richesse en espegraveces drsquoun eacutecosystegraveme Pour simplifierla preacutesentation le niveau drsquoeacutetude dans ce document sera engeacuteneacuteral celui des espegraveces8 La prise en compte de la totaliteacutedes ecirctres vivants est geacuteneacuteralement hors de porteacutee La mesurede diversiteacute est alors limiteacutee agrave un taxocegravene crsquoest-agrave-dire unsous-ensemble des espegraveces drsquoune communauteacute relieacutees taxono-miquement les papillons les mammifegraveres les arbres (la deacute-limitation du sous-ensemble nrsquoest pas forceacutement strictementtaxonomique)hellip

Un objet privileacutegieacute des eacutetudes sur la biodiversiteacute est depuisle Forum la forecirct tropicale parce qursquoelle est tregraves diverse et unenjeu pour la conservation La plupart des exemples concer-neront ici les arbres de la forecirct tropicale qui ont lrsquoavantagedrsquoecirctre clairement deacutefinis en tant qursquoindividus (donc simplesagrave compter) et posent des problegravemes meacutethodologiques consideacute-rables pour lrsquoestimation de leur diversiteacute agrave partir de donneacuteesreacuteelles

On peut bien eacutevidemment srsquointeacuteresser agrave drsquoautres niveaux etdrsquoautres objets par exemple la diversiteacute geacuteneacutetique (en termesdrsquoallegraveles diffeacuterents pour certains gegravenes ou marqueurs) agrave lrsquointeacute-rieur drsquoune population ou mecircme la diversiteacute des interactionsentre espegraveces drsquoune communauteacute9 On gardera toujours agrave lrsquoes-prit que la prise en compte de la diversiteacute speacutecifique nrsquoest pasla seule approche les meacutethodes preacutesenteacutees ici srsquoappliquent agravela mesure de la diversiteacute en geacuteneacuteral pas mecircme neacutecessairementbiologique

Lrsquoobjectif de ce document est de traiter la mesure de labiodiversiteacute pas son importance en tant que telle On se reacutefeacute-rera par exemple agrave Chapin et al10 pour une revue sur cettequestion Cardinale et al11 pour les conseacutequences de lrsquoeacuterosionde la biodiversiteacute sur les services eacutecosysteacutemiques ou Ceballoset al12 pour les proprieacuteteacutes autocatalytiques de la biodiversiteacute

La mesure de la diversiteacute est un sujet important en tantque tel13 pour permettre de formaliser les concepts et de lesappliquer agrave la reacutealiteacute La question est loin drsquoecirctre eacutepuiseacutee et faittoujours lrsquoobjet drsquoune recherche active et de controverses14

15R Core Team R A Lan-guage and Environment for Statis-tical Computing Vienna Austria R Foundation for Statistical Compu-ting 2021

16E Marcon et B Heacuterault laquo En-tropart an r Package to Measure andPartition Diversity raquo In Journal ofStatistical Software 678 (2015) p 1-26 doi 1018637jssv067i08

17httpsgithubcomEricMarconMesuresBioDiv2

18httpsericmarcongithubioMesuresBioDiv2

19S Gourlet-Fleury et al Ecolo-gy amp Management of a Neotropi-cal Rainforest Lessons Drawn fromParacou a Long-Term ExperimentalResearch Site in French Guiana Pa-ris Elsevier 2004

20R Condit et al laquo Thirty Yearsof Forest Census at Barro Coloradoand the Importance of Immigrationin Maintaining Diversity raquo In PLoSONE 711 (2012) e49826 doi 10 1371journalpone0049826

21J Oksanen et al laquo Vegan Community Ecology Package raquo In (2012)

Calculs et donneacutees

La preacutesentation des mesures de diversiteacute est donneacutee avecun usage intensif du formalisme matheacutematique La liste desnotations est fournie ci-dessous on srsquoy reacutefeacuterera autant queneacutecessaire

Les calculs sont reacutealiseacutes dans R15 essentiellement avec lepackage entropart16 Lrsquoensemble du code est disponible surGitHub17 ougrave se trouvent les mises agrave jour de ce document18

Les donneacutees sont souvent celles de la parcelle 6 de la forecirctde Paracou (figure 1 en Guyane franccedilaise19 drsquoune surface de625 ha Tous les arbres de plus de 10 cm de diamegravetre agrave hau-teur de poitrine (DBH Diameter at Breast Height) y ont eacuteteacuteinventorieacutes en 2016 La position de chaque arbre son espegraveceet sa surface terriegravere sont fournis dans le package SpatDiv

Drsquoautres exemples utilisent la parcelle forestiegravere perma-nente de Barro Colorado Island souvent abreacutegeacutee BCI 20 50 hade forecirct tropicale dont les arbres de plus de 1 cm de diamegravetreagrave hauteur de poitrine (DBH Diameter at Breast Height) onteacuteteacute inventorieacutes Le jeu de donneacutees utiliseacute pour les exemplesest une version reacuteduite aux arbres de plus de 10 cm disponibledans le package vegan21 soient 21457 arbres dans 225 espegraveces

Enfin les donneacutees fournies par le package entropart sousle nom laquo Paracou618 raquo sont deux inventaires de lrsquoanneacutee 2012limiteacutes agrave un hectare chacun dans les parcelles 6 et 18 de laforecirct de Paracou soient 1124 arbres dans 229 espegraveces

Le code R pour reacutealiser la figure est le suivant

library(dbmss)library(SpatDiv)autoplot(Paracou6 labelSize = expression(paste(Surface terriegravere (

cm^2 ))) labelColor = Espegravece)

xii Table des matiegraveres

Fig 1 Carte de la parcelle 6 deParacou Les points repreacutesentent

les arbres Leur taille estproportionnelle agrave leur surface

terriegravere Seules les espegraveces les plusfreacutequentes sont identifieacutees sur la

0 50 100 150 200 250

Espegravece

Annonaceae_Oxandra_asbeckii

Chrysobalanaceae_Licania_alba

Euphorbiaceae_Sandwithia_guyanensis

Fabaceae_Eperua_falcata

Lecythidaceae_Eschweilera_sagotiana

Lecythidaceae_Lecythis_persistens

Surface terriegravere (cm2)

Notations

Les notations matheacutematiques peuvent diffeacuterer de celles dela litteacuterature citeacutee pour lrsquohomogeacuteneacuteiteacute de ce document

Les matrices sont noteacutees en caractegraveres gras et majuscules X Les eacuteleacutements de la matrice X sont noteacutes 119909119894119895

Les vecteurs sont noteacutes en gras minuscule p Les nombressont noteacutes en minuscules 119899 et les variables aleacuteatoires en ma-juscules 119873 Les valeurs maximales des eacutenumeacuterations fontexception elles sont noteacutees en majuscules pour les distinguerdes indices sum119878

119904=1 119901119904 = 1Le produit matriciel de X et Y est noteacute XY Dans les

scripts R lrsquoopeacuterateur est Le produit de Hadamard (termeagrave terme) est noteacute X ∘ Y (opeacuterateur dans R) De mecircme X119899

indique la puissance 119899 au sens du produit matriciel drsquoune ma-trice carreacutee (opeacuterateur ^ du package expm) alors que X∘119899

est la matrice dont chaque terme est celui de X agrave la puissance119899 (opeacuterateur ^ de R) La matrice transposeacutee de X est noteacuteeXprime

Les notations sont les suivantes 1(sdot) la fonction indicatrice qui vaut 1 si la condition dans laparenthegravese est vraie 0 sinon1119904 le vecteur de longueur 119904 composeacute uniquement de 1 11199041prime

119904 =J119904 ougrave J119904 est la matrice carreacute de taille 119904 ne contenant que des1119860 lrsquoaire drsquoeacutetude et selon le contexte sa surface120572120584 la probabiliteacute moyenne des espegraveces repreacutesenteacutees par 120584individus119862 le taux de couverture de lrsquoeacutechantillon crsquoest-agrave-dire la pro-babiliteacute qursquoun individu de la communauteacute appartienne agrave unedes espegraveces eacutechantillonneacutees 119862119899 est le taux de couverture cor-respondant agrave un eacutechantillon de taille 119899119902119863 la diversiteacute vraie (nombre de Hill pour les diversiteacutes 120572et 120574) nombre eacutequivalent de communauteacutes pour la diversiteacute 120573119902119894119863120572 est la diversiteacute 120572 mesureacutee dans la communauteacute 119894 119902 (119879 )est la diversiteacute phylogeacuteneacutetiqueΔ la matrice de dissimilariteacute dont les eacuteleacutements sont 120575119904119905 ladissimilariteacute entre lrsquoespegravece 119904 et lrsquoespegravece 119905

xiv Table des matiegraveres

120124 (119883) lrsquoespeacuterance de la variable aleacuteatoire 119883119902119867 lrsquoentropie de Tsallis (ou HCDT) 119902

119894119867120572 est lrsquoentropie 120572mesureacutee dans la communauteacute 119894 Si neacutecessaire le vecteur desprobabiliteacutes servant au calcul est preacuteciseacute sous la forme 119902119867(p)119902(119879 ) est lrsquoentropie phylogeacuteneacutetique119868 le nombre de communauteacutes qui constituent une partitionde la meacuteta-communauteacute dans le cadre de la deacutecomposition dela diversiteacute Les communauteacutes sont indexeacutees par 119894119868(119901119904) lrsquoinformation apporteacutee par lrsquoobservation drsquoun eacutevegravene-ment de probabiliteacute 119901119904 119868(119902119904 119901119904) est le gain drsquoinformation ap-porteacute par lrsquoexpeacuterience (119902119904 est observeacute) par rapport aux proba-biliteacutes 119901119904 attenduesI119904 la matrice identiteacute de rang 119904 matrice carreacutee de taille 119904times119904dont la diagonale ne comporte que des 1 et les autres eacutelementssont nuls119873 le nombre (aleacuteatoire) drsquoindividus se trouvant dans lrsquoairedrsquoeacutetude 119873119904 est la mecircme variable aleacuteatoire mais restreinte auxindividus de lrsquoespegravece 119904119899 le nombre drsquoindividus eacutechantillonneacutes 119899119904119894 est le nombredrsquoindividus de lrsquoespegravece 119904 dans la communauteacute 119894 Les effectifstotaux sont 119899119904+ (pour lrsquoespegravece 119904) 119899+119894 pour la communauteacute 119894et 119899 le total geacuteneacuteral Srsquoil nrsquoy a qursquoune communauteacute le nombredrsquoindividus par espegravece est 119899119904119901119904 la probabiliteacute qursquoun individu tireacute au hasard appartienneagrave lrsquoespegravece 119904 Son estimateur 119901119904 est la freacutequence observeacutee 119901119904|119894est la mecircme probabiliteacute dans la communauteacute 119894p = (1199011 1199012 hellip 119901119904 hellip 119901119878) le vecteur deacutecrivant la distributiondes probabiliteacutes 119901119904 appeleacute simplexe en reacutefeacuterence agrave sa repreacute-sentation dans lrsquoespace agrave 119878 dimensions120587120584 la probabiliteacute qursquoune espegravece choisie au hasard soit re-preacutesenteacutee par 120584 individus sum119899

120584=1 120587120584=1 Si lrsquoespegravece est choisieexplicitement la probabiliteacute est noteacutee 120587119899119904

119902119877 lrsquoentropie de Reacutenyi drsquoordre 119902119878 le nombre drsquoespegraveces consideacutereacute comme une variable aleacutea-toire estimeacute par 119878119878119899

120584 le nombre drsquoespegraveces consideacutereacute comme une variable aleacutea-toire observeacutees 120584 fois dans lrsquoeacutechantillonnage Lrsquoindice est lenombre de fois ougrave lrsquoespegravece est deacutetecteacutee par exemple 1198781 ou119878ne0 Lrsquoexposant est la taille de lrsquoeacutechantillon 119878119860 pour la sur-face 119860 ou 119878119899 pour un eacutechantillon de 119899 individus 119878119860

0 est lenombre drsquoespegraveces non rencontreacutees dans la surface 119860 Pour al-leacuteger les notations srsquoil nrsquoy a pas drsquoambiguiumlteacute lrsquoindice est omispour les espegraveces preacutesentes 119878119860

ne0 est noteacute 119878119860 Si lrsquoexposant nrsquoestpas noteacute lrsquoeacutechantillon nrsquoest pas preacuteciseacute et peut ecirctre aussi bienun nombre drsquoindividus qursquoune surface

Table des matiegraveres xv

119904119899120584 le nombre drsquoespegraveces observeacutees avec les mecircmes notations

que ci-dessus 119904119899120584 peut ecirctre consideacutereacute comme une reacutealisation

de 119878119899120584

1199051198991minus1205722 le quantile drsquoune loi de Student agrave 119899 degreacutes de liberteacute au

seuil de risque 120572 classiquement 196 pour 119899 grand et 120572 = 5Z la matrice de similariteacute entre espegraveces dont les eacuteleacutementssont 119911119904119905 la similariteacute entre lrsquoespegravece 119904 et lrsquoespegravece 119905(sdot) la fonction gamma(sdot) la fonction digamma(119899

119896) le nombre de combinaisons de 119896 eacuteleacutements parmi 119899

(119899119896) = 119899

119896 (119899 minus 119896)

Premiegravere partie

Notions

1R H Whittaker laquo Dominanceand Diversity in Land Plant Commu-nities raquo In Science 1473655 (1965)p 250-260 doi 101126science1473655250

2terme introduit par R P Mcin-tosh laquo An Index of Diversity and theRelation of Certain Concepts to Di-versity raquo In Ecology 483 (1967)p 392-404 doi 1023071932674

Chapitre 1

Notions de Diversiteacute

11 Composantes

2 espegraveces

7 espegraveces

4 espegraveces

Fig 11 Importance de larichesse (en haut) et delrsquoeacutequitabiliteacute (en bas) pour ladeacutefinition de la diversiteacute Ligne duhaut toutes choses eacutegales parailleurs une communauteacute de 7espegraveces semble plus diverse qursquounecommunauteacute de 2 espegraveces Lignedu bas agrave richesse eacutegale unecommunauteacute moins eacutequitable (agravegauche) semble moins diverseColonne de gauche unecommunauteacute moins riche (en haut)peut sembler plus diverse si elle estplus eacutequitable Colonne de droite idem pour la communauteacute du bas

Une communauteacute comprenant beaucoup drsquoespegraveces maisavec une espegravece dominante nrsquoest pas perccedilue intuitivementcomme plus diverse qursquoune communauteacute avec moins drsquoespegravecesmais dont les effectifs sont proches (figure 11 colonne degauche) La prise en compte de deux composantes de la di-versiteacute appeleacutees richesse et eacutequitabiliteacute est neacutecessaire1

RichesseLa richesse2 est le nombre (ou une fonction croissante du

nombre) de classes diffeacuterentes preacutesentes dans le systegraveme eacutetudieacutepar exemple le nombre drsquoespegraveces drsquoarbres dans une forecirct

Un certain nombre drsquohypothegraveses sont assumeacutees plus oumoins explicitement

bull Les classes sont bien connues compter le nombre drsquoes-pegraveces a peu de sens si la taxonomie nrsquoest pas bien eacutetablie

4 Notions de Diversiteacute

3D Mouillot et al laquo Niche Over-lap Estimates Based on QuantitativeFunctional Traits A New Family ofNon-Parametric Indices raquo In Oeco-logia 1453 (2005) p 345-353 doi 101007s00442- 005- 0151- z C Ri-cotta laquo A Semantic Taxonomy for Di-versity Measures raquo In Acta Biotheo-retica 551 (2007) p 23-33 doi 101007s10441-007-9008-7

4S Pavoine et M B Bonsalllaquo Measuring Biodiversity to ExplainCommunity Assembly A Unified Ap-proach raquo In Biological Reviews 864(2011) p 792-812 doi 101111j1469-185X201000171x

Crsquoest parfois une difficulteacute majeure quand on travaillesur les microorganismes

bull Les classes sont eacutequidistantes la richesse augmentedrsquoune uniteacute quand on rajoute une espegravece que cetteespegravece soit proche des preacuteceacutedentes ou extrecircmementoriginale

Lrsquoindice de richesse le plus simple et le plus utiliseacute est toutsimplement le nombre drsquoespegraveces 119878

EacutequitabiliteacuteLa reacutegulariteacute de la distribution des espegraveces (eacutequitabiliteacute en

Franccedilais evenness ou equitability en anglais) est un eacuteleacutementimportant de la diversiteacute Une espegravece repreacutesenteacutee abondam-ment ou par un seul individu nrsquoapporte pas la mecircme contribu-tion agrave lrsquoeacutecosystegraveme Sur la figure 11 la ligne du bas preacutesentedeux communauteacutes de 4 espegraveces mais celle de droite est beau-coup plus eacutequitable de celle de gauche et semble intuitivementplus diverse Agrave nombre drsquoespegraveces eacutegal la preacutesence drsquoespegravecestregraves dominantes entraicircne matheacutematiquement la rareteacute de cer-taines autres on comprend donc assez intuitivement que lemaximum de diversiteacute sera atteint quand les espegraveces aurontune reacutepartition tregraves reacuteguliegravere

Un indice drsquoeacutequitabiliteacute est indeacutependant du nombre drsquoes-pegraveces (donc de la richesse)

La plupart des indices courants comme ceux de Simpsonou de Shannon eacutevaluent agrave la fois la richesse et lrsquoeacutequitabiliteacute

DispariteacuteLes mesures classiques de la diversiteacute dites mesures de

diversiteacute neutre (species-neutral diversity) ou taxonomique neprennent pas en compte une quelconque distance entre classesPourtant deux espegraveces du mecircme genre sont de toute eacutevi-dence plus proches que deux espegraveces de familles diffeacuterentesLes mesures de diversiteacute non neutres (chapitre 6) prennent encompte cette notion qui neacutecessite quelques deacutefinitions suppleacute-mentaires3

La mesure de la diffeacuterence entre deux classes est souventune distance mais parfois une mesure qui nrsquoa pas toutes lesproprieacuteteacutes drsquoune distance une dissimilariteacute Les mesures dedivergence4 sont construites agrave partir de la dissimilariteacute entreles classes avec ou sans pondeacuteration par la freacutequence

Si la divergence entre espegraveces est une distance eacutevolutivecomme lrsquoacircge du plus reacutecent ancecirctre commun la diversiteacute seradite phylogeacuteneacutetique Si crsquoest une distance fonctionnelle deacutefiniepar exemple dans lrsquoespace des traits fonctionnels la diversiteacutesera dite fonctionnelle

12 Niveaux de lrsquoeacutetude 5

5B Runnegar laquo Rates andModes of Evolution in the Mollusca raquoIn Rates of Evolution Sous ladir de M Campbell et M F DayLondon Allen amp Unwin 1987p 39-60

6A Stirling laquo A General Fra-mework for Analysing Diversity inScience Technology and Society raquoIn Journal of the Royal Society In-terface 415 (2007) p 707-719 doi 101098rsif20070213

7L Jost laquo The Relation betweenEvenness and Diversity raquo In Diver-sity 22 (2010) p 207-232 doi 103390d2020207

8R H Whittaker laquo Vegetationof the Siskiyou Mountains Oregonand California raquo In Ecological Mo-nographs 303 (1960) p 279-338 doi 1023071943563 JSTOR 1943563page 320

9K J Gaston laquo Global Patternsin Biodiversity raquo In Nature 4056783(2000) p 220-227 doi 10 1038 35012228

10Ibid figure 111A Miraldo et al laquo An Anthro-

pocene Map of Genetic Diversity raquoIn Science 3536307 (2016) p 1532-1535 doi 101126scienceaaf4381

La dispariteacute5 divergence moyenne entre deux espegraveces (in-deacutependamment des freacutequences) ou de faccedilon eacutequivalente la lon-gueur totale des branches drsquoun arbre phylogeacuteneacutetique est lacomposante qui deacutecrit agrave quel point les espegraveces sont diffeacuterentesles unes des autres

Les mesures de reacutegulariteacute deacutecrivent la faccedilon dont les es-pegraveces occupent lrsquoespace des niches (reacutegulariteacute fonctionnelle)ou la reacutegulariteacute dans le temps et entre les clades des eacutevegravene-ments de speacuteciation repreacutesenteacutes par un arbre phylogeacuteneacutetiqueCe concept complegravete celui drsquoeacutequitabiliteacute dans les mesures clas-siques la diversiteacute augmente avec la richesse la divergenceentre espegraveces et la reacutegulariteacute (qui se reacuteduit agrave lrsquoeacutequitabili-teacute quand toutes les espegraveces sont eacutegalement divergentes entreelles)

Agreacutegation

Agrave partir drsquoune large revue de la litteacuterature dans plusieursdisciplines scientifiques srsquointeacuteressant agrave la diversiteacute (au-delagrave dela biodiversiteacute) A Stirling6 estime que les trois composantesqursquoil nomme varieacuteteacute (richesse) eacutequilibre (eacutequitabiliteacute) et dis-pariteacute recouvrent tous les aspects de la diversiteacute

Stirling deacutefinit la proprieacuteteacute drsquoagreacutegation comme la capaciteacutedrsquoune mesure de diversiteacute agrave combiner explicitement les troiscomposantes preacuteceacutedentes Cela ne signifie pas que les compo-santes contribuent indeacutependamment les unes des autres agrave ladiversiteacute7

12 Niveaux de lrsquoeacutetudeLa diversiteacute est classiquement estimeacutee agrave plusieurs niveaux

emboicircteacutes nommeacutes 120572 120573 et 120574 par Whittaker8 qui a nommeacute 120572 ladiversiteacute locale qursquoil mesurait avec lrsquoindice 120572 de Fisher (voir lechapitre 20) et a utiliseacute les lettres suivantes selon ses besoins

Diversiteacute 120572 120573 et 120574La diversiteacute 120572 est la diversiteacute locale mesureacutee agrave lrsquointeacuterieur

drsquoun systegraveme deacutelimiteacute Plus preacuteciseacutement il srsquoagit de la diver-siteacute dans un habitat uniforme de taille fixe

De faccedilon geacuteneacuterale9 la richesse speacutecifique diminue avec lalatitude (la diversiteacute est plus grande dans les zones tropicaleset au sein de celles-ci quand on se rapproche de lrsquoeacutequateur)voir figure 1210 La tendance est la mecircme pour la diversiteacutegeacuteneacutetique intraspeacutecifique11 La richesse diminue avec lrsquoaltitudeElle est geacuteneacuteralement plus faible sur les icircles ougrave elle deacutecroicirct avecla distance au continent source de migrations

Fig 12 Patrons de biodiversiteacute(a) Le nombre drsquoespegraveces de vers de

terre augmente en fonction de lasurface eacutechantillonneacutee de 100 msup2 agrave

plus de 500000 kmsup2 selon larelation drsquoArrhenius) (b) Nombredrsquoespegraveces drsquooiseaux en fonction de

la latitude (c) Relation entre larichesse reacutegionale et la richesse

locale (d) Nombre drsquoespegraveces dechauves-souris en fonction delrsquoaltitude dans une reacuteserve au

Peacuterou (e) Nombre drsquoespegraveces deveacutegeacutetaux ligneux en fonction des

preacutecipitations en Afrique du Sudhistory of biodiversity56 In the marine environment open-oceanpelagic and deep-sea taxa also show broad latitudinal gradients inspecies richness but some debate continues to surround evidence forshallow-water systems particularly for non-calcareous taxa7

The growing number of increasingly refined analyses of latitudi-nal gradients in species richness has begun to suggest some impor-tant nuances to this pattern although the extent of their generalityremains uncertain Thus it seems that declines in richness with latitude may be faster in the Northern than in the Southern Hemisphere89 and that peaks in richness may not lie actually at theEquator itself but some distance away1011 Although poorly docu-mented such latitudinal asymmetries would be unsurprising giventhat these exist also in contemporary climate in historical climaticevents and in the latitudinal complexities of the geometry and area ofland and ocean

Indeed the latitudinal gradient in species richness is a grossabstraction Any underlying pattern is disrupted sometimesmarkedly by variation in species richness with other positional variables (for example longitude elevation and depth) and environmental ones (for example topography and aridity) Thusthe detailed pattern of change with latitude depends on where onelooks reflecting the generally complex patterns of spatial variation inspecies richness This indicates that consideration of latitudinal gradients in richness in isolation from other gradients might not bethe most profitable way forward In as much as latitude per se (andlikewise other positional variables) cannot be a determinant ofspecies richness but only a correlate of numbers of potentially causalenvironmental factors this is doubtless correct Nonetheless morethan any other pattern the latitudinal gradient in species richness has

held an enduring fascination for biologists particularly because ofthe obviously striking diversity of many tropical floras and faunaswhen contrasted with their counterparts at high latitudes

The latitudinal gradient in species richness however complex itmight be is a consequence of systematic spatial variation in the balance of speciation and the immigration of species which addspecies to an area and of the extinction and emigration of specieswhich take them away For very large areas the effects of speciationand regional or global extinction will predominate and immigrationand emigration will be less important More than 25 different mecha-nisms have been suggested for generating systematic latitudinal variation in these processes2 commonly emphasizing reasons as towhy the tropics are highly speciose (although there is no a prioriexpectation that either tropical or temperate zones in any sense represent an lsquounusualrsquo condition12) These include explanationsbased on chance historical perturbation environmental stabilityhabitat heterogeneity productivity and interspecific interactions

Many of these mechanisms are not mutually exclusive and othersmerely offer different levels of explanation Nonetheless to some enmasse they have been perceived to constitute a gordian knot Tworecent attempts to cut it concern the importance of the physical struc-ture of the Earth First null models that assume no environmentalgradients but merely a random latitudinal association between thesize and placement (midpoint) of the geographical ranges of speciespredict a peak of species richness at tropical latitudes13 This occursbecause when the latitudinal extents of species in a given taxonomicgroup are bounded to north and south mdash perhaps by a physical con-straint such as a continental edge or perhaps by a climatic constraintsuch as a critical temperature or precipitation threshold mdash then the

insight review articles

NATURE | VOL 405 | 11 MAY 2000 | wwwnaturecom 221

Figure 1 Spatial patterns in species richness a Speciesndasharea relationshipearthworms in areas ranging from 100 m2 togt500000 km2 acrossEurope76 b Speciesndashlatituderelationship birds in grid cells(~ 611000 km2) across theNew World44 c Relationshipbetween local and regionalrichness lacustrine fish inNorth America (orange circleslarge lakes blue circles smalllakes)61 d Speciesndashelevationrelationship bats in ManuNational Park amp BiosphereReserve Peru77 e Speciesndashprecipitationrelationship woody plants ingrid cells (20000 km2) insouthern Africa78

ndash02

ndash5 ndash3 ndash1 1 3 5 08 10 12 14 16 18 20 22

ndash80 ndash60 ndash40 ndash20 0 20 40 60 0

0 200 400 600 800 1000 1200 1400

500 1000 1500 2000 2500 3000 3500

Log area Log regional number of species

Latitude

Annual precipitation (mm)

Elevation (m)degN degS

copy 2000 Macmillan Magazines Ltd

12C E Moreno et P Rodriacute-guez laquo A Consistent Terminology forQuantifying Species Diversity raquo In Oecologia 1632 (2010) p 279-82doi 101007s00442-010-1591-7

13R H Whittaker laquo Evolution ofSpecies Diversity in Land Communi-ties raquo In Evolutionary Biology 10(1977) Sous la dir de M K Hechtet al p 1-67

La diversiteacute 120573 mesure agrave quel point les systegravemes locaux sontdiffeacuterents Cette deacutefinition assez vague fait toujours lrsquoobjet dedeacutebats12

Enfin la diversiteacute 120574 est similaire agrave la diversiteacute 120572 prise encompte sur lrsquoensemble du systegraveme eacutetudieacute Les diversiteacutes 120572 et120574 se mesurent donc de la mecircme faccedilon

Deacutecomposition

Whittaker13 a proposeacute sans succegraves une normalisation deseacutechelles drsquoeacutevaluation de la biodiversiteacute en introduisant la di-versiteacute reacutegionale 120576 (120574 eacutetant reacuteserveacute au paysage et 120572 agrave lrsquohabitat)et la diversiteacute 120575 entre les paysages Seuls les trois niveaux origi-naux ont eacuteteacute conserveacutes par la litteacuterature sans deacutefinition strictedes eacutechelles drsquoobservation

La distinction entre les diversiteacutes 120572 et 120573 deacutepend de la fi-nesse de la deacutefinition de lrsquohabitat La distinction de nombreuxhabitats diminue la diversiteacute 120572 au profit de la 120573 Il est donc im-portant de deacutefinir une mesure qui ne deacutepende pas de ce deacutecou-page donc une mesure cumulative (additive ou multiplicative)deacutecrivant la diversiteacute totale deacutecomposable en la somme ou leproduit convenablement pondeacutereacutes de toutes les diversiteacutes 120572des habitats (diversiteacute intra) et de la diversiteacute 120573 inter-habitat

Nous appellerons communauteacute le niveau de deacutecoupageconcernant la diversiteacute 120572 et meacuteta-communauteacute le niveau de

14E Casetta laquo Eacutevaluer et Conser-ver La Biodiversiteacute Face Au Pro-blegraveme Des Espegraveces raquo In La Biodi-versiteacute En Question Enjeux Philo-sophiques Eacutethiques et ScientifiquesSous la dir drsquoE Casetta et J De-lord Paris Editions Mateacuteriologiques2014 p 139-154

15R A Richards The SpeciesProblem A Philosophical AnalysisCambridge Cambridge UniversityPress 2010

16R L Mayden laquo A Hierarchy ofSpecies Concepts The Denouementin the Saga of the Species Problem raquoIn Species The Units of Biodiver-sity Sous la dir de M F Claridge etal London Chapman and Hall 1997p 381-424

17J S Wilkins laquo Philosophical-ly Speaking How Many SpeciesConcepts Are There raquo In Zootaxa27651 (15 feacutev 2011) p 58-60 doi 1011646zootaxa276515

18T Dobzhansky Genetics andthe Origin of Species New York Co-lumbia University Press 1937

19E Mayr Systematics and theOrigin of Species from the Viewpointof a Zoologist New York ColumbiaUniversity Press 1942

20J Cracraft laquo Species Conceptsand Speciation Analysis raquo In Cur-rent Ornithology Volume 1 Sous ladir de R F Johnston T 1 Cur-rent Ornithology Springer US 1983p 159-187 doi 101007978-1-4615-6781-3_6

21J Sukumaran et L L Knowleslaquo Multispecies Coalescent DelimitsStructure Not Species raquo In Pro-ceedings of the National Academyof Sciences of the United States ofAmerica in press (2017) doi 10 1073PNAS1607921114

22L Van Valen laquo Ecological Spe-cies Multispecies and Oaks raquo In Taxon 2523 (1976) p 233-239 doi 1023071219444

23ensemble drsquoespegraveces voisineseacutechangeant des gegravenes J Pernegraves eacutedGestion Des Ressources GeacuteneacutetiquesDes Plantes Tome 2 ManuelParis Agence de Coopeacuterationculturelle et technique 1984

24P M Agapow et al laquo The Im-pact of Species Concept on Biodiver-sity Studies raquo In The Quarterly Re-view of Biology 792 (2004) p 161-179 doi 101086383542

25Hey laquo The Mind of the SpeciesProblem raquo cf note 8 p x

26A Barberousse et S Samadilaquo La Taxonomie et Les Collectionsdrsquohistoire Naturelle agrave lrsquoheure de LaSixiegraveme Extinction raquo In La Biodi-versiteacute En Question Enjeux Philo-sophiques Eacutethiques et ScientifiquesSous la dir drsquoE Casetta et J De-lord Paris Editions Mateacuteriologiques2014 p 155-182

regroupement pour lrsquoestimation de la diversiteacute 120574

13 Le problegraveme de lrsquoespegraveceEacutevaluer la richesse speacutecifique suppose que les espegraveces soient

deacutefinies clairement ce qui nrsquoest de toute eacutevidence pas le cas14

Le premier aspect du problegraveme concerne la nature des es-pegraveces reacutealiteacute naturelle ou seulement repreacutesentation simplifi-catrice Une analyse historique et philosophique en est faitepar Richards15 Lrsquoautre aspect avec des conseacutequences pra-tiques plus immeacutediates concerne leur deacutelimitation Mayden16

recense vingt-deux deacutefinitions diffeacuterentes du concept drsquoespegraveceWilkins17 estime qursquoil nrsquoy a qursquoun seul concept drsquoespegravece maissept deacutefinitions crsquoest-agrave-dire sept faccedilons de les identifier etvingt-sept variations ou meacutelanges de ces deacutefinitions

La deacutefinition historique est celle de morphoespegravece quiclasse les espegraveces selon leurs formes supposeacutees drsquoabordimmuables La deacutefinition moderne la plus reacutepandue est celledrsquoespegravece biologique 18 un laquo groupe de populations naturellesisoleacutees reproductivement les unes des autres raquo19 Lorsqueles populations drsquoune espegravece sont isoleacutees geacuteographiquementleur capaciteacute agrave se reproduire ensemble est toute theacuteorique(et rarement veacuterifieacutee expeacuterimentalement) Des populationsallopatriques nrsquoont pas de flux de gegravenes reacuteels entre elles etpeuvent ecirctre consideacutereacutees comme des espegraveces distinctes selonla deacutefinition drsquoespegravece phylogeacuteneacutetique laquo le plus petit groupeidentifiable drsquoindividus avec un pattern commun drsquoancecirctreset de descendants raquo20 Crsquoest lrsquouniteacute geacuteneacutetique deacutetecteacutee par lameacutethode du coalescent pour la deacutelimitation des espegraveces21

Le nombre drsquoespegraveces phylogeacuteneacutetiques est bien supeacuterieur aunombre drsquoespegraveces biologiques Enfin Van Valen22 deacutefinit lesespegraveces par la niche eacutecologique qursquoelles occupent (agrave partirde lrsquoexemple des checircnes blancs europeacuteens) plutocirct que parles flux de gegravenes (permanents entre les espegraveces distinctes) la deacutefinition eacutecologique drsquoespegravece est proche du concept decomplexe drsquoespegraveces23

Le choix de la deacutefinition modifie consideacuterablement surla quantification de la richesse24 Des problegravemes meacutethodolo-giques srsquoajoutent aux problegravemes conceptuels 25 la seacuteparationou le regroupement de plusieurs populations ou morphotypesen un nombre plus ou moins grand drsquoespegraveces est un choix quireflegravete les connaissances du moment et peut eacutevoluer26

Lrsquoimpact du problegraveme de lrsquoespegravece sur la mesure de la di-versiteacute reste sans solution agrave ce stade si ce nrsquoest drsquoutiliser lesmecircmes deacutefinitions si des communauteacutes diffeacuterentes doivent ecirctrecompareacutees Lrsquoapproche phylogeacuteneacutetique (chapitre 8) permet decontourner le problegraveme si deux taxons tregraves semblables ap-portent agrave peine plus de diversiteacute qursquoun seul taxon le choix de

les distinguer ou non nrsquoest pas critique

Chapitre 2

Outils

La diversiteacute peut ecirctre deacutecrite localement par une courbe drsquoaccumulation(SAC) qui repreacutesente le nombre drsquoespegraveces eacutechantillonneacutees en fonctionde lrsquoeffort Agrave une eacutechelle plus large cette courbe srsquoappelle relation aire-espegraveces (SAR)La distribution des abondances des espegraveces (SAD) est repreacutesenteacutee parune histogramme des freacutequences ou un diagramme rang-abondanceLe taux de couverture est la somme des probabiliteacutes des espegraveces observeacuteeseacutetant donneacute lrsquoeffort drsquoeacutechantillonnage Il peut ecirctre estimeacute preacuteciseacutement agravepartir des donneacutees drsquoinventaire Le taux de compleacutetude est la proportion(en nombre) des espegraveces observeacutees

Lrsquoessentiel

Quelques outils sont neacutecessaires avant drsquoentrer dans lecoeur du sujet Les relations deacutecrivant le nombre drsquoespegravecesen fonction de la taille de lrsquoeacutechantillon (relations aire-espegraveces)et la distribution de lrsquoabondance des espegraveces sont importantspour les eacutecologues La mesure de lrsquoexhaustiviteacute de lrsquoeacutechan-tillonnage par le taux de couverture sera la base de lrsquoestima-tion de la diversiteacute agrave partir de donneacutees reacuteelles

21 Courbes drsquoaccumulation

0 10 20 30 40 50Surface (ha)

Fig 21 Courbe drsquoaccumulationdes espegraveces drsquoarbres du dispositifde Barro Colorado Island Lenombre drsquoespegraveces est cumuleacute danslrsquoordre des carreacutes drsquoun hectare dudispositif

10 Outils

1S M Scheiner laquo Six Typesof Species-Area Curves raquo In Glo-bal Ecology and Biogeography 126(2003) p 441-447 doi 101046j1466-822X200300061x

2J Dengler laquo Which FunctionDescribes the Species-Area Relation-ship Best A Review and EmpiricalEvaluation raquo In Journal of Biogeo-graphy 364 (2009) p 728-744 doi 101111j1365-2699200802038x

Evaluer la diversiteacute drsquoune communauteacute neacutecessite en pra-tique de lrsquoinventorier Le nombre drsquoespegraveces deacutecouvertes enfonction de lrsquoeffort drsquoeacutechantillonnage permet de tracer unecourbe drsquoaccumulation (SAC Species Acumulation Curve)Une courbe de rareacutefaction (Rarefaction Curve) peut ecirctre cal-culeacutee en reacuteduisant par des outils statistiques lrsquoeffort drsquoeacutechan-tillonnage reacuteel pour obtenir une SAC theacuteorique libeacutereacutee desaleacuteas de lrsquoordre de prise en compte des donneacutees

La figure 21 montre lrsquoaccumulation des espegraveces pour lesdonneacutees de BCI Une SAC peut ecirctre traceacutee en fonction de lasurface du nombre drsquoindividus ou du nombres de placettesdrsquoeacutechantillonnage selon les besoins

Code R pour reacutealiser la figure 21

library(vegan)data(BCI)Cumul lt- apply(BCI 2 cumsum)Richesse lt- apply(Cumul 1 function(x) sum(x gt 0))SARplot lt- ggplot(dataframe(A = 050

S = c(0 Richesse))) +aes(A S) +geom_line() +labs(x = Surface (ha))

SARplot

Les courbes drsquoaccumulation peuvent aussi concerner la di-versiteacute (voir le chapitre 21) mesureacutee au-delagrave du nombre drsquoes-pegraveces

Plus geacuteneacuteralement une courbe aire-espegraveces (SAR SpeciesArea Relationship) repreacutesente le nombre drsquoespegraveces observeacutees enfonction de la surface eacutechantillonneacutee (figure 221) Il existe plu-sieurs faccedilons de prendre en compte cette relation1 classablesen deux grandes familles 2

bull Dans une SAR au sens strict chaque point repreacute-sente une communauteacute La question traiteacutee est larelation entre le nombre drsquoespegraveces et la taille de chaquecommunauteacute en lien avec des processus eacutecologiques

bull Une courbe drsquoaccumulation (SAC) ne repreacutesente que lrsquoef-fet statistique de lrsquoeacutechantillonnage Pour eacuteviter touteconfusion le terme SAR ne doit pas ecirctre utiliseacute pourdeacutecrire une SAC

22 Diversiteacute asymptotiqueAugmenter lrsquoeffort drsquoeacutechantillonnage peut permettre drsquoat-

teindre un stade ougrave la diversiteacute nrsquoaugmente plus sa valeur estappeleacutee diversiteacute asymptotique Dans des communauteacutes tregraves di-verses comme les forecircts tropicales la diversiteacute asymptotiquene peut en geacuteneacuteral pas ecirctre observeacutee sur le terrain agrave cause de

23 Taux de couverture 11

3I J Good laquo The PopulationFrequency of Species and the Estima-tion of Population Parameters raquo In Biometrika 4034 (1953) p 237-264doi 101093biomet403-4237

4C-H Chiu et al laquo An ImprovedNonparametric Lower Bound of Spe-cies Richness via a Modified Good-Turing Frequency Formula raquo In Biometrics 703 (2014) p 671-682doi 10 1111 biom 12200 PMID 24945937 eq 6 et 7a

la variabiliteacute de lrsquoenvironnement lrsquoaugmentation de la sur-face inventorieacutee amegravene agrave eacutechantillonner dans des communau-teacutes diffeacuterentes avant drsquoatteindre la diversiteacute asymptotique dela communauteacute eacutetudieacutee La diversiteacute asymptotique est donccelle drsquoune communauteacute theacuteorique qui nrsquoexiste geacuteneacuteralementpas En drsquoautres termes crsquoest la diversiteacute drsquoune communauteacutedont lrsquoinventaire disponible serait un eacutechantillon repreacutesentatif

Evaluer la diversiteacute asymptotique neacutecessite drsquoutiliser desestimateurs de diversiteacute dont la preacutecision deacutepend de lrsquoexhaus-tiviteacute de lrsquoeacutechantillonnage La diversiteacute peut aussi ecirctre estimeacuteepour un effort donneacute un hectare de forecirct ou 5000 arbres parexemple ou encore un taux de couverture choisi qui deacutecritmieux la qualiteacute de lrsquoeacutechantillonnage

23 Taux de couverture

Formule des freacutequences de Good-TuringLa relation fondamentale entre les freacutequences des espegraveces

dans un eacutechantillon est due agrave Turing et a eacuteteacute publieacutee parGood3 En absence de toute information sur la loi de distri-bution des espegraveces en supposant seulement que les individussont tireacutes indeacutependamment les uns des autres selon une loimultinomiale respectant ces probabiliteacutes la formule de Good-Turing relie la probabiliteacute moyenne 120572120584 drsquoune espegravece repreacutesen-teacutee 120584 fois (crsquoest-agrave-dire par 120584 individus) au rapport entre lesnombres drsquoespegraveces repreacutesenteacutees 120584 + 1 fois et 120584 fois

120572120584 asymp (120584 + 1)119899

119904119899120584+1119904119899120584

Les singletons (1199041198991 le nombre drsquoespegraveces observeacutees une

seule fois) et les doubletons (1199041198992 le nombre drsquoespegraveces obser-

veacutees deux fois) ont une importance centrale Pour 120584 = 1 ona 1205721 = 2119904119899

2 (1198991199041198991 ) la freacutequence drsquoune espegravece typiquement

repreacutesenteacutee par un singleton est proportionnelle au rapportentre le nombre des doubletons et des singletons Pour 120584 = 0lrsquoignorance du nombre drsquoespegraveces non eacutechantillonneacutees 119904119899

0 poseproblegraveme mais le produit 1205720times119904119899

0 = 1205870 la probabiliteacute totale desespegraveces non repreacutesenteacutees peut ecirctre estimeacutee par 119904119899

1 119899 Ces re-lations sont le fondement des estimateurs de richesse de Chaopreacutesenteacutees ci-dessous

La relation a eacuteteacute preacuteciseacutee4 en limitant les approximationsdans les calculs La seule neacutecessaire est que les probabiliteacutesdes espegraveces repreacutesenteacutees le mecircme nombre de fois 120584 varient peuet puissent ecirctre consideacutereacutees toutes eacutegales agrave 120572120584 Alors 120572120584 estestimeacute par

120572120584 = (120584 + 1) 119904119899120584+1

(119899 minus 120584) 119904119899120584 + (120584 + 1) 119904119899120584+1

12 Outils

5Good laquo The Population Fre-quency of Species and the Estima-tion of Population Parameters raquo cfnote 3 p 11

6A Chao et L Jost laquo Coverage-Based Rarefaction and Extrapola-tion Standardizing Samples by Com-pleteness Rather than Size raquo In Eco-logy 9312 (2012) p 2533-2547 doi 10189011-19521

7G Dauby et O J Hardylaquo Sampled-Based Estimation of Di-versity Sensu Stricto by Transfor-ming Hurlbert Diversities into Effec-tive Number of Species raquo In Eco-graphy 357 (2012) p 661-672 doi 101111j1600-0587201106860x

8Z Zhang et H Huang laquo Tu-ringrsquos Formula Revisited raquo In Jour-nal of Quantitative Linguistics 142-3 (2007) p 222-241 doi 10108009296170701514189

9A Chao et al laquo A GeneralizedGoodrsquos Nonparametric Coverage Es-timator raquo In Chinese Journal ofMathematics 16 (1988) p 189-199JSTOR 43836340

10Z Zhang et Huang cf note 8

11W W Esty laquo A Normal Li-mit Law for a Nonparametric Esti-mator of the Coverage of a RandomSample raquo In The Annals of Statis-tics 113 (1983) p 905-912 doi 1023072240652 JSTOR 2240652

12C-H Zhang et Z Zhanglaquo Asymptotic Normality of a Nonpa-rametric Estimator of Sample Cove-rage raquo In Annals of Statistics 37 (5A2009) p 2582-2595 doi 10121408-aos658

Ce nouvel estimateur est agrave la base de lrsquoestimateur de Chaoameacutelioreacute et des estimateurs drsquoentropie de Chao et Jost (sec-tions 33 et 46)

Taux de couverture et deacuteficit de couverture

Good5 deacutefinit le taux de couverture (sample coverage)de lrsquoeacutechantillonnage comme la proportion des espegravecesdeacutecouvertes

119862 =119878

sum119904=1

1 (119899119904 gt 0) 119901119904 (23)

ougrave 1(sdot) est la fonction indicatrice Son compleacutement agrave 1 estappeleacute deacuteficit de couverture (coverage deficit)

Le taux de couverture augmente avec lrsquoeffort drsquoeacutechantillon-nage Plus il est eacuteleveacute meilleures seront les estimations de ladiversiteacute Pour comparer deux communauteacutes par des courbesde rareacutefaction Chao et Jost6 montrent que le taux de couver-ture plutocirct que la taille de lrsquoeacutechantillon doit ecirctre identique Lesestimateurs de la diversiteacute deacuteveloppeacutes plus loin reposent large-ment sur cette notion pour la correction du biais drsquoeacutechantillon-nage7 (la sous-estimation systeacutematique de la diversiteacute due auxespegraveces non observeacutees un des eacuteleacutements du biais drsquoestimation)

Lrsquoestimateur du taux de couverture que Good attribue agraveTuring est selon la relation des freacutequences vues plus haut

119862 = 1 minus 1199041198991119899 (24)

Cet estimateur est biaiseacute8 En reacutealiteacute

119862 = 1 minus 120124(1198781198991 ) minus 1205871119899 (25)

Lrsquoestimateur de Good neacuteglige le terme 1205871 la somme desprobabiliteacutes des espegraveces observeacutees une fois Ce terme peut ecirctreestimeacute avec un biais plus petit Chao et al9 puis Z Zhanget Huang10 proposent lrsquoestimateur suivant qui utilise toutelrsquoinformation disponible et a le plus petit biais possible

119862 = 1 minus119899

sum120584=1

(minus1)120584+1(119899120584)

minus1119904119899

120584 (26)

Les termes de la somme deacutecroissent tregraves vite avec 120584 En selimitant agrave 120584 = 1 lrsquoestimateur se reacuteduit agrave celui de Good

Esty11 compleacuteteacute par C-H Zhang et Z Zhang12 a montreacuteque lrsquoestimateur eacutetait asymptotiquement normal et a calculeacutelrsquointervalle de confiance de 119862

13A Chao et T-J Shen laquo Pro-gram SPADE Species Prediction andDiversity Estimation Program andUserrsquos Guide raquo In (2010)

14A Chao et al laquo SpadeR Spe-cies Prediction and Diversity Estima-tion with R raquo In (2016)

15Chao et Jost cf note 6

119862 = 119862 plusmn 1199051198991minus1205722

radic1199041198991 (1 minus 119904119899

1119899 ) + 2119904119899

2119899 (27)

Ougrave 1199051198991minus1205722 est le quantile drsquoune loi de Student agrave 119899 degreacutes de

liberteacutes au seuil de risque 120572 classiquement 196 pour 119899 grandet 120572 = 5

Un autre estimateur est utiliseacute dans le logiciel SPADE13 etson portage sous R le package spadeR14 Il est la base des esti-mateurs drsquoentropie de Chao et Jost (section 46) Lrsquoestimationde lrsquoeacutequation (25) donne la relation

119862 = 1 minus 1199041198991 minus 1205871

119899 (28)

Or 1205871 = 1199041198991 1205721 1205721 peut ecirctre estimeacute par la relation de Good-

Turing (22) en remplaccedilant 1199041198990 par lrsquoestimateur Chao1 (35)

119862 = 1 minus 1199041198991119899 (1 minus 1205721) = 1 minus 119904119899

1119899 [ (119899 minus 1) 119904119899

1(119899 minus 1) 119904119899

1 + 21199041198992

] (29)

Dans le package entropart la fonction Coverage calculeles trois estimateurs (celui de Zhang et Huang par deacutefaut)

library(entropart)Ns lt- colSums(BCI)Coverage(Ns)

ZhangHuang 09991146

Le taux de couverture de BCI est proche de 1 parce quelrsquoinventaire couvre 50 ha Il est moindre sur les 625 ha de laparcelle 6 de Paracou

library(SpatDiv)Coverage(asAbdVector(Paracou6))

ZhangHuang 09723258

Chao et Jost15 montrent que la pente de la courbe drsquoaccu-mulation donnant lrsquoespeacuterance du nombre drsquoespegraveces en fonctiondu nombre drsquoindividus (courbe de rareacutefaction de la figure 211)est eacutegale au deacuteficit de couverture

1 minus 120124 (119862119899) = 120124 (119878119899+1) minus 120124 (119878119899) (210)

ougrave 119862119899 est le taux de couverture drsquoun eacutechantillon de taille119899 et 119878119899 le nombre drsquoespegraveces deacutecouvertes dans cet eacutechantillon

14 Outils

16A Chao et C-W Lin laquo Non-parametric Lower Bounds for SpeciesRichness and Shared Species Rich-ness under Sampling without Repla-cement raquo In Biometrics 683 (2012)p 912-921 doi 101111j1541-0420201101739x

17W-H Hwang et al laquo Good-Turing Frequency Estimation in a Fi-nite Population raquo In Biometricaljournal 572 (2014) p 321-339 doi 101002bimj201300168

Les estimateurs preacutesenteacutes ici supposent une population detaille infinie (de faccedilon eacutequivalente les individus sont tireacutes avecremise) Le cas des populations de taille finie est traiteacute parChao et C-W Lin16 et Hwang et al17

CompleacutetudeLa compleacutetude de lrsquoeacutechantillonnage est la proportion du

nombre drsquoespegraveces observeacutees 119904119899ne0119878 Elle compte simplement

les espegraveces et ne doit pas ecirctre confondue avec la couverture quisomme leurs probabiliteacutes le taux de compleacutetude est toujourstregraves infeacuterieur au taux de couverture parce que les espegraveces noneacutechantillonneacutees sont les plus rares

La compleacutetude du mecircme eacutechantillon drsquoarbres de forecirct tro-picale que dans lrsquoexemple preacuteceacutedent peut ecirctre estimeacutee en di-visant le nombre drsquoespegraveces observeacutees par le nombre drsquoespegravecesestimeacutees (voir section 31) Agrave BCI

Espegraveces observeacutees(Obs lt- Richness(Ns Correction = None))

None 225

Richesse estimeacutee(Est lt- Richness(Ns Correction = Jackknife))

Jackknife 1 244

Compleacutetudeasnumeric(ObsEst)

[1] 09221311

Agrave Paracou

Espegraveces observeacutees(Obs lt- Richness(Paracou6 Correction = None))

None 334

Richesse estimeacutee(Est lt- Richness(Paracou6 Correction = Jackknife))

Jackknife 2 471

[1] 07091295

24 Distribution de lrsquoabondance des espegraveces (SAD) 15

18F W Preston laquo The Common-ness and Rarity of Species raquo In Ecology 293 (1948) p 254-283 doi 1023071930989

19Whittaker laquo Dominance andDiversity in Land Plant Communi-ties raquo cf note 1 p 3

20J Izsaacutek et S Pavoine laquo Linksbetween the Species Abundance Dis-tribution and the Shape of the Cor-responding Rank Abundance Curve raquoIn Ecological Indicators 141 (2012)p 1-6 doi 101016jecolind201106030

24 Distribution de lrsquoabondance desespegraveces (SAD)

La distribution de lrsquoabondance des espegraveces (SAD Spe-cies Abundance Distribution) est la loi statistique qui donnelrsquoabondance attendue de chaque espegravece drsquoune communauteacuteLes espegraveces ne sont pas identifieacutees individuellement mais parle nombre drsquoindividus leur appartenant

1 10 100 1000Effectifs (eacutechelle logarithmique)

pegravece

Fig 22 Histogramme desfreacutequences (diagramme dePreston) des arbres du dispositifde Barro Colorado Island Enabscisse le nombre drsquoarbres dechaque espegravece (en logarithme) enordonneacutee le nombre drsquoespegraveces

Elle peut ecirctre repreacutesenteacutee sous la forme drsquoun histogrammedes freacutequences (diagramme de Preston18 figure 22) ou biendrsquoun diagramme rang-abondance (RAC Rank AbundanceCurve ou diagramme de Whittaker19 figure 23) Le RACest souvent utiliseacute pour reconnaicirctre des distributions connuesIzsaacutek et Pavoine20 ont eacutetudieacute les proprieacuteteacutes des RAC pour lesprincipales SAD

50 100 150 200Rank

Fig 23 Diagrammerang-abondance (diagramme deWhittaker) des arbres du dispositifde Barro Colorado Island Lespoints sont les donneacutees enabscisse le rang de lrsquoespegravece agravepartir de la plus abondante enordonneacutee lrsquoabondance de lrsquoespegraveceLa courbe est lrsquoajustement drsquounedistribution log-normale

Code de la figure 22

Ns lt- sort(colSums(BCI) decreasing = TRUE)N lt- sum(Ns)SADhist lt- ggplot(dataframe(Ns) aes(Ns)) +

16 Outils

21A E Magurran Ecological Di-versity and Its Measurement Prince-ton NJ Princeton University Press1988

22B J McGill et al laquo SpeciesAbundance Distributions Movingbeyond Single Prediction Theories toIntegration within an Ecological Fra-mework raquo In Ecology Letters 1010(2007) p 995-1015 doi 101111j1461-0248200701094x

23R A Fisher et al laquo The Rela-tion between the Number of Speciesand the Number of Individuals in aRandom Sample of an Animal Popu-lation raquo In Journal of Animal Eco-logy 12 (1943) p 42-58 doi 10 23071411

24I Motomura laquo On the sta-tistical treatment of communities raquoIn Zoological Magazine 44 (1932)p 379-383 R H Whittaker laquo Evolu-tion and Measurement of Species Di-versity raquo In Taxon 2123 (1972)p 213-251 doi 1023071218190

25Preston laquo The Commonnessand Rarity of Species raquo cf note 18p 15

26R H MacArthur laquo On the Re-lative Abundance of Bird Species raquoIn Proceedings of the NationalAcademy of Sciences of the UnitedStates of America 433 (1957) p 293-295 doi 101073pnas433293 JS-TOR 89566

27S P Hubbell The UnifiedNeutral Theory of Biodiversity andBiogeography Princeton UniversityPress 2001

28MacArthur cf note 26

geom_histogram(bins=nclassSturges(log(Ns))color=black fill=white boundary = 0) +

scale_x_log10() +labs(x=Effectifs (eacutechelle logarithmique)

y=Nombre despegraveces)SADhist

library(entropart)autoplot(asAbdVector(Ns) Distribution = lnorm)

Les SAD sont traiteacutees en deacutetail par Magurran21 ou McGillet al22 Les principales distributions neacutecessaires agrave la compreacute-hension de la suite sont preacutesenteacutees ici

bull La distribution en log-seacuteries de Fisher et al 23

bull La distribution geacuteomeacutetrique 24

bull La distribution log-normale 25

bull Le modegravele Broken Stick26

Formellement la distribution des probabiliteacutes des espegravecesnoteacutees 119901119904 est agrave eacutetablir

La distribution en log-seacuteriesCette distribution est traiteacutee en deacutetail dans le chapitre 20Le nombre drsquoespegraveces est lieacute au nombre drsquoindividus par la

relation 120124(119878119899) = 120572 ln(1 + 119899120572) ougrave 119878119899 indique le nombre drsquoes-pegraveces observeacutees dans un eacutechantillon de 119899 individus 120572 est leparamegravetre qui fixe la pente de la partie lineacuteaire de la rela-tion valide degraves que 119899 gtgt 120572 ougrave le nombre drsquoespegraveces 119878119899 aug-mente proportionnellement au logarithme du nombre drsquoindivi-dus ln(119899)

La distribution a eacuteteacute obtenue agrave partir drsquoinventaires de com-munauteacutes de papillons en Malaisie et en Angleterre Le mo-degravele est tombeacute en deacutesueacutetude faute de confirmation empiriqueagrave lrsquoeacutechelle de la communauteacute avant drsquoecirctre remis en valeurpar la theacuteorie neutre27 dans lequel la distribution de la meacuteta-communauteacute est en log-seacuteries

La distribution Broken StickSi les espegraveces se partagent les ressources ou lrsquoespace des

niches repreacutesenteacutees par un bacircton par un processus de cassurealeacuteatoire et simultaneacutee (preacuteciseacutement les 119878 minus 1 cassures dubacircton sont distribueacutees uniformeacutement sur sa longueur) et queleur abondance est proportionnelle agrave la quantiteacute de ressourcesou drsquoespace de niche obtenus alors leur distribution suit lemodegravele Broken Stick de MacArthur28

29R M May laquo Patterns of Spe-cies Abundance and Diversity raquo In Ecology and Evolution of Communi-ties Sous la dir de M L Cody etJ M Diamond Harvard UniversityPress 1975 p 81-120

30M G Bulmer laquo On Fitting thePoisson Lognormal Distribution toSpecies-Abundance Data raquo In Bio-metrics 301 (1974) p 101-110 doi 1023071939021

31S Engen et R Lande laquo Popula-tion Dynamic Models Generating theLognormal Species Abundance Dis-tribution raquo In Mathematical Bios-ciences 1322 (1996) p 169-183 doi 1010160025-5564(95)00054-2

32Hubbell cf note 27

33I Volkov et al laquo Neutral Theo-ry and Relative Species Abundancein Ecology raquo In Nature 4246952(2003) p 1035-1037 doi 101038nature01883

Parmi les distributions classiques crsquoest la plus eacutequitable la distribution uniforme des probabiliteacutes (119901119904 = 1119878 pour tout119904) nrsquoest jamais approcheacutee

Elle est peu observeacutee empiriquement

La distribution log-normale

Dans une distribution log-normale le logarithme des pro-babiliteacutes des espegraveces (noteacutees 119901119904 pour lrsquoespegravece 119904) suit une loinormale Lrsquoeacutecart-type 120590 de cette distribution regravegle lrsquoeacutequitabi-liteacute de la distribution Son espeacuterance est obtenue agrave partir dunombre drsquoespegraveces et de 120590 pour que la somme des probabiliteacuteseacutegale 1

May29 explique cette distribution par le theacuteoregraveme de lalimite centrale la variable aleacuteatoire valant 1 si un individu estde lrsquoespegravece 119904 et 0 sinon est le produit de nombreuses variablesde loi inconnues valant 1 en cas de succegraves (germination drsquounegraine survie agrave de nombreux eacutevegravenementshellip) Le logarithme dece produit est une somme de variables aleacuteatoire dont la loi estforceacutement normale par application du theacuteoregraveme de la limitecentrale

La distribution est aussi le reacutesultat drsquoun algorithme debacircton briseacute (broken stick) hieacuterarchique 30

bull Si les ressources (repreacutesenteacutees par un bacircton) sont parta-geacutees une premiegravere fois aleacuteatoirement selon une loi quel-conque

bull Si chaque bacircton obtenu est partageacute agrave nouveau selon lemecircme proceacutedeacute et que lrsquoopeacuteration est reacutepeacuteteacutee un assezgrand nombre de fois

bull Si lrsquoabondance de chaque espegravece est proportionnelle auxressources dont elle dispose

bull Alors la distribution des espegraveces est log-normale

Ce meacutecanisme deacutecrit assez bien un meacutecanisme de partagesuccessif des ressources par exemple entre groupes drsquoespegravecesde plus en plus petits correspondant agrave des niches eacutecologiquesde plus en plus eacutetroites

Drsquoautres arguments existent dans la litteacuterature Parexemple Engen et Lande31 obtiennent une distributionnormale agrave partir drsquoun modegravele de dynamique des populations

La distribution log-normale deacutecrit assez bien (mais pasexactement) une communauteacute locale dans le cadre de la theacuteo-rie neutre32 comme le montre la figure 23 Le nombre drsquoes-pegraveces rares est un peu surestimeacute La distribution exacte estdonneacutee par Volkov et al33

18 Outils

34Motomura laquo On the statisti-cal treatment of communities raquo cfnote 24 p 16

35May laquo Patterns of SpeciesAbundance and Diversity raquo cfnote 29 p 17

36Whittaker laquo Evolution andMeasurement of Species Diversity raquocf note 24 p 16

37S Pueyo et al laquo The MaximumEntropy Formalism and the Idiosyn-cratic Theory of Biodiversity raquo In Ecology letters 1011 (2007) p 1017-28 doi 101111j1461- 0248200701096x

38F A Bazzaz laquo Plant SpeciesDiversity in Old-Field SuccessionalEcosystems in Southern Illinois raquo In Ecology 562 (mars 1975) p 485-488doi 1023071934981

39B Haegeman et al laquo RobustEstimation of Microbial Diversity inTheory and in Practice raquo In TheISME journal 76 (2013) p 1092-101doi 101038ismej201310

40Magurran Ecological Diversityand Its Measurement cf note 21p 16

La distribution geacuteomeacutetriqueSi les espegraveces se partagent les ressources selon un algo-

rithme broken stick seacutequentiel (comme dans la distributionlog-normale) mais de proportion fixe 0 lt 119896 lt 1 alors ladistribution obtenue est geacuteomeacutetrique Les abondances succes-sives sont proportionnelles agrave 119896 119896(1 minus 119896) 119896(1 minus 119896)2 hellip 119896(1 minus119896)119904 hellip 119896(1 minus 119896)119878

Ce modegravele a eacuteteacute eacutetabli par Motomura34 citeacute par May35 Sesproprieacuteteacutes ont eacuteteacute eacutetudieacutees par Whittaker36

Crsquoest la distribution qui traduit lrsquoabsence de relation entrela taille de lrsquoeacutechantillon et lrsquoabondance des espegraveces 37 la dis-tribution du logarithme de ses probabiliteacutes est uniforme Endrsquoautre termes lrsquoordre de grandeur de lrsquoabondance drsquoune es-pegravece est uniformeacutement distribueacute

La distribution est observeacutee dans les communauteacutes pion-niegraveres38 peu diverses ou les communauteacutes microbiennes39

Synthegravese

Fig 24 Diagrammerang-freacutequence des distributions de

probabiliteacute classiques Toutes lesdistributions sont de 100 espegraveces

Les probabiliteacutes infeacuterieures agrave 10minus6

ne sont pas afficheacutees Lesparamegravetres choisis sont 120572 = 11pour la distribution log-seacuteries

119896 = 0 2 pour la distributiongeacuteomeacutetrique et 120590 = 2 pour la

distribution log-normale

1eminus05

1eminus03

1eminus01

0 25 50 75 100Rang

liteacute

Distribution

Broken Stick

Geacuteometrique

LogminusNormale

LogminusSeacuteries

La figure 24 est inspireacutee de la figure tregraves connue de Ma-gurran40 Elle montre bien une gradation en termes de deacutecrois-sance de probabiliteacute entre des distributions de mecircme richesse de la plus eacutequitable (broken stick) agrave la plus ineacutequitable (geacuteo-meacutetrique) Elle doit ecirctre nuanceacutee la proportion 119896 de la distri-bution geacuteomeacutetrique fixe la pente de la droite qui la repreacutesentesur la figure 119896 = 10 sur la figure une valeur plus faiblediminuerait la pente De mecircme lrsquoeacutecart-type de la distributionlog-normale deacutecrit sa dispersion Une valeur supeacuterieure aug-menterait sa deacutecroissance

Le code utiliseacute pour produire la figure 24 est le suivant

library(entropart) Tirage dune communauteacute en log-seacuterieslseries lt- rCommunity(1 size=1E5 Distribution=lseries alpha=11) Nombre despegraveces de reacutefeacuterenceS lt- length(lseries) Part des ressources accapareacutees dans la distribution geacuteomeacutetriqueprob=02 Calcul des probabiliteacutes de la distribution geacuteomeacutetriquegeom lt- prob(1-(1-prob)^S)(1-prob)^(0(S-1)) Dispersion de la loi lognormalesd lt- 2 Tirage de S valeurs dans une loi lognormaleNslnorm lt- rlnorm(S 0 sd) Normalisation pour obtenir des probabiliteacuteslnorm lt- Nslnormsum(Nslnorm) Tirage des probabiliteacutes de la distribution broken stickbstick lt- c(cuts lt- sort(statsrunif(S-1)) 1)- c(0 cuts) Graphiquetibble(Rang=1S

`Log-Seacuteries`=sort(lseriessum(lseries) decreasing=TRUE)`Geacuteometrique`=sort(geom decreasing=TRUE)`Log-Normale`=sort(lnorm decreasing=TRUE)`Broken Stick`=sort(bstick decreasing=TRUE)) gt

pivot_longer(cols=-Rang) gtggplot() +geom_line(aes(x=Rang y=value color=name)) +scale_y_log10(limits=c(1E-6 NA)) +labs(y=Probabiliteacute color=Distribution)

La simulation de ces quatre distributions peut ecirctre reacutealiseacuteepar la fonction rCommunity() du package entropart ougrave lrsquoargu-ment Distribution peut valoir laquo bstick raquo laquo lnorm raquo laquo geom raquoou laquo lseries raquo La simulation des communauteacutes autres que log-seacuteries passe par le tirage des probabiliteacutes des espegraveces (le calculest deacuteterministe dans le cas de la distribution geacuteomeacutetrique)puis le tirage drsquoun nombre drsquoindividus dans une loi multino-miale respectant ces probabiliteacutes et lrsquoeffectif total

Les fonction RACbstick() RAClnorm() RACgeom() etRAClseries() permettent drsquoinfeacuterer agrave partir drsquoun vecteurdrsquoabondance les paramegravetres drsquoune distribution La distribu-tion correspondant au modegravele estimeacute peut ecirctre afficheacutee sur lafigure Rang-Abondance (figure 22)

Le package sads fournit les fonctions classiques de R (den-siteacute de probabiliteacute cumulative quantile simulation) pour lesdistributions utiles en eacutecologie au-delagrave de celles preacutesenteacuteesici La distribution de Volkov notamment peut ecirctre simuleacuteeLes fonctions fitxxx() complegravetent les fonctions RACxxx()drsquoentropart

Le code suivant montre comment ajuster une distributionlog-normale aux donneacutees de BCI avec entropart ou sads

entropartlibrary(entropart)fit_entropart_lnorm lt- RAClnorm(Ns) Affichage des paramegravetres estimeacutesfit_entropart_lnorm$mu

20 Outils

[1] 3142695

fit_entropart_lnorm$sigma

[1] 1791177

sadslibrary(sads) Estimation Les donneacutees sont tronqueacutees les espegraveces observeacutees 0 fois ne sont pas compteacuteesfit_sads_lnorm lt- fitlnorm(Ns trunc = 0)fit_sads_lnormfullcoef

meanlog sdlog 3142695 1787195

Lrsquoajustement du modegravele de Volkov peut ecirctre compareacute agravecelui drsquoune distribution log-normale Ajustement du modegravele de Volkovfit_volkov lt- fitvolkov(Ns)fit_volkovfullcoef

theta m J 4767437e+01 9237586e-02 2145700e+04

Graphiquement lrsquoajustement est tregraves proche mais la dis-tribution de Volkov preacutevoit explicitement des effectifs eacutegauxparce qursquoentiers Comparaison graphique des deux modegraveles Log-normal en rougeplot(asAbdVector(Ns) Distribution = lnorm)

$mu [1] 3142695 $sigma [1] 1791177

Volkov en vertlines(sort(rvolkov(length(Ns) fit_volkovfullcoef[1] fit_volkovfullcoef[2]

fit_volkovfullcoef[3]) decreasing = TRUE) col = green)

1 51 101 151 201

Les vraisemblances sont proches

Comparaison des vraisemblancesfit_sads_lnormmin

[1] 1157013

fit_volkovmin

[1] 1150182

Les paramegravetres du modegravele de communauteacute locale de latheacuteorie neutre sont 120579 le laquo nombre fondamental de la biodiver-siteacute raquo eacutegal agrave deux fois le nombre drsquoespegraveces apparaissant par pasde temps dans la meacuteta-communauteacute 119898 le taux de migrationet 119869 la taille de la communauteacute locale (qui nrsquoest pas agrave propre-ment parler un paramegravetre mais une statistique deacutecrivant lesdonneacutees)

La diffeacuterence entre les logarithmes de vraisemblance desdeux modegraveles en faveur du modegravele de Volkov alors que lenombre de paramegravetres est le mecircme Lrsquoajustement est doncmeilleur mais la diffeacuterence est petite et la complexiteacute du mo-degravele et des calculs pour lrsquoestimer ne se justifient pas en geacuteneacuteral le modegravele de Volkov est tregraves peu utiliseacute en pratique

Deuxiegraveme partie

Diversiteacute neutre drsquounecommunauteacute

1R K Peet laquo The Measurementof Species Diversity raquo In Annual re-view of ecology and systematics 5(1974) p 285-307 doi 10 1146 annureves05110174001441

2V Devictor et al laquo SpatialMismatch and Congruence betweenTaxonomic Phylogenetic and Func-tional Diversity The Need for Inte-grative Conservation Strategies in aChanging World raquo In Ecology let-ters 138 (2010) p 1030-40 doi 10 1111 j 1461 - 0248 2010 01493 x PMID 20545736 J C Ste-gen et A H Hurlbert laquo InferringEcological Processes from TaxonomicPhylogenetic and Functional Trait -Diversity raquo In PloS one 66 (2011)e20906 doi 101371journalpone0020906

3K R Clarke et R M War-wick laquo A Further Biodiversity In-dex Applicable to Species Lists Va-riation in Taxonomic Distinctness raquoIn Marine Ecology-Progress Se-ries 216 (2001) p 265-278 doi 10 3354 meps216265 C Ricottaet G C Avena laquo An Information-Theoretical Measure of TaxonomicDiversity raquo In Acta biotheoretica2551 (2003) p 35-41 doi 101023A1023000322071

4A Balmford et al laquo Measuringthe Changing State of Nature raquo In Trends in Ecology amp Evolution 187(2003) p 326-330 doi 10 1016 S0169-5347(03)00067-3

5M Williamson et al laquo TheSpeciesndashArea Relationship Does NotHave an Asymptote raquo In Journalof Biogeography 287 (2001) p 827-830 doi 101046j1365-2699200100603x

6Fisher et al laquo The Relationbetween the Number of Species andthe Number of Individuals in a Ran-dom Sample of an Animal Popula-tion raquo cf note 23 p 16

Chapitre 3

Mesures neutres de la diversiteacute 120572ou 120574

Les indices classiques de diversiteacute sont ceux de Shannon et de Simpson etla richesse speacutecifique Ils peuvent ecirctre estimeacutes agrave partir des donneacutees drsquoin-ventaire Lrsquoestimation de la richesse est particuliegraverement difficile et faitlrsquoobjet drsquoune abondante litteacuterature les estimateurs non-parameacutetriques(Chao et Jackknife) sont les plus utiliseacutes

Lrsquoessentiel

Les mesures classiques1 considegraverent que chaque classe drsquoob-jets est diffeacuterente de toutes les autres sans que certaines soientplus ou moins semblables Dans ce chapitre les classes serontdes espegraveces Les mesures sont qualifieacutees de neutres (species-neutral) au sens ougrave elles ne prennent en compte aucune carac-teacuteristique propre des espegraveces La diversiteacute neutre est souventappeleacutee diversiteacute taxonomique2 mecircme si le terme peut precircteragrave confusion avec la diversiteacute phylogeacuteneacutetique quand la phylo-geacutenie se reacuteduit agrave une taxonomie3

Ce type de mesure nrsquoa de sens qursquoagrave lrsquointeacuterieur drsquoun taxo-cegravene bien deacutefini sommer un nombre drsquoespegraveces drsquoinsectes agraveun nombre drsquoespegraveces de mammifegraveres a peu drsquointeacuterecirct Ces meacute-thodes ne sont donc pas forceacutement les plus adapteacutees agrave laconservation agrave grande eacutechelle des indicateurs de biodiver-siteacute4 peuvent ecirctre plus pertinents Drsquoautre part les commu-nauteacutes sont consideacutereacutees comme limiteacutees avec un nombre drsquoes-pegraveces fini la courbe drsquoaccumulation des espegraveces atteint donctheacuteoriquement une asymptote quand lrsquoeffort drsquoinventaire estsuffisant Cette approche est opposeacutee agrave celle traiteacutee dans leschapitres 20 et suivants qui considegravere que la diversiteacute aug-mente indeacutefiniment avec la surface5 que ce soit par change-ment drsquoeacutechelle (eacutelargir lrsquoinventaire ajoute de nouvelles commu-nauteacutes) ou plus theacuteoriquement parce que les communauteacutesreacuteelles sont consideacutereacutees comme un tirage aleacuteatoire parmi uneinfiniteacutes drsquoespegraveces6

26 Mesures neutres de la diversiteacute 120572 ou 120574

7D Mouillot et A Leprecirctre laquo AComparison of Species Diversity Esti-mators raquo In Researches on Popula-tion Ecology 412 (1999) p 203-215doi 101007s101440050024

8A Chao laquo Nonparametric Esti-mation of the Number of Classes in aPopulation raquo In Scandinavian Jour-nal of Statistics 114 (1984) p 265-270 JSTOR 4615964

9K P Burnham et W S Over-ton laquo Robust Estimation of Popula-tion Size When Capture ProbabilitiesVary among Animals raquo In Ecology605 (1979) p 927-936 doi 1023071936861

10R B OrsquoHara laquo Species Rich-ness Estimators How Many SpeciesCan Dance on the Head of a Pin raquoIn Journal of Animal Ecology 74(2005) p 375-386 doi 101111j1365-2656200500940x

11Y Basset et al laquo Arthropod Di-versity in a Tropical Forest raquo In Science 3386113 (2012) p 1481-1484 doi 101126science1226727

Les mesures preacutesenteacutees ici sont les plus utiliseacutees richesseindices de Shannon et de Simpson et lrsquoindice de HurlbertElles sont sujettes agrave des biais drsquoestimation7 notamment (maispas seulement) agrave cause des espegraveces non eacutechantillonneacutees

Au chapitre suivant lrsquoentropie HCDT permettra drsquounifierces mesures et les nombres de Hill et de leur donner un sensintuitif

31 Richesse speacutecifiqueLa richesse est tout simplement le nombre drsquoespegraveces preacute-

sentes dans le taxocegravene consideacutereacute Crsquoest la mesure conceptuel-lement la plus simple mais pratiquement la plus deacutelicate dansdes systegravemes tregraves riches comme les forecircts tropicales mecircmeavec des efforts drsquoinventaire consideacuterables il nrsquoest en geacuteneacuteralpas possible de relever toutes les espegraveces rares ce qui impliquede recourir agrave des modegraveles matheacutematiques pour en estimer lenombre

On ne fait pas de supposition sur la forme de la SAD quandon utilise des meacutethodes drsquoestimation non parameacutetriques Lesestimateurs les plus connus sont ceux de Chao8 et le jackknife9

Une alternative consiste agrave infeacuterer agrave partir des donneacutees lesparamegravetres drsquoune SAD choisie et particuliegraverement le nombretotal drsquoespegraveces Cette approche est bien moins reacutepandue parceqursquoelle suppose le bon choix du modegravele et est beaucoup plusintensive en calcul Il nrsquoexiste pas de meilleur estimateur uni-versel10 et il peut ecirctre efficace drsquoutiliser plusieurs meacutethodesdrsquoestimation de faccedilon concurrente sur les mecircmes donneacutees11

Techniques drsquoestimation non parameacutetriqueDans le cadre drsquoun eacutechantillonnage de 119899 individus on ob-

serve 119904119899ne0 espegraveces diffeacuterentes parmi les 119878 existantes Chaque

individu a une probabiliteacute 119901119904 drsquoappartenir agrave lrsquoespegravece 119904On ne sait rien sur la loi des 119901119904 On sait seulement comme

les individus sont tireacutes indeacutependamment les uns des autresque lrsquoespeacuterance du nombre 119899119904 drsquoindividus de lrsquoespegravece 119904 observeacutedans lrsquoeacutechantillon est 119899119901119904 La probabiliteacute de ne pas observerlrsquoespegravece est (1 minus 119901119904)119899

Pour les espegraveces freacutequentes 119899119901119904 est grand et les espegravecessont observeacutees systeacutematiquement La difficulteacute est due auxespegraveces pour lesquelles 119899119901119904 lrsquoespeacuterance du nombre drsquoobserva-tions est petit La probabiliteacute de les observer est donneacutee par laloi binomiale si 119899119901119904 est proche de 0 la probabiliteacute drsquoobserverun individu est faible

Les estimateurs non parameacutetriques cherchent agrave tirer lemaximum drsquoinformation de la distribution des abondances 119899119904

31 Richesse speacutecifique 27

12C X Mao et R K Colwelllaquo Estimation of Species Richness Mixture Models the Role of RareSpecies and Inferential Challenges raquoIn Ecology 865 (2005) p 1143-1153doi 10189004-1078

13Chao cf note 8

pour estimer le nombre drsquoespegraveces non observeacutees Une preacutesen-tation deacutetailleacutee du problegraveme et des limites agrave sa reacutesolution estfournie par Mao et Colwell12 qui concluent notamment queles estimateurs ne peuvent fournir qursquoune borne infeacuterieure delrsquointervalle des possibles valeurs du nombre reacuteel drsquoespegraveces

Chao1 et Chao2

Chao13 estime le nombre drsquoespegraveces non observeacutees agrave partirde celles observeacutees 1 ou 2 fois

Dans un eacutechantillon de taille 119899 reacutesultant drsquoun tirage indeacute-pendant des individus la probabiliteacute que lrsquoespegravece 119904 soit obser-veacutee 120584 fois est obtenue en eacutecrivant la probabiliteacute de tirer danslrsquoordre 120584 fois lrsquoespegravece 119904 puis 119899 minus 120584 fois une autre espegravece multi-plieacute par le nombre de combinaisons possible pour prendre encompte lrsquoordre des tirages

119901119899119904120584 = (119899

120584)119901120584119904 (1 minus 119901119904)119899minus120584 (31)

Lrsquoespeacuterance du nombre drsquoespegraveces observeacutees 120584 fois 120124(119904119899120584 )

est obtenue en sommant pour toutes les espegraveces la probabiliteacutede les observer 120584 fois

120124 (119904119899120584 ) = (119899

120584) sum119904

119901120584119904 (1 minus 119901119904)119899minus120584 (32)

Le carreacute de la norme du vecteur en 119878 dimensions dont lescoordonneacutees sont (1 minus 119901119904)1198992 est

sum119904

(1 minus 119901119904)119899

crsquoest-agrave-dire 120124(1199041198990 ) lrsquoespeacuterance du nombre drsquoespegraveces non obser-

veacutees Celui du vecteur de coordonneacutees 119901119904(1 minus 119901119904)1198992minus1 est

sum119904

1199012119904(1 minus 119901119904)119899minus2 = 2

119899(119899 minus 1)120124(1199041198992 )

Enfin le produit scalaire des deux vecteurs vaut

sum119904

119901119904(1 minus 119901119904)119899minus1 = 1119899120124(119904119899

Lrsquoineacutegaliteacute de Cauchy-Schwarz (le produit scalaire est infeacute-rieur au produit des normes des vecteurs) peut ecirctre appliqueacuteeaux deux vecteurs (tous les termes sont au carreacute)

[sum119904

(1 minus 119901119904)119899] [sum119904

1199012119904(1 minus 119901119904)119899minus2] ge [sum

119904119901119904(1 minus 119901119904)119899minus1]

14J Beacuteguinot laquo An Algebraic De-rivation of Chaorsquos Estimator of theNumber of Species in a Commu-nity Highlights the Condition Allo-wing Chao to Deliver Centered Esti-mates raquo In International Scholar-ly Research Notices 2014 (Article ID847328 2014) doi 10 1155 2014 847328

15A Chao laquo Species Richness Es-timation raquo In Encyclopedia of Sta-tistical Sciences Sous la dir de NBalakrishnan et al 2nd ed NewYork Wiley 2004

16A Chao laquo Estimating the Po-pulation Size for Capture-RecaptureData with Unequal Catchability raquoIn Biometrics 434 (1987) p 783-791 doi 1023072531532

drsquoougrave

120124(1199041198990 ) ge 119899 minus 1

119899[120124(119904119899

1 )]22120124(119904119899

2 ) (34)

Lrsquoestimateur est obtenu en remplaccedilant les espeacuterances parles valeurs observeacutees

119878Chao1 = 119904119899ne0 + (119899 minus 1) (119904119899

21198991199041198992

ougrave 119904119899ne0 est le nombre drsquoespegraveces diffeacuterentes observeacute

Il srsquoagit drsquoun estimateur minimum lrsquoespeacuterance du nombredrsquoespegraveces est supeacuterieure ou eacutegale au nombre estimeacute

Beacuteguinot14 a montreacute que lrsquoestimateur est sans biais si lenombre drsquoespegraveces non observeacutees deacutecroicirct exponentiellementavec la taille de lrsquoeacutechantillon

1199041198990 = 119878119890minus119896119899 (36)

ougrave 119896 est un reacuteel strictement positif Cette relation est coheacuterenteavec un eacutechantillonnage poissonien dans lequel la densiteacute desindividus est constante voir le chapitre 21

Si aucune espegravece nrsquoest observeacutee deux fois lrsquoestimateur estremplaceacute par

119878Chao1 = 119904119899ne0 + (119899 minus 1) 119904119899

1 (1199041198991 minus 1)

2119899 (37)

Si 119899 nrsquoest pas trop petit les approximations suivantes sontpossibles

119878Chao1 = 119904119899ne0 + (119904119899

21199041198992

Si aucune espegravece nrsquoest observeacutee deux fois lrsquoestimateur estremplaceacute15 par

119878Chao1 = 119904119899ne0 + 119904119899

1 (1199041198991 minus 1)2 (39)

La variance de lrsquoestimateur est connue mais pas sa distri-bution

Var ( 119878Chao1) = 1199041198992 [1

2(1199041198991

1199041198992

+ (1199041198991

1199041198992

+ 14(119904119899

1119904119899

4] (310)

Si aucune espegravece nrsquoest observeacutee deux fois

Var ( 119878Chao1) = 1199041198991 (119904119899

1 minus 1)2 + 119904119899

1 (21199041198991 minus 1)2

4 + (1199041198991 )4

4119904119899ne0

17M I Eren et al laquo Estimatingthe Richness of a Population Whenthe Maximum Number of Classes IsFixed A Nonparametric Solution toan Archaeological Problem raquo In PlosOne 75 (2012) doi 101371journalpone0034179 eq 8

18Chao cf note 16

19Chiu et al laquo An Improved Non-parametric Lower Bound of SpeciesRichness via a Modified Good-TuringFrequency Formula raquo cf note 4p 11

20A Chao et al laquo Seen Once orMore than Once Applying Good-Turing Theory to Estimate SpeciesRichness Using Only Unique Obser-vations and a Species List raquo In Me-thods in Ecology and Evolution 810(2017) p 1221-1232 doi 1011112041-210X12768

21A Chao et S-M Lee laquo Esti-mating the Number of Classes viaSample Coverage raquo In Journal ofthe American Statistical Association87417 (1992) p 210-217 doi 10 108001621459199210475194

Chao16 donne une approximation de lrsquointervalle deconfiance agrave 95 en assumant une distribution normale

119904119899ne0 +

119878Chao1 minus 119904119899ne0

119888 le 119878 le 119904119899ne0 + ( 119878Chao1 minus 119904119899

ne0) 119888 (312)

ougrave

119888 = 119890119905119899

1minus1205722

radicradicradic

ln⎛⎜⎝

1+ Var( 119878Chao1)

( 119878Chao1minus119904119899ne0)

2⎞⎟⎠ (313)

Eren et al17 calculent un intervalle de confiance qui estplus petit quand la valeur maximum theacuteorique du nombredrsquoespegraveces est connue ce qui est rarement le cas en eacutecologie

Chao18 propose un estimateur du nombre drsquoespegraveces ap-pliqueacute aux donneacutees de preacutesence-absence (un certain nombrede releveacutes contiennent seulement lrsquoinformation de preacutesence ouabsence de chaque espegravece) appeleacute Chao2 Il est identique agraveChao1 mais 119899 est le nombre de releveacutes en geacuteneacuteral trop petitpour appliquer lrsquoapproximation de Chao1

Chiu et al19 ameacuteliorent lrsquoestimateur en reprenant la deacute-marche originale de Chao mais en utilisant un estimateur pluspreacutecis du taux de couverture (29) au lieu de (24)

119878iChao1 = 119878Chao1 + 1199041198993

41199041198994

max (1199041198991 minus 119904119899

2 1199041198993

21199041198994

0) (314)

Chao et al20 eacutetendent lrsquoapplicabiliteacute de lrsquoestimateur Chao2agrave des donneacutees dans lesquelles les espegraveces sont noteacutees unique-ment comme singletons ou doubletons et plus sans distinctionentre doubletons et espegraveces plus freacutequentes Une relation entrele nombre de doubletons et les donneacutees disponibles est fournie sa reacutesolution numeacuterique (le code R neacutecessaire est disponibleavec lrsquoarticle) permet drsquoestimer 119904119899

2 et de lrsquoinjecter dans lrsquoesti-mateur Chao2

Lrsquoestimateur ACE

Chao et Lee21 deacuteveloppent lrsquoestimateur ACE (Abundance-based coverage estimator) agrave travers lrsquoestimation du taux decouverture 119862 Lrsquoestimateur ACE utilise toutes les valeurs de120584119904 correspondant aux espegraveces rares concregravetement la valeurlimite de 120584 noteacutee 120581 est fixeacutee arbitrairement geacuteneacuteralement agrave10

Lrsquoestimateur prend en compte le coefficient de variationde la distribution des freacutequences ( 119901119904) plus les probabiliteacutessont heacuteteacuterogegravenes plus le nombre drsquoespegraveces non observeacutees seragrand Finalement

22Chao et T-J Shen laquo ProgramSPADE Species Prediction andDiversity Estimation Program andUserrsquos Guide raquo cf note 13 p 13

23K P Burnham et W S Over-ton laquo Estimation of the Size of a Clo-sed Population When Capture Pro-babilities Vary among Animals raquo In Biometrika 653 (1978) p 625-633doi 1023072335915 Burnham etOverton laquo Robust Estimation of Po-pulation Size When Capture Proba-bilities Vary among Animals raquo cfnote 9 p 26

24Chao laquo Nonparametric Estima-tion of the Number of Classes in a Po-pulation raquo cf note 8 p 26

25J F Heltshe et N E Forresterlaquo Estimating Species Richness Usingthe Jackknife Procedure raquo In Bio-metrics 391 (1983) p 1-11 doi 1023072530802 JSTOR 2530802

119878ACE = 119904119899gt120581 + 119904119899

le120581119862rares

+ 1199041198991

119862rares120574rares (315)

119904119899gt120581 est le nombre drsquoespegraveces dites abondantes observeacutees

plus de 120581 fois 119904119899le120581 le nombre drsquoespegraveces dites rares observeacutees

120581 fois ou moins 119862rares est le taux de couverture ne prenant encompte que les espegraveces rares

Lrsquoestimateur du coefficient de variation est

1205742rares = max ( 119904119899

le120581 sum120581120584=1 120584 (120584 minus 1) 119904119899

120584119862rares (sum120581

120584=1 120584119904119899120584 ) (sum120581120584=1 120584119904119899120584 minus 1)

minus 1 0)

(316)Lorsque lrsquoheacuteteacuterogeacuteneacuteiteacute est tregraves forte un autre estimateur

est plus performant

1205742rares = max ( 1205742

rares (1 +(1 minus 119862rares) sum120581

120584=1 120584 (120584 minus 1) 119904119899120584

119862rares (sum120581120584=1 120584119904119899120584 minus 1)

(317)Chao et T-J Shen22 conseillent drsquoutiliser le deuxiegraveme es-

timateur degraves que 1205742rares deacutepasse 08 Lrsquoestimateur ACE donne

normalement une valeur plus grande que Chao1 Si ce nrsquoestpas le cas la limite des espegraveces rares 120581 doit ecirctre augmenteacutee

Lrsquoestimateur jackknife

La meacutethode jackknife a pour objectif de reacuteduire le biaisdrsquoun estimateur en consideacuterant des jeux de donneacutees dans les-quels on a supprimeacute un certain nombre drsquoobservations (cenombre est lrsquoordre de la meacutethode) Burnham et Overton23 ontutiliseacute cette technique pour obtenir des estimateurs du nombredrsquoespegraveces appeleacutes jackknife agrave lrsquoordre 119895 prenant en compte lesvaleurs de 119904119899

1 agrave 119904119899119895 Les estimateurs du premier et du deuxiegraveme

ordre sont les plus utiliseacutes en pratique

119878J1 = 119904119899ne0 + (119899 minus 1) 119904119899

1119899 (318)

119878J2 = 119904119899ne0 + (2119899 minus 3) 119904119899

1119899 minus (119899 minus 2)2119904119899

2119899 (119899 minus 1) (319)

Augmenter lrsquoordre du jackknife diminue le biais mais aug-mente la variance de lrsquoestimateur

Chao24 a montreacute que les estimateurs jackknife pouvaientecirctre retrouveacutes par approximation de lrsquoindice Chao1

La variance du jackknife drsquoordre 1 est25

26R M Cormack laquo Log-LinearModels for Capture-Recapture raquo In Biometrics 452 (1989) p 395-413doi 1023072531485

Var ( 119878J1) = 119899 minus 1119899

⎛⎜⎝

119899sum119895=1

1198952119904119899119895 minus

(119904119899ne0)2

119899⎞⎟⎠

Lrsquoestimateur est construit agrave partir de lrsquohypothegravese selonlaquelle le nombre drsquoespegraveces non observeacutees est de la forme

1199041198990 =

infinsum119894=1

119886119894119899119894

Pour cette raison Cormack26 affirme qursquoil nrsquoa pas de sup-port theacuteorique solide Lrsquoespeacuterance du nombre drsquoespegraveces nonobserveacutees est (32) sum119904 (1 minus 119901119904)119899 qui deacutecroicirct beaucoup plusrapidement que sum119894 119886119894119899119894 lrsquohypothegravese est bien fausse En re-vanche pour une gamme de 119899 fixeacutee (de la taille de lrsquoinventaireagrave une taille suffisante pour approcher la richesse asymptotiquepar exemple) il est toujours possible drsquoeacutecrire le nombre drsquoes-pegraveces non observeacutees sous la forme drsquoune seacuterie de puissancesneacutegatives de 119899 comme dans lrsquoillustration ci-dessous

Une communauteacute log-normale similaire agrave BCI (300 es-pegraveces eacutecart-type eacutegal agrave 2) est simuleacutee et un eacutechantillon de1000 individus est tireacute

library(entropart) Ecart-typesdlog lt- 2 Nombre despegravecesS lt- 300 Tirage des probabiliteacutes log-normalesPs lt- asProbaVector(rlnorm(S 0 sdlog)) Taille de leacutechantillonN lt- 1000 Tirage dun eacutechantillonNs lt- rCommunity(1 size = N NorP = Ps)

Lrsquoeacutechantillon est preacutesenteacute en figure 31Code de la figure 31

autoplot(Ns Distribution = lnorm)

Il est possible de veacuterifier que lrsquoespeacuterance du nombre drsquoes-pegraveces non observeacutees correspond bien agrave la moyenne des obser-vations

Espeacuterance des espegraveces non vuesE0 lt- (1 - Ps)^N(f0 lt- sum(E0))

[1] 1699725

Tirage de 1000 eacutechantillons nombre moyen despegraveces observeacutees(Sn lt- mean(colSums(rmultinom(1000 N Ps) gt 0)))

Fig 31 Echantillon de 1000individus tireacute dans une

communauteacute log-normale

25 50 75 100 125Rank

[1] 129987

Veacuterification nombre despegraveces observeacutees en moyenne et non observeacuteesSn + f0

[1] 2999595

Nombre total despegraveces dans la communauteacute(S lt- length(Ps))

[1] 300

Le nombre drsquoespegraveces non observeacutees peut ecirctre eacutecrit sousla forme drsquoune seacuterie de puissances neacutegatives de 119899 comme lepreacutevoit le jackknife entre deux valeurs de 119899 fixeacutees

Echantillonnage de 500 agrave 5000 individusnseq lt- 5005000 Calcul du nombre despegraveces non observeacuteesBias lt- sapply(nseq function(n) sum((1 - Ps)^n))

Le nombre drsquoespegraveces non observeacutees qui est le biais de lrsquoes-timateur de la richesse est preacutesenteacute en figure 32

ggplot(dataframe(n=nseq Biais=Bias lm1=predict(lm1)lm2=predict(lm2) lm4=predict(lm4)) aes(x=n)) +

geom_line(aes(y=Biais) col=black lty=1) +geom_line(aes(y=lm1) col=red lty=2) +geom_line(aes(y=lm2) col=orange lty=3) +geom_line(aes(y=lm4) col=blue lty=4) +coord_cartesian(ylim = c(0 250))

La courbe peut ecirctre approcheacutee par une seacuterie de puissancesneacutegatives de 119899 dont quelques termes sont preacutesenteacutes sur la fi-gure

27J Beacuteguinot laquo Basic Theoreti-cal Arguments Advocating Jackknife-2 as Usually Being the Most Appro-priate Nonparametric Estimator ofTotal Species Richness raquo In AnnualResearch amp Review in Biology 101(2016) p 1-12 doi 109734ARRB201625104

Ordre 1lm1 lt- lm(Bias ~ 0 +I(1nseq)) Ordre 2lm2 lt- lm(Bias ~ 0 +I(1nseq) + I(1nseq^2)) Ordre 4summary(lm4 lt- lm(Bias ~ 0 +I(1nseq) + I(1nseq^2)

+ I(1nseq^3) + I(1nseq^4)))

Call lm(formula = Bias ~ 0 + I(1nseq) + I(1nseq^2) + I(1nseq^3) + I(1nseq^4)) Residuals Min 1Q Median 3Q Max -88796 -32632 01727 38447 222823 Coefficients Estimate Std Error t value Pr(gt|t|) I(1nseq) 5662e+05 7979e+02 7095 lt2e-16 I(1nseq^2) -8026e+08 2803e+06 -2863 lt2e-16 I(1nseq^3) 5184e+11 2821e+09 1837 lt2e-16 I(1nseq^4) -1180e+14 8461e+11 -1395 lt2e-16 --- Signif codes 0 0001 001 005 01 1 Residual standard error 3972 on 4497 degrees of freedom Multiple R-squared 09991 Adjusted R-squared 09991 F-statistic 1212e+06 on 4 and 4497 DF p-value lt 22e-16

1000 2000 3000 4000 5000n

Fig 32 Nombre drsquoespegraveces nonoberveacutees dans un eacutechantillon detaille croissante et sadeacutecomposition en seacuteries depuissances neacutegatives de 119899 Lenombre drsquoespegraveces non observeacuteesest repreacutesenteacute par la courbecontinue noire Les seacuteries depuissances neacutegatives drsquoordre 1(courbe rouge) 2 (courbe orange)et 4 (courbe bleue) sontrepreacutesenteacutees en pointilleacutes Lescourbes drsquoordre 6 et plus sontconfondues avec la courbe noire

Lrsquoajustement est possible pour des valeurs de 119899 diffeacuterentesmais les coefficients 119886119894 sont alors diffeacuterents la forme du biaisnrsquoest valide que pour une gamme de valeurs de 119899 fixeacutee

Beacuteguinot27 apporte un autre argument important en fa-veur du jackknife Agrave condition que 119899 soit suffisamment grandlrsquoestimateur du nombre drsquoespegraveces non observeacutees est une fonc-tion lineacuteaire du nombre drsquoespegraveces observeacutees 120584 fois 119904119899

1 pourle jackknife 1 2119904119899

1 minus 1199041198992 pour le jackknife 2 et ainsi de suite

pour les ordres suivants contrairement agrave lrsquoestimateur de ChaoGracircce agrave cette proprieacuteteacute lrsquoestimateur du jackknife est addi-tif quand plusieurs groupes drsquoespegraveces disjoints sont pris en

28E P Smith et G V Bellelaquo Nonparametric Estimation of Spe-cies Richness raquo In Biometrics 401(1984) p 119-129 doi 10 1002 9780470015902a0026329

29R K Colwell et J A Codding-ton laquo Estimating Terrestrial Biodi-versity through Extrapolation raquo In Philosophical Transactions of theRoyal Society of London Series B Biological Sciences 3451311 (1994)p 101-118 doi 101098rstb19940091

30Chao et al laquo SpadeR SpeciesPrediction and Diversity Estimationwith R raquo cf note 14 p 13

compte lrsquoestimation du nombre drsquoespegraveces de papillons et descarabeacutees inventorieacutees ensemble est eacutegale agrave la somme des es-timations des deux groupes inventorieacutes seacutepareacutement Ce nrsquoestpas le cas pour lrsquoestimateur de Chao

Lrsquoestimateur du jackknife est tregraves utiliseacute parce qursquoil estefficace en pratique notamment parce que son ordre peut ecirctreadapteacute aux donneacutees

Lrsquoestimateur du bootstrap

Lrsquoestimateur du bootstrap28 est119878b = 119904119899

ne0 + sum119904

(1 minus 119901119904)119899 (321)

Il est peu utiliseacute parce que le jackknife est plus perfor-mant29

Calcul

Ces estimateurs peuvent ecirctre calculeacutes de faccedilon relative-ment simple agrave lrsquoaide du logiciel SPADE dans sa version pourR30 Le guide de lrsquoutilisateur preacutesente quelques estimateurssuppleacutementaires et des directives pour choisir Il est conseilleacutedrsquoutiliser Chao1 pour une estimation minimale et ACE pourune estimation moins biaiseacutee de la richesse

Les intervalles de confiance de chaque estimateur sont cal-culeacutes par bootstrap mecircme quand la variance drsquoun estimateurest connue sa loi ne lrsquoest geacuteneacuteralement pas et le calcul analy-tique de lrsquointervalle de confiance nrsquoest pas possible

Les estimateurs et leurs intervalles de confiance peuventeacutegalement ecirctre calculeacutes avec le package vegan qui dispose pourcela de deux fonctions specpool et estimateR

specpool est baseacute sur les incidences des espegraveces dansun ensemble de sites drsquoobservation et donne une estimationunique de la richesse selon les meacutethodes Chao2 jackknife(ordre 1 et 2) et bootstrap Lrsquoeacutecart-type de lrsquoestimateurest eacutegalement fourni par la fonction sauf pour le jackknifedrsquoordre 2

estimateR est baseacute sur les abondances des espegraveces et re-tourne un estimateur de la richesse speacutecifique par site et nonglobal comme specpool

Exemple

On utilise les donneacutees de Barro Colorado Island (BCI)La parcelle a eacuteteacute diviseacutee en carreacutes de 1 ha Le tableau drsquoen-treacutee est un dataframe contenant pour chaque espegravece drsquoarbres(DBH ge 10 cm) ses effectifs par carreacute

On charge le tableau de donneacutees

31J-P Wang laquo SPECIES An RPackage for Species Richness Estima-tion raquo In Journal of Statistical Soft-ware 409 (2011) p 1-15 doi 10 18637jssv040i09

library(vegan)data(BCI)

On utilise la fonction estimateR pour calculer la richessedes deux premiers carreacutes

estimateR(BCI[12 ])

1 2 Sobs 93000000 84000000 Schao1 117473684 117214286 sechao1 11583785 15918953 SACE 122848959 117317307 seACE 5736054 5571998

Le package SPECIES31 permet de calculer les estimateursjackknife drsquoordre supeacuterieur agrave 2 et surtout choisit lrsquoordre quifournit le meilleur compromis entre biais et variance

Comparaison des fonctions sur lrsquoensemble du dispositifBCI (119904119899

ne0 = 225 1199041 = 19)

specpool(BCI)

Species chao chaose jack1 jack1se jack2 All 225 2363732 654361 24558 5650522 2478722 boot bootse n All 2356862 3468888 50

library(SPECIES) Distribution du nombre despegraveces (vecteur noms = nombre dindividus valeurs = nombres despegraveces ayant ce nombre dindividus)Ns lt- colSums(BCI) Mise au format requis (matrice colonne 1 = nombre dindividus colonne 2 = nombres despegraveces ayant ce nombre dindividus) par la fonction AbdFreqCount dans entropartjackknife(AbdFreqCount(Ns))

Your specified order is larger than that determined by the test Therefore the order from the test is used

$JackknifeOrder [1] 1 $Nhat [1] 244 $SE [1] 6164414 $CI lb ub [1] 232 256

Comparaison avec la valeur de lrsquoeacutequation (318)

32U Brose et al laquo EstimatingSpecies Richness Sensitivity toSample Coverage and Insensitivity toSpatial Patterns raquo In Ecology 849(2003) p 2364-2377 doi 10189002-0558

33J Beck et W Schwanghartlaquo Comparing Measures of Species Di-versity from Incomplete Inventories An Update raquo In Methods in Ecolo-gy and Evolution 11 (2010) p 38-44 doi 101111j2041-210X200900003x

34Brose et al cf note 32 fig 6

Nombre despegraveces par efffectif observeacuteDistNs lt- tapply(Ns Ns length) Calcul direct de Jack1sum(DistNs) + DistNs[1] (sum(BCI) - 1)sum(BCI)

1 2439991

La valeur du jackknife 1 fournie par specpool est fausseLa fonction jackknife de SPECIES donne le bon reacutesultatavec un intervalle de confiance calculeacute en supposant que ladistribution est normale (plusmn 196 eacutecart-type au seuil de 95)

Lrsquoestimateur du bootstrap est calculable simplement

N lt- sum(Ns)Ps lt- NsNlength(Ps) + sum((1 - Ps)^N)

[1] 2343517

Choix de lrsquoestimateur

Des tests pousseacutes ont eacuteteacute meneacutes par Brose et al32 pour per-mettre le choix du meilleur estimateur de la richesse en fonc-tion de la compleacutetude de lrsquoeacutechantillonnage 119904119899

ne0119878 Les auteursappellent cette proportion couverture (coverage) Le termecompleteness a eacuteteacute proposeacute par J Beck et Schwanghart33 poureacuteviter la confusion avec le taux de couverture deacutefini par Good(vu en section 23) La compleacutetude est infeacuterieure agrave la couver-ture toutes les espegraveces ont le mecircme poids alors que les espegravecesmanquantes sont plus rares et peacutenalisent moins le taux de cou-verture

Fig 33 Arbre de deacutecision dumeilleur estimateur du nombre

drsquoespegraveces

September 2003 2375ESTIMATING SPECIES RICHNESS

FIG 6 Two alternative ways to choose the most appropriate estimator based on either an estimated range of samplecoverage or the community evenness Sobs 5 observed species richness Thresholds are accurate within 61

Jack1 Our results indicate that this might stem fromthe differences in their sample coverage The field datasets in the present study give an example that evalu-ations under different sampling intensity communityevenness and consequently different sample coverageyield different results concerning estimator ranking Incontrast to this in simulated landscapes Strue samplingintensity and community evenness are not only un-questionably known they are also controlled as inde-pendent variables This has led to the new estimatorperformance model based on sample coverage in thepresent study

All jacknife estimators were positively biased above95 sample coverage This has previously been re-ported in field studies by Heltshe and Forrester (1983)Colwell and Coddington (1994) and Hellmann andFowler (1999) but with different magnitudes In con-trast to this the jacknife estimators did not overesti-mate in the studies of Palmer (1990 1991) and Baltanas(1992) Potential explanations include the followingFirst differences in the sample coverage between thestudies might be responsible Second particularly infield studies the determination of Strue is prone to un-derestimation Such lower Strue may account for someof the jacknife estimatorrsquos overestimations In our sim-ulations however the first- and second-order jacknifeestimators were less positively biased under high sam-ple coverage than previously reported (eg Hellmannand Fowler 1999)

Estimator choice

We will subsequently present a framework for thechoice of the most appropriate nonparametric estimatordepending on sample coverage (see Fig 6) Howeverunless the sample contains the entire community onecan only guess about the sample coverage whichmakes the estimator choice more problematic An es-timator evaluation based on sampling intensity ie thepercentage of total quadrats sampled (Hellmann andFowler 1999) only provides an incomplete frameworksince sampling intensity is only one of the factors in-fluencing sample coverage This framework remainsspecific for the respective levels of community even-ness Strue and habitat area As independent reliable in-formation about Strue is scarcely obtainable in field stud-ies the most promising procedure to choose the ap-propriate estimator is iterative (Fig 6 path 1) First arange of Strue needs to be calculated by various esti-mators Then the most accurate estimator can be cho-sen based on the resulting mean estimated sample cov-erage Applying this procedure to the field data setsyields mean inaccuracies of 15 of Strue for the tem-porary wetlands and 35 of Strue and 96 of Strue forthe dry grasslands in the full and reduced data setrespectively While these estimates are the most ac-curate for the temporary wetlands they are only slight-ly outperformed by Jack2 and Jack3 on the dry grass-lands Compared to a decision based on communityevenness (Fig 6 path 2) the decision path based onestimated sample coverage (Fig 6 path 1) is more

Dans tous les cas les estimateurs jackknife sont lesmeilleurs Lrsquoarbre de deacutecision est en figure 3334 Le choixdeacutepend principalement de la compleacutetude (coverage sur lafigure) Une premiegravere estimation est neacutecessaire par plusieursestimateurs Si les reacutesultats sont coheacuterents choisir un estima-teur jackknife drsquoordre drsquoautant plus faible que la compleacutetude

36E Marcon laquo Practical Estima-tion of Diversity from Abundance Da-ta raquo In HAL 01212435 (version 22015)

37J Beacuteguinot laquo Extrapolation ofthe Species Accumulation Curve forIncomplete Species Samplings ANew Nonparametric Approach to Es-timate the Degree of Sample Com-pleteness and Decide When to StopSampling raquo In Annual Research ampReview in Biology 85 (2015) p 1-9 doi 10 9734 ARRB 2015 22351 Beacuteguinot laquo Basic Theoreti-cal Arguments Advocating Jackknife-2 as Usually Being the Most Appro-priate Nonparametric Estimator ofTotal Species Richness raquo cf note 27p 33

est grande Au-delagrave de 96 le nombre drsquoespegraveces observeacuteest plus performant parce que les jackknifes surestiment 119878Srsquoils sont incoheacuterents (intervalle des estimations supeacuterieuragrave 50 de leur moyenne) le critegravere majeur est lrsquoeacutequitabiliteacute(voir section 5) Si elle est faible (de lrsquoordre de 05-06)les estimateurs jackknife 2 agrave 4 sont performants lrsquoordrediminuant avec lrsquointensiteacute drsquoeacutechantillonnage (forte 10faible 05 de la communauteacute) Pour une forte eacutequitabiliteacute(08-09) on preacutefeacuterera jackknife 1 ou 2

Pour BCI le nombre drsquoespegraveces estimeacute par jackknife 1 est244 La compleacutetude est 225244 = 92 dans le domaine devaliditeacute du jackknife 1 (74 agrave 96) qui est donc le bon esti-mateur

La parcelle 6 de Paracou neacutecessite lrsquoestimateur jackknife2

library(SpatDiv)jackknife(AbdFreqCount(asAbdVector(Paracou6)))

Compleacutetudeasnumeric(Richness(Paracou6 Correction = None)Richness(Paracou6

Correction = Jackknife))

[1] 07091295

Chiu et al35 agrave partir drsquoautres simulations preacutefegraverent lrsquouti-lisation de lrsquoestimateur iChao1 Quand lrsquoeacutechantillonnage estsuffisant les estimateurs de Chao ont lrsquoavantage de posseacutederune base theacuteorique solide et de fournir une borne infeacuterieuredu nombre drsquoespegraveces possible Dans ce cas les estimations dujackknife drsquoordre 1 sont coheacuterentes avec celles de Chao Enrevanche quand lrsquoeacutechantillonnage est insuffisant lrsquoestimateurjackknife drsquoordre supeacuterieur agrave 1 permet de reacuteduire le biais drsquoes-timation au prix drsquoune variance accrue36

Enfin Beguinot37 suggegravere drsquoutiliser en regravegle geacuteneacuterale le ja-cknife 2 (mais ne traite pas les cas dans lesquels lrsquoeacutechantillon-nage est trop faible pour justifier un ordre supeacuterieur) tant que

38Brose et al laquo Estimating Spe-cies Richness Sensitivity to SampleCoverage and Insensitivity to SpatialPatterns raquo cf note 32 p 36

39T-J Shen et al laquo Predictingthe Number of New Species in a Fur-ther Taxonomic Sampling raquo In Eco-logy 843 (2003) p 798-804 doi 10 1890 0012 - 9658(2003 ) 084[0798 PTNONS]20CO2

le nombre de singletons est supeacuterieur agrave 2 minus radic(2) asymp 0 6 fois lenombre de doubletons Le ratio des singletons sur les double-tons diminue quand lrsquoeacutechantillonnage approche de lrsquoexhausti-viteacute Quand le seuil de 06 est deacutepasseacute la valeur de lrsquoestimateurde Chao devient supeacuterieur au jacknife 2 et doit ecirctre utiliseacute Ceseuil est coheacuterent avec les regravegles de Brose et al38

Preacutediction de la richesse drsquoun nouvel eacutechantillon

La preacutediction du nombre drsquoespegraveces 119878prime deacutecouvert dans unenouvelle placette drsquoun habitat dans lequel on a deacutejagrave eacutechan-tillonneacute est une question importante par exemple pour eacutevaluerle nombre drsquoespegraveces preacuteserveacutees dans le cadre drsquoune mise en reacute-serve ou eacutevaluer le nombre drsquoespegraveces perdues en reacuteduisant lasurface drsquoune forecirct

T-J Shen et al39 proposent un estimateur et leconfrontent avec succegraves agrave des estimateurs anteacuterieurs Onnote 119878119899

0 lrsquoestimateur du nombre drsquoespegraveces non observeacuteesdans le premier eacutechantillon et 119862 lrsquoestimateur de son tauxde couverture Lrsquoestimateur du nombre drsquoespegraveces du nouveleacutechantillon de 119899prime individus est

119878prime = 1198781198990

⎡⎢⎣

1 minus (1 minus 1 minus 1198621198781198990

)119899prime

⎤⎥⎦

1198781198990 est obtenu par la diffeacuterence entre les nombres drsquoespegraveces

estimeacute et observeacute 1198781198990 = 119878 minus 119904119899

ne0Exemple de BCI suite combien de nouvelles espegraveces se-

ront deacutecouvertes en eacutechantillonnant plus

Espegraveces non observeacutees(NonObs lt- jackknife(AbdFreqCount(Ns))$Nhat - length(Ns))

[1] 19

Taux de couverture(C lt- Coverage(Ns))

ZhangHuang 09991146

Le taux de couverture de lrsquoinventaire de BCI est tregravesproche de 100 donc peu de nouvelles espegraveces seront deacutecou-vertes en augmentant lrsquoeffort drsquoeacutechantillonnage La courbeobtenue est en figure 34

Le code R neacutecessaire pour reacutealiser la figure est

0 2500 5000 7500 10000n

Fig 34 Nombre de nouvellesespegraveces deacutecouvertes en fonction delrsquoeffort drsquoeacutechantillonnagesuppleacutementaire (donneacutees de BCI)Seulement 7 nouvelles espegravecesseront observeacutees eneacutechantillonnant 10000 arbressuppleacutementaires (environ 25 ha enplus des 50 ha de la parcelle quicontiennent 225 espegraveces)

41M Williamson et K J Gas-ton laquo The Lognormal Distribution IsNot an Appropriate Null Hypothesisfor the Species-Abundance Distribu-tion raquo In Journal of Animal Eco-logy 742001 (2005) p 409-422 doi 101111j1365-2656200500936x

Nouvelles espegraveces en fonction du nombre de nouveaux individusSprime lt- function(Nprime) NonObs (1 - (1 - (1 - C)NonObs)^Nprime)ggplot(dataframe(x = c(1 10000)) aes(x)) +

stat_function(fun = Sprime) +labs(x = n y = S)

La question de lrsquoextrapolation de la richesse est traiteacutee plusen deacutetail dans les sections 46 et 212

Infeacuterence du nombre drsquoespegraveces agrave partir de la SADDistribution de Preston

Preston40 fournit degraves lrsquointroduction de son modegravele log-normal une technique drsquoestimation du nombre total drsquoespegravecespar la ceacutelegravebre meacutethode des octaves Elle est disponible dansle package vegan

veiledspec(colSums(BCI))

Extrapolated Observed Veiled 23540577 22500000 1040577

Lrsquoajustement direct du modegravele aux donneacutees sans regrou-pement par octaves41 est eacutegalement possible (figure 35)

modll lt- prestondistr(colSums(BCI))veiledspec(modll)

plot(modll)

Fig 35 Ajustement du modegravelede Preston aux donneacutees de BCI

Frequency

1 2 4 8 16 32 64 128 512 2048

42J L Norris et K H Pollocklaquo Non-Parametric MLE for PoissonSpecies Abundance Models Allowingfor Heterogeneity between Species raquoIn Environmental and EcologicalStatistics 54 (1998) p 391-402 doi 101023A1009659922745

Maximum de vraisemblance drsquoune distribution deFisher

Norris et Pollock42 supposent que la distribution des es-pegraveces suit le modegravele de Fisher (voir chapitre 20) et infegraverent lenombre drsquoespegraveces par maximum de vraisemblance non para-meacutetrique (ils ne cherchent pas agrave infeacuterer les paramegravetres de laloi de probabiliteacute de 119901119904 mais seulement agrave ajuster au mieux lemodegravele de Poisson aux valeurs de 119901119904 observeacutees)

Le calcul est possible avec la librairie SPECIES de R Distribution du nombre despegraveces (vecteur noms = nombre dindividus valeurs = nombres despegraveces ayant ce nombre dindividus)Ns lt- colSums(BCI) Mise au format requis (matrice colonne 1 = nombre dindividus colonne 2 = nombres despegraveces ayant ce nombre dindividus)DistNsSPECIES lt- AbdFreqCount(Ns) Regroupement de la queue de distribution la longueur du vecteur est limiteacutee agrave 25 pour alleacuteger les calculsDistNsSPECIES[25 2] lt- sum(DistNsSPECIES[25nrow(DistNsSPECIES)

2])DistNsSPECIES lt- DistNsSPECIES[125 ]unpmle(DistNsSPECIES)

Method Unconditional NPMLE method by Norris and Pollock 1996 1998 using algorithm by Wang and Lindsay 2005 MLE= 239 Estimated Poisson mixture components p= 110372 3595437 1060832 pi= 0402579 02525368 03448842

$Nhat [1] 239

Le problegraveme de cette meacutethode drsquoestimation est qursquoelle di-verge freacutequemment Les calculs nrsquoaboutissent pas si la queuede distribution nrsquoest pas regroupeacutee (il existe 108 valeurs diffeacute-rentes de 119899119904 dans lrsquoexemple de BCI aucune des fonctions deSPECIES ne fonctionne en lrsquoeacutetat)

43J-P Wang et al laquo Gene Cap-ture Prediction and Overlap Estima-tion in EST Sequencing from One orMultiple Libraries raquo In BMC Bio-informatics 61 (2005) p 300 doi 1011861471-2105-6-300

44J-P Wang laquo Estimating Spe-cies Richness by a Poisson-CompoundGamma Model raquo In Biometrika 973(2010) p 727-740 doi 10 1093 biometasq026

45L Michaelis et M L Mentenlaquo Die Kinetik Der Invertinwirkung raquoIn Biochemische Zeitschrift 49(1913) p 333-369 PMID 21888353

46H K Clench laquo How to MakeRegional Lists of Butterflies SomeThoughts raquo In Journal of theLepidopteristsrsquo Society 334 (1979)p 216-231

47Fiche TD de JR Lobry httppbiluniv-lyon1frRpdftdr47pdf

Wang et al43 ont ameacutelioreacute sa stabiliteacute en peacutenalisant lecalcul de la vraisemblance

pnpmle(DistNsSPECIES)

Method Penalized NPMLE method by Wang and Lindsay 2005 MLE= 243 Estimated zero-truncated Poisson mixture components p= 09033625 3397048 1059029 pi= 02771211 03208847 04019942

$Nhat [1] 243

Enfin Wang44 perfectionne la technique drsquoestimation ensupposant que les 119901119904 suivent une loi gamma et en estimantaussi ses paramegravetres La souplesse de la loi gamma permetdrsquoajuster le modegravele agrave des lois diverses et lrsquoestimateur de Wangest tregraves performant

Il est disponible dans SPECIES fonction pcg Son deacute-faut est qursquoil neacutecessite un tregraves long temps de calcul (plusieursheures selon les donneacutees)

Calcul longpcg(DistNsSPECIES)

Infeacuterence du nombre drsquoespegraveces agrave partir decourbes drsquoaccumulation

Cette approche consiste agrave extrapoler la courbe drsquoaccumu-lation observeacutee

Le modegravele le plus connu est celui de Michaelis-Menten45

proposeacute par Clench46 En fonction de lrsquoeffort drsquoeacutechantillonnage119899 eacutevalueacute en temps (il srsquoagit de la collecte de papillons) lenombre drsquoespegraveces deacutecouvert augmente jusqursquoagrave une asymptoteeacutegale au nombre drsquoespegraveces total

119878119899 = 119878 119899119870 + 119899 (323)

119870 est une constante que Clench relie agrave la difficulteacute decollecte

Lrsquoestimation empirique du modegravele de Michaelis-Mentenpeut ecirctre faite avec R47 Les 50 carreacutes de BCI sont utiliseacutespour fabriquer une courbe drsquoaccumulation

data(BCI) Cumul du nombre darbresnArbres lt- cumsum(rowSums(BCI)) Cumul de linventaireCumul lt- apply(BCI 2 cumsum) Nombre despegraveces cumuleacuteesnEspeces lt- apply(Cumul 1 function(x) sum(x gt 0))

48Colwell et Coddington laquo Es-timating Terrestrial Biodiversitythrough Extrapolation raquo cf note 29p 34

49J G W Raaijmakers laquo Sta-tistical Analysis of the Michaelis-Menten Equation raquo In Biometrics434 (1987) p 793-803 doi 1023072531533

Le modegravele est ajusteacute par nlsfit Des valeurs de deacutepartdoivent ecirctre fournies pour 119870 et 119878 119870 est la valeur de 119899 cor-respondant agrave 119878119899 = 1198782 Une approximation suffisante est1198994 Pour 119878 le nombre total drsquoespegraveces inventorieacutees est unbon choix Le reacutesultat se trouve en figure 37

Ajustement du modegravele(nlsfit lt- nls(nEspeces ~ S nArbres(K + nArbres) data = list(nArbres

nEspeces) start = list(K = max(nArbres)4 S = max(nEspeces))))

Nonlinear regression model model nEspeces ~ S nArbres(K + nArbres) data list(nArbres nEspeces) K S 12510 2328 residual sum-of-squares 3066 Number of iterations to convergence 6 Achieved convergence tolerance 7881e-06

Lrsquoestimation preacuteceacutedente utilise la meacutethode des moindrescarreacutes qui suppose lrsquoindeacutependance des reacutesidus hypothegraveses eacutevi-demment violeacutee par une courbe drsquoaccumulation48 Lrsquoestima-tion par le maximum de vraisemblance est plus convenable49

Elle utilise la totaliteacute des points de la courbe drsquoaccumulationLa courbe drsquoaccumulation de BCI est preacutesenteacutee en figure 212Ses donneacutees sont utiliseacutees ici

SAC lt- specaccum(BCI random) Calculs intermeacutediairesYi lt- SAC$richnessN lt- length(Yi)Xi lt- Yi(1N)Xbar lt- mean(Xi)Ybar lt- mean(Yi)Syy lt- sum((Yi - Ybar)^2)Sxx lt- sum((Xi - Xbar)^2)Sxy lt- sum((Xi - Xbar) (Yi - Ybar)) Estimations(Khat lt- (Xbar Syy - Ybar Sxy)(Ybar Sxx - Xbar Sxy))

[1] 1712278

(Shat lt- Ybar + Khat Xbar)

[1] 2236211

Lrsquoestimation preacuteceacutedente repose sur une approximation nu-meacuterique Le paramegravetre 119870 peut ecirctre estimeacute plus preacuteciseacutementpar reacutesolution numeacuterique de lrsquoeacutequation exacte du maximumde vraisemblance

Equation que Khat doit annulerf lt- function(Khat) Sxy + Khat Sxx - (Syy + 2 Khat Sxy +

Khat Khat Sxx) sum(Xi(Yi + Khat Xi)N) Reacutesolution numeacuterique lintervalle de recherche doit ecirctre fourniSolution lt- uniroot(f c(0 1e+07))(Khat lt- Solution$root)

50H Lineweaver et D Burk laquo TheDetermination of Enzyme Dissocia-tion Constants raquo In Journal ofthe American Chemical Society 563(1934) p 658-666 doi 10 1021 ja01318a036

51Raaijmakers cf note 49

52J Soberoacuten M et J LlorenteB laquo The Use of Species Accumula-tion Functions for the Prediction ofSpecies Richness raquo In ConservationBiology 73 (1993) p 480-488 doi 101046j1523-1739199307030480x

[1] 1712293

[1] 2236213

Le nombre drsquoespegraveces estimeacute est 224 infeacuterieur au nombredrsquoespegraveces observeacute

Pour calculer lrsquointervalle de confiance il est plus simple depasser par une transformation lineacuteaire du modegravele 50

[ 1119878119899

] = 119870119878[ 1

119899] + 1119878

Le nombre drsquoespegraveces est estimeacute par lrsquoinverse de lrsquoordonneacuteeagrave lrsquoorigine du modegravele

y lt- 1nEspecesx lt- 1nArbreslm1 lt- lm(y ~ x)(S lt- 1lm1$coef[1])

(Intercept) 217002

`geom_smooth()` using formula y ~ x

00000 00005 00010 00015 000201n

Fig 36 Ajustement du mecircmemodegravele de Michaelis-Mententransformeacute selon Lineweaver etBurk

On voit assez clairement que le modegravele (figure 36) srsquoajustemal quand il est repreacutesenteacute sous cette forme51

ggplot(dataframe(x y) aes(x y)) +geom_point() +stat_smooth(method = lm col = red) +labs(x = 1n y=1S)

53L R Holdridge et al Fo-rest Environments in Tropical LifeZones Oxford Pergamon Press1971

Le nombre drsquoespegraveces estimeacute est infeacuterieur au nombre obser-veacute qui ne se trouve mecircme pas dans lrsquointervalle de confiance agrave95 Le modegravele de Michaelis-Menten ne convient pas

Soberoacuten M et Llorente B52 deacuteveloppent un cadre theacuteo-rique plus vaste qui permet drsquoajuster la courbe drsquoaccumulationagrave plusieurs modegraveles Ces modegraveles sont efficaces empiriquementmais manquent de support theacuteorique pour justifier leur formeLe modegravele le plus simple est exponentiel neacutegatif Si la proba-biliteacute de trouver une nouvelle espegravece est proportionnelle aunombre drsquoespegraveces non encore deacutecouvertes la courbe drsquoaccu-mulation suit la relation

119878119899 = 119878 (1 minus 119890119870119899) (325)

Les paramegravetres peuvent ecirctre estimeacutes par la meacutethode desmoindres carreacutes

(nlsexp lt- nls(nEspeces ~ S (1 - exp(K nArbres)) data = list(nArbresnEspeces) start = list(S = max(nEspeces) K = -11000)))

Nonlinear regression model model nEspeces ~ S (1 - exp(K nArbres)) data list(nArbres nEspeces) S K 212198082 -0000494 residual sum-of-squares 10664 Number of iterations to convergence 13 Achieved convergence tolerance 8042e-06

Ce modegravele proposeacute par Holdridge et al53 sous-estime larichesse parce que la probabiliteacute de deacutecouvrir une nouvelleespegravece diminue plus vite que le nombre drsquoespegraveces restant agravedeacutecouvrir les derniegraveres espegraveces sont plus rares et donc plusdifficiles agrave deacutetecter

Un modegravele plus reacutealiste deacutefinit cette probabiliteacute commeune fonction deacutecroissante du nombre drsquoespegraveces manquantesLa fonction la plus simple est une exponentielle neacutegative maiselle ne srsquoannule jamais et le nombre drsquoespegraveces nrsquoa pas drsquoasymp-tote Un paramegravetre suppleacutementaire pour obtenir lrsquoasymptoteest neacutecessaire et aboutir agrave la relation

119878119899 = 1119911 ln [119886

119888 minus 119886 minus 119888119888 119890minus119888119911119899] (326)

Les paramegravetres agrave estimer sont 119911 119886 et 119888

(nlslog lt- nls(nEspeces ~ 1z log(ac - (a - c)c exp(-c z nArbres)) data = list(nArbres nEspeces) start = list(z = 005a = 1 c = 0001)))

Nonlinear regression model model nEspeces ~ 1z log(ac - (a - c)c exp(-c z nArbres)) data list(nArbres nEspeces)

z a c 0025139 0755365 0001114 residual sum-of-squares 4461 Number of iterations to convergence 4 Achieved convergence tolerance 4813e-06

Nombre despegravecescoefs lt- coef(nlslog)log(coefs[a]coefs[c])coefs[z]

a 2593128

0 5000 10000 15000 20000Nombre darbres

pegravece

Fig 37 Ajustement des modegravelede Michaelis-Menten (trait plein)et de de Soberoacuten et Llorente(pointilleacutes longs modegraveleexponentiel neacutegatif pointilleacutescourts modegravele agrave trois paramegravetres)aux donneacutees de BCI Les cerclesrepreacutesentent le nombre drsquoespegravecescumuleacutees en fonction du nombredrsquoarbres Le modegravele exponentielneacutegatif (Holdridge) sous-estime larichesse plus que celui deMichaelis-Menten (Clench) Lemodegravele agrave trois paramegravetres srsquoajustemieux aux donneacutees mais ilsurestime probablement larichesse

Lrsquoestimation est cette fois supeacuterieure agrave celle du jackknife(244 espegraveces)

La figure 37 preacutesente les deux ajustements de modegravele deSoberoacuten et Llorente avec celui de Clench Lrsquoestimation de larichesse par extrapolation est plus incertaine que par les meacute-thodes non parameacutetriques Elle est tregraves peu utiliseacutee

x lt- seq(from = 0 to = max(nArbres) length = 255)NewData lt- list(nArbres = x)ggplot(dataframe(x

MM = predict(nlsfit newdata = NewData)Holdridge = predict(nlsexp newdata = NewData)Soberon = predict(nlslog newdata = NewData))

aes(x)) +geom_point(aes(nArbres nEspeces) dataframe(nArbres nEspeces)) +geom_line(aes(y = MM)) +geom_line(aes(y = Holdridge) lty = 2) +geom_line(aes(y = Soberon) lty = 3) +labs(x = Nombre darbres y = Nombre despegraveces)

Diversiteacute geacuteneacuteriqueLa deacutetermination des genres est plus facile et fiable que

celle des espegraveces le biais drsquoeacutechantillonnage moins sensible (lenombre de singletons diminue rapidement en regroupant les

54A Balmford et al laquo UsingHigher-Taxon Richness as a Surro-gate for Species Richness II Lo-cal Applications raquo In Proceedings ofthe Royal Society of London SeriesB Biological Sciences 263 (1996)p 1571-1575 doi 101098rspb19960230

55P H Williams et K J Gastonlaquo Measuring More of Biodiversity Can Higher-Taxon Richness PredictWholesale Species Richness raquo In Biological Conservation 67 (1994)p 211-217 doi 10 1016 0006 -3207(94)90612-2

56A Balmford et al laquo UsingHigher-Taxon Richness as a Surro-gate for Species Richness I RegionalTests raquo In Proceedings of the RoyalSociety of London Series B Bio-logical Sciences 263 (1996) p 1267-1274 doi 101098rspb19960186

57C C Cartozo et al laquo Quanti-fying the Taxonomic Diversity in RealSpecies Communities raquo In Journalof Physics A Mathematical andTheoretical 41 (2008) p 224012 doi 1010881751-81134122224012

58G Caldarelli et al laquo Scale-FreeNetworks from Varying Vertex Intrin-sic Fitness raquo In Physical ReviewLetters 8925 (2002) p 258702 doi 101103PhysRevLett89258702

59C Mora et al laquo How ManySpecies Are There on Earth and inthe Ocean raquo In PLoS Biology 98(2011) e1001127 doi 10 1371 journalpbio1001127

60Ibid figure 1

61R M May laquo Why Worry aboutHow Many Species and Their Loss raquoIn PLoS Biology 98 (2011)e1001130 doi 1013712Fjournalpbio1001130

donneacutees) et les coucircts drsquoinventaire sont geacuteneacuteralement large-ment reacuteduits54 Le choix drsquoestimer la diversiteacute de taxons derang supeacuterieur (genres ou mecircme familles au lieu des espegraveces)est envisageable55

Empiriquement la correacutelation entre la richesse geacuteneacuteriqueet la richesse speacutecifique (des angiospermes des oiseaux et desmammifegraveres) est bonne en forecirct tropicale56 suffisante pourcomparer les communauteacutes mecircme si la preacutediction de la ri-chesse speacutecifique agrave partir de la richesse geacuteneacuterique est tregraves im-preacutecise

Cartozo et al57 ont montreacute que le nombre de taxons deniveau supeacuterieur (genre par rapport aux espegraveces ordres parrapport aux sous-ordres) est universellement proportionnel aunombre de taxons du niveau immeacutediatement infeacuterieur agrave la puis-sance 061 Cette relation est valideacutee agrave lrsquoeacutechelle mondiale pourles systegravemes veacutegeacutetaux La loi de puissance reste valide pourdes assemblages aleacuteatoires crsquoest donc la conseacutequence de pro-prieacuteteacutes matheacutematiques58 mais la puissance de la relation estplus eacuteleveacutee (les communauteacutes reacuteelles sont plus agreacutegeacutees dupoint de vue phylogeacuteneacutetique que sous lrsquohypothegravese nulle drsquounassemblage aleacuteatoire) et varie entre les niveaux

Combien y a-t-il drsquoespegraveces diffeacuterentes sur Terre La question de lrsquoestimation du nombre total drsquoespegraveces geacute-

negravere une abondante litteacuterature Mora et al59 en font une revueet proposent une meacutethode nouvelle

Dans chaque regravegne le nombre de taxons de niveaux supeacute-rieurs (phylums classes ordres familles et mecircme genres) estestimeacute par des modegraveles prolongeant jusqursquoagrave leur asymptoteles valeurs connues en fonction du temps Cette meacutethode estapplicable jusqursquoau niveau du genre (figure 38 A agrave E) Lenombre de taxon de chaque niveau est lieacute agrave celui du niveaupreacuteceacutedent ce qui est repreacutesenteacute par la figure 38 G60 sous laforme du relation lineacuteaire entre le logarithme du logarithmedu nombre de taxons et le rang (1 pour les phylums 5 pourles genres) La droite est prolongeacutee jusqursquoau rang 6 pour ob-tenir le nombre drsquoespegraveces Une faccedilon alternative de deacutecrire lameacutethode est de dire que le nombre de taxons du niveau 119899 + 1est eacutegal agrave celui du niveau 119899 agrave la puissance 119896 La pente de ladroite de la figure est ln 119896 Aucune justification de ce reacutesultatmajeur nrsquoest donneacutee par les auteurs si ce nrsquoest leur veacuterificationempirique

Le nombre total drsquoespegraveces estimeacute est 87 millions tousregravegnes confondus dans la fourchette des estimations preacuteceacute-dentes (de 3 agrave 100 millions) et neacutecessitant pregraves de 500 ansdrsquoinventaires au rythme actuel des deacutecouvertes61

En se limitant aux arbres lrsquoestimation se monte agrave 16000

32 Indice de Simpson 47

through our higher taxon approach which suggests that our

species estimates are conservative particularly for poorly sampled

taxa We reason that underestimation due to this effect is severe for

prokaryotes due to the ongoing discovery of higher taxa (Figure

S1) but is likely to be modest in most eukaryote groups because the

rate of discovery of higher taxa is rapidly declining (Figure 1Andash3E

Figure S1 Figure 3Fndash3J)

Since higher taxonomic levels are described more completely

(Figure 1Andash1E) the resulting error from incomplete inventories

should decrease while rising in the taxonomic hierarchy

Recalculating the number of species while omitting all data from

genera yielded new estimates that were mostly within the intervals

of our original estimates (Figure S3) However Chromista (on

Earth and in the ocean) and Fungi (in the ocean) were exceptions

having inflated predictions without the genera data (Figure S3)

This inflation in the predicted number of species without genera

data highlights the high incompleteness of at least the genera data

in those three cases In fact Adl et alrsquos [28] survey of expert

opinions reported that the number of described species of

chromists could be in the order of 140000 which is nearly 10

times the number of species currently catalogued in the databases

used here (Table 1) These results suggest that our estimates for

Chromista and Fungi (in the ocean) need to be considered with

caution due to the incomplete nature of their data

Subjectivity in the Linnaean system of classification

Different ideas about the correct classification of species into a

taxonomic hierarchy may distort the shape of the relationships we

describe here However an assessment of the taxonomic hierarchy

shows a consistent pattern we found that at any taxonomic rank

the diversity of subordinate taxa is concentrated within a few

groups with a long tail of low-diversity groups (Figure 3Pndash3T)

Although we cannot refute the possibility of arbitrary decisions in

the classification of some taxa the consistent patterns in Figure 3Pndash

3T imply that these decisions do not obscure the robust underlying

relationship between taxonomic levels The mechanism for the

exponential relationships between nested taxonomic levels is

uncertain but in the case of taxa classified phylogenetically it

may reflect patterns of diversification likely characterized by

radiations within a few clades and little cladogenesis in most others

[29] We would like to caution that the database we used here for

protistan eukaryotes (mostly in Protozoa and Chromista in this

work) combines elements of various classification schemes from

different agesmdashin fact the very division of these organisms into

lsquolsquoProtozoarsquorsquo and lsquolsquoChromistarsquorsquo kingdoms is non-phylogenetic and

not widely followed among protistologists [28] It would be

valuable to revisit the species estimates for protistan eukaryotes

once their global catalogue can be organized into a valid and

stable higher taxonomy (and their catalogue of described species is

more completemdashsee above)

Discussion

Knowing the total number of species has been a question of

great interest motivated in part by our collective curiosity about

the diversity of life on Earth and in part by the need to provide a

reference point for current and future losses of biodiversity

Unfortunately incomplete sampling of the worldrsquos biodiversity

combined with a lack of robust extrapolation approaches has

Figure 1 Predicting the global number of species in Animalia from their higher taxonomy (AndashF) The temporal accumulation of taxa(black lines) and the frequency of the multimodel fits to all starting years selected (graded colors) The horizontal dashed lines indicate the consensusasymptotic number of taxa and the horizontal grey area its consensus standard error (G) Relationship between the consensus asymptotic number ofhigher taxa and the numerical hierarchy of each taxonomic rank Black circles represent the consensus asymptotes green circles the cataloguednumber of taxa and the box at the species level indicates the 95 confidence interval around the predicted number of species (see Materials andMethods)doi101371journalpbio1001127g001

On the Number of Species on Earth and in the Ocean

PLoS Biology | wwwplosbiologyorg 4 August 2011 | Volume 9 | Issue 8 | e1001127

Fig 38 Eacutevolution du nombre detaxons connus en fonction dutemps et valeur estimeacutee du nombretotal (ligne horizontale grise A agraveE) Le nombre drsquoespegraveces connuesest trop faible pour utiliser cettemeacutethode (F) Il est obtenu parextrapolation de la relation dunombre de taxons drsquoun niveau agravecelui du niveau supeacuterieur (G)

62H ter Steege et al laquo Hyperdo-minance in the Amazonian Tree Flo-ra raquo In Science 3426156 (2013)p 1243092 doi 10 1126 science 1243092

63J W F Slik et al laquo An Es-timate of the Number of TropicalTree Species raquo In Proceedings ofthe National Academy of Sciences ofthe United States of America 11224(2015) p 7472-7477 doi 101073pnas1423147112

64S P Hubbell laquo Estimating theGlobal Number of Tropical Tree Spe-cies and Fisherrsquos Paradox raquo In Pro-ceedings of the National Academy ofSciences 11224 (2015) p 7343-7344doi 101073pnas1507730112

65J B Wilson et al laquo Plant Spe-cies Richness The World Records raquoIn Journal of Vegetation Science234 (2012) p 796-802 doi 101111j1654-1103201201400x

66J H Connell laquo Diversity inTropical Rain Forests and CoralReefs raquo In Science 1994335 (1978)p 1302-1310 doi 101126science19943351302

67E H Simpson laquo Measurementof Diversity raquo In Nature 1634148(1949) p 688 doi 10 1038 163688a0

espegraveces pour lrsquoAmazonie62 de lrsquoordre de 5000 pour lrsquoAfriqueet entre 40000 et 53000 pour lrsquoensemble des tropiques63

(donc pour lrsquoensemble de la planegravete le nombre drsquoespegravecesnon-tropicales eacutetant neacutegligeable) Ces estimations sont ob-tenues par extrapolation du modegravele en log-seacuteries (chapitre20) et sont sujettes au paradoxe de Fisher les espegravecesrepreacutesenteacutees par un tregraves petit nombre drsquoindividu dans lemodegravele notamment les singletons sont les plus nombreusesUne discussion approfondie est donneacutee par Hubbell 64 lesespegraveces reacutecemment apparues au sens du modegravele ne sont pasdeacutetectables avant plusieurs geacuteneacuterations creacuteant un deacutecalageentre le nombre drsquoespegraveces reconnues par la taxonomie et lemodegravele

J B Wilson et al65 compilent les releveacutes du nombre drsquoes-pegraveces de plantes vasculaires en fonction de la surface et re-tiennent uniquement les plus riches agrave chaque eacutechelle spatiale(du millimegravetre carreacute agrave lrsquohectare) Ces releveacutes sont tous situeacutes enforecirct tropicale ou en prairie tempeacutereacutee geacutereacutee (les perturbationsreacuteguliegraveres et modeacutereacutees y favorisent la diversiteacute conformeacutementagrave la theacuteorie de la perturbation intermeacutediaire66) La relationentre le nombre drsquoespegraveces et la surface est celle drsquoArrheniusSon extrapolation agrave la surface terrestre donne environ 220000espegraveces comparables agrave lrsquoestimation de 275000 espegraveces rappor-teacutee par Mora et al

32 Indice de SimpsonDeacutefinition

On note 119901119904 la probabiliteacute qursquoun individu tireacute au hasardappartienne agrave lrsquoespegravece 119904 Lrsquoindice de E H Simpson67 ou Gini-Simpson est

119864 = 1 minus119878

sum119904=1

1199012119904 (327)

Il peut ecirctre interpreacuteteacute comme la probabiliteacute que deux indi-

68T D Olszewski laquo A UnifiedMathematical Framework for theMeasurement of Richness and Even-ness within and among Multiple Com-munities raquo In Oikos 1042 (2004)p 377-387 doi 101111j0030-1299200412519x

69S H Hurlbert laquo The Noncon-cept of Species Diversity A Cri-tique and Alternative Parameters raquoIn Ecology 524 (1971) p 577-586doi 1023071934145

70R S Mendes et al laquo A UnifiedIndex to Measure Ecological Diversityand Species Rarity raquo In Ecography314 (2008) p 450-456 doi 101111j0906-7590200805469x

71C Gini Variabilitagrave e Mutabili-tagrave Bologna C Cuppini 1912

72D Ellerman laquo An Introductionto Logical Entropy and Its Relationto Shannon Entropy raquo In Interna-tional Journal of Semantic Compu-ting 702 (2013) p 121-145 doi 101142S1793351X13400059

vidus tireacutes au hasard soient drsquoespegraveces diffeacuterentes Il est comprisdans lrsquointervalle [0 1[ Sa valeur diminue avec la reacutegulariteacute dela distribution 119864 = 0 si une seule espegravece a une probabiliteacutede 1 119864 = 1 minus 1119878 si les 119878 espegraveces ont la mecircme probabili-teacute 119901119904 = 1119878 La valeur 1 est atteinte pour un nombre infinidrsquoespegraveces de probabiliteacutes nulles

Deux autres formes de lrsquoindice sont utiliseacutees Tout drsquoabordla probabiliteacute que deux individus soient de la mecircme espegravecesouvent appeleacutee indice de concentration de Simpson qui estcelui deacutefini dans lrsquoarticle original de Simpson

119863 =119878

sum119904=1

1199012119904 (328)

Lrsquoindice de Simpson est parfois consideacutereacute comme une me-sure drsquoeacutequitabiliteacute68 mais il varie avec la richesse cette ap-proche est donc erronneacutee S H Hurlbert69 lrsquoa diviseacute par savaleur maximale 1 minus 1119878 pour obtenir une mesure drsquoeacutequita-biliteacute valide geacuteneacuteraliseacutee plus tard par Mendes et al70 voirsection 55 Le nombre drsquoespegraveces doit ecirctre estimeacute par les meacute-thodes preacutesenteacutees plus haut pour ne pas deacutependre de la taillede lrsquoeacutechantillon

Lrsquoestimateur du maximum de vraisemblance de lrsquoindice est

119864 = 1 minus119904119899

sum119904=1

1199012119904 (329)

Le calcul de lrsquoindice de Simpson peut se faire avec la fonc-tion diversity disponible dans le package vegan de R ou avecla fonction Simpson du package entropart

data(BCI) asProbaVector() transforme les abondances en probabiliteacutesPs lt- asProbaVector(colSums(BCI))Simpson(Ps)

None 09736755

Un historique de la deacutefinition de lrsquoindice de Gini71 agrave Simp-son inspireacute par Turing est fourni par Ellerman72

EstimationDeacutefinissons lrsquoindicatrice 1119904ℎ valant 1 si lrsquoindividu ℎ ap-

partient agrave lrsquoespegravece 119904 0 sinon 1119904ℎ suit une loi de Bernoullidrsquoespeacuterance 119901119904 et de variance 119901119904 (1 minus 119901119904) 119864 est la somme surtoutes les espegraveces de cette variance Un estimateur non biai-seacute drsquoune variance agrave partir drsquoun eacutechantillon est la somme des

33 Indice de Shannon 49

73Good laquo The Population Fre-quency of Species and the Estima-tion of Population Parameters raquo cfnote 3 p 11 R Lande laquo Statisticsand Partitioning of Species Diversityand Similarity among Multiple Com-munities raquo In Oikos 761 (1996)p 5-13 doi 1023073545743

74C E Shannon laquo A Mathemati-cal Theory of Communication raquo In The Bell System Technical Journal273 (1948) p 379-423 623-656 doi 101002j1538-73051948tb01338x C E Shannon et W Weaver TheMathematical Theory of Communi-cation University of Illinois Press1963

75I F Spellerberg et P J Fe-der laquo A Tribute to Claude Shan-non (1916ndash2001) and a Plea for MoreRigorous Use of Species RichnessSpecies Diversity and the lsquoShannonndashWienerrsquo Index raquo In Global Ecologyand Biogeography 123 (2003) p 177-179 doi 101046j1466-822X200300015x

eacutecarts quadratiques diviseacutee par le nombre drsquoobservation moinsune Lrsquoestimateur 119864 est leacutegegraverement biaiseacute parce qursquoil est calcu-leacute agrave partir des 119901119904 ce qui revient agrave diviser la somme des eacutecartspar 119899 et non 119899 minus 1 Un estimateur non biaiseacute est73

119864 = ( 119899119899 minus 1) ⎛⎜

⎝1 minus

119904119899ne0

sum119904=1

1199012119904⎞⎟⎠

La correction par 119899(119899 minus 1) tend rapidement vers 1 quandla taille de lrsquoeacutechantillon augmente lrsquoestimateur est tregraves peubiaiseacute

Le non-eacutechantillonnage des espegraveces rares est pris en comptedans cette correction parce qursquoelle considegravere que 119864 est lrsquoesti-mateur de variance drsquoun eacutechantillon et non drsquoune populationcomplegravetement connue Il est neacutegligeable si 119901119904 est petit 1199012

119904 estneacutegligeable dans la somme

Simpson a fourni un estimateur non biaiseacute de 119863 agrave partirdu calcul du nombre de paires drsquoindividus tireacutes sans remise

= sum119878119904=1 119899119904 (119899119904 minus 1)

119899 (119899 minus 1) (331)

Lrsquoargumentation est totalement diffeacuterente mais le reacutesultatest le mecircme 119864 = 1 minus

La fonction Simpson de entropart accepte comme argu-ment un vecteur drsquoabondances et propose par deacutefaut la cor-rection de Lande

Simpson(colSums(BCI))

Lande 09737209

33 Indice de ShannonDeacutefinition

Lrsquoindice de Shannon74 aussi appeleacute indice de Shannon-Weaver ou Shannon-Wiener75 ou simplement entropie est deacute-riveacute de la theacuteorie de lrsquoinformation

119867 = minus119878

sum119904=1

119901119904 ln 119901119904 (332)

Consideacuterons une placette forestiegravere contenant 119878 espegravecesveacutegeacutetales diffeacuterentes La probabiliteacute qursquoune plante choisie auhasard appartienne agrave lrsquoespegravece 119904 est noteacutee 119901119904 On preacutelegraveve 119899plantes et on enregistre la liste ordonneacutee des espegraveces des 119899

76L Brillouin Science and Infor-mation Theory 2nd ed Oxford Aca-demic Press 1962

77E C Pielou laquo The Measure-ment of Diversity in Different Typesof Biological Collections raquo In Jour-nal of Theoretical Biology 13C(1966) p 131-144 doi 10 1016 0022-5193(66)90013-0

78H Theil Economics and Infor-mation Theory Chicago Rand Mc-Nally amp Company 1967

79P Conceiccedilatildeo et P Ferreira TheYoung Personrsquos Guide to the TheilIndex Suggesting Intuitive Inter-pretations and Exploring Analyti-cal Applications Austin Texas 2000p 54

plantes Si 119899 est suffisamment grand le nombre de plantes delrsquoespegravece 119904 est 119899119901119904 On note 119871 le nombre de listes respectantces conditions

119871 = 119899prod119878

119894=1 (119899119901119904) (333)

Ce reacutesultat est obtenu en calculant le nombre de positionspossibles dans la liste pour les individus de la premiegravereespegravece ( 119899

1198991199011) Le nombre de positions pour la deuxiegraveme

espegravece est (119899minus11989911990111198991199012

) Pour la 119878-iegraveme espegravece le nombre est(119899minus1198991199011minus⋯minus119899119901119904minus1

119899119901119894) Les produits de combinaisons se simplifient

pour donner lrsquoeacutequation (333)On peut maintenant eacutecrire le logarithme de 119871

ln 119871 = ln 119899 minus119878

sum119904=1

ln 119899119901119904

On utilise lrsquoapproximation de Stirling

ln 119899 asymp 119899 ln 119899 minus 119899

pour obtenir apregraves simplifications

ln 119871 = minus119899119878

sum119904=1

119901119904 ln 119901119904 (334)

119867 = (ln 119871)119899 est lrsquoindice de Shannon Ce reacutesultat estconnu sous le nom de formule de Brillouin76 Agrave lrsquoorigine Shan-non a utiliseacute un logarithme de base 2 pour que 119867 soit lenombre moyen de questions binaires (reacuteponse oui ou non) neacute-cessaire pour identifier lrsquoespegravece drsquoune plante (un caractegravere uti-liseacute dans une chaicircne dans le contexte du travail de Shannon)Les logarithmes naturels de base 2 ou 10 ont eacuteteacute utiliseacutes parla suite77

La formule (334) est celle de lrsquoindice de Theil78 preacutesen-teacute en deacutetail par Conceiccedilatildeo et Ferreira79 agrave lrsquoorigine utiliseacutepour mesurer les ineacutegaliteacutes de revenu puis pour caracteacuteriserles structures spatiales en eacuteconomie Lrsquoindice est proportion-nel au nombre de plantes choisies on peut donc le diviser par119899 et on obtient lrsquoindice de biodiversiteacute de Shannon Ces in-dices ont eacuteteacute deacutefinis en choisissant des lettres au hasard pourformer des chaicircnes de caractegraveres Leur valeur est le nombrede chaicircnes de caractegraveres diffeacuterentes que lrsquoon peut obtenir aveclrsquoensemble des lettres disponibles crsquoest-agrave-dire la quantiteacute drsquoin-formation contenue dans lrsquoensemble des lettres Lrsquoindice deShannon donne une mesure de la biodiversiteacute en tant que quan-titeacute drsquoinformation

80K Hutcheson laquo A Test forComparing Diversities Based on theShannon Formula raquo In Journal ofTheoretical Biology 29 (1970) p 151-154 doi 10 1016 0022 - 5193(70 )90124-4

81Bulmer laquo On Fitting thePoisson Lognormal Distributionto Species-Abundance Data raquocf note 30 p 17

82G P Basharin laquo On a Statisti-cal Estimate for the Entropy of a Se-quence of Independent Random Va-riables raquo In Theory of Probabili-ty and its Applications 43 (1959)p 333-336 doi 1011371104033

83G A Miller laquo Note on the Biasof Information Estimates raquo In Infor-mation Theory in Psychology Pro-blems and Methods Sous la dir de HQuastler Free Press 1955 p 95-100

= minus119904119899

sum119904=1

119901119904 ln 119901119904 (335)

Le calcul de lrsquoindice de Shannon peut se faire avec la fonc-tion diversity disponible dans le package vegan de R ou avecla fonction Shannon de entropart

Ps lt- asProbaVector(colSums(BCI))Shannon(Ps)

None 4270409

La distribution de lrsquoestimateur est connue80 mais elle estinutile en pratique agrave cause du biais drsquoestimation

Bulmer81 eacutetablit une relation entre lrsquoindice de Shannon etlrsquoindice 120572 de Fisher agrave condition que la distribution de lrsquoabon-dance des espegraveces soit log-normale

= ( 120572 + 1) minus (1) (336)

(sdot) est la fonction digamma et 120572 est lrsquoestimateur de lrsquoin-dice de Fisher (204)

digamma(fisheralpha(colSums(BCI)) + 1) - digamma(1)

[1] 4148322

La sous-estimation est assez seacutevegravere sur cet exemple

EstimationBasharin82 a montreacute que lrsquoestimateur de lrsquoindice de Shan-

non eacutetait biaiseacute parce que des espegraveces ne sont pas eacutechantillon-neacutees Si 119878 est le nombre drsquoespegraveces reacuteel et 119899 le nombre drsquoindi-vidus eacutechantillonneacutes le biais est

120124 () minus 119867 = minus119878 minus 12119899 + 119874 (119899minus2) (337)

119874 (119899minus2) est un terme neacutegligeable La valeur estimeacutee agrave par-tir des donneacutees est donc trop faible drsquoautant plus que lenombre drsquoespegraveces total est grand mais drsquoautant moins quelrsquoeacutechantillonnage est important Comme le nombre drsquoespegraveces119878 nrsquoest pas observable le biais reacuteel est inconnu

Lrsquoestimateur de Miller-Madow83 utilise lrsquoinformation dis-ponible en sous-estimant le nombre drsquoespegraveces et donc lrsquoentro-pie

= minus119904119899

sum119904=1

119901119904 ln 119901119904 +119904119899

ne0 minus 12119899 (338)

84A Chao et T-J Shen laquo Nonpa-rametric Estimation of Shannonrsquos In-dex of Diversity When There Are Un-seen Species in Sample raquo In Envi-ronmental and Ecological Statistics104 (2003) p 429-443 doi 101023A1026096204727

85J Ashbridge et I B J Gou-die laquo Coverage-Adjusted Estimatorsfor Mark-Recapture in HeterogeneousPopulations raquo In Communicationsin Statistics - Simulation and Com-putation 294 (2000) p 1215-1237doi 10108003610910008813661

86D G Horvitz et D J Thomp-son laquo A Generalization of Samplingwithout Replacement from a FiniteUniverse raquo In Journal of the Ame-rican Statistical Association 47260(1952) p 663-685 doi 10 1080 01621459195210483446

87J Beck et Schwanghart laquo Com-paring Measures of Species Diversityfrom Incomplete Inventories An Up-date raquo cf note 33 p 36

88V Q Vu et al laquo Coverage-Adjusted Entropy Estimation raquo In Statistics in Medicine 2621 (2007)p 4039-4060 doi 101002sim2942

89Z Zhang laquo Entropy Estimationin Turingrsquos Perspective raquo In Neu-ral Computation 245 (2012) p 1368-1389 doi 101162NECO_a_00266

90Z Zhang laquo Asymptotic Norma-lity of an Entropy Estimator withExponentially Decaying Bias raquo In IEEE Transactions on InformationTheory 591 (2013) p 504-508 doi 101109TIT20122217393

91Z Zhang et M Grabchaklaquo Bias Adjustment for a Nonparame-tric Entropy Estimator raquo In Entro-py 156 (2013) p 1999-2011 doi 103390e15061999

92M Vinck et al laquo Estimation ofthe Entropy Based on Its PolynomialRepresentation raquo In Physical Re-view E 855 (2012) doi 10 1103 PhysRevE85051139

Chao et T-J Shen84 eacutetablissent un estimateur moins biai-seacute agrave partir du taux de couverture de lrsquoeacutechantillonnage 119862

= minus119904119899

sum119904=1

119862 119901119904 ln ( 119862 119901119904)1 minus (1 minus 119862 119901119904)

119899 (339)

Multiplier les freacutequences observeacutees par le taux de couver-ture permet drsquoobtenir un estimateur non biaiseacute des probabili-teacutes conditionnellement aux espegraveces non observeacutees85

Le terme au deacutenominateur est la correction de Horvitz etThompson 86 chaque terme de la somme est diviseacute par la pro-babiliteacute drsquoobserver au moins une fois lrsquoespegravece correspondanteIl tend vers 1 quand la taille de lrsquoeacutechantillon augmente

J Beck et Schwanghart87 montrent que la correction dubiais est efficace mecircme agrave des niveaux de compleacutetude delrsquoeacutechantillonnage (voir section 31) tregraves faibles Vu et al88

eacutetudient la vitesse de convergence de lrsquoestimateurZ Zhang89 deacutefinit lrsquoindice de Simpson geacuteneacuteraliseacute

120577119906119907 =119878

sum119904=1

119901119906119904 (1 minus 119901119904)119907 (340)

ougrave 120577119906119907 est la somme sur toutes les espegraveces de la probabiliteacutede rencontrer 119906 fois lrsquoespegravece dans un eacutechantillon de taille 119906+119907Lrsquoindice de Shannon peut srsquoexprimer en fonction de 1205771119907

119867 =infin

sum119907=1

11199071205771119907 (341)

Les premiers termes de la somme jusqursquoagrave 119907 = 119899minus1 peuventecirctre estimeacutes agrave partir des donneacutees les suivants constituent lebiais de lrsquoestimateur qui est caculeacute en pratique par

119867119911 =119899minus1sum119907=1

1119907

⎧⎨⎩

119899119907+1 [119899 minus (119907 + 1)]119899

119904119899ne0

sum119904=1

119901119904119907minus1prod119895=0

(1 minus 119901119904 minus 119895119899)

⎫⎬⎭

(342)Z Zhang90 montre que le biais de lrsquoestimateur 119867119911 est

asymptotiquement normal et calcule sa variance Z Zhang etGrabchak91 ameacuteliorent lrsquoestimateur en le compleacutetant par unestimateur de son biais mais les calculs deviennent excessive-ment complexes Vinck et al92 appliquent la mecircme deacutemarcheavec un estimateur bayesien du biais utilisant un prior aussiplat que possible pour la valeur de lrsquoentropie (et non un priorplat sur les probabiliteacutes qui tire lrsquoestimateur vers lrsquoentropiemaximale) Cet estimateur neacutecessite de connaicirctre le nombre

93E C Pielou laquo Species-Diversityand Pattern-Diversity in the Study ofEcological Succession raquo In Journalof Theoretical Biology 102 (1966)p 370-383 doi 10 1016 0022 -5193(66)90133-0

94A Chao et al laquo Entropy andthe Species Accumulation Curve ANovel Entropy Estimator via Disco-very Rates of New Species raquo In Me-thods in Ecology and Evolution 411(2013) p 1091-1100 doi 1011112041-210x12108

95Chao et Jost laquo Coverage-BasedRarefaction and Extrapolation Stan-dardizing Samples by CompletenessRather than Size raquo cf note 6 p 12

96J A Bonachela et al laquo Entro-py Estimates of Small Data Sets raquo In Journal of Physics A Mathemati-cal and Theoretical 41202001 (2008)p 1-9 doi 1010881751-81134120202001

97J L W V Jensen laquo Sur lesfonctions convexes et les ineacutegaliteacutesentre les valeurs moyennes raquo In ActaMathematica 301 (1906) p 175-193doi 101007bf02418571

drsquoespegraveces ce qui empecircche son utilisation sur des donneacutees drsquoeacuteco-logie

Pielou93 a deacuteveloppeacute une autre meacutethode de correction debiais lorsque de nombreux releveacutes de petite taille sont dispo-nibles ln 119871 est calculeacute pour un releveacute choisi aleacuteatoirement puisles donneacutees du premier releveacute sont ajouteacutees agrave celles drsquoun autrepuis un autre jusqursquoagrave ce que 119867 = (ln 119871)119899 nrsquoaugmente plus la diversiteacute augmente dans un premier temps mais se stabi-lise quand lrsquoeffet des espegraveces ajouteacutees est compenseacute par celuide la diminution de lrsquoeacutequitabiliteacute due aux espegraveces preacutesentesdans tous les releveacutes Agrave partir de ce seuil lrsquoaugmentation deln 119871 par individu ajouteacute est calculeacutee pour chaque releveacute sup-pleacutementaire Son espeacuterance estimeacutee par sa moyenne calculeacuteeen ajoutant tous les releveacutes disponibles est

Chao et al94 utilisent lrsquoestimateur de la pente de lacourbe de rareacutefaction calculeacute preacuteceacutedemment95 pour estimerla richesse speacutecifique pour fournir un estimateur extrecircmementperformant

= minus119904119899

sum119904=1

119899119904119899 ( (119899) minus (119899119904)) (343)

minus 1199041119899 (1 minus 119860)1minus119899 (minusln (119860) minus

119899minus1sum119903=1

1119903 (1 minus 119860)119903) (344)

ougrave (sdot) est la fonction digamma et 119860 vaut

bull 21199042[(119899 minus 1) 1199041 + 21199042] en preacutesence de singletons et dou-bletons

bull 2[(119899 minus 1) (1199041 minus 1) + 2] en preacutesence de singletons seule-ment

bull 1 en absence de singletons et doubletons

Enfin la litteacuterature de physique statistique srsquoest abondam-ment inteacuteresseacutee agrave cette question (Bonachela et al96 en fontune revue) Le problegraveme traiteacute est la non-lineacuteariteacute de lrsquoin-dice de Shannon par rapport aux probabiliteacutes qui entraine unbiais drsquoestimation La fonction logarithme fournit un exemplesimple lrsquoespeacuterance de ln(119901119904) nrsquoest pas le logarithme de lrsquoes-peacuterance de 119901119904 parce que la fonction ln est concave Chaque es-timateur 119901119904 fluctue autour de 119901119904 mais vaut 119901119904 en moyenne Agravecause de la concaviteacute ln( 119901119904) est en moyenne infeacuterieur agrave ln(119901119904) cette relation est connue sous le nom drsquoineacutegaliteacute de Jensen97

Lrsquoindice de Shannon est concave (figure 39) donc son esti-mateur (332) est biaiseacute neacutegativement mecircme sans prendre enconsideacuteration les espegraveces non observeacutees

Fig 39 Courbe de 119909 ln 119909 entre 0et 1

000 025 050 075 100p

ggplot(dataframe(x = c(00001 1)) aes(x)) +stat_function(fun = function(x) -xlog(x)) +labs(x = p y = H(p))

Le biais peut ecirctre eacutevalueacute par simulation 10000 tirages sontreacutealiseacutes dans une loi normale drsquoespeacuterance 119901119904 choisie et drsquoeacutecart-type 001 Le biais est la diffeacuterence entre minus119901119904ln 119901119904 (connu) etla moyenne des 1000 valeurs de minus 119901119904ln 119901119904 (la probabiliteacute estestimeacutee par sa reacutealisation agrave chaque tirage) La valeur du biaisen fonction de 119901119904 est en figure 310 Le biais de lrsquoindice deShannon est la somme des biais pour toutes les probabiliteacutesspeacutecifiques de la communauteacute eacutetudieacutee et son calcul est tou-jours lrsquoobjet de recherches

Fig 310 Biais de 119904 ln 119904 entre 0et 1

minus000075

minus000050

minus000025

000000

025 050 075p

Biaisp lt- function (p) Ps lt-rnorm(10000 p 001)p log(p) - mean(Ps log(Ps))

Biais lt- function (Ps)

Applique Biaisp agrave chaque valeur de Ps

98P Grassberger laquo Finite SampleCorrections to Entropy and Dimen-sion Estimates raquo In Physics LettersA 1286-7 (1988) p 369-373 doi 1010160375-9601(88)90193-4

99P Grassberger laquo EntropyEstimates from Insufficient Sam-plings raquo In arXiv Physics e-prints0307138v2 (2003)

100T Schuumlrmann laquo Bias Analysisin Entropy Estimation raquo In Jour-nal of Physics A Mathematical andGeneral 3727 (2004) p L295-L301doi 1010880305-44703727L02

sapply(Ps Biaisp)ggplot(dataframe(x = c(005 095)) aes(x)) +

stat_function(fun = Biais) +geom_hline(yintercept = 0 lty = 2) +labs(x = p y = Biais)

Grassberger98 a fourni la correction de reacutefeacuterence

= minus119904119899

sum119904=1

119899119904119899 (ln (119899) minus (119899119904) minus (minus1)119899119904

119899119904 + 1 ) (345)

Grassberger99 lrsquoa perfectionneacutee

= minus119904119899

sum119904=1

119899119904119899 ( (119899) minus (119899119904) minus (minus1)119899119904 int

119905119899119904minus1

1 + 119905 119889119905) (346)

Enfin Schuumlrmann100 lrsquoa geacuteneacuteraliseacutee pour deacutefinir une fa-mille de corrections deacutependant drsquoun paramegravetre 120585

= minus119904119899

sum119904=1

1120585 minus1

119905119899119904minus1

1 + 119905 119889119905)

(347)Le biais drsquoestimation diminue avec 120585 mais lrsquoerreur qua-

dratique augmente Schuumlrmann suggegravere drsquoutiliser 120585 = 119890minus12

comme meilleur compromisLa fonction Shannon permet toutes ces corrections Elle

accepte comme argument un vecteur drsquoabondances (et non deprobabiliteacutes)

Shannon(colSums(BCI) Correction = ChaoWangJost)

ChaoJost 4276193

Shannon(colSums(BCI) Correction = Grassberger)

Grassberger 4276599

Shannon(colSums(BCI) Correction = Grassberger2003)

Grassberger2003 4276491

101J Hausser et K Strimmerlaquo Entropy Inference and the James-Stein Estimator with Applicationto Nonlinear Gene Association Net-works raquo In Journal of MachineLearning Research 10 (2009) p 1469-1484

102W James et C Stein laquo Esti-mation with Quadratic Loss raquo In Proceedings of the Fourth BerkeleySymposium on Mathematical Statis-tics and Probability Sous la dir de JNeyman T 1 Berkeley California University of California Press 1961p 361-379

Shannon(colSums(BCI) Correction = Schurmann)

Schurmann 4276094

Shannon(colSums(BCI) Correction = ZhangHz)

ZhangHz 4272529

Drsquoautres estimateurs peu utiliseacutes en eacutecologie sont dispo-nibles dans le package entropy101 La contraction de Stein102

consiste agrave estimer la distribution des probabiliteacutes drsquooccurencedes espegraveces par la pondeacuteration optimale entre un estimateuragrave faible biais et un estimateur agrave faible variance Lrsquoestimateur119901119904 est sans biais mais a une variance importante Lrsquoestimateur

1119878 si 119878 est connu est de variance nulle mais est tregraves biai-seacute Comme le nombre drsquoespegraveces est en geacuteneacuteral inconnu il doitecirctre estimeacute par une meacutethode quelconque mais de preacutefeacuterencele surestimant plutocirct que le sous-estimant Lrsquoestimateur deJames-Stein (shrinkage estimator) optimal est

119901119904 = 1119878+ (1 minus ) 119901119904 (348)

ougrave

= 1 minus sum119904119899ne0

119904=1 ( 119901119904)2

(119899 minus 1) sum119904119899ne0

119904=1 ( 1119878 minus 119901119904)2 (349)

Lrsquoentropie est ensuite simplement estimeacutee par lrsquoestimateurplug-in = minus sum119904119899

ne0119904=1 119901119904 ln 119901119904 Le calcul sous R est le suivant

library(entropy)entropyshrink(colSums(BCI))

Estimating optimal shrinkage intensity lambdafreq (frequencies) 00021

[1] 4275689 attr(lambdafreqs) [1] 0002074043

Le principe mecircme de lrsquoestimation rapproche la distributionde lrsquoeacutequiprobabiliteacute des espegraveces et donc augmente lrsquoentropieLrsquoestimation preacuteceacutedente ignore les espegraveces non observeacutees Pourles inclure le vecteur des abondance doit ecirctre allongeacute par au-tant de zeacuteros que drsquoespegraveces estimeacutees

(S0 lt- jackknife(AbdFreqCount(Ns))$Nhat - ncol(BCI))

34 Indice de Hurlbert 57

103D Liu et al laquo Entropy ofHydrological Systems under SmallSamples Uncertainty and Variabili-ty raquo In Journal of Hydrology 532(2016) p 163-176 doi 101016jjhydrol201511019

104S H Hurlbert laquo The Noncon-cept of Species Diversity A Cri-tique and Alternative Parameters raquocf note 69 p 48

105Dauby et O J Hardylaquo Sampled-Based Estimation of Di-versity Sensu Stricto by TransformingHurlbert Diversities into EffectiveNumber of Species raquo cf note 7p 12

[1] 19

entropyshrink(c(colSums(BCI) rep(0 S0)))

Les freacutequences sont estimeacutees par la fonction freqsshrinkLeur utilisation dans lrsquoestimateur plug-in donne le mecircme reacute-sultat

PsJS lt- freqsshrink(c(colSums(BCI) rep(0 S0)))

Shannon(asProbaVector(PsJS))

None 4276543

Appliqueacute agrave des donneacutees de biodiversiteacute aquatique lrsquoestima-teur de James-Stein obtient de meilleurs reacutesultats que celui deChao et Shen103 quand lrsquoeacutechantillonnage est reacuteduit

34 Indice de HurlbertDeacutefinition

Lrsquoindice de S H Hurlbert104 est lrsquoespeacuterance du nombredrsquoespegraveces observeacutees dans un eacutechantillon de taille 119896 choisie

119896119878 =119878

sum119904=1

[1 minus (1 minus 119901119904)119896] (350)

Chaque terme de la somme est la probabiliteacute drsquoobserverau moins une fois lrsquoespegravece correspondante

Lrsquoaugmentation de la valeur de 119896 permet de donner plusdrsquoimportance aux espegraveces rares

Lrsquoindice peut ecirctre converti en nombre eacutequivalent drsquoes-pegraveces105 crsquoest-agrave-dire le nombre drsquoespegraveces eacutequiprobablesneacutecessaire pour obtenir la mecircme diversiteacute noteacutes 119896119863 agrave partirde la relation

119896119878 = 119896119863 [1 minus (1 minus 1119896119863)

119896] (351)

Lrsquoeacutequation doit ecirctre reacutesolue pour obtenir 119896119863 agrave partir de lavaleur de 119896119878 estimeacutee numeacuteriquement pour 119896 gt 3

106A Chao et al laquo Rarefaction andExtrapolation with Hill Numbers A Framework for Sampling and Es-timation in Species Diversity Stu-dies raquo In Ecological Monographs841 (2014) p 45-67 doi 10189013-01331 Annexe S2

107T Leinster et C Cobboldlaquo Measuring Diversity The Impor-tance of Species Similarity raquo In Eco-logy 933 (2012) p 477-489 doi 10189010-24021

108C X Mao laquo Estimating Spe-cies Accumulation Curves and Diver-sity Indices raquo In Statistica Sinica 17(2007) p 761-774

110W Smith et J F Grasslelaquo Sampling Properties of a Family ofDiversity Measures raquo In Biometrics332 (1977) p 283-292 doi 1023072529778 JSTOR 2529778

Dans deux cas particuliers les nombres eacutequivalents drsquoes-pegraveces de Hurlbert sont identiques aux nombres de Hill 2119863 =2119863 et infin119863 = 0119863

Pour les autres ordres entiers de diversiteacute il existe unecorrespondance parfaite entre les deux mesures 106 la connais-sance de lrsquoune permet drsquoobtenir lrsquoautre Pour 119896 gt 1 on a107

119896119878 = 119896 +119896

sum119902=2

(119896119902)(minus1)119902+1(119902119863)1minus119902 (352)

On a vu que 0119863 eacutegale infin119863 donc infin119878 = 0119863 (351)Inversement pour 119902 gt 1

(119902119863)1minus119902 = 119902 +119902

sum119896=2

(119902119896)(minus1)119896+1

119896119878 (353)

Pour 119902 = 1 la relation est108

1119867 = minus1 +infin

sum119896=2

119896119878119896(119896 minus 1) (354)

EstimationHurlbert fournit un estimateur non biaiseacute de son indice

(119899 est la taille de lrsquoeacutechantillon 119899119904 le nombre drsquoindividus delrsquoespegravece 119904)

119896 119878 =119904119899

sum119904=1

[1 minus (119899 minus 119899119904119896 )(119899

119896)] (355)

Dauby et O J Hardy109 montrent que cet estimateur esttregraves peu sensible agrave la taille de lrsquoeacutechantillon et obtient demeilleurs reacutesultats sur ce point que les estimateurs de Chaoet Shen pour lrsquoindice de Shannon ou du nombre drsquoespegraveces WSmith et Grassle110 ont calculeacute sa variance

Le calcul de la diversiteacute de Hurlbert est possible dans en-tropart

Indice de Hurlbert (probabiliteacutes)Hurlbert(asProbaVector(colSums(BCI)) k = 2)

Biased 1973676

Estimateur sans biais (abondances)Hurlbert(colSums(BCI) k = 2)

Unbiased 1973721

Nombre effectif despegravecesHurlbertD(colSums(BCI) k = 2)

Unbiased 3805308

1E C Pielou Ecological Diver-sity New York Wiley 1975

2H T Davis The Theory ofEconometrics Bloomington India-na The Principia Press 1941

3Theil Economics and Informa-tion Theory cf note 78 p 50

4Shannon laquo A Mathemati-cal Theory of Communication raquocf note 74 p 49 Shannon etWeaver The Mathematical Theoryof Communication cf note 74p 49

5E Maasoumi laquo A Compendiumto Information Theory in Economicsand Econometrics raquo In EconometricReviews 122 (1993) p 137-181 doi 10108007474939308800260

Chapitre 4

Entropie

Lrsquoentropie est la surprise moyenne apporteacutee par lrsquoobservation des indivi-dus drsquoune communauteacute drsquoautant plus grande qursquoun individu appartientagrave une espegravece plus rare Lrsquoentropie HCDT permet drsquounifier les indices clas-siques de diversiteacute son paramegravetre appeleacute ordre fixe lrsquoimportance don-neacutee aux espegraveces rares Lrsquoentropie drsquoordre 0 est la richesse celle drsquoordre 1lrsquoindice de Shannon celle drsquoordre 2 celui de Simpson Lrsquoentropie est lamoyenne du logarithme deacuteformeacute de la rareteacute des espegraveces deacutefinie commelrsquoinverse de leur probabiliteacuteLrsquoentropie va de pair avec la diversiteacute au sens strict (Nombres de Hill) le nombre drsquoespegraveces eacutequiprobables dont lrsquoentropie est la mecircme que cellede la communauteacute reacuteelle La diversiteacute est lrsquoexponentielle deacuteformeacutee delrsquoentropie Les profils de diversiteacute repreacutesentent la diversiteacute en fonction deson ordre et permettent la comparaison de communauteacutesLrsquoestimation de la diversiteacute est difficile pour des ordres infeacuterieurs agrave 0 5dans des taxocegravenes tregraves divers comme les arbres des forecircts tropicales

Lrsquoessentiel

Lrsquoentropie peut ecirctre entendue comme la surprise moyennefournie par lrsquoobservation drsquoun eacutechantillon Crsquoest intuitivementune bonne mesure de diversiteacute1 Ses proprieacuteteacutes matheacutematiquespermettent drsquounifier les mesures de diversiteacute dans un cadregeacuteneacuteral

41 Deacutefinition de lrsquoentropieLes textes fondateurs sont Davis2 et surtout Theil3 en eacuteco-

nomeacutetrie et Shannon4 pour la mesure de la diversiteacute Unerevue est fournie par Maasoumi5

Consideacuterons une expeacuterience dont les reacutesultats possiblessont 1199031 1199032 hellip 119903119878 La probabiliteacute drsquoobtenir 119903119904 est 119901119904 etp = (1199011 1199012 hellip 119901119878) est le vecteur composeacute des probabiliteacutesdrsquoobtenir chaque reacutesultat Les probabiliteacutes sont connues a prio-ri Tout ce qui suit est vrai aussi pour des valeurs de 119903 conti-nues dont on connaicirctrait la densiteacute de probabiliteacute

On considegravere maintenant un eacutechantillon de valeurs de 119903La preacutesence de 119903119904 dans lrsquoeacutechantillon est peu eacutetonnante si 119901119904est grande elle apporte peu drsquoinformation suppleacutementaire

62 Entropie

6G P Patil et C Taillie laquo Di-versity as a Concept and Its Measure-ment raquo In Journal of the AmericanStatistical Association 77379 (1982)p 548-561 doi 1023072287709 JS-TOR 2287709

par rapport agrave la simple connaissance des probabiliteacutes En re-vanche si 119901119904 est petite la preacutesence de 119903119904 est surprenante Ondeacutefinit donc une fonction drsquoinformation 119868(119901119904) deacutecroissantequand la probabiliteacute augmente de 119868(0) gt 0 (eacuteventuellement+infin) agrave 119868(1) = 0 Chaque valeur observeacutee dans lrsquoeacutechantillonapporte une certaine quantiteacute drsquoinformation dont la sommeest lrsquoinformation de lrsquoeacutechantillon Patil et Taillie6 appellentlrsquoinformation laquo rareteacute raquo

La quantiteacute drsquoinformation attendue de lrsquoexpeacuterience estsum119878

119904=1 119901119904119868(119901119904) = 119867(p) Si on choisit 119868 (119901119904) = minus ln (119901119904) 119867 (p)est lrsquoindice de Shannon mais bien drsquoautres formes de 119868 (119901119904)sont possibles 119867 (p) est appeleacutee entropie Crsquoest une mesurede lrsquoincertitude (de la volatiliteacute) du reacutesultat de lrsquoexpeacuterience Sile reacutesultat est certain (une seule valeur 119901119878 vaut 1) lrsquoentropieest nulle Lrsquoentropie est maximale quand les reacutesultats sonteacutequiprobables

Si p est la distribution des probabiliteacute des espegraveces dansune communauteacute Patil et Taillie7 montrent que

bull Si 119868 (119901119904) = (1 minus 119901119904)119901119904 alors 119867 (p) est le nombre drsquoes-pegraveces 119878 moins 1

bull Si 119868 (119901119904) = minus ln (119901119904) alors 119867 (p) est lrsquoindice de Shannon bull Si 119868 (119901119904) = 1 minus 119901119904 alors 119867 (p) est lrsquoindice de Simpson

Fig 41 Fonctions drsquoinformationutiliseacutees dans le nombre drsquoespegraveces(trait plein) lrsquoindice de Shannon

(pointilleacutes longs) et lrsquoindice deSimpson (pointilleacutes) Lrsquoinformation

apporteacutee par lrsquoobservationdrsquoespegraveces rares deacutecroicirct du nombre

drsquoespegraveces agrave lrsquoindice de Simpson

000 025 050 075 100p

Ces trois fonctions drsquoinformation sont repreacutesenteacutees en fi-gure 41

I0 lt- function(p) (1 - p)pI1 lt- function(p) -log(p)I2 lt- function(p) 1 - pggplot(dataframe(x = c(0 1)) aes(x)) + stat_function(fun = I0) +

stat_function(fun = I1 lty = 2) + stat_function(fun = I2lty = 3) + coord_cartesian(ylim = c(0 10)) + labs(x = py = I(p))

42 Entropie relative 63

000 025 050 075 100p

Fig 42 Valeur de 119901119904119868(119901119904) dansle nombre drsquoespegraveces (trait plein)lrsquoindice de Shannon (pointilleacuteslongs) et lrsquoindice de Simpson(pointilleacutes) Les espegraveces rarescontribuent peu sauf pour lenombre drsquoespegraveces

8S Kullback et R A Leiblerlaquo On Information and Sufficiency raquoIn The Annals of Mathematical Sta-tistics 221 (1951) p 79-86 JSTOR 2236703

La contribution de chaque espegravece agrave la valeur totale de lrsquoen-tropie est repreacutesenteacutee figure 42

Code R

H0 lt- function(p) 1 - pH1 lt- function(p) -p log(p)H2 lt- function(p) p (1 - p)ggplot(dataframe(x = c(0001 1)) aes(x)) + stat_function(fun = H0) +

stat_function(fun = H1 lty = 2) + stat_function(fun = H2lty = 3) + labs(x = p y = H(p))

42 Entropie relativeConsideacuterons maintenant les probabiliteacutes 119902119904 formant lrsquoen-

semble q obtenues par la reacutealisation de lrsquoexpeacuterience Ellessont diffeacuterentes des probabiliteacutes 119901119904 par exemple parce quelrsquoexpeacuterience ne srsquoest pas deacuterouleacutee exactement comme preacutevuOn deacutefinit le gain drsquoinformation 119868(119902119904 119901119904) comme la quantiteacutedrsquoinformation suppleacutementaire fournie par lrsquoobservation drsquounreacutesultat de lrsquoexpeacuterience connaissant les probabiliteacutes a prio-ri La quantiteacute totale drsquoinformation fournie par lrsquoexpeacuteriencesum119878

119904=1 119902119904119868(119902119904 119901119904) = 119867(q p) est souvent appeleacutee entropie rela-tive Elle peut ecirctre vue comme une distance entre la distribu-tion a priori et la distribution a posteriori Il est possible queles distributions p et q soit identiques que le gain drsquoinforma-tion soit donc nul mais les estimateurs empiriques nrsquoeacutetant pasexactement eacutegaux entre eux des tests de significativiteacute de lavaleur de (q p) seront neacutecessaires

Quelques formes possibles de 119867(q p) sont

bull La divergence de Kullback-Leibler8 connue par les eacuteco-nomistes comme lrsquoindice de dissimilariteacute de Theil 9

119879 =119878

sum119904=1

119902119904 ln 119902119904119901119904

64 Entropie

10Conceiccedilatildeo et Ferreira TheYoung Personrsquos Guide to the TheilIndex Suggesting Intuitive Inter-pretations and Exploring AnalyticalApplications cf note 79 p 50

11E Marcon et al laquo The Decom-position of Shannonrsquos Entropy and aConfidence Interval for Beta Diversi-ty raquo In Oikos 1214 (2012) p 516-522 doi 101111j1600-0706201119267x

12R H MacArthur laquo Fluctua-tions of Animal Populations and aMeasure of Community Stability raquoIn Ecology 363 (1955) p 533-536doi doi1023071929601

13R E Ulanowicz laquo InformationTheory in Ecology raquo In Computersamp Chemistry 254 (2001) p 393-399doi 101016S0097-8485(01)00073-0

bull Sa proche parente appeleacutee parfois deuxiegraveme mesure deTheil10 qui inverse simplement les rocircles de 119901 et 119902

119871 =119878

sum119904=1

119901119904 ln 119901119904119902119904

Fig 43 Valeur de 119902 ln(119902119901) enfonction de 119901 et 119902 La divergencede Kullback-Leibler est la somme

de cette valeur pour toutes lesespegraveces

00 02 04 06 08 10

minus03

minus02 minus01

Lrsquoentropie relative est essentielle pour la deacutefinition de ladiversiteacute 120573 preacutesenteacutee dans le chapitre 12 En se limitant agrave ladiversiteacute 120572 on peut remarquer que lrsquoindice de Shannon est ladivergence de Kullback-Leibler entre la distribution observeacuteeet lrsquoeacutequiprobabiliteacute des espegraveces11 Les valeurs de chaque termede la divergence sont repreacutesenteacutees en figure 43

p lt- q lt- seq(001 1 001)KB lt- function(p q) p log(pq)xyz lt- t(outer(p q FUN = KB))library(sp)image(xyz col = bpycolors(n = 100 cutofftails = 03 alpha = 06)

xlab = q ylab = p asp = 1)contour(xyz levels = c(seq(-03 0 01) c(02 05) seq(1

4 1)) labcex = 1 add = T)

43 Lrsquoappropriation de lrsquoentropie par labiodiversiteacute

MacArthur12 est le premier agrave avoir introduit la theacuteoriede lrsquoinformation en eacutecologie13 MacArthur srsquointeacuteressait aux reacute-seaux trophiques et cherchait agrave mesurer leur stabiliteacute lrsquoindicede Shannon qui comptabilise le nombre de relations possibleslui paraissait une bonne faccedilon de lrsquoeacutevaluer Mais lrsquoefficaciteacute

43 Lrsquoappropriation de lrsquoentropie par la biodiversiteacute 65

14A Reacutenyi laquo On Measures of En-tropy and Information raquo In 4th Ber-keley Symposium on MathematicalStatistics and Probability Sous ladir de J Neyman T 1 BerkeleyUSA University of California Press1961 p 547-561

15Patil et Taillie laquo Diversity as aConcept and Its Measurement raquo cfnote 6 p 62

16H Dalton laquo The Measure-ment of the Inequality of Incomes raquoIn The Economic Journal 30119(1920) p 348-361 doi 10 2307 2223525

17M O Hill laquo Diversity andEvenness A Unifying Notation andIts Consequences raquo In Ecology 542(1973) p 427-432 doi 10 2307 1934352

implique la speacutecialisation ignoreacutee dans 119867 qui est une mesureneutre (toutes les espegraveces y jouent le mecircme rocircle) MacArthura abandonneacute cette voie

Les premiers travaux consistant agrave geacuteneacuteraliser lrsquoindice deShannon sont dus agrave Reacutenyi14 Lrsquoentropie drsquoordre 119902 de Reacutenyi est

119902119877 = 11 minus 119902 ln sum119878

119902=1 119901119902119904 (43)

Reacutenyi pose eacutegalement les axiomes pour une mesure drsquoen-tropie 119877 (p) ougrave p = (1199011 1199012 hellip 119901119878)

bull La symeacutetrie les espegraveces doivent ecirctre interchangeablesaucune nrsquoa de rocircle particulier et leur ordre est indiffeacute-rent

bull La mesure doit ecirctre continue par rapport aux probabili-teacutes

bull La valeur maximale est atteinte si toutes les probabiliteacutessont eacutegales

Il montre que 119902119877 respecte les 3 axiomesPatil et Taillie15 ont montreacute de plus que

bull Lrsquointroduction drsquoune espegravece dans une communauteacute aug-mente sa diversiteacute (conseacutequence de la deacutecroissance de119892(119901119904))

bull Le remplacement drsquoun individu drsquoune espegravece freacutequentepar un individu drsquoune espegravece plus rare augmente lrsquoentro-pie agrave condition que 119877(p) soit concave Dans la litteacuteratureeacuteconomique sur les ineacutegaliteacutes cette proprieacuteteacute est connuesous le nom de Pigou-Dalton16

Hill17 transforme lrsquoentropie de Reacutenyi en nombres de Hillqui en sont simplement lrsquoexponentielle

119902119863 = (119878

sum119904=1

119901119902119904)

11minus119902

Le souci de Hill eacutetait de rendre les indices de diversiteacute in-telligibles apregraves lrsquoarticle remarqueacute de S H Hurlbert18 intituleacutelaquo le non-concept de diversiteacute speacutecifique raquo Hurlbert reprochait agravela litteacuterature sur la diversiteacute sa trop grande abstraction et soneacuteloignement des reacutealiteacutes biologiques notamment en fournis-sant des exemples dans lesquels lrsquoordre des communauteacutes nrsquoestpas le mecircme selon lrsquoindice de diversiteacute choisi Les nombres deHill sont le nombre drsquoespegraveces eacutequiprobables donnant la mecircmevaleur de diversiteacute que la distribution observeacutee Ils sont destransformations simples des indices classiques

66 Entropie

19J A Stoddart laquo A Genoty-pic Diversity Measure raquo In Jour-nal of Heredity 74 (1983) p 489-490doi 101093oxfordjournalsjhereda109852

20R H MacArthur laquo Patterns ofSpecies Diversity raquo In BiologicalReviews 404 (1965) p 510-533 doi 101111j1469-185X1965tb00815x

21M A Adelman laquo Comment onthe rdquoHrdquo Concentration Measure as aNumbers-Equivalent raquo In The Re-view of Economics and Statistics511 (1969) p 99-101 doi 1023071926955

22H-R Gregorius laquo On theConcept of Effective Number raquoIn Theoretical population bio-logy 402 (1991) p 269-83 doi 10 1016 0040 - 5809(91 ) 90056 - LPMID 1788824

23S Wright laquo Evolution in Men-delian Populations raquo In Genetics162 (1931) p 97-159

24H-R Gregorius laquo Partitioningof Diversity The rdquowithin Communi-tiesrdquo Component raquo In Web Ecology14 (2014) p 51-60 doi 105194we-14-51-2014

25Ricotta et Avena laquo AnInformation-Theoretical Measure ofTaxonomic Diversity raquo cf note 3p 25

bull 0119863 est le nombre drsquoespegraveces bull 1119863 = 119890119867 lrsquoexponentielle de lrsquoindice de Shannon bull 2119863 = 1(1 minus 119864) lrsquoinverse de lrsquoindice de concentration de

Simpson connu sous le nom drsquoindice de Stoddart19

Ces reacutesultats avaient deacutejagrave eacuteteacute obtenus avec une autre ap-proche par MacArthur20 et repris par Adelman21 dans la lit-teacuterature eacuteconomique

Les nombres de Hill sont des laquo nombres effectifs raquo oulaquo nombres eacutequivalents raquo Le concept a eacuteteacute deacutefini rigoureu-sement par Gregorius22 drsquoapregraves S Wright23 (qui avait lepremier deacutefini la taille effective drsquoune population) eacutetantdonneacute une variable caracteacuteristique (ici lrsquoentropie) fonctionseulement drsquoune variable numeacuterique (ici le nombre drsquoespegraveces)dans un cas ideacuteal (ici lrsquoeacutequiprobabiliteacute des espegraveces) lenombre effectif est la valeur de la variable numeacuterique pourlaquelle la variable caracteacuteristique est celle du jeu de donneacutees

Gregorius24 montre que de nombreux autres indicesde diversiteacute sont acceptables dans le sens ougrave ils veacuterifientles axiomes preacuteceacutedents et de plus que la diversiteacute drsquounassemblage de communauteacutes est obligatoirement supeacuterieureagrave la diversiteacute moyenne de ces communauteacutes (lrsquoeacutegaliteacute nrsquoeacutetantpossible que si les communauteacutes sont toutes identiques) Cettederniegravere proprieacuteteacute sera traiteacutee en deacutetail dans la partie consa-creacutee agrave la deacutecomposition de la diversiteacute Ces indices doiventveacuterifier deux proprieacuteteacutes leur fonction drsquoinformation doitecirctre deacutecroissante et ils doivent ecirctre une fonction strictementconcave de 119901119904 Parmi les possibiliteacutes 119868(119901119904) = cos (1199011199041205872) estenvisageable par exemple le choix de la fonction drsquoinfor-mation est virtuellement illimiteacute mais seules quelques unesseront interpreacutetables clairement

Un nombre eacutequivalent drsquoespegraveces existe pour tous ces in-dices il est toujours eacutegal agrave lrsquoinverse de lrsquoimage de lrsquoindice parla reacuteciproque de la fonction drsquoinformation

119863 = 1119868minus1 (sum119878

119904=1 119901119904119868(119901119904)) (45)

Drsquoautres entropies ont eacuteteacute utliseacutees avec plus ou moins desuccegraves Par exemple Ricotta et Avena25 proposent drsquoutiliserla fonction drsquoinformation 119868(119901119904) = minus ln(119896119904) ougrave 119896119904 est la dissi-milariteacute totale de lrsquoespegravece 119904 avec les autres (par exemple lasomme des distances aux autres espegraveces dans un arbre phylo-geacuteneacutetique voir section 62) normaliseacutee pour que sum119904 119896119904 = 1Ainsi les espegraveces les plus originales apportent peu drsquoinforma-tion ce qui nrsquoest pas tregraves intuitif Les auteurs montrent queleur mesure est la somme de lrsquoentropie de Shannon et de ladivergence de Kullback-Leibler entre les probabiliteacutes et les dis-

44 Entropie HCDT 67

26C Ricotta et L Szeidl laquo To-wards a Unifying Approach to Di-versity Measures Bridging the Gapbetween the Shannon Entropy andRaorsquos Quadratic Index raquo In Theore-tical Population Biology 703 (2006)p 237-243 doi 101016jtpb200606003

27C Tsallis laquo Possible Genera-lization of Boltzmann-Gibbs Statis-tics raquo In Journal of Statistical Phy-sics 521 (1988) p 479-487 doi 101007BF01016429

28J Havrda et F Charvaacutetlaquo Quantification Method of Classifica-tion Processes Concept of StructuralAlpha-Entropy raquo In Kybernetika 31(1967) p 30-35

29Z Daroacuteczy laquo Generalized Infor-mation Functions raquo In Informationand Control 161 (1970) p 36-51doi 101016s0019-9958(70)80040-7

30Mendes et al laquo A Unified Indexto Measure Ecological Diversity andSpecies Rarity raquo cf note 70 p 48

31C Ricotta laquo On Parametric Di-versity Indices in Ecology A Histo-rical Note raquo In Community Ecology62 (2005) p 241-244 doi 101556ComEc62005212

33C J Keylock laquo Simpson Diver-sity and the Shannon-Wiener Index asSpecial Cases of a Generalized Entro-py raquo In Oikos 1091 (2005) p 203-207 doi 101111j0030-1299200513735x

34L Jost laquo Entropy and Diversi-ty raquo In Oikos 1132 (2006) p 363-375 doi 10 1111 j 2006 0030 -1299 14714 x L Jost laquo Partitio-ning Diversity into Independent Al-pha and Beta Components raquo In Eco-logy 8810 (2007) p 2427-2439 doi 10189006-17361

35C Tsallis laquo What Are the Num-bers That Experiments Provide raquoIn Quiacutemica Nova 176 (1994)p 468-471

36G E P Box et D R Cox laquo AnAnalysis of Transformations raquo In Journal of the Royal Statistical So-ciety Series B (Statistical Metho-dology) 262 (1964) p 211-252 doi 101111j2517-61611964tb00553xJSTOR 2984418

similariteacutes des espegraveces Ricotta et Szeidl26 ont deacutefini plus tardune entropie augmentant avec lrsquooriginaliteacute de chaque espegravecepreacutesenteacutee au chapitre 9

44 Entropie HCDTTsallis27 propose une classe de mesures appeleacutee entropie

geacuteneacuteraliseacutee deacutefinie par Havrda et Charvaacutet28 pour la premiegraverefois et redeacutecouverte plusieurs fois notamment par Daroacuteczy29

drsquoougrave son nom entropie HCDT (voir Mendes et al30 page 451pour un historique complet)

119902119867 = 1119902 minus 1 (1 minus

119878sum119904=1

119901119902119904) (46)

Tsallis a montreacute que les indices de Simpson et de Shannoneacutetaient des cas particuliers drsquoentropie geacuteneacuteraliseacutee retrouvantsans faire le rapprochement31 la deacutefinition drsquoun indice de di-versiteacute de Patil et Taillie32

Ces reacutesultats ont eacuteteacute compleacuteteacutes par drsquoautres et repris eneacutecologie par Keylock33 et Jost34 Lagrave encore

bull Le nombre drsquoespegraveces moins 1 est 0119867 bull Lrsquoindice de Shannon est 1119867 bull Lrsquoindice de Gini-Simpson est 2119867

Lrsquoentropie HCDT est particuliegraverement attractive parce quesa relation avec la diversiteacute au sens strict est simple apregraves in-troduction du formalisme adapteacute (les logarithmes deacuteformeacutes)Son biais drsquoestimation peut ecirctre corrigeacute globalement et nonseulement pour les cas particuliers (nombre drsquoespegraveces Shan-non Simpson) Enfin sa deacutecomposition sera preacutesenteacutee en deacute-tail dans le chapitre 12

Logarithmes deacuteformeacutesLrsquoeacutecriture de lrsquoentropie HCDT est largement simplifieacutee en

introduisant le formalisme des logarithmes deacuteformeacutes35 Le lo-garithme drsquoordre 119902 est deacutefini par

ln119902 119909 = 1199091minus119902 minus 11 minus 119902 (47)

dont la forme est identique agrave la transformation de Box et Cox36

utiliseacutee en statistiques pour normaliser une variableLe logarithme deacuteformeacute converge vers le logarithme naturel

quand 119902 rarr 1 (figure 44)Le code R neacutecessaire pour reacutealiser la figure est

68 Entropie

ln0 lt- function(p) lnq(p 0)ln2 lt- function(p) lnq(p 2)lnm1 lt- function(p) lnq(p -1)ggplot(dataframe(x = c(0 1)) aes(x)) +

stat_function(fun = log) +stat_function(fun = ln0 lty = 2 col = red) +stat_function(fun = ln2 lty = 3 col = blue) +stat_function(fun = lnm1 lty = 4 col = green) +coord_cartesian(ylim = c(-4 0)) +labs(x = p y = expression(ln[q](p)))

Sa fonction inverse est lrsquoexponentielle drsquoordre 119902

119890119909119902 = [1 + (1 minus 119902) 119909]

11minus119902 (48)

Fig 44 Valeur du logarithmedrsquoordre 119902 de probabiliteacutes entre 0 et

1 pour diffeacuterentes valeurs de 119902 119902 = 0 (pointilleacutes longs rouges) la

courbe est une droite 119902 = 1 (traitplein) logarithme naturel 119902 = 2

(pointilleacutes courts bleus) la courbea la mecircme forme que le logarithme

naturel pour les valeurs positivesde 119902 119902 = minus1 (pointilleacutes alterneacutes

verts) la courbe est convexe pourles valeurs neacutegatives de 119902

minus4

minus3

minus2

minus1

000 025 050 075 100p

Enfin le logarithme deacuteformeacute est subadditif

ln119902 (119909119910) = ln119902 119909 + ln119902 119910 minus (119902 minus 1) (ln119902 119909) (ln119902 119910) (49)

Ses proprieacuteteacutes sont les suivantes

ln1199021119909 = minus119909119902minus1 ln119902 119909 (410)

ln119902 (119909119910) = ln119902 119909 + 1199091minus119902 ln119902 119910 (411)

ln119902 (119909119910 ) = ln119902 119909 minus (119909

119910 )1minus119902

ln119902 119910 (412)

119890119909+119910119902 = 119890119909

119902 119890119910

1+(1minus119902)119909119902 (413)

Si 119902 gt 1 lim119909rarr+infin (ln119902 119909) = 1(119902 minus 1) donc 119890119909119902 nrsquoest pas

deacutefinie pour 119909 gt 1(119902 minus 1)

44 Entropie HCDT 69

37E Marcon et al laquo Generaliza-tion of the Partitioning of ShannonDiversity raquo In Plos One 93 (2014)e90289 doi 101371journalpone0090289

38Jost laquo Entropy and Diversity raquocf note 34 p 67

39Jost laquo Partitioning Diversityinto Independent Alpha and BetaComponents raquo cf note 34 p 67

40S Hoffmann et A Hoffmannlaquo Is There a rdquoTruerdquo Diversity raquo In Ecological Economics 652 (2008)p 213-215 doi 101016jecolecon200801009

41L Jost laquo Mismeasuring Biologi-cal Diversity Response to Hoffmannand Hoffmann (2008) raquo In Ecologi-cal Economics 68 (2009) p 925-928doi 101016jecolecon200810015

La deacuteriveacutee du logarithme deacuteformeacute est quel que soit 119902

lnprime119902 (119909) = 119909minus119902 (414)

Les deacuteriveacutees premiegravere et seconde de lrsquoexponentielle deacutefor-meacutee sont quel que soit 119902

expprime119902 (119909) = (119890119909

119902 )119902 (415)

expPrime119902 (119909) = (119890119909

119902 )2119902minus1 (416)

Ces fonctions sont impleacutementeacutees dans le package entro-part lnq(x q) et expq(x q)

Lrsquoentropie drsquoordre 119902 srsquoeacutecrit

119902119867 = 1119902 minus 1 (1 minus

119878sum119904=1

119901119902119904) = minus sum

119904119901119902

119904 ln119902 119901119904 = sum119904

119901119904 ln1199021119901119904

(417)Ces trois formes sont eacutequivalentes mais les deux derniegraveres

srsquointerpregravetent comme une geacuteneacuteralisation de lrsquoentropie de Shan-non37

Le calcul de 119902119867 peut se faire avec la fonction Tsallis dela librairie entropart

Ps lt- asProbaVector(colSums(BCI))q lt- 15Tsallis(Ps q)

None 1715954

Entropie et diversiteacuteOn voit immeacutediatement que lrsquoentropie de Tsallis est le lo-

garithme drsquoordre 119902 du nombre de Hill correspondant commelrsquoentropie de Reacutenyi en est le logarithme naturel

119902119867 = ln119902119902119863 (418)

119902119863 = 119890119902119867119902 (419)

Lrsquoentropie est utile pour les calculs la correction des biaisdrsquoestimation notamment Les nombres de Hill ou nombreseacutequivalents drsquoespegraveces ou nombres effectif drsquoespegraveces permettentune appreacutehension plus intuitive de la notion de biodiversiteacute38

En raison de leurs proprieacuteteacutes notamment de deacutecomposition(voir le chapitre 12) Jost39 les appelle laquo vraie diversiteacute raquo SHoffmann et A Hoffmann40 critiquent cette deacutefinition totali-taire et fournissent une revue historique plus lointaine sur les

70 Entropie

43H-R Gregorius laquo Linking Di-versity and Differentiation raquo In Di-versity 23 (2010) p 370-394 doi 103390d2030370

44A Chao et al laquo Phylogene-tic Diversity Measures Based onHill Numbers raquo In PhilosophicalTransactions of the Royal Socie-ty of London Series B Biologi-cal Sciences 3651558 (2010) p 3599-3609 doi 10 1098 rstb 2010 0272Supplementary

45Hill laquo Diversity and Evenness A Unifying Notation and Its Conse-quences raquo cf note 17 p 65

46W H Berger et F L Parkerlaquo Diversity of Planktonic Foramini-fera in Deep-Sea Sediments raquo In Science 1683937 (1970) p 1345-1347 doi 101126science16839371345

origines de ces mesures Jost41 reconnaicirct qursquoun autre termeaurait pu ecirctre choisi (laquo diversiteacute neutre raquo ou laquo diversiteacute matheacute-matique raquo par exemple)

Dauby et O J Hardy42 eacutecrivent laquo diversiteacute au sens strict raquo Gregorius43 laquo diversiteacute explicite raquo

Quoi qursquoil en soit les nombres de Hill respectent le principede reacuteplication (voir Chao et al44 section 3 pour une discus-sion et un historique) si 119868 communauteacutes de mecircme taille demecircme niveau de diversiteacute 119863 mais sans espegraveces en communsont regroupeacutees dans une meacuteta-communauteacute la diversiteacute dela meacuteta-communauteacute doit ecirctre 119868 times 119863

Lrsquointeacuterecirct de ces approches est de fournir une deacutefinitionparameacutetrique de la diversiteacute qui donne plus ou moins drsquoim-portance aux espegraveces rares

bull minusinfin119863 = 1min(119901119878) est lrsquoinverse de la proportion de lacommunauteacute repreacutesenteacutee par lrsquoespegravece la plus rare (toutesles autres espegraveces sont ignoreacutees) Le biais drsquoestimationest incontrocirclable lrsquoespegravece la plus rare nrsquoest pas danslrsquoeacutechantillon tant que lrsquoinventaire nrsquoest pas exhaustif

bull 0119863 est le nombre drsquoespegraveces (alors que 0119867 est le nombredrsquoespegraveces moins 1) Crsquoest la mesure classique qui donnele plus drsquoimportance aux espegraveces rares toutes les es-pegraveces ont la mecircme importance quel que soit leur effectifen termes drsquoindividus Il est bien adapteacute agrave une approchepatrimoniale celle du collectionneur qui considegravere quelrsquoexistence drsquoune espegravece suppleacutementaire a un inteacuterecirct ensoi par exemple parce qursquoelle peut contenir une moleacute-cule valorisable Comme les espegraveces rares sont difficilesagrave eacutechantillonner le biais drsquoestimation est tregraves importantet sa reacutesolution a geacuteneacutereacute une litteacuterature en soi

bull 1119863 est lrsquoexponentielle de lrsquoindice de Shannon donne lamecircme importance agrave tous les individus Il est adapteacute agraveune approche drsquoeacutecologue inteacuteresseacute par les interactionspossibles le nombre de combinaisons drsquoespegraveces en estune approche satisfaisante Le biais drsquoestimation est sen-sible

bull 2119863 est lrsquoinverse de lrsquoindice de concentration de Gini-Simpson donne moins drsquoimportance aux espegraveces raresHill45 lrsquoappelle laquo le nombre drsquoespegraveces tregraves abondantes raquoIl comptabilise les interactions possibles entre pairesdrsquoindividus les espegraveces rares interviennent dans peu depaires et influent peu sur lrsquoindice En conseacutequence lebiais drsquoestimation est tregraves petit de plus un estimateurnon biaiseacute existe

bull infin119863 = 1119889 est lrsquoinverse de lrsquoindice de Berger-Parker46 quiest la proportion de la communauteacute repreacutesenteacutee par lrsquoes-pegravece la plus abondante 119889 = max(p) Toutes les autres

45 Profils de diversiteacute 71

47R Gadagkar laquo An UndesirableProperty of Hillrsquos Diversity IndexN2 raquo In Oecologia 80 (1989) p 140-141 doi 101007BF00789944

48Leinster et Cobbold laquo Measu-ring Diversity The Importance ofSpecies Similarity raquo cf note 107p 58

51B Tothmeresz laquo Comparison ofDifferent Methods for Diversity Or-dering raquo In Journal of VegetationScience 62 (1995) p 283-290 doi 1023073236223

52R Kindt et al laquo Tree Diversi-ty in Western Kenya Using Profilesto Characterise Richness and Even-ness raquo In Biodiversity and Conser-vation 154 (2006) p 1253-1270 doi 101007s10531-005-0772-x

53Tothmeresz cf note 5154R Lande et al laquo When Spe-

cies Accumulation Curves Intersect Implications for Ranking DiversityUsing Small Samples raquo In Oikos 893(2000) p 601-605 doi 101034j1600-07062000890320x

espegraveces sont ignoreacutees

Le calcul de 119902119863 peut se faire avec la fonction Diversityde la librairie entropart

Ps lt- asProbaVector(colSums(BCI))q lt- 15Diversity(Ps q)

None 4957724

Les proprieacuteteacutes matheacutematiques de la diversiteacute ne sont pascelles de lrsquoentropie Lrsquoentropie doit ecirctre une fonction concavedes probabiliteacutes comme on lrsquoa vu plus haut mais pas la di-versiteacute (un exemple de confusion est fourni par Gadagkar47

qui reproche agrave 2119863 de ne pas ecirctre concave) Lrsquoentropie est unemoyenne pondeacutereacutee par les probabiliteacutes de la fonction drsquoin-formation crsquoest donc une fonction lineacuteaire des probabiliteacutesproprieacuteteacute importante pour deacutefinir lrsquoentropie 120572 (section 103)comme la moyenne des entropies de plusieurs communauteacutesou lrsquoentropie phylogeacuteneacutetique (chapitre 8) comme la moyennede lrsquoentropie sur les peacuteriodes drsquoun arbre La diversiteacute nrsquoest pasune fonction lineacuteaire des probabiliteacutes la diversiteacute moyennenrsquoest en geacuteneacuteral pas la moyenne des diversiteacutes

SynthegraveseLrsquoinverse de la probabiliteacute drsquoune espegravece 1119901119904 deacutefinit sa

rareteacute Lrsquoentropie est la moyenne du logarithme de la rareteacute

119902119867 = 1119902 minus 1 (1 minus

119878sum119904=1

119901119902119904) = sum

119904119901119904 ln119902

1119901119904

La diversiteacute est son exponentielle

119902119863 = 119890119902119867119902 (421)

45 Profils de diversiteacuteLeinster et Cobbold48 apregraves Hill49 Patil et Taillie50 Toth-

meresz51 et Kindt et al52 recommandent de tracer des profilsde diversiteacute crsquoest-agrave-dire la valeur de la diversiteacute 119902119863 en fonctionde lrsquoordre 119902 (figure 45) pour comparer plusieurs communau-teacutes Une communauteacute peut ecirctre deacuteclareacutee plus diverse qursquouneautre si son profil de diversiteacute est au-dessus de lrsquoautre pourtoutes les valeurs de 119902 Si les courbes se croisent il nrsquoy a pasde relation drsquoordre53

72 Entropie

55P Pallmann et al laquo Asses-sing Group Differences in Biodiversi-ty by Simultaneously Testing a User-Defined Selection of Diversity In-dices raquo In Molecular Ecology Re-sources 126 (2012) p 1068-1078doi 1011111755-099812004

56C Liu et al laquo Unifying and Dis-tinguishing Diversity Ordering Me-thods for Comparing Communities raquoIn Population Ecology 492 (2006)p 89-100 doi 101007s10144-006-0026-0

Lande et al54 montrent que si la diversiteacute de Simpson et larichesse de deux communauteacutes nrsquoont pas le mecircme ordre alorsles courbes drsquoaccumulation du nombre drsquoespegraveces en fonctiondu nombre drsquoindividus eacutechantillonneacutes se croisent aussi

Fig 45 Profil de diversiteacutecalculeacute pour deux parcelles de

Paracou (Parcelle 6 trait plein etParcelle 18 trait pointilleacute) Lacorrection du biais drsquoestimation

est celle de Chao et Jost

00 05 10 15 20q

teacute

qseq lt- seq(0 2 1)P6Dlt- CommunityProfile(Diversity Paracou618MC$Nsi[ 1] qseq)P18Dlt- CommunityProfile(Diversity Paracou618MC$Nsi[ 2] qseq)autoplot(P6D xlab = q ylab = Diversiteacute) +

geom_line(aes(x y) asdataframelist(P18D) lty = 2)

Pallmann et al55 ont deacuteveloppeacute un test statistique pourcomparer la diversiteacute de deux communauteacutes pour plusieursvaleurs de 119902 simultaneacutement

C Liu et al56 nomment seacuteparables des communauteacutes dontles profils ne se croisent pas Ils montrent que des communau-teacutes peuvent ecirctre seacuteparables en selon un profil de diversiteacute de 119902119863sans lrsquoecirctre forceacutement selon un profil de diversiteacute de Hurlbert(section 34) et inversement Ils montrent que les communau-teacutes seacuteparables selon un troisiegraveme type de profil celui de laqueue de distribution57 le sont dans tous les cas Le profil dela queue de distribution est construit en classant les espegravecesde la plus freacutequente agrave la plus rare et en traccedilant la probabiliteacuteqursquoun individu appartienne agrave une espegravece plus rare que lrsquoespegraveceen abscisse (figure 46)

Code R

Elimination des espegraveces absentes des deux parcellesPsi lt- asdataframe(Paracou618MC$Psi[Paracou618MC$Ps gt 0

])Psi[ 1] ltgt

sort gtcumsum gtrev

Psi[ 2] ltgtsort gtcumsum gt

46 Estimation de lrsquoentropie 73

1 10 100Espegraveces

Freacute

Fig 46 Profil de queue dedistribution calculeacute pour les deuxparcelles de Paracou (Parcelle 6 trait plein et Parcelle 18 traitpointilleacute) En abscisse rang delrsquoespegravece dans le classement de laplus freacutequente agrave la plus rare enordonneacutee probabiliteacute qursquounindividu de la communauteacuteappartienne agrave une espegravece plus rare

58L Fattorini et M Marchesellilaquo Inference on Intrinsic Diversity Pro-files of Biological Populations raquo In Environmetrics 105 (1999) p 589-599 doi 10 1002 (SICI ) 1099 -095X(199909 10 ) 10 5lt589 AID -ENV374gt30CO2-0

59Z Zhang et M Grabchak laquo En-tropic Representation and Estima-tion of Diversity Indices raquo In Jour-nal of Nonparametric Statistics 283(2016) p 563-575 doi 10 1080 1048525220161190357

60Z Zhang et J Zhou laquo Re-Parameterization of Multinomial Dis-tributions and Diversity Indices raquo In Journal of Statistical Planning andInference 1407 (2010) p 1731-1738doi 101016jjspi200912023

revPsi$x lt- 1nrow(Psi)ggplot(Psi aes(x)) + geom_path(aes(y = P006)) + geom_path(aes(y = P018)

lty = 2) + labs(x = Espegraveces y = Freacutequence) + scale_x_log10()

Les coordonneacutees des points du profil sont deacutefinies par

119910(119909) =119878

sum119904=119909+1

119901[119904] 119909 isin 0 1 hellip 119878 (422)

119901[119904] est la probabiliteacute de lrsquoespegravece 119904 les espegraveces sont classeacuteespar probabiliteacute deacutecroissante

Ce profil est exhaustif (toutes les espegraveces sont repreacutesenteacutees)alors que les autres profils de diversiteacute ne sont repreacutesenteacutes quepour un intervalle restreint du paramegravetre et qursquoun croisementde courbes peut se produire au-delagrave En revanche il ne prendpas en compte les espegraveces non observeacutees

Fattorini et Marcheselli58 proposent un test pour compa-rer deux profils de queue de distribution agrave partir drsquoeacutechantillon-nages multiples (neacutecessaires pour eacutevaluer la variance de cha-cune des probabiliteacutes) mais qui neacuteglige les espegraveces non obser-veacutees

46 Estimation de lrsquoentropieZhang et Grabchak

Z Zhang et Grabchak59 montrent que toutes les mesuresdrsquoentropie usuelles sont des combinaisons lineacuteaires de 120577119906119907(340) Agrave partir des estimateurs de 12057711990611990760 lrsquoestimateur suivantest proposeacute pour ℎ119902 = sum119878

119904=1 119901119902119904

ℎ119902 = 1 +119904119899

sum119904=1

119899119904119899

119899minus119899119904

sum119907=1

[119907

prod119894=1

119894 minus 119902119894 ] [

119907prod119895=1

(1 minus 119899119904 minus 1119899 minus 119895 )] (423)

74 Entropie

61Z Zhang laquo Entropy Estimationin Turingrsquos Perspective raquo cf note 89p 52

62Mao laquo Estimating Species Ac-cumulation Curves and Diversity In-dices raquo cf note 108 p 58 Vincket al laquo Estimation of the EntropyBased on Its Polynomial Representa-tion raquo cf note 92 p 52 Chao et allaquo Entropy and the Species Accumu-lation Curve A Novel Entropy Es-timator via Discovery Rates of NewSpecies raquo cf note 94 p 53 AnnexeS1

63A Chao et L Jost laquo Estima-ting Diversity and Entropy Profilesvia Discovery Rates of New Species raquoIn Methods in Ecology and Evolu-tion 68 (2015) p 873-882 doi 1011112041-210X12349

64Chao et al laquo Entropy and theSpecies Accumulation Curve A No-vel Entropy Estimator via DiscoveryRates of New Species raquo cf note 94p 53

ℎ119902 peut ensuite ecirctre utiliseacute pour lrsquoestimation de lrsquoentropieHCDT

119902 = 1 minus ℎ119902119902 minus 1 (424)

Lrsquoestimateur est asymptotiquement normal et son biais deacute-croit exponentiellement vite

ℎ119902 nrsquoest deacutefini que pour 119902 ne 1 Lrsquoestimateur corrigeacute de 1119867est

1 =119904119899

sum119904=1

119899119904119899

119899minus119899119904

sum119907=1

1119907 [

119907prod119895=1

1 minus 119899119904 minus 1119899 minus 119895 ] (425)

Cet estimateur est diffeacuterent de 11986711991161 Il a eacuteteacute eacutegalementobtenu par drsquoautres auteurs62 avec drsquoautres approches

Dans entropart utiliser Tsallis et Diversity

Tsallis(Paracou618MC$Ns q = 1 Correction = ZhangGrabchak)

ZhangGrabchak 4846407

Diversity(Paracou618MC$Ns q = 1 Correction = ZhangGrabchak)

Chao et JostChao et Jost63 complegravetent cet estimateur par une es-

timation du biais reacutesiduel selon la mecircme deacutemarche quepour lrsquoentropie de Shannon64 ℎ119902 srsquoeacutecrit sous la forme dela somme infinie des entropies de Simpson geacuteneacuteraliseacutees ℎ119902 = suminfin

119896=0 (119902minus1119896 )(minus1)1198961205771119896 Alors que lrsquoestimateur de Zhang et

Grabchak ne prend en compte que les 119899 minus 1 premiers termesde la somme pour un estimateur sans biais Chao et Jost65

eqn 5 le complegravetent par une estimation forceacutement biaiseacuteedes termes suivants pour obtenir

119902 = 1119902 minus 1 (426)

[1 minus ℎ119902 minus 1199041119899 (1 minus 119860)1minus119899 (119860119902minus1 minus

119899minus1sum119903=0

(119902 minus 1119903 )(119860 minus 1)119903)]

La formule du nombre de combinaisons est geacuteneacuteraliseacutee auxvaleurs de 119902 minus 1 non entiegraveres et vaut par convention 1 pour119903 = 0 119860 vaut

Cet estimateur est le plus performant Quand 119902 rarr 1 iltend vers lrsquoestimateur de lrsquoentropie de Shannon de Chao etal66 eacutequation (343) Quand 119902 = 0 lrsquoestimateur se reacuteduit agraveChao1 Pour toutes les valeurs entiegraveres de 119902 supeacuterieures oueacutegales agrave 2 il se reacuteduit agrave lrsquoestimateur (424) identique agrave lrsquoesti-mateur de Lande pour 119902 = 2 et est sans biais

Lrsquoestimateur est obtenu agrave partir de celui du taux de couver-ture extrapoleacute (section 23) fourni par Chao et Jost67 annexeE sans le deacutetail de la deacutemonstration preacutesenteacute ici Lrsquoespeacuteranceconditionnelle du taux de couverture dans un eacutechantillon detaille 119899+119898 compte-tenu des effectifs observeacutes noteacutes 119899119904 est

120124 (119862119899+119898|119899119904) = 119862119899+sum119904

119901119904[1 minus (1 minus 119901119904)119898]1(119899119904 = 0) (428)

Le taux de couverture 119862119899 est augmenteacute par lrsquoeacutechantillon-nage de 119898 individus suppleacutementaires si les espegraveces non eacutechan-tillonneacutees (veacuterifiant 1(119899119904 = 0)) sont deacutecouvertes (la probabili-teacute de le faire est 1 minus (1 minus 119901119904)119898)

119862119899 + sum119904 1199011199041(119899119904 = 0) vaut par deacutefinition 1Le deuxiegraveme terme de la somme est estimeacute en posant 119901119904 =

1205720 pour toutes les espegraveces non observeacutees ce qui constitue lamecircme approximation que pour lrsquoestimation de la relation deGood-Turing eacutequation (22) Alors (1 minus 119901119904)119898 est estimeacute par(1 minus 1205720)119898 et peut sortir de la somme qui ne contient plus quele terme sum119904 1199011199041(119899119904 = 0) estimeacute par 1205720119904119899

0 = 1199041198991119899 (1 minus 1205721)

Les deux estimateurs 1205721 et 1205720 sont eacutegaux agrave 119860 si le nombredrsquoespegraveces non eacutechantillonneacutees est estimeacute par lrsquoestimateurChao1 On obtient

120124 (119862119899+119898) = 1 minus 1199041198991119899 [ (119899 minus 1) 119904119899

1(119899 minus 1) 119904119899

1 + 21199041198992

]119899+119898

= 1 minus 1199041198991119899 (1 minus 119860)119898+1 (430)

Lrsquoespeacuterance du taux de couverture est directement lieacutee agravelrsquoindice de Simpson geacuteneacuteraliseacute 68 120124(119862119899+119898) = 1 minus 1205771119899+119898 Lrsquoes-timateur de ℎ119902 est obtenu en remplaccedilant les termes 1205771119896 dela somme infinie suminfin

119896=119899 (119902minus1119896 )(minus1)1198961205771119896 par la valeur de 1 minus

120124(119862119899+119898) calculeacutee dans lrsquoeacutequation (429) La formule obtenue

76 Entropie

69Chao et Jost laquo Estimating Di-versity and Entropy Profiles via Dis-covery Rates of New Species raquo cfnote 63 p 74 Appendix S1 TheoremS12d

70Marcon et al laquo Generalizationof the Partitioning of Shannon Diver-sity raquo cf note 37 p 69

71Chao et T-J Shen laquo Nonpara-metric Estimation of Shannonrsquos Indexof Diversity When There Are UnseenSpecies in Sample raquo cf note 84 p 52

72Grassberger laquo Finite SampleCorrections to Entropy and Dimen-sion Estimates raquo cf note 98 p 55

73Marcon laquo Practical Estimationof Diversity from Abundance Data raquocf note 36 p 37

74A Chao et al laquo Unveiling theSpecies-Rank Abundance Distribu-tion by Generalizing Good-TuringSample Coverage Theory raquo In Eco-logy 965 (2015) p 1189-1201 doi 10189014-05501

contient le deacuteveloppement en seacuterie entiegravere de [1 minus (1 minus 119860)119902minus1]ce qui permet drsquoeacuteliminer la somme infinie et drsquoobtenir lrsquoesti-mateur de lrsquoeacutequation (426) apregraves simplifications69

Autres meacutethodesDeux autres approches sont possibles 70

bull Celle de Chao et T-J Shen71 eacutetendue au-delagrave de lrsquoen-tropie de Shannon qui prend en compte les espegraveces nonobserveacutees

bull Celle de Grassberger72 qui prend en compte la non-lineacuteariteacute de lrsquoestimateur

Le domaine de validiteacute des deux corrections est diffeacuterentQuand 119902 est petit les espegraveces rares non observeacutees ont unegrande importance alors que 119902119867 est presque lineacuteaire la cor-rection de Grassberger disparaicirct quand 119902 = 0 Quand 119902 estgrand (au-delagrave de 2) lrsquoinfluence des espegraveces rares est faiblela correction de Chao et Shen devient neacutegligeable alors que lanon-lineacuteariteacute augmente Un compromis raisonnable consiste agraveutiliser le plus grand des deux estimateurs

Lrsquoestimateur de Chao et Shen est

119902 = minus119904119899

sum119904=1

119862 119901119904 ln119902 ( 119862 119901119904)1 minus (1 minus 119862 119901119904)

119899 (431)

Celui de Grassberger est

119902 = 1 minus sum119904119899ne0

119904=1 119901119902119904

119902 minus 1 (432)

ougrave

119901119902119904 = 119899119904

minus119902 ( (119899119904 + 1) (119899119904 minus 119902 + 1) + (minus1)119899 (1 + 119902) sin 120587119902

120587 (119899 + 1) ) (433)

(sdot) est la fonction gamma Lrsquoestimateur est lineacuteaire parrapport agrave 119901119902

119904 le problegraveme original est donc reacutesolu par laconstruction de lrsquoestimateur de 119901119902

119904 mais celui-ci est biaiseacute eacutega-lement

Lrsquoestimateur de Chao et Shen peut ecirctre ameacutelioreacute73 en es-timant mieux les probabiliteacutes Chao et al74 ont deacuteveloppeacute unestimateur de la distribution des probabiliteacutes agrave partir de lrsquoes-timation du taux de couverture geacuteneacuteraliseacute 119862 119901119904 peut ecirctre rem-placeacute par cet estimateur pour reacuteduire le biais de lrsquoestimateurde Chao et Shen

75Ibid

76Burnham et Overton laquo RobustEstimation of Population Size WhenCapture Probabilities Vary amongAnimals raquo cf note 9 p 26

79voir par exemple Chao et allaquo Entropy and the Species Accumu-lation Curve A Novel Entropy Es-timator via Discovery Rates of NewSpecies raquo cf note 94 p 53 figure 1

80Haegeman et al laquo Robust Es-timation of Microbial Diversity inTheory and in Practice raquo cf note 39p 18

Enfin la distribution des espegraveces non eacutechantillonneacutees peutecirctre ajouteacutee en estimant leur nombre et en choisissant une loiChao et al75 ont utiliseacute lrsquoestimateur Chao1 et une distributiongeacuteomeacutetrique Lrsquoestimateur jackknife76 est plus versatile parceque son ordre peut ecirctre adapteacute aux donneacutees quand lrsquoeffortdrsquoeacutechantillonnage est trop faible pour que lrsquoestimateur Chao1soit performant77 Un simple estimateur plug-in appeleacute laquo esti-mateur reacuteveacuteleacute raquo peut ensuite ecirctre appliqueacute agrave cette distributionreacuteveacuteleacutee78

Lrsquoestimateur du taux de couverture geacuteneacuteraliseacute ne fait au-cune hypothegravese sur les espegraveces non observeacutees et nrsquoutilise que letaux de couverture et la technique de Horvitz-Thompson pourestimer leur contribution Lrsquoestimateur reacuteveacuteleacute ne tente aucunecorrection mais utilise lrsquoestimation la meilleure possible pourla distribution des probabiliteacutes

Biais des estimateurs

Eacutetant donneacute la distribution des probabiliteacutes des espegravecesdans la communauteacute lrsquoeacutechantillon inventorieacute peut ecirctre consi-deacutereacute comme un tirage dans une loi multinomiale qui contientpas toutes les espegraveces Par simulation agrave partir drsquoune distribu-tion connue il est possible de tirer un grand nombre drsquoeacutechan-tillons et de reacutepeacuteter lrsquoestimation de la diversiteacute sur chacundrsquoeux La distribution de la valeur de lrsquoeacutechantillon permet dejuger ses performances son biais moyen (mesureacute par rap-port agrave la valeur de reacutefeacuterence calculeacutee agrave partir des probabiliteacuteschoisies) et sa variabiliteacute (eacutevalueacutee par sa variance empiriquesur les simulations) Un estimateur performant doit ecirctre peubiaiseacute mais aussi peu variable Lrsquoerreur quadratique moyennesomme du carreacute du biais et de la variance ou sa racine car-reacutee dont la dimension est celle des donneacutees (root mean squareerror RMSE) est un bon critegravere de test79

Haegeman et al80 proposent deux estimateurs de la diver-siteacute 119902119863 agrave partir des courbes de rareacutefaction et drsquoextrapolationdu nombre drsquoespegraveces Les deux estimateurs bornent la vraievaleur de 119902119863 (leur variabiliteacute nrsquoest pas prise en compte maiselle est neacutegligeable dans le cadre utiliseacute) Lrsquoestimateur minimalest tregraves proche de celui de Chao et Jost agrave la diffeacuterence que lestermes estimant le biais reacutesiduel sont eacutevalueacutes par une approxi-mation numeacuterique Lrsquoestimateur maximal suppose que tous lesindividus non eacutechantillonneacutes appartiennent agrave une espegravece nou-velle ce qui est effectivement le pire cas possible Les deuxestimateurs sont appliqueacutes agrave la diversiteacute de communauteacutes mi-crobiennes (jusqursquoagrave un million drsquoespegraveces distribueacutees selon uneloi geacuteomeacutetrique) et tregraves sous-eacutechantillonneacutees (un individu sur1010 dans le pire des cas)

Les reacutesultats preacutesentent de tregraves grands intervalles drsquoestima-

78 Entropie

82Marcon et al laquo The Decompo-sition of Shannonrsquos Entropy and aConfidence Interval for Beta Diversi-ty raquo cf note 11 p 64 Marcon et allaquo Generalization of the Partitioningof Shannon Diversity raquo cf note 37p 69

83Chao et Jost laquo Estimating Di-versity and Entropy Profiles via Dis-covery Rates of New Species raquo cfnote 63 p 74

tion (de plusieurs ordres de grandeur) entre la borne infeacuterieureet la borne supeacuterieure ce qui montre que la meacutethode est inuti-lisable pour 119902 lt 1 approximativement Lrsquoestimateur minimalqui correspond agrave lrsquoeacutetat de lrsquoart sous-estime seacutevegraverement la di-versiteacute quand lrsquoeacutechantillonnage est faible Lrsquoestimateur maxi-mal est excessivement conservateur (il est conccedilu pour bornerlrsquoestimation dans la pire hypothegravese)

Aux ordres de diversiteacute supeacuterieurs les estimateursconvergent mecircme avec de petits eacutechantillons mecircme ensupposant que la richesse de la communauteacute est la plusgrande possible lrsquoestimation de la diversiteacute est preacutecise degraves119902 = 1

Dans des conditions moins difficiles correspondant agrave descommunauteacutes moins riches (typiquement des forecircts tropicales)lrsquoestimation est preacutecise degraves 119902 = 0 581 Ces reacutesultats sont deacuteve-loppeacutes plus loin

Intervalle de confiance des estimateurs

Agrave partir de donneacutees drsquoinventaire lrsquoestimation du biais estimpossible (sinon le biais serait simplement ajouteacute agrave lrsquoestima-teur pour le rendre sans biais) La variabiliteacute de lrsquoestimateurpeut ecirctre eacutevalueacutee en geacuteneacuterant des communauteacutes par boots-trap et en estimant leur diversiteacute comme dans la meacutethode preacute-ceacutedente Les communauteacutes peuvent ecirctre simuleacutees par tiragedans une loi multinomiale respectant les probabiliteacutes obser-veacutees82 Lrsquoinconveacutenient est que les espegraveces dont les probabiliteacutessont petites ne sont pas tireacutees ce qui entraicircne un nouveaubiais drsquoestimation Lrsquoestimateur le corrige en partie le biaisdrsquoestimation ducirc au non eacutechantillonnage des espegraveces rares de lacommunauteacute (corrigeacute par lrsquoestimateur appliqueacute aux donneacuteesreacuteelles) nrsquoest pas accessible Il est donc neacutecessaire de recen-trer les valeurs obtenues par simulation autour de la valeurobtenue sur les donneacutees

Chao et Jost83 proposent une meacutethode plus eacutelaboreacutee quiconsiste agrave reconstituer la distribution des probabiliteacutes de lacommunauteacute reacuteelle le mieux possible avant drsquoen tirer les eacutechan-tillons simuleacutes Lrsquoestimateur naiumlf de la probabiliteacute drsquoune espegraveceobserveacutee 119904 est 119901119904 = 119899119904119899 119901119904 est sans biais mais comme on nedispose que drsquoune reacutealisation de la loi il est preacutefeacuterable de cher-cher un estimateur sans biais conditionnellement aux espegravecesobserveacutees Il est obtenu par Chao et al84 agrave partir de lrsquoespeacute-rance conditionnelle de 119873119904119899

120124 (119873119904119899 |119899119904 gt 0) = 119901119904

1 minus (1 minus 119901119904)119899 (434)

Lrsquoestimateur de 119901119904 obtenu est

85Chao et al laquo Unveiling theSpecies-Rank Abundance Distribu-tion by Generalizing Good-TuringSample Coverage Theory raquo cfnote 74 p 76

119901119904 = 119899119904119899 [1 minus (1 minus 119899119904

119899 )119899] (435)

ougrave

= 1 minus 119862sum119904119899

ne0119904=1

119899119904119899 (1 minus 119899119904

119899 )119899 (436)

120582 est un paramegravetre drsquoun modegravele permettant drsquoestimer lesvaleurs de 119901119894 agrave partir de leur espeacuterance conditionnelle et desdonneacutees Le modegravele complet est preacutesenteacute par Chao et al85

Les probabiliteacutes des espegraveces non observeacutees sont consideacute-reacutees comme eacutegales par souci de simplification et parce qursquoellesinfluencent peu la variance des estimateurs Leur somme esteacutegale au deacuteficit de couverture et leur nombre estimeacute parChao1

Lrsquointervalle de confiance de lrsquoestimateur obtenu par cettetechnique agrave partir des donneacutees permet de connaicirctre sa variabi-liteacute mais pas son biais Il nrsquoest absolument pas garanti (et peuprobable si lrsquoeacutechantillonnage est faible et 119902 petit) que la vraievaleur de la diversiteacute se trouve dans lrsquointervalle de confiance

Pratique de lrsquoestimation

La conversion de lrsquoestimateur de lrsquoentropie en estimateurde la diversiteacute pose un nouveau problegraveme puisque 119902119863 nrsquoestpas une transformation lineacuteaire de 119902119867 Ce dernier biais peutecirctre neacutegligeacute86 parce que 119902119867 lrsquoentropie est la valeur moyennede lrsquoinformation de nombreuses espegraveces indeacutependantes et fluc-tue donc peu agrave cause de lrsquoeacutechantillonnage contrairement auxestimateurs des probabiliteacutes

Des simulations meneacutees sur des distributions log-normaleou geacuteomeacutetrique de richesse diverses avec des efforts drsquoeacutechan-tillonnage varieacutes permettent de tester les estimateurs dans descas theacuteoriques reacutealistes87 Un reacutesultat repreacutesentatif est donneacuteici

La figure 47 compare les reacutesultats des deux meilleurs es-timateurs agrave la vraie valeur de la diversiteacute drsquoune communau-teacute de 300 espegraveces dont la distribution log-normale (avec uneacutecart-type dont le logarithme vaut 2) mime une forecirct tropi-cale similaire agrave Barro-Colorado Lrsquoeffort drsquoinventaire simuleacuteest de 500 ou 5000 individus (de lrsquoordre drsquoun ou dix hectarespour les arbres de diamegravetre supeacuterieur ou eacutegal agrave 10 cm) Lrsquoes-timation ne pose pas de problegraveme avec 5000 individus bienque Chao-Wang-Jost sous-estime un peu le nombre drsquoespegravecesLrsquoestimateur reacuteveacuteleacute est centreacute sur la vraie valeur mais avecune plus grande variabiliteacute

80 Entropie

Fig 47 Estimation de ladiversiteacute drsquoune communauteacute

log-normale de 300 espegraveces Uninventaire de 500 (en bas) ou 5000(en haut) individus est reacutepeacuteteacute 1000

fois et la diversiteacute estimeacutee agravechaque fois par lrsquoestimateur deChao-Wang-Jost (agrave gauche) ou

lrsquoestimateur reacuteveacuteleacute (agrave droite) Lacourbe noire en gras repreacutesente lavraie diversiteacute de la communauteacuteLa courbe maigre est la moyennede lrsquoestimation lrsquoenveloppe grise

limiteacutee par les pointilleacutes rougescontient 95 des valeurs simuleacuteesA 5000 individus estimateur de

Chao-Wang-Jost B 5000individus estimateur reacuteveacuteleacute C

500 individus estimateur deChao-Wang-Jost D 500

individus estimateur reacuteveacuteleacute

00 01 02 03 04 05 06

Diversity

00 01 02 03 04 05 06

Diversity

00 01 02 03 04 05 06

Diversity

00 01 02 03 04 05 06

Diversity

En limitant lrsquoeacutechantillonnage agrave 500 individus lrsquoestimateurde Chao-Wang-Jost sous-estime le nombre drsquoespegraveces de moitieacuteLrsquoestimateur reacuteveacuteleacute sous-estime beaucoup moins la diversiteacutedrsquoordre faible mais son intervalle de confiance est tregraves large

Degraves 119902 = 0 5 lrsquoestimation est tregraves preacutecise dans tous les casmecircme en reacuteduisant lrsquoeacutechantillonnage agrave 200 individus ou pourdes communauteacutes dont la queue de distribution est beaucoupplus longue (reacutesultats non preacutesenteacutes ici)

Les conclusions de ce travail drsquoeacutevaluation tiennent en deuxpoints Dans des conditions reacutealistes drsquoinventaire drsquoarbres enforecirct tropicale les estimateurs de diversiteacute les plus perfor-mants sont celui de Chao Wang et Jost et lrsquoestimateur reacuteveacuteleacuteLe premier a une variance plus faible pour les valeurs de 119902proches de 0 mais est limiteacute par son estimation du nombredrsquoespegraveces par lrsquoestimateur Chao1 Le second est preacutefeacuterablequand le nombre drsquoespegraveces estimeacute par lrsquoestimateur jackknifedrsquoordre optimal est clairement supeacuterieur (crsquoest-agrave-dire en pra-tique quand lrsquoordre du jacknife optimal est supeacuterieur agrave 1)Son biais est alors bien infeacuterieur au prix drsquoune variance plusgrande

Dans tous les cas lrsquoestimation de la diversiteacute aux ordresinfeacuterieurs agrave 05 est impreacutecise sauf agrave disposer drsquoinventairesde taille consideacuterable (de lrsquoordre de la dizaine drsquohectares aumoins)

Les fonctions Tsallis et Diversityde entropart acceptentcomme argument un vecteur drsquoabondances (et non de proba-biliteacutes) et proposent par deacutefaut la correction de Chao et Jost

Tsallis(colSums(BCI) q = 1)

UnveilJ 4276075

47 Autres approches 81

88J Zhang et al laquo Partitioning of and Diversity Using HierarchicalBayesian Modeling of Species Distri-bution and Abundance raquo In Envi-ronmental and Ecological Statistics214 (2014) p 611-625 doi 101007s10651-013-0271-2

89K M Broms et al laquo Accountingfor Imperfect Detection in Hill Num-bers for Biodiversity Studies raquo In Methods in Ecology and Evolution61 (2014) p 99-108 doi 1011112041-210X12296

90K J Iknayan et al laquo DetectingDiversity Emerging Methods to Es-timate Species Diversity raquo In Trendsin Ecology amp Evolution 292 (2014)p 97-106 doi 101016jtree201310012

91Chao et al laquo Rarefaction andExtrapolation with Hill Numbers AFramework for Sampling and Estima-tion in Species Diversity Studies raquo cfnote 106 p 58

92N J Gotelli et R K Col-well laquo Quantifying Biodiversity Pro-cedures and Pitfalls in the Measu-rement and Comparison of SpeciesRichness raquo In Ecology Letters 44(2001) p 379-391 doi 101046j1461-0248200100230x

93T C Hsieh et al laquo iNEXT An R Package for Interpolation andExtrapolation in Measuring SpeciesDiversity raquo In Methods in Ecologyand Evolution 7 (2016) p 1451-1456doi 1011112041-210X12613

94Reacutenyi laquo On Measures of Entro-py and Information raquo cf note 14p 65

Diversity(colSums(BCI) q = 1)

UnveilJ 7195748

MSOM et MSAM

Lrsquoutilisation de modegraveles hieacuterarchiques bayesiens fondeacutessur des modegraveles drsquooccupation multispeacutecifiques (MSOM) oudes modegraveles drsquoabondance multispeacutecifiques (MSAM) progressedans la litteacuterature reacutecente Ils neacutecessitent de choisir une loide probabiliteacute drsquoobservation des espegraveces compatible avec uneacutechantillonnage non exhaustif par exemple une loi ZIP (zero-inflated Poisson)88 dans laquelle lrsquoespeacuterance de la preacutesencede chaque espegravece peut ecirctre modeacuteliseacutee agrave son tour comme laconseacutequence de variables environnementales Une approchealternative consiste agrave modeacuteliser la probabiliteacute drsquoobservationcomme la combinaison drsquoune probabiliteacute de preacutesence et drsquouneprobabiliteacute de deacutetection89 Ces meacutethodes ont lrsquoavantage defournir une distribution de probabiliteacute des paramegravetres desmodegraveles et donc de la diversiteacute qui est calculeacutee comme unequantiteacute deacuteriveacutee Leur faiblesse est qursquoils deacutependent de la loichoisie Une revue complegravete est fournie par Iknayan et al90

Rareacutefaction et extrapolation

Chao et al91 eacutetendent lrsquoapproche de Gotelli et Colwell92

aux nombres de Hill et fournissent les meacutethodes neacutecessairesau calcul de courbes de rareacutefaction et drsquoextrapolation de lrsquoes-timateur de 119902119863 en fonction de la taille de lrsquoeacutechantillon ou dutaux de couverture

Les courbes de rareacutefaction sont obtenues agrave partir delrsquoeacutechantillon disponible en simulant la diminution de sa tailleLes courbes drsquoextrapolation simulent lrsquoaugmentation de lataille de lrsquoeacutechantillon Elles sont en reacutealiteacute calculeacutees parrareacutefaction drsquoun eacutechantillon hypotheacutetique de taille infinie unestimateur de 119902119863 corrigeacute du biais drsquoestimation est neacutecessaireLrsquoarticle se limite aux valeurs de 119902 eacutegales agrave 0 1 ou 2 ounon entiegraveres mais supeacuterieures agrave 2 Le package iNEXT93

impleacutemente ces calculs dans R comme le package entropartqui ameacuteliore lrsquoestimation des ordres non entiers de diversiteacute

47 Autres approches

Lrsquoentropie de Reacutenyi

Lrsquoentropie drsquoordre 119902 de Reacutenyi94 est

82 Entropie

96C Beck laquo Generalised Informa-tion and Entropy Measures in Phy-sics raquo In Contemporary Physics504 (2009) p 495-510 doi 10108000107510902823517

97F Cowell laquo Measurement of In-equality raquo In Handbook of IncomeDistribution Sous la dir drsquoA B At-kison et F Bourguignon T 1 6North Holland 2000 p 87-166 doi 101016S0014-2921(81)80003-7

98M Bruumllhart et R Traeger laquo AnAccount of Geographic ConcentrationPatterns in Europe raquo In RegionalScience and Urban Economics 356(2005) p 597-624 doi 101016jregsciurbeco200409002

99Maasoumi laquo A Compendium toInformation Theory in Economics andEconometrics raquo cf note 5 p 61

100N Cressie et T R C Readlaquo Multinomial Goodness-of-FitTests raquo In Journal of the RoyalStatistical Society Series B (Sta-tistical Methodology) 463 (1984)p 440-464 JSTOR 2345686

101Kullback et Leibler laquo On Infor-mation and Sufficiency raquo cf note 8p 63

102K Pearson laquo On the Crite-rion That a given System of De-viations from the Probable in theCase of a Correlated System of Va-riables Is Such That It Can Be Rea-sonably Supposed to Have Arisenfrom Random Sampling raquo In Phi-losophical Magazine Series 5 50302(1900) p 157-175 doi 10 1080 14786440009463897

103A C Studeny et allaquo Goodness-of-Fit Measures ofEvenness A New Tool for ExploringChanges in Community Structure raquoIn Ecosphere 22 (2011) art15doi 101890ES10-000741

119902119877 = 11 minus 119902 ln sum119878

119902=1 119901119902119904 (437)

Crsquoest le logarithme naturel des nombres de Hill95 qui onteacuteteacute deacutefinis agrave partir drsquoelle Lrsquoentropie de Reacutenyi a connu un suc-cegraves important en tant que seule mesure drsquoentropie geacuteneacuteraliseacuteejusqursquoagrave la diffusion de lrsquoentropie HCDT Son deacutefaut est qursquoellenrsquoest pas forceacutement concave96 ce qui empecircche sa deacutecomposi-tion (voir chapitre 12)

Lrsquoentropie geacuteneacuteraliseacutee des mesures drsquoineacutegaliteacute

Lrsquoentropie geacuteneacuteraliseacutee des eacuteconomistes drsquoordre 119902 est deacutefi-nie comme

119867119902 = 1119902 (119902 minus 1) [ 1

119878119878

sum119904=1

(119899119904119899119904)

119902minus 1] (438)

Crsquoest en reacutealiteacute une entropie relative qui mesure lrsquoeacutecartentre la distribution observeacutee 119899119904 et sa valeur moyenne Elletend vers lrsquoentropie de Theil quand 119902 rarr 1 et la moyenne desln(119899119904

119899119904) quand 119902 rarr 0 Elle a eacuteteacute conccedilue pour mesurer les ineacutegali-

teacutes97 puis utiliseacutee par exemple pour mesurer la concentrationspatiale98

Maasoumi99 explicite cet usage et pour comparer la distri-bution de probabiliteacute observeacutee 119902119904 agrave une distribution atten-due 119901119904 plutocirct qursquoagrave la distribution uniforme dont toutes lesvaleurs seraient 1

119878 En posant 119903 = 119902 minus 1 en transformant lesabondances 119899119904 en probabiliteacutes 119902119904 et en choisissant 119901119904arbitrairement on obtient

119867119903 (q p) = 1119903 (119903 + 1) [

119878sum119904=1

119902119904(119902119904119901119904

)119903

minus 1] (439)

N Cressie et Read100 ont deacutefini une mesure geacuteneacuteraliseacutee dequaliteacute drsquoajustement (Goodness of Fit) de la distribution 119902119904agrave celle de 119901119904 Elle est identique agrave lrsquoentropie geacuteneacuteraliseacutee (agrave uncoefficient 2 pregraves) bien que deacuteveloppeacutee indeacutependamment pourdrsquoautres motivations La statistique de Cressie et Read drsquoordre1 est la divergence de Kullback et Leibler101 celle drsquoordre 2 le1205942 de Pearson102

Studeny et al103 deacutefinissent une mesure drsquoeacutequitabiliteacutecomme la divergence entre la distribution observeacutee 119901119904 etla distribution uniforme ce qui les ramegravene agrave lrsquoentropie deCowell

105Z Zhang et Zhou laquo Re-Parameterization of MultinomialDistributions and Diversity Indices raquocf note 60 p 73

106Z Zhang et Grabchak laquo Entro-pic Representation and Estimation ofDiversity Indices raquo cf note 59 p 73

108M Grabchak et al laquo The Gene-ralized Simpsonrsquos Entropy Is a Mea-sure of Biodiversity raquo In Plos One123 (2017) e0173305 doi 101371journalpone0173305

119868119903 = 1119903 (119903 + 1) [

119878sum119904=1

119901119904 ( 1199011199041119878 )

119903minus 1] (440)

Cette mesure inclut agrave la fois lrsquoeacutequitabiliteacute et la richesse dela distribution Il srsquoagit donc drsquoune mesure de diversiteacute qui estagrave une normalisation pregraves lrsquoeacutecart entre la valeur de lrsquoentropieHCDT drsquoordre 119902 = 119903+1 et sa valeur maximale Elle geacuteneacuteralisedonc lrsquoindice de Theil 104

119868119903 = 11199021198781minus119902 (ln119902 119878 minus119902119867) (441)

Lrsquoentropie de Simpson geacuteneacuteraliseacuteeLrsquoentropie de Simpson geacuteneacuteraliseacutee a eacuteteacute introduite dans

une classe drsquoindices plus geacuteneacuterale (340) par Z Zhang etZhou105 et eacutetudieacutee en deacutetail par Z Zhang et Grabchak106

Lrsquoentropie drsquoordre 119903 gt 0 est

120577119903 =119878

sum119904=1

119901119904(1 minus 119901119904)119903 (442)

Elle se reacuteduit agrave lrsquoentropie de Simpson pour 119903 = 1La fonction drsquoinformation de lrsquoentropie de Simpson geacuteneacute-

raliseacutee 119868(119901) = (1 minus 119901)119903 repreacutesente la probabiliteacute de nrsquoobserveraucun individu de lrsquoespegravece de probabiliteacute 119901 dans un eacutechan-tillon de taille 119903 crsquoest une mesure intuitive de la rareteacute Chaoet al107 ont interpreacuteteacute 120577119903 comme la probabiliteacute qursquoun individueacutechantillonneacute au rang 119903 + 1 appartienne agrave une espegravece nouvelledans une SAC (119903 + 1)120577119903 est aussi lrsquoespeacuterance du nombre desingletons dans un eacutechantillon de taille (119903 + 1)

Lrsquointeacuterecirct majeur de cette entropie est qursquoelle dispose drsquounestimateur non biaiseacute pour toutes les valeurs de 119903 strictementinfeacuterieures agrave la taille de lrsquoeacutechantillon Crsquoest une mesure dediversiteacute valide pour les ordres 119903 strictement infeacuterieurs aunombre drsquoespegraveces108 Au-delagrave elle ne respecte plus lrsquoaxiomedrsquoeacutequitabiliteacute sa valeur maximale nrsquoest pas obtenue quandles espegraveces sont eacutequiprobables

Son nombre effectif drsquoespegraveces est

119903119863120577 = 11 minus 120577

1119903119903

Lrsquoexistence drsquoun estimateur sans biais et drsquoun intervalle deconfiance calculable analytiquement permet de comparer desprofils de diversiteacute de faccedilon robuste quand lrsquoeacutechantillonnageest limiteacute et la richesse eacuteleveacutee

La figure 48a montre les profils de diversiteacute (en nombreeffectifs drsquoespegraveces) des deux parcelles 6 et 18 de Paracou

84 Entropie

1 ha inventorieacute respectivement 681 et 483 arbres pour unerichesse estimeacutee agrave 254 et 309 espegraveces par les estimateurs ja-ckknife drsquoordres 2 et 3

NsP6 lt- asAbdVector(Paracou618MC$Nsi[ 1])(S6 lt- Richness(NsP6 Correction = Jackknife))

Jackknife 2 254

Jackknife 3 309

S lt- min(S6 S18)

En comparaison la figure 48b montre les profils de diver-siteacute HCDT des mecircmes parcelles Ils se chevauchent pour lespetits ordres de diversiteacute ce qui ne permet pas de conclure

Fig 48 Comparaison des profilsde diversiteacute des parcelles 6 et 18

de Paracou avec leur intervalle deconfiance agrave 95 La parcelle 18 est

traceacutee en rouge lignes continueset la 6 en vert lignes pointilleacutees

(a) Diversiteacute geacuteneacuteraliseacutee deSimpson (nombres effectif

drsquoespegraveces) les profils sontdistincts ce qui permet de

conclure que la parcelle 6 est plusdiverse que la parcelle 18 (b)

Diversiteacute HCDT les profils sechevauchent jusqursquoagrave 119902 asymp 0 7

0 50 100 150 200 250Ordre de diversiteacute

teacute d

eacuteneacuter

eacutee

00 05 10 15 20Ordre de diversiteacute

La diversiteacute est donc estimeacutee jusqursquoagrave lrsquoordre 253Code R pour reacutealiser la figure 48

Profil P6library(EntropyEstimation)zeta6 lt- CommunityProfile(GenSimpson NsP6 1(S - 1))sigma6 lt- sapply(1(S - 1) function(r) GenSimpsd(NsP6 r))ic6 lt- qnorm(1 - 0052) sigma6sqrt(sum(NsP6))zeta6$low lt- zeta6$y - ic6zeta6$high lt- zeta6$y + ic6 Profil P18zeta18 lt- CommunityProfile(GenSimpson NsP18 1(S - 1))sigma18 lt- sapply(1(S - 1) function(r) GenSimpsd(NsP18 r))ic18 lt- qnorm(1 - 0052) sigma18sqrt(sum(NsP18))zeta18$low lt- zeta18$y - ic18zeta18$high lt- zeta18$y + ic18 Transformation en diversiteacutezeta6D lt- zeta6zeta6D$y lt- 1(1 - (zeta6$y)^(1zeta6$x))zeta6D$low lt- 1(1 - (zeta6$low)^(1zeta6$x))zeta6D$high lt- 1(1 - (zeta6$high)^(1zeta6$x))

zeta18D lt- zeta18zeta18D$y lt- 1(1 - (zeta18$y)^(1zeta18$x))zeta18D$low lt- 1(1 - (zeta18$low)^(1zeta18$x))zeta18D$high lt- 1(1 - (zeta18$high)^(1zeta18$x)) Figuregga lt- ggplot() +

geom_ribbon(aes(x ymin = low ymax = high)asdataframelist(zeta18D) alpha = 03) +

geom_line(aes(x y) asdataframelist(zeta18D) col = red) +geom_ribbon(aes(x ymin = low ymax = high)

asdataframelist(zeta6D) alpha = 03) +geom_line(aes(x y) asdataframelist(zeta6D) col = darkgreen) +labs(x = Ordre de diversiteacute

y = Diversiteacute de Simpson geacuteneacuteraliseacutee) +labs(tag = a)

Calcul des profils HCDTD6 lt- CommunityProfile(Diversity NsP6 NumberOfSimulations = 10qseq=qseq Correction = UnveilJ)D18 lt- CommunityProfile(Diversity NsP18 NumberOfSimulations = 10qseq=qseq Correction = UnveilJ) Figureggb lt- ggplot(dataframe(x = D6$x D6$y D18$y)) +

geom_ribbon(aes(x ymin = low ymax = high) asdataframelist(D6)alpha = 03) +

geom_line(aes(x D6y) col = darkgreen lty = 2) +geom_ribbon(aes(x ymin = low ymax = high) asdataframelist(D18)

alpha = 03) +geom_line(aes(x D18y) col = red) +labs(x = Ordre de diversiteacute y = Nombre de Hill) +labs(tag = b)

gridarrange(gga ggb ncol = 2)

La distribution statistique de la diffeacuterence drsquoentropie estconnue et peut donc ecirctre traceacutee (figure 49) Son intervallede confiance ne contient jamais la valeur 0 ce qui permet deconclure que la parcelle 18 est plus diverse

eacuteren

Fig 49 Diffeacuterence entre lesentropies de Simpson geacuteneacuteraliseacuteesdes parcelles 18 et 6 de Paracouavec son intervalle de confiance agrave95 La ligne horizontalerepreacutesente lrsquohypothegravese nulledrsquoeacutegaliteacute entre les entropies quipeut ecirctre rejeteacutee

Code R pour reacutealiser la figure Calcul de P18-P6 avec IC

Difference lt- list(x = zeta18$x y = zeta18$y-zeta6$y)class(Difference) lt- class(zeta18)icDifference lt- qnorm(1-0052)sqrt(sigma6^2sum(NsP6)

+ sigma18^2sum(NsP18))Difference$low lt- Difference$y - icDifferenceDifference$high lt- Difference$y + icDifference

86 Entropie

110R Rajaram et B Castellanilaquo An Entropy Based Measure forComparing Distributions of Com-plexity raquo In Physica A Statisti-cal Mechanics and its Applications453 (2016) p 35-43 doi 101016jphysa201602007

111B Castellani et R Rajaramlaquo Past the Power Law Complex Sys-tems and the Limiting Law of Restric-ted Diversity raquo In Complexity 21S2(nov 2016) p 99-112 doi 101002cplx21786

Plotautoplot(Difference xlab = Ordre de diversiteacute

ylab = Diffeacuterence dentropie) +geom_hline(yintercept = 0 col = blue lty = 2)

La prise en compte des espegraveces rares est limiteacutee par lavaleur maximale de lrsquoordre 119903 (limiteacute agrave 119878 minus 1) Les espegravecesplus rares ne peuvent pas ecirctre prises en compte le profil dediversiteacute srsquoarrecircte lagrave Le nombre effectif drsquoespegraveces maximumcorrespond au nombre de Hill drsquoordre 05 environ Les espegravecesplus rares sont prises en compte dans la partie du profil dediversiteacute HCDT drsquoordre infeacuterieur agrave 05 mais son incertitudeest grande et son biais tregraves important quand lrsquoeacutechantillonnageest aussi reacuteduit109

Lrsquoentropie de Simpson geacuteneacuteraliseacutee est donc lrsquooutil le plusapproprieacute pour comparer des profils de diversiteacute de commu-nauteacutes riches et sous-eacutechantillonneacutees

Lrsquoentropie par cas

Rajaram et Castellani110 deacutecomposent la diversiteacute de Shan-non en produit des contributions de chaque cateacutegorie et pro-posent une mesure cumulative de la diversiteacute drsquoune commu-nauteacute prenant en compte une partie des espegraveces classeacutees selonun critegravere pertinent deacutecrivant leur complexiteacute par exemplela diversiteacute des mammifegraveres classeacutes par taille croissante ou laposition dans lrsquoeacutevolution

La fraction de la communauteacute dont le cumul des probabi-liteacutes eacutegale 119888 est prise en compte La diversiteacute cumuleacutee est

Dc = prod119888

119901minus119901119904119904 (444)

La mesure normaliseacutee est appeleacutee case-based entropy enanglais et vaut

Cc = 1001198631198881119863 (445)

Dc = 1119863 quand toute la communauteacute est prise en compte(119888 = 1) Les auteurs srsquointeacuteressent principalement agrave la courbede 119862119888 en fonction de 119888 pour montrer111 que la contribution agrave ladiversiteacute totale des 40 des composants les moints complexesde systegravemes tregraves divers (laquo des galaxies au gegravenes raquo) atteint tou-jours au moins 60 ce reacutesultat eacutetant interpreacuteteacute comme uneloi universelle de limitation de la complexiteacute

Cette mesure peut ecirctre eacutetendue agrave lrsquoentropie HCDT sansdifficulteacute

qCc = (sum119888

119901119902119904)

11minus119902

La meacutethode peut ecirctre appliqueacutee pour eacutevaluer la contribu-tion de nrsquoimporte quel partie de la communauteacute agrave la diversiteacutetotale Il ne srsquoagit pas drsquoune deacutecomposition de la diversiteacute ausens classique du terme qui consiste agrave partitionner la diversi-teacute totale en diversiteacute intra et inter-groupes mais plutocirct drsquounefaccedilon de prendre en compte les caracteacuteristiques des espegravecesdans une approche non-neutre

1M Lloyd et R J Ghelardi laquo ATable for Calculating the rsquoequitabili-tyrsquo Component of Species Diversity raquoIn Journal of Animal Ecology 332(1964) p 217-225 doi 10 2307 2628 JSTOR 2628

2Jost laquo The Relation betweenEvenness and Diversity raquo cf note 7p 5

3H Tuomisto laquo An UpdatedConsumerrsquos Guide to Evenness andRelated Indices raquo In Oikos 1218(2012) p 1203-1218 doi 101111j1600-0706201119897x

4Dalton laquo The Measurement ofthe Inequality of Incomes raquo cfnote 16 p 65

5B Smith et J B Wilson laquo AConsumerrsquos Guide to Evenness In-dices raquo In Oikos 761 (1996) p 70-82 doi 1023073545749 JSTOR 3545749

6F Gosselin laquo Lorenz PartialOrder The Best Known Logical Fra-mework to Define Evenness Indices raquoIn Community Ecology 22 (2001)p 197-207 doi 101556ComEc2200127

7M O Lorenz laquo Methods ofMeasuring the Concentration ofWealth raquo In Quarterly Publicationsof the American Statistical Asso-ciation 9 (1905) p 209-219 doi 10108015225437190510503443

8figure 51 Tuomisto cf note 3

Chapitre 5

Eacutequitabiliteacute

Lrsquoeacutequitabiliteacute mesure lrsquoeacutecart entre la distribution observeacutee et une distri-bution uniformeLrsquoindice de Pielou est la mesure drsquoeacutequitabiliteacute la plus connue Il a eacuteteacutegeacuteneacuteraliseacute pour permettre de pondeacuterer plus ou moins les espegraveces raresde la mecircme faccedilon que lrsquoentropie HCDT

Lrsquoessentiel

La reacutegulariteacute drsquoune distribution est une notion intuitive-ment assez simple la faiblesse de lrsquoeacutecart entre la distribu-tion reacuteelle et une distribution parfaitement reacuteguliegravere1 veacuterifiant119901119904 = 1119878 Des difficulteacutes apparaissent quand il srsquoagit de com-parer lrsquoeacutequitabiliteacute de communauteacutes de richesses diffeacuterentesLrsquoapproche axiomatique est preacutesenteacutee puis les diffeacuterents in-dices de la litteacuterature et enfin la geacuteneacuteralisation de lrsquoindice dePielou en coheacuterence avec lrsquoentropie HCDT

51 Approche axiomatiqueUne approche axiomatique a eacuteteacute deacuteveloppeacutee par la litteacutera-

ture revue par Jost2 ou Tuomisto3 Les proprieacuteteacutes fondamen-tales sont les critegraveres de Dalton 4

bull Lrsquoeacutequitabiliteacute augmente quand un individu est transfeacutereacutedrsquoune espegravece freacutequente agrave une espegravece rare

bull Lrsquoeacutequitabiliteacute diminue quand une espegravece rare est ajou-teacutee

bull Invariance drsquoeacutechelle lrsquoeacutequitabiliteacute ne deacutepend que desfreacutequences pas des abondances absolues

Un critegravere suppleacutementaire eacutetabli par B Smith et J BWilson5 compleacuteteacute par Gosselin6 est la compatibiliteacute avec lacourbe de Lorenz7 construite en classant les espegraveces de lamoins freacutequente agrave la plus freacutequente et en traccedilant le cumuldes freacutequences en fonction du rang 8 une communauteacute parfai-

90 Eacutequitabiliteacute

Fig 51 Tuomisto2012

Their four essential requirements have a long history (Dalton 1920) and can be rephrased as follows

1) Evenness should be replication invariant it should not change when a dataset is replicated such that each of its species gives rise to n new species of the same absolute abundance as the original one

2) Evenness should decrease when abundance is transferred from a less abundant species to a more abundant one

3) Evenness should decrease when an exceedingly rare speshycies is added

4) Evenness should be scale invariant such that it depends on the proportional rather than absolute abundances of species

After describing the essential requirements and desirable features of evenness Smith and Wilson (1996) proceeded to evaluate how well fourteen evenness indices performed against these criteria They found that five of the indices (Evar 0 EQ E primeand ElD in their notation) fulfilled all essential requirements but none had all the desirable features

Another popular approach is to use compatibility with the Lorenz partial order as the main criterion for choosing among evenness measures (Taillie 1979 Nijssen et al 1998 Rousseau et al 1999 Gosselin 2001) The Lorenz curve shows the increase in cumulative proportional abundance of the species as a function of the proportion of species already considered with species being ranked from the least abunshydant to the most abundant (Fig 1) If all species are equally abundant each new species adds the same amount of proshyportional abundance and the Lorenz curve becomes a straight line along the diagonal of the diagram As the inequality in the species abundances increases the Lorenz curve falls increasingly below the diagonal Any evenness index that is Lorenz compatible must correctly indicate whether the Lorenz curve of one dataset is above or below that of another dataset If the Lorenz curves of two datasets cross then one is not intrinsically more even than the other and two Lorenz compatible indices may rank them in opposite ways

The essential requirements of Smith and Wilson (1996) pose no conflict with the Lorenz criterion but many of

their desirable features do and some of these also conflict with each other (Gosselin 2001 Ricotta 2004) Only two of the five indices that fared best in the evaluation of Smith and Wilson (1996) are Lorenz compatible (0 and ElD Gosselin 2001) On the other hand Gosselin (2001) and Ricotta et al (2001) listed several Lorenz compatible indishyces that were not discussed by Smith and Wilson (1996) Since Smith and Wilsonrsquos review other researchers have made further additions to the wish list of desirable index properties (Mouillot and Wilson 2002 Ricotta 2004 Camargo 2008)

After all this discussion the fundamental problem still remains preferences concerning the mathematical behavshyior of index values may vary and a consensus on a universal set of requirements for an optimal evenness index will never be reached Indeed studies that compare evenness indices often finish by stating that there are many ways in which evenness can be quantified and that different evenshyness indices can be used in different situations (Alatalo 1981 Smith and Wilson 1996 Ricotta et al 2001) This is rather like comparing different indices in order to identify the optimal index of size The obvious conclusion from such comparisons is that there is no universally best index because different aspects of size are relevant in different situations

Settling for terminological clarity

The fact that no single index can be declared universally superior to the others does not mean that the indices are interchangeable On the contrary different evenness indices correspond to very different phenomena (such as relative diversity entropy ratio and rate of increase in diversity) Choosing a relevant index for any particular purpose requires that it is understood which phenomenon each of the available indices quantifies Similarly and perhaps more obviously different size indices (such as m r r2 pr2 r3 and 43pr3) correspond to very different phenomena (such as mass length area and volume) Comparing index values without keeping track of which values represent length and which represent volume is both meaningless and potentially dangerous

Similarly accurate communication about issues related to evenness is only possible if indices that actually quantify different things are each called by a different name The tershyminology is currently unstable so the words lsquoevennessrsquo and lsquoequitabilityrsquo have been used as synonyms as have lsquounevenshynessrsquo and lsquoinequalityrsquo I propose to use the terms lsquoevennessrsquo and lsquounevennessrsquo in a specific quantitative sense (to be defined below analogous to lsquolengthrsquo) and the terms lsquoequitashybilityrsquo and lsquoinequalityrsquo in a more generic sense (analogous to lsquosizersquo) I also propose descriptive unique names for the pheshynomena that correspond to aspects other than evenness in the strict sense

If the use of the term lsquoevennessrsquo is restricted to just one phenomenon which one should that be Ideally this choice should be as compatible as possible with earlier pracshytice Let us therefore use as a starting point the most often repeated statement that involves the word lsquoevennessrsquo in the ecological literature lsquodiversity consists of two independent components richness and evennessrsquo On the basis of this

Figure 1 Lorenz curves of different datasets Species along the xshyaxis are ranked from the least abundant to the most abundant The absolute abundances of the species of each dataset are listed below the corresponding line type Because the Lorenz curve is repshylication invariant the same curve is obtained with the threeshyspecies dataset (1510) and any dataset derived by exactly replicating its species such as (11551010) and (111555101010)

9Gini Variabilitagrave e Mutabilitagravecf note 71 p 48 L Ceriani et PVerme laquo The Origins of the Gini In-dex Extracts from Variabilitagrave e Mu-tabilitagrave (1912) by Corrado Gini raquo In Journal of Economic Inequality 103(2012) p 421-443 doi 10 1007 s10888-011-9188-x

10C Ricotta laquo A Recipe forUnconventional Evenness Measures raquoIn Acta Biotheoretica 522 (2004)p 95-104 doi 10 1023 B ACBI 000004343841888ac

11R D Routledge laquo Evenness In-dices Are Any Admissible raquo In Oikos 401 (1983) p 149-151 doi 1023073544211 JSTOR 3544211

12Ricotta cf note 10

tement eacutequitable est repreacutesenteacutee par la bissectrice La surfaceentre la courbe reacuteelle et la bissectrice est tregraves utiliseacutee en eacutecono-mie pour mesurer lrsquoineacutegaliteacute sous le nom drsquolaquo indice de Gini raquo 9

bull Compatibiliteacute avec la courbe de Lorenz lrsquoeacutequitabiliteacuteaugmente pour une communauteacute si sa courbe de Lorenzest plus proche de la bissectrice Si les courbes de deuxcommunauteacutes se croisent lrsquoordre de leurs eacutequitabiliteacutesest impreacutevisible

Ce critegravere est remis en cause par Ricotta 10 il est incom-patible11 avec le critegravere de continuiteacute retenu pour les mesuresde diversiteacute lrsquointroduction drsquoune espegravece suppleacutementaire avecune probabiliteacute infiniteacutesimale peut modifier consideacuterablementlrsquoeacutequitabiliteacute

Lrsquoinvariance par reacuteplication est une proprieacuteteacute neacutecessaire(mais pas suffisante) agrave la compatibiliteacute avec la courbe de Lo-renz 12

bull Invariance par reacuteplication lrsquoeacutequitabiliteacute ne change passi chaque espegravece est remplaceacutee par plusieurs nouvellesespegraveces ayant la mecircme abondance

Cette proprieacuteteacute est retenue par Tuomisto mais rejeteacutee parJost comme par Ricotta et drsquoautres Lrsquoargumentation de Jostest la plus convaincante une communauteacute drsquoune richesse don-neacutee dans laquelle tous les individus (agrave lrsquoexception drsquoun nombreneacutegligeable) sont concentreacutes dans une seule espegravece atteint leniveau minimum drsquoeacutequitabiliteacute Si elle est dupliqueacutee les indivi-dus seront reacutepartis dans deux espegraveces et non une la nouvellecommunauteacute nrsquoatteindra pas le niveau minimum drsquoeacutequitabi-liteacute il est donc souhaitable que la mesure drsquoeacutequitabiliteacute aug-mente

52 Indice classiques 91

13L Bulla laquo An Index of Even-ness and Its Associated DiversityMeasure raquo In Oikos 701 (1994)p 167-172 doi 1023073545713 JS-TOR 3545713

14C Taillie laquo Species Equitabili-ty A Comparative Approach raquo In Ecological Diversity in Theory andPractice Sous la dir de J F Grassleet al Fairland MD InternationalCooperative Publishing House 1979p 51-62

16A L Sheldon laquo Equitability In-dices Dependence on the SpeciesCount raquo In Ecology 503 (1969)p 466-467 doi 1023071933900

17Peet laquo The Measurement ofSpecies Diversity raquo cf note 1 p 25

18R V Alatalo laquo Problems in theMeasurement of Evenness in Ecolo-gy raquo In Oikos 372 (1981) p 199-204 doi 1023073544465

19C Ricotta et al laquo On the Mu-tual Relatedness of Evenness Mea-sures raquo In Community Ecology 21(2001) p 51-56 doi 10 1556 ComEc2200116

52 Indice classiquesIndice de Bulla

Lrsquoindice drsquoeacutequitabiliteacute de Bulla13 respecte les critegraveres deSmith et Wilson

119874 = sum119904

min(119901119904 1119878 ) (51)

Il mesure lrsquoeacutecart entre la distribution reacuteelle et une distri-bution parfaitement eacutequitable Bulla le normalise pour qursquoilsoit compris entre 0 et 1

119864119874 = 119874 minus min 1198741 minus min 119874 (52)

La valeur minimale de 119874 est 1119878 Bulla considegravere que cenrsquoest pas le cas si les effectifs sont entiers et fournit une valeurexacte deacutependant du nombre drsquoespegraveces

Indice de GiniLrsquoindice de Gini est le double de la surface comprise entre

la courbe de Lorenz et la bissectrice (figure 51)

Rapports de moyennesTaillie14 propose le rapport de la moyenne geacuteomeacutetrique

ou de la moyenne harmonique agrave la moyenne arithmeacutetique desprobabiliteacutes

Ratios de HillHill15 utilise les rapports entre nombres effectifs drsquoespegraveces

drsquoordres diffeacuterents comme mesure drsquoeacutequitabiliteacute 11986410 = 11198630119863avait deacutejagrave eacuteteacute proposeacute par Sheldon16 Peet17 le normalise enretirant au numeacuterateur et au deacutenominateur leur valeur mini-male crsquoest-agrave-dire 1

La version normaliseacutee de 11986421 est recommandeacutee par Alata-lo18

SynthegraveseRicotta et al19 testent ces indices sur 65 jeux de donneacutees

diffeacuterents pour observer leurs correacutelations Tous sont compa-tibles avec la courbe de Lorenz Ils concluent que les indicesse reacutepartissent en deux groupes la plupart sont sensiblesaux abondances relatives des espegraveces rares 119864infin0 et dansune moindre mesure 11986420 sont plus sensibles aux espegraveces freacute-quentes

20S Engen laquo Exponential and Lo-garithmic Species-Area Curves raquo In The American Naturalist 111979(1977) p 591-594 JSTOR 2460244

21C Ricotta laquo On ParametricEvenness Measures raquo In Journalof Theoretical Biology 2222 (2003)p 189-197 doi 10 1016 S0022 -5193(03)00026-2

22Ricotta laquo A Recipe for Uncon-ventional Evenness Measures raquo cfnote 10 p 90

23R R Yager laquo On the Speci-ficity of a Possibility Distribution raquoIn Fuzzy Sets and Systems AnInternational Journal in Informa-tion Science and Engineering 503(1992) p 279-292 doi 10 1016 0165-0114(92)90226-T

24Lloyd et Ghelardi laquo A Table forCalculating the rsquoequitabilityrsquo Com-ponent of Species Diversity raquo cfnote 1 p 89 Sheldon laquo Equitabili-ty Indices Dependence on the Spe-cies Count raquo cf note 16 p 91 Pie-lou laquo The Measurement of Diversityin Different Types of Biological Col-lections raquo cf note 77 p 50 PielouEcological Diversity cf note 1 p 61

53 Indice alternatifs

Variance de la rareteacute

Engen20 deacutefinit comme mesure drsquoeacutequitabiliteacute la variance dela rareteacute (la fonction drsquoinformation) de lrsquoentropie de Shannon(minus ln 119901)

119864VS = sum119904

119901119904(ln 119901119904)2 minus (sum119904

119901119904 ln 119901119904)2 (53)

Sa valeur est nulle si les espegraveces sont eacutequiprobablesRicotta21 geacuteneacuteralise cette mesure aux autres fonctions drsquoin-

formation Toutes peuvent ecirctre utiliseacutees

119864VR = sum119904

119901119904119868(119901119904)2 minus [sum119904

119901119904119868(119901119904)]2 (54)

Ces mesures ne sont pas invariantes par reacuteplication maissont continues par rapport aux probabiliteacutes

Non-speacutecificiteacute

Ricotta22 propose un indice fondeacute sur les ensembles flousutilisant les mesures de speacutecificiteacute23 Les espegraveces sont classeacuteespar probabiliteacute deacutecroissante La mesure de non-speacutecificiteacute uti-lisable comme mesure drsquoeacutequitabiliteacute est

119864NSp =119878minus1sum119904=1

119901119904 minus 119901119904+1119904 (55)

Cet indice nrsquoest pas invariant par reacuteplication mais est conti-nu par rapport aux probabiliteacutes

54 Indice de Pielou

Une expression de lrsquoeacutequitabiliteacute est souvent donneacutee agrave par-tir de lrsquoindice de Shannon24 La valeur maximale de lrsquoindice deShannon est obtenue quand la distribution est parfaitement reacute-guliegravere Alors 119867max = ln 119878 On a donc deacutefini lrsquoindice souventappeleacute laquo indice de Pielou raquo

119869 = 119867119867max

= 119867ln 119878 (56)

119869 est compris entre 0 (une seule espegravece a une probabiliteacutede 1) et 1 (toutes les espegraveces ont la mecircme probabiliteacute)

55 Geacuteneacuteralisation de lrsquoindice de Pielou 93

27B Smith et J B Wilson laquo AConsumerrsquos Guide to Evenness In-dices raquo cf note 5 p 89

55 Geacuteneacuteralisation de lrsquoindice de PielouMendes et al

Mendes et al25 geacuteneacuteralisent lrsquoindice de Pielou en rempla-ccedilant lrsquoindice de Shannon par lrsquoentropie de Tsallis Ils deacutefi-nissent

119902119869 lowast =119902119867

119902119867max=

119902119867ln119902 119878 (57)

et tracent des profils drsquoeacutequitabiliteacute crsquoest-agrave-dire la valeurde 119902119869 lowast en fonction de 119902 Ils observent que lrsquoeacutequitabiliteacute est mi-nimale pour une valeur particuliegravere de 119902 qursquoils notent 119902lowast etmontrent sur des exemples simuleacutes que 119902lowast diminue avec la ri-chesse de la communauteacute mais sans en explorer complegravetementles proprieacuteteacutes

2119869 lowast est lrsquoindice drsquoeacutequitabiliteacute deacuteriveacute de lrsquoindice de diversiteacutede Simpson par S H Hurlbert26

TuomistoTuomisto argumente en faveur drsquoune deacutefinition stricte de

lrsquoeacutequitabiliteacute (evenness en anglais equitability pouvant ecirctreutiliseacute dans un sens plus large) en tant que ratio de Hill

119902119864 = 1198641199020 =1199021198630119863 =

119902119863119878 (58)

Lrsquoeacutequitabiliteacute drsquoordre 119902 est le rapport de la diversiteacutedrsquoordre 119902 sur la richesse

Lrsquoideacutee fondamentale de la notion drsquoeacutequitabiliteacute est que lamesure de la diversiteacute doit pouvoir ecirctre partitionneacutee en deuxcomposantes indeacutependantes la richesse et lrsquoeacutequitabiliteacute27

Ineacuteq

eacute

Fig 52 Profil drsquoineacutequitabiliteacute deBCI Lrsquoineacutequitabiliteacute augmentequand on neacuteglige de plus en plusles espegraveces rares Pour q=2 laforecirct de BCI est aussi ineacutequitableqursquoune communauteacute de 6 espegravecesdans laquelle une seule seraitrepreacutesenteacutee au-delagrave drsquoun nombreneacutegligeable drsquoindividus

29Sheldon laquo Equitability Indices Dependence on the Species Count raquocf note 16 p 91

30Alatalo laquo Problems in the Mea-surement of Evenness in Ecology raquocf note 18 p 91

31Tuomisto laquo An UpdatedConsumerrsquos Guide to Evenness andRelated Indices raquo cf note 3 p 89

32B Smith et J B Wilson laquo AConsumerrsquos Guide to Evenness In-dices raquo cf note 5 p 89 Tuomistolaquo An Updated Consumerrsquos Guide toEvenness and Related Indices raquo cfnote 3 p 89

Jost28 montre que lrsquoindeacutependance est impossible dans lecadre de la deacutecomposition multiplicative si 119902119864 = 119902119863119878 savaleur minimale est contrainte par le nombre drsquoespegraveces unecommunauteacute pauvre ne peut pas ecirctre aussi ineacutequitable qursquounecommunauteacute riche (proprieacuteteacute deacutejagrave montreacutee par Sheldon29 ouAlatalo30) En revanche la richesse peut ecirctre partitionneacutee defaccedilon indeacutependante en diversiteacute et ineacutequitabiliteacute 119878 = 119902119863119902119864

Lrsquoineacutequitabiliteacute 1119902119864 (figure 52) est un nombre ef-fectif drsquoespegraveces crsquoest la richesse drsquoune communauteacute dumecircme niveau drsquoeacutequitabiliteacute que la communauteacute reacuteelle danslaquelle tous les individus (sauf un nombre neacutegligeable)appartiendraient agrave une seule espegravece

Code R pour la figure 52

Estimation du nombre despegravecesNs lt- colSums(BCI)UBNs lt- jackknife(AbdFreqCount(Ns) k = 1)$Nhat ProfilInq lt- DivPrf lt- CommunityProfile(Diversity Ns)Inq$y lt- UBNsDivPrf$yautoplot(Inq xlab = Ordre de diversiteacute ylab = Ineacutequitabiliteacute)

SynthegraveseLrsquoindice de Pielou est le plus utiliseacute31 mais nrsquoest pas inva-

riant par reacuteplication parce qursquoil ne normalise pas une diversiteacutemais une entropie Il est rejeteacute pour cette raison32 par unepartie de la litteacuterature Jost33 argumente au contraire en safaveur 119902119864 deacutepend de la richesse et ne peut donc pas ecirctre com-pareacute entre communauteacutes de richesse diffeacuterente Le logarithmede 119902119864 normaliseacute est une meilleure geacuteneacuteralisation de lrsquoindice dePielou que celle de Mendes et al

119902119869 = ln (119902119863)ln 119878 =

119902119877ln 119878 (59)

119902119869 varie entre 0 et 1 et est une transformation monotonede 119902119864 contrairement au 119902119869 lowast de Mendes et al Il est eacutegal aurapport de lrsquoentropie de Reacutenyi sur le logarithme du nombredrsquoespegraveces

Lrsquoestimation de lrsquoeacutequitabiliteacute repose lourdement sur lrsquoes-timation du nombre drsquoespegraveces quelle que soit la valeur duparamegravetre 119902 La solution la plus eacutevidente consiste agrave corrigerle mieux possible le biais drsquoestimation du nombre drsquoespegraveces etcelui de lrsquoentropie drsquoordre 119902

119902 119869 =ln (119890119902

119902 )ln 119878

Un profil drsquoeacutequitabiliteacute calculeacute de cette faccedilon est preacutesenteacuteen figure 53 repreacutesentation alternative de la figure 52

Fig 53 Profil drsquoeacutequitabiliteacute deBCI Lrsquoeacutequitabiliteacute est icinormaliseacutee selon Jost

34B J Wilsey et al laquo Relation-ships among Indicies Suggest ThatRichness Is an Imcomplete Surrogatefor Grassland Diversity raquo In Eco-logy 865 (2005) p 1178-1184 doi 10189004-0394

35Z G MacDonald et al laquo Ne-gative Relationships between SpeciesRichness and Evenness Render Com-mon Diversity Indices Inadequate forAssessing Long-Term Trends in But-terfly Diversity raquo In Biodiversityand Conservation 263 (2017) p 617-629 doi 101007s10531-016-1261-0

36P A DeBenedictis laquo On theCorrelations between Certain Diversi-ty Indices raquo In The American Natu-ralist 107954 (1973) p 295-302 doi 1023072459799

Code R suppleacutementaire

Inq$y lt- log(DivPrf$y)log(UBNs)autoplot(Inq xlab = Ordre de diversiteacute ylab = Indice de Pielou)

56 Relations empiriques entre richesseet eacutequitabiliteacute

Au-delagrave de la question des contraintes matheacutematiquesentre richesse et eacutequtabiliteacute traiteacutees preacuteceacutedemment il srsquoagitici des relations entre les deux aspects de la diversiteacute dansdes communauteacutes reacuteelles

Wilsey et al34 passent en revue lrsquoargument selon lequelrichesse et eacutequitabiliteacute seraient toujours positivement correacute-leacutes Srsquoil est valide la richesse peut ecirctre consideacutereacutee comme unemesure suffisante de la diversiteacute Agrave partir drsquoinventaires de prai-ries ils montrent la tregraves faible relation entre les deux valeursLe suivi temporel de communauteacutes de papillons35 met en eacutevi-dence une relation neacutegative Les auteurs de lrsquoeacutetude critiquentun peu naiumlvement lrsquoutilisation des nombres de Hill pour mesu-rer la diversiteacute parce qursquoils confondent les effets de la richesseet de lrsquoeacutequitabiliteacute crsquoest justement leur but

Drsquoun point de vue plus theacuteorique DeBenedictis36 eacutetudie lescontraintes numeacuteriques sur lrsquointervalle des valeurs possiblesde lrsquoentropie de Shannon et de lrsquoeacutequitabiliteacute en fonction dela richesse Il ne prouve pas de correacutelation entre ces valeurspour des communauteacutes reacuteelles mais simplement un lien positifquand les eacutechantillons sont de petite taille et lrsquoeffectif mini-mum de chaque espegravece eacutegal agrave 1 ces contraintes se relacircchentsi les donnneacutees sont des probabiliteacutes pouvant tendre vers 0pour les espegraveces rares ou des abondances dans de grandseacutechantillons Cette approche est similaire agrave celle de Jost37

plus aboutie

39G Stirling et B J Wilseylaquo Empirical Relationships betweenSpecies Richness Evenness and Pro-portional Diversity raquo In The Ame-rican naturalist 1583 (2001) p 286-299 doi 101086321317

May38 montre que dans le cadre drsquoune distribution log-normale la richesse lrsquoentropie de Simpson et lrsquoeacutequitabiliteacute dePielou sont positivement correacuteleacutees Ce reacutesultat a eacuteteacute eacutetendupar G Stirling et Wilsey39 aux distributions en log-seacuterieset testeacute dans des communauteacutes reacuteelles avec des conclusionscontrasteacutees notamment des correacutelations neacutegatives ntrerichesse et eacutequitabiliteacute dans des communauteacutes tregraves riches

Des simulations permettent de comprendre les correacutelationsdans des cas simples

La figure 54 montre que lrsquoentropie et lrsquoeacutequitabiliteacute sontcorreacuteleacutees positivement agrave la richesse dans des communauteacuteslog-normales de mecircme variance

Fig 54 Relations entrelrsquoentropie de Shannon (a) lrsquoindice

drsquoeacutequitabiliteacute de Pielou (b)lrsquoentropie de Simpson (c)

lrsquoeacutequitabiliteacute de Hurlbert (d) et larichesse de communauteacutes

log-normales similaires (mecircmeeacutecart-type des probabiliteacutes seule

la richesse varie)

30 100 300S (eacutechelle logarithmique)

100 200 300S

Code R pour reacutealiser les figures

Communauteacutes de 30 agrave 300 espegravecesS lt- 30300 Tirage de communauteacutes log-normales de 10000 individusrcl lt- lapply(S function(S) rCommunity(1 10000 S=S)) Richesse et ShannonSobs lt- sapply(rcl Richness)H lt- sapply(rcl Shannon)ggH lt- ggplot(dataframe(S H) aes(S H)) +

geom_point() + scale_x_log10() +labs(x=S (eacutechelle logarithmique)) +labs(tag = a)

Equitabiliteacute de PielouJ lt- Hlog(S)ggJ lt- ggplot(dataframe(S J) aes(S J)) +

geom_point() + labs(tag = b)E lt- sapply(rcl Simpson)ggE lt- ggplot(dataframe(S E) aes(S E)) +

geom_point() + labs(tag = c)J2 lt- E(1-1S)ggJ2 lt- ggplot(dataframe(S J2) aes(S J2)) +

geom_point() + labs(tag = d)gridarrange(ggH ggJ ggE ggJ2 ncol = 2 nrow = 2)

En revanche dans une communauteacute log-normale derichesse fixe mais insuffisamment eacutechantillonneacutee les correacute-lations sont neacutegatives (figure 55) Le sous-eacutechantillonnagea un effet plus seacutevegravere sur la richesse que sur les entropiesdrsquoordres supeacuterieurs La non observation des espegraveces les plusrares augmente aussi lrsquoeacutequitabiliteacute

0 50 100 150 200 250S

Fig 55 Relations entrelrsquoentropie de Shannon (a) lrsquoindicedrsquoeacutequitabiliteacute de Pielou (b)lrsquoentropie de Simpson (c)lrsquoeacutequitabiliteacute de Hurlbert (d) et larichesse drsquoeacutechantillons de taillevariable drsquoune mecircme communauteacutelog-normale

Communauteacutes de taille 10 agrave 1000 individus 300 sprmc lt- MetaCommunity(sapply(101000 function(n) rCommunity(1 n))) Richesse et ShannonS lt- apply(rmc$Psi 2 Richness)H lt- apply(rmc$Psi 2 Shannon)ggH lt- ggplot(dataframe(S H) aes(S H)) +

geom_point() + labs(tag = b)E lt- apply(rmc$Psi 2 Simpson)ggE lt- ggplot(dataframe(S E) aes(S E)) +

La correacutelation entre richesse et eacutequitabiliteacute est donc po-sitive si la richesse varie entre communauteacutes mais neacutegativesi ce nrsquoest qursquoun effet de lrsquoeacutechantillonnage Les reacutesultats sontsimilaires avec des communauteacutes en log-seacuteries la correacutelationest positive quand 120572 varie neacutegative quand lrsquoeacutechantillonnagevarie

Troisiegraveme partie

Diversiteacute fonctionnelleet phylogeacuteneacutetique

1B H Walker laquo Biodiversityand Ecological Redundancy raquo In Conservation biology 61 (1992)p 18-23 doi 101046j1523-17391992610018x

2Pielou Ecological Diversitycf note 1 p 61 R M May laquo Taxo-nomy as Destiny raquo In Nature 347(1990) p 129-130 doi 10 1038 347129a0 S H Cousins laquo SpeciesDiversity Measurement Choosingthe Right Index raquo In Trends in Eco-logy amp Evolution 66 (1991) p 190-192 doi 10 1016 0169 - 5347(91 )90212-G

3D Tilman et al laquo The Influenceof Functional Diversity and Compo-sition on Ecosystem Processes raquo In Science 2775330 (1997) p 1300-1302 doi 101126science27753301300

4C O Webb et al laquo IntegratingPhylogenies into Community Ecolo-gy raquo In Ecology 87 (sp7 2006) S1-S2 doi 10 1890 0012 - 9658(2006 )87[1IPICE]20CO2

5C R Rao laquo Diversity and Dis-similarity Coefficients A Unified Ap-proach raquo In Theoretical PopulationBiology 21 (1982) p 24-43 doi 1010160040-5809(82)90004-1

6R I Vane-Wright et al laquo Whatto Protect mdashSystematics and theAgony of Choice raquo In BiologicalConservation 553 (1991) p 235-254doi 1010160006-3207(91)90030-D

7R M Warwick et K R Clarkelaquo New rsquobiodiversityrsquo Measures Reveala Decrease in Taxonomic Distinctnesswith Increasing Stress raquo In MarineEcology Progress Series 129 (1995)p 301-305 JSTOR 24855596

8J Chave et al laquo The Impor-tance of Phylogenetic Structure inBiodiversity Studies raquo In ScalingBiodiversity Sous la dir de D Storchet al Santa Fe Institute Editions2007 p 150-167

9Ricotta laquo A Semantic Taxono-my for Diversity Measures raquo cfnote 3 p 4 M Vellend et allaquo Measuring Phylogenetic Biodiversi-ty raquo In Biological Diversity Fron-tiers in Measurement and Assess-ment Sous la dir drsquoA E Magurranet B J McGill Oxford Oxford Uni-versity Press 2010 p 194-207

Chapitre 6

La diversiteacute fonctionnelle ou phylogeacuteneacutetique prend en compte la proxi-miteacute des espegraveces entre elles Geacuteneacuteralement la distance entre espegraveces esteacutevalueacutee dans lrsquoespace des traits approximation de lrsquoespace des nichespour la diversiteacute fonctionnelle et dans un dendrogramme repreacutesentant laphylogeacutenie ou la taxonomie pour la diversiteacute phylogeacuteneacutetique

Lrsquoessentiel

Les mesures neutres de la diversiteacute considegraverent que toutesles classes auxquelles les objets appartiennent sont diffeacuterentessans que certaines soient plus diffeacuterentes que drsquoautres Parexemple toutes les espegraveces sont eacutequidistantes les unes desautres qursquoelles appartiennent au mecircme genre ou agrave des famillesdiffeacuterentes Intuitivement lrsquoideacutee qursquoune communauteacute de 119878 es-pegraveces toutes de genres diffeacuterents est plus diverse qursquoune com-munauteacute de 119878 espegraveces du mecircme genre est satisfaisante B HWalker1 argumente en faveur de la protection de groupes fonc-tionnels plutocirct que de celle de chacune des espegraveces qui lesconstitue pour maintenir le bon eacutetat des eacutecosystegravemes

Il srsquoagit donc de caracteacuteriser la diffeacuterence entre deux classesdrsquoobjets puis de construire des mesures de diversiteacute en rap-port2 En eacutecologie ces diffeacuterences sont fonctionnelles ou phy-logeacuteneacutetiques deacutefinissant la diversiteacute fonctionnelle3 ou la diver-siteacute phylogeacuteneacutetique (phylodiversity)4

Les premiegraveres propositions de ce type drsquoindices sont duesagrave Rao5 (voir section 76) puis avec nettement moins de suc-cegraves Vane-Wright et al6 et Warwick et Clarke7 Chave et al8montrent que la diversiteacute neutre preacutedit mal la diversiteacute phylo-geacuteneacutetique (calculeacutee par lrsquoentropie quadratique de Rao)

De nombreuses mesures de diversiteacute ont eacuteteacute creacuteeacutees et plu-sieurs revues permettent drsquoen faire le tour9 Les mesures preacute-senteacutees ici sont les plus utiliseacutees et notamment celles quipeuvent ecirctre rameneacutees aux mesures classiques en fixant unedistance eacutegale entre toutes les espegraveces Le cadre meacutethodolo-gique dans lequel ces mesures ont eacuteteacute deacuteveloppeacutees est preacutesenteacutedans ce chapitre suivi par une revue des nombreuses mesures

102 Cadre

10J C Lingoes laquo Some Bounda-ry Conditions for a Monotone Ana-lysis of Symmetric Matrices raquo In Psychometrika 362 (1971) p 195-203 doi 10 1007BF02291398 FCailliez laquo The Analytical Solution ofthe Additive Constant Problem raquo In Psychometrika 48 (1983) p 305-310doi 101007BF02294026

de diversiteacute fonctionnelles et phylogeacuteneacutetiques de la litteacuteratureLrsquoentropie phylogeacuteneacutetique et la diversiteacute de Leinster et Cob-bold sont ensuite deacuteveloppeacutees en deacutetail suivies drsquoune synthegraveseet de consideacuterations sur la mesure de la diversiteacute individuelleplutocirct que speacutecifique

Des exemples montrent comment calculer cette diversi-teacute principalement agrave lrsquoaide du package entropart Le packagecontient les donneacutees drsquoinventaire de deux hectares du disposi-tif de Paracou et la taxonomie des espegraveces concerneacutees

library(entropart) Chargement du jeu de donneacuteesdata(Paracou618)

61 Dissimilariteacute et distanceUne similariteacute ou dissimilariteacute est toute application agrave va-

leurs numeacuteriques qui permet de mesurer le lien entre les in-dividus drsquoun mecircme ensemble ou entre les variables Pour unesimilariteacute le lien est drsquoautant plus fort que sa valeur est grande

Une dissimilariteacute veacuterifie (119896 119897 et 119898 sont trois individus)

bull La dissimilariteacute drsquoun individu avec lui-mecircme est nulle 119889 (119896 119896) = 0

bull La dissimilariteacute entre deux individus diffeacuterents est posi-tive 119889 (119896 119897) ge 0

bull La dissimilariteacute est symeacutetrique 119889 (119896 119897) = 119889 (119897 119896)

Une distance veacuterifie en plus

bull La distance entre deux individus diffeacuterents est stricte-ment positive 119889 (119896 119897) = 0 rArr 119896 = 119897

bull Lrsquoineacutegaliteacute triangulaire 119889 (119896 119898) le 119889 (119896 119897) + 119889 (119897 119898) Denombreux indices de dissimilariteacute ne veacuterifient pas cetteproprieacuteteacute

Une distance est euclidienne si elle peut ecirctre repreacutesen-teacutee par des figures geacuteomeacutetriques On peut rendre toute dis-tance euclidienne par ajout drsquoune constante10 Dans R utiliseriseuclid() pour veacuterifier qursquoune distance est euclidienne etcailliez() ou lingoes() pour la transformation

Enfin une distance est ultrameacutetrique si 119889 (119896 119898) lemax (119889 (119896 119897) 119889 (119897 119898)) Les distances obtenues en mesurant leslongueurs des branches drsquoun dendrogramme (arbre) reacutesultantdrsquoune classification hieacuterarchique sont ultrameacutetriques

La faccedilon exacte de mesurer les longueurs de branche estillustreacutee par la figure 61 la distance entre les espegraveces 1 et2 est 1198791 + 1198792 elle est eacutegale agrave 1198791 entre les espegraveces 4 et 5 Ladistance est la hauteur du premier noeud commun

62 Distance phylogeacuteneacutetique 103

1198791 1199011 1199015 1199012 1199013 1199014

1198792

1198793 b31

b11 b12 b13 b14 b15

Fig 61 Arbre phylogeacuteneacutetique oufonctionnel hypotheacutetique 5espegraveces sont preacutesentes (119878 = 5)leurs probabiliteacutes noteacutees 1199011 agrave 1199015Les noms des branches sontafficheacutes

11Clarke et Warwick laquo A FurtherBiodiversity Index Applicable to Spe-cies Lists Variation in TaxonomicDistinctness raquo cf note 3 p 25 War-wick2001

12Chave et al laquo The Importanceof Phylogenetic Structure in Biodiver-sity Studies raquo cf note 8 p 101

13A E Zanne et al laquo Three Keysto the Radiation of Angiosperms intoFreezing Environments raquo In Nature5067486 (2014) p 89-92 doi 10 1038nature12872

14C Ricotta et al laquo ComputingDiversity from Dated Phylogenies andTaxonomic Hierarchies Does It Makea Difference to the Conclusions raquo In Oecologia 1702 (2012) p 501-506doi 101007s00442-012-2318-8

15R H Crozier laquo Preserving theInformation Content of Species Ge-netic Diversity Phylogeny andConservation Worth Interaction withReasons Justifying the Preservation raquoIn Annual Review of Ecology andSystematics 28 (1997) p 243-268doi 101146annurevecolsys281243

16M Westoby et al laquo PLANTECOLOGICAL STRATEGIES Some Leading Dimensions of Varia-tion between Species raquo In AnnualReview of Ecology and Systematics331 (2002) p 125-159 doi 101146annurevecolsys33010802150452

62 Distance phylogeacuteneacutetique

La faccedilon la plus eacutevidente de deacutefinir une distance entre es-pegraveces est drsquoutiliser la taxonomie11 en attribuant une distancearbitraire (par exemple 1) agrave deux espegraveces du mecircme genre uneautre (par exemple 2) agrave deux espegraveces de la mecircme famille etcLa distance deacutefinie est ultrameacutetrique

La taxonomie peut ecirctre remplaceacutee avantageusement parune phylogeacutenie La phylogeacutenie ideacuteale contiendrait lrsquohistoireeacutevolutive de toutes les espegraveces et les distances seraient lestemps de divergence depuis le premier ancecirctre commun Enpratique les phylogeacutenies sont eacutetablies agrave partir drsquoun nombrede marqueurs geacuteneacutetiques limiteacutes sans datation preacutecise (maisavec des calages partiels agrave partir de fossiles) et ne sont pas tou-jours ultrameacutetriques Elles peuvent prendre en compte chaqueindividu sans regroupement par espegravece Une meacutethode pourdater une phylogeacutenie est fournie par Chave et al12 Zanne etal13 fournissent une phylogeacutenie dateacutee de plus de 32000 espegravecesRicotta et al14 montrent sur des exemples que la diversiteacute cal-culeacutee agrave partir de phylogeacutenies dateacutees est tregraves correacuteleacutee agrave cellecalculeacutee agrave partir de simples taxonomies

Dans tous les cas la distance est une mesure de la diver-gence eacutevolutive Du point de vue de la biologie de la conserva-tion chaque espegravece accumule une quantiteacute drsquoeacutevolution inter-preacuteteacutee comme une quantiteacute drsquoinformation15 dont le maximumdoit ecirctre preacuteserveacute

Lrsquoentropie phylogeacuteneacutetique (voir chapitre 8) utilise un arbrephylogeacuteneacutetique pour mesurer la diversiteacute

63 Distance fonctionnelle

Lrsquoapproche fonctionnelle est diffeacuterente Chaque espegravece ouindividu est repreacutesenteacute par ses valeurs de traits dans un espacemultidimensionnel Le vecteur de traits est consideacutereacute commeun proxy de la niche eacutecologique16 Les individus proches danslrsquoespace des traits sont donc consideacutereacutes comme proches eacutecologi-quement Les distances entre les points peuvent ecirctre calculeacutees

104 Cadre

17J H C Cornelissen et al laquo AHandbook of Protocols for Standardi-sed and Easy Measurement of PlantFunctional Traits Worldwide raquo In Australian Journal of Botany 514(2003) p 335-380 doi 10 1071 BT02124

18I J Wright et al laquo The World-wide Leaf Economics Spectrum raquo In Nature 428 (2004) p 821-827 doi 101038nature02403

19C Baraloto et al laquo FunctionalTrait Variation and Sampling Strate-gies in Species Rich Plant Communi-ties raquo In Functional Ecology 241(2010) p 208-216 doi 101111j1365-2435200901600x

20S van Buuren et al laquo FullyConditional Specification in Multiva-riate Imputation raquo In Journal ofStatistical Computation and Simula-tion 7612 (2006) p 1049-1064 doi 10108010629360600810434

21S van Buuren et K Groothuis-Oudshoorn laquo Mice Multivariate Im-putation by Chained Equations inR raquo In Journal of Statistical Soft-ware 453 (2011) p 1-67 doi 10 18637jssv045i03

22J C Gower laquo A General Co-efficient of Similarity and Some ofIts Properties raquo In Biometrics 274(1971) p 857-871 doi 10 2307 2528823

23J Podani laquo Extending GowerrsquosGeneral Coefficient of Similarity toOrdinal Characters raquo In Taxon 482(1999) p 331-340 doi 10 2307 1224438 JSTOR 1224438

24S Pavoine et al laquo On the Chal-lenge of Treating Various Types ofVariables Application for Improvingthe Measurement of Functional Diver-sity raquo In Oikos 1183 (2009) p 391-402 doi 101111j1600-0706200916668x

25J Podani et D Schmeralaquo On Dendrogram-Based Measures ofFunctional Diversity raquo In Oikos1151 (2006) p 179-185 doi 10 1111j20060030-129915048x

26R R Sokal et C D Michenerlaquo A Statistical Method for EvaluatingSystematic Relationships raquo In TheUniversity of Kansas Science Bulle-tin 3822 (1958) p 1409-1438 doi citeulike-article-id1327877

27M A Mouchet et al laquo To-wards a Consensus for CalculatingDendrogram-Based Functional Diver-sity Indices raquo In Oikos 117 (2008)p 794-800 doi 101111j0030-1299200816594x

28R R Sokal et F J Rohlf laquo TheComparison of Dendrograms by Ob-jective Methods raquo In Taxon 112(1962) p 33-40 doi 10 2307 1217208 JSTOR 1217208 P Le-gendre et L Legendre NumericalEcology 3rd Ed Elsevier 2012

29J Felsenstein Inferring Phylo-genies 2nd Ed Sinauer Associates2004

directement dans lrsquoespace des traits ou freacutequemment un arbreest construit par classification automatique hieacuterarchique

La premiegravere eacutetape consiste donc agrave choisir un ensemblede traits pertinents et agrave les mesurer de faccedilon standardiseacutee17

Toute la strateacutegie relative agrave la photosynthegravese peut ecirctrepar exemple assez bien reacutesumeacutee par la masse surfaciquedes feuilles18 mais en forecirct tropicale ce trait est deacutecorreacuteleacutede la densiteacute du bois19 Les valeurs manquantes peuventecirctre compleacuteteacutees en utilisant toute lrsquoinformation disponiblepar MICE (multiple imputation by chained equations)20

disponible sous R dans le package mice21

La prise en compte de variables qualitatives ou de rang etla possibiliteacute de donneacutees manquantes pose un problegraveme pra-tique de construction de la matrice de dissimilariteacute traiteacute parGower22 La formule de Gower eacutetendue par Podani23 puisPavoine et al24 agrave drsquoautres types de variables calcule la dissi-milariteacute entre deux espegraveces par la moyenne des dissimilariteacutescalculeacutees pour chaque trait dont la valeur est comprise entre0 et 1

bull Pour une variable quantitative la diffeacuterence de valeurentre deux espegraveces est normaliseacutee par lrsquoeacutetendue des va-leurs de la variable

bull Les variables ordonneacutees sont remplaceacutees par leur rang ettraiteacutees comme les variables quantitatives

bull Pour des variables qualitatives la dissimilariteacute vaut 0 ou1

bull Les valeurs manquantes sont simplement ignoreacutees etnrsquoentrent pas dans la moyenne

Une matrice de distances entre espegraveces est construite decette faccedilon Podani et Schmera25 suggegraverent drsquoutiliser ensuiteune classification hieacuterarchique par UPGMA26 qursquoils montrentecirctre la plus robuste (pour le calcul de FD voir section 75)agrave lrsquoajout ou au retrait drsquoun trait ou drsquoune espegravece Mouchetet al27 suggegraverent plutocirct drsquoappliquer toutes les meacutethodes declassification et de retenir agrave la fin lrsquoarbre dont la distributiondes distances entre espegraveces dans lrsquoarbre est la plus proche dela distribution des distances dans la matrice de dissimilariteacutes cette proximiteacute est mesureacutee par la correacutelation copheacuteneacutetiquecrsquoest-agrave-dire le coefficient de correacutelation entre les valeurs dedistances28 Un arbre consensus29 est souvent plus proche dela matrice de distance

Un dendrogramme fonctionnel nrsquoa pas drsquointerpreacutetationaussi claire qursquoun arbre phylogeacuteneacutetique qui repreacutesente leprocessus de lrsquoeacutevolution Il peut ecirctre interpreacuteteacute comme larepreacutesentation agrave des eacutechelles de plus en plus grossiegraveres en

64 Eacutequivalence des deux diversiteacutes 105

30S Pavoine et al laquo Is the Origi-nality of a Species Measurable raquo In Ecology Letters 8 (2005) p 579-586doi 101111j1461-0248200500752x J Podani et D Schmera laquo HowShould a Dendrogram-Based Measureof Functional Diversity Function ARejoinder to Petchey and Gaston raquoIn Oikos 1168 (2007) p 1427-1430doi 101111j20070030-129916160x

31E Maire et al laquo How ManyDimensions Are Needed to Accura-tely Assess Functional Diversity APragmatic Approach for Assessingthe Quality of Functional Spaces raquoIn Global Ecology and Biogeogra-phy 246 (2015) p 728-740 doi 101111geb12299

32S Villeacuteger et al laquo On the Risksof Using Dendrograms to MeasureFunctional Diversity and Multidimen-sional Spaces to Measure Phylogene-tic Diversity A Comment on Sobralet al (2016) raquo In Ecology Letters204 (avr 2017) Sous la dir de MVila p 554-557 doi 101111ele 12750

33F L Sobral et al laquo Introduc-tions Do Not Compensate for Func-tional and Phylogenetic Losses Follo-wing Extinctions in Insular Bird As-semblages raquo In Ecology Letters 199(2016) p 1091-1100 doi 101111ele12646

34J Felsenstein laquo Phylogeniesand the Comparative Method raquoIn The American Naturalist 251(1985) p 1-15 doi 101086284325

35C O Webb laquo Exploring thePhylogenetic Structure of EcologicalCommunities An Example for RainForest Trees raquo In American Natu-ralist 1562 (2000) p 145-155 doi 101086303378

allant vers le haut de lrsquoarbre de regroupements fonctionnelsdans des niches de plus en plus vastes

La transformation drsquoune matrice (non ultrameacutetrique) endendrogramme deacuteforme la topologie des espegraveces 30 une me-sure de diversiteacute qui utilise directement la matrice est preacutefeacute-rable crsquoest un inteacuterecirct de la diversiteacute de Leinster et Cobbold(voir chapitre 9) Maire et al31 ont deacutefini une mesure de qua-liteacute drsquoun espace fonctionnel mSD comme lrsquoeacutecart quadratiquemoyen entre les distances fonctionnelles entre espegraveces dans lrsquoes-pace utiliseacute (par exemple les distances copheacuteneacutetiques dans undendrogramme fonctionnel) et les distances originales (dans lamatrice de distance agrave partir de laquelle lrsquoarbre a eacuteteacute obtenu)Dans la matrice originale les valeurs de traits sont centreacutees etreacuteduites et la hauteur du dendrogramme est fixeacutee pour que ladistance copheacuteneacutetique maximale soit eacutegale agrave la distance origi-nale maximale

Villeacuteger et al32 ont montreacute que lrsquoutilisation de dendro-grammes fonctionnels dans une eacutetude de Sobral et al33 amegraveneagrave sous-estimer les changements de niveau de biodiversiteacute lieacutesagrave lrsquoarriveacutee drsquoespegraveces invasives drsquooiseaux Dans la tregraves grandemajoriteacute des dendrogrammes utiliseacutes la transformation de lamatrice de distance a entraicircneacute un eacutecart moyen de plus de 10par rapport aux valeurs originales (une valeur de mSD lrsquoeacutecartquadratique moyen supeacuterieure agrave 1) Cette deacuteformation estsuffisante pour largement invalider les reacutesultats obtenus

64 Eacutequivalence des deux diversiteacutes

Lrsquoapproche fonctionnelle eacutetant particuliegraverement complexeet lourde agrave mettre en oeuvre (notamment pour la mesure destraits sur chaque individu) la tentation a eacuteteacute grande de consi-deacuterer que la phylogeacutenie contenait plus drsquoinformation fonction-nelle que ce qui pouvait ecirctre mesureacute et donc de consideacuterer ladiversiteacute phylogeacuteneacutetique comme proxy de la diversiteacute fonction-nelle

Du point de vue theacuteorique le modegravele le plus simple delrsquoeacutevolution de la valeur drsquoun trait hypotheacutetique au cours dutemps est le mouvement brownien agrave chaque geacuteneacuteration lavaleur du trait varie un peu sans meacutemoire Dans ce cadre34 lavariance de la valeur actuelle du trait pour une espegravece donneacuteeest proportionnelle agrave la dureacutee de lrsquoeacutevolution et la covarianceentre deux espegraveces agrave celle de lrsquoacircge de leur ancecirctre communDeux espegraveces proches dans lrsquoarbre phylogeacuteneacutetique deacutecrivantlrsquoeacutevolution doivent donc avoir des valeurs de trait correacuteleacutees

Webb35 a montreacute que des communauteacutes drsquoarbres tropi-caux avaient une moins grande diversiteacute phylogeacuteneacutetique localeqursquoattendue sous lrsquohypothegravese nulle drsquoune distribution aleacuteatoire

106 Cadre

36J Cavender-Bares et al laquo TheMerging of Community Ecology andPhylogenetic Biology raquo In EcologyLetters 127 (2009) p 693-715 doi 101111j1461-0248200901314x

37N G Swenson et B J Enquistlaquo Opposing Assembly Mechanisms ina Neotropical Dry Forest Implica-tions for Phylogenetic and Functio-nal Community Ecology raquo In Eco-logy 908 (2009) p 2161-2170 doi 10189008-10251

38Pavoine et Bonsall laquo MeasuringBiodiversity to Explain CommunityAssembly A Unified Approach raquo cfnote 4 p 4

39Devictor et al laquo SpatialMismatch and Congruence betweenTaxonomic Phylogenetic andFunctional Diversity The Need forIntegrative Conservation Strategiesin a Changing World raquo cf note 2p 25

40Ricotta laquo A Semantic Taxono-my for Diversity Measures raquo cfnote 3 p 4 Pavoine et Bonsalllaquo Measuring Biodiversity to ExplainCommunity Assembly A Unified Ap-proach raquo cf note 4 p 4

42Ibid43A Oslash Mooers et S B Heard

laquo Inferring Evolutionary Process fromPhylogenetic Tree Shape raquo In TheQuarterly Review of Biology 721(1997) p 31-54 doi 10 1086 419657

des espegraveces et a supposeacute que la cause en eacutetait le filtrage envi-ronnemental local agissant sur les traits et observables par laphylogeacutenie sous lrsquohypothegravese de conservation phylogeacuteneacutetiquedes traits fonctionnels La discipline appeleacutee eacutecologie phylogeacute-neacutetique des communauteacutes cherche encore agrave comprendre quelstraits sont conserveacutes et lesquels sont convergents36

Swenson et Enquist37 ont montreacute que la relation entre lesdeux diversiteacutes eacutetait faible Lrsquoutilisation de la diversiteacute phy-logeacuteneacutetique comme proxy de la diversiteacute fonctionnelle nrsquoestpas satisfaisante38 Pour optimiser la conservation les deuxaspects de la diversiteacute souvent divergents doivent ecirctre prisen compte39

65 Typologie des mesuresAgrave partir de la litteacuterature40 une typologie des mesures de

diversiteacute eacutemerge Elle eacutetend les notions classiques de richesseet eacutequitabiliteacute

La richesse est lrsquoaccumulation de classes diffeacuterentes dansles mesures classiques Dans un arbre phylogeacuteneacutetique la lon-gueur des branches repreacutesente un temps drsquoeacutevolution la ri-chesse en est la somme FD et PD sont des mesures de richesse

Fig 62 Reacutegulariteacute contreirreacutegulariteacute Les arbres de A agrave D

sont de plus en plus irreacuteguliersLrsquoarbre A parfaitement reacutegulier

est le cadre des mesures classiquesde la diversiteacute La phylogeacutenie eacutetantdonneacutee trois vecteurs drsquoabondance(P1 agrave P3) sont de moins en moinsreacuteguliers dans les cas C et D la

reacutegulariteacute maximale nrsquoest pasobtenue pour des effectifs

identiques mais en augmentant leseffectifs des espegraveces originales Skewness

Re gularity

Abundance vectors

SkewnessRegularity

Abundance vectors(D)

SkewnessRegularity

Abundance vectors(B)

SkewnessRegularity

Abundance vectors

La reacutegulariteacute mesure la faccedilon dont les espegraveces occupentuniformeacutement lrsquoespace des niches41 Cette notion est simpledans un espace multidimensionnel (par exemple lrsquoespace destraits fonctionnels) Dans un arbre phylogeacuteneacutetique (figure 62Pavoine et Bonsall42) la reacutegulariteacute de lrsquoarbre43 est un premiercritegravere compleacuteteacute eacuteventuellement par les abondances Dans unarbre parfaitement reacutegulier la reacutegulariteacute se reacuteduit agrave lrsquoeacutequita-biliteacute

Les mesures de divergence sont des fonctions croissantes dela dissimilariteacute entre les espegraveces geacuteneacuteralement consideacutereacutees parpaires Certaines sont pondeacutereacutees par les abondances drsquoautresnon Dans un arbre parfaitement reacutegulier lrsquoindice de Simp-son est une mesure de divergence pondeacutereacutee Ces mesures sontinfluenceacutees par la richesse et la reacutegulariteacute

65 Typologie des mesures 107

44C Ricotta laquo A Note on Func-tional Diversity Measures raquo In Ba-sic and Applied Ecology 65 (2005)p 479-486 doi 101016jbaae200502008

45A R Solow et S Polaskylaquo Measuring Biological Diversity raquoIn Environmental and EcologicalStatistics 12 (1994) p 95-103 doi 101007BF02426650

46M L Weitzman laquo On Diversi-ty raquo In The Quarterly Journal ofEconomics 1072 (1992) p 363-405doi 1023072118476

Face agrave la profusion des mesures de diversiteacute fonctionnelleRicotta44 en compleacutement de A R Solow et Polasky45 eacutetablitun certain nombre drsquoaxiomes

1 Monotoniciteacute drsquoensemble la diversiteacute ne doit pas dimi-nuer quand une espegravece est ajouteacutee avec une faible proba-biliteacute (qui ne modifie pas la structure de la communauteacuteexistante) quelles que soient ses caracteacuteristiques fonc-tionnelles

2 Jumelage 46 lrsquointroduction drsquoune espegravece identique agrave uneespegraveces existante ne doit pas augmenter la diversiteacute Defaccedilon moins triviale une espegravece infiniment proche nedoit pas augmenter la diversiteacute il srsquoagit donc drsquounaxiome de continuiteacute dans lrsquoespace des niches

3 Monotoniciteacute de distance la diversiteacute ne doit pas dimi-nuer quand la distance entre espegraveces est augmenteacutee

4 Deacutecomposabiliteacute les mesures de divergence doivent ecirctredeacutecomposables en diversiteacute 120572 120573 et 120574 ce qui implique leurconcaviteacute par rapport aux probabiliteacutes

Lrsquoentropie phylogeacuteneacutetique permet drsquounifier ces notionsmais de nombreuses mesures ont eacuteteacute proposeacutees Elles sontdeacutetailleacutees au chapitre suivant

1N W H Mason et al laquo Func-tional Richness Functional Evennessand Functional Divergence The Pri-mary Components of Functional Di-versity raquo In Oikos 1111 (2005)p 112-118 doi 101111j0030-1299200513886x

4D Schleuter et al laquo A UserrsquosGuide to Functional Diversity In-dices raquo In Ecological Monographs803 (2010) p 469-484 doi 10189008-22251

Chapitre 7

Mesures particuliegraveres

De nombreuses mesures de diversiteacute fonctionnelle ou phylogeacuteneacutetique onteacuteteacute deacuteveloppeacutees pour combiner le mieux possible la richesse et la reacutegulariteacutede la distribution des espegraveces dans lrsquoespace des niches ou la phylogeacutenieCertaines (PD FD lrsquoentropie quadratique de Rao 119867119901 et 1198681) serontunifieacutees au chapitre suivant dans le cadre de lrsquoentropie phylogeacuteneacutetique

Lrsquoessentiel

Un certain nombre de mesures de diversiteacute phylogeacuteneacutetiquesa eacutemergeacute dans la litteacuterature Elles sont passeacutees en revue icien commenccedilant par la diversiteacute fonctionnelle envisageacutee danslrsquoespace multidimensionnel des traits Les sections suivantesenvisagent les espegraveces dans un arbre phylogeacuteneacutetique

71 Richesse eacutequitabiliteacute et divergencefonctionnelle

Mason et al1 postulent que la diversiteacute fonctionnelle peutecirctre abordeacutee dans trois dimensions indeacutependantes (Jost2 mon-trera que lrsquoindeacutependance nrsquoest pas assureacutee)

bull la richesse fonctionnelle qui indique lrsquoeacutetendue de lrsquoes-pace des niches fonctionnelles occupeacute par la communau-teacute

bull lrsquoeacutequitabiliteacute de la distribution des espegraveces dans cesniches (appeleacutee reacutegulariteacute par Pavoine et Bonsall3)

bull la divergence fonctionnelle qui mesure comment la dis-tribution des espegraveces dans lrsquoespace des niches maximisela variabiliteacute des caracteacuteristiques fonctionnelles dans lacommunauteacute et combine richesse et eacutequitabiliteacute

Schleuter et al4 font une revue des mesures utiliseacutees dansce cadre Les notations des indices utiliseacutees ici sont les leurs

Diffeacuterents traits numeacuteriques sont connus pour toutes lesespegraveces de la communauteacute La matrice X les contient lrsquoeacuteleacute-ment 119909119905119904 est la valeur moyenne du trait 119905 pour lrsquoespegravece 119904 On

110 Mesures particuliegraveres

5Mason et al laquo Functional Rich-ness Functional Evenness and Func-tional Divergence The PrimaryComponents of Functional Diversi-ty raquo cf note 1 p 109

6G E Hutchinson laquo ConcludingRemarks raquo In Cold spring harborsymposia on quantitative biology 22(1957) p 415-427 doi 10 1101 SQB195702201039

note T119904 le vecteur des valeurs moyennes de chaque trait delrsquoespegravece 119904

Richesse fonctionnelleEacutetendue fonctionnelle

Lrsquoeacutetendue fonctionnelle5 mesure lrsquoeacutetendue des valeurs drsquountrait occupeacutee par une communauteacute normaliseacutee par lrsquoeacutetenduemaximale possible

FR119877 = max119904(119909119905119904) minus min119904(119909119905119904)119883119905119898119886119909 minus 119883119905119898119894119899

ougrave max119904(119909119905119904) est la valeur maximale pour toutes les es-pegraveces de la matrice de la valeur du trait 119905 119883119905119898119886119909 est sa valeurmaximale absolue (les notations sont identiques pour les mi-nima) Les extrecircmes absolus peuvent ecirctre ceux de lrsquoensembledes communauteacutes compareacutees Ils sont toujours sous-estimeacutes ilest toujours possible theacuteoriquement de trouver des valeurs plusextrecircmes en augmentant lrsquoeffort drsquoeacutechantillonnage Lrsquoeacutetenduefonctionnelle peut ecirctre moyenneacutee sur plusieurs traits

Schleuter et al deacuteveloppent lrsquoindice FR119868119904 pour prendreen compte la variabiliteacute intraspeacutecifique et les valeurs de traitsnon occupeacutees par des espegraveces dans lrsquoeacutetendue fonctionnelle Lesvaleurs de traits individuelles sont neacutecessaires lrsquoeacutetendue desvaleurs drsquoun trait est deacutefinie comme lrsquounion des eacutetendues desvaleurs de chaque espegravece

Fig 71 Fonction drsquoappartenancede lrsquoespace des niches de Schleuter

et al en une dimension 119909 enordonneacutee est la valeur du trait

consideacutereacute Chaque espegravece estconsideacutereacutee comme un ensemble

flou dans lrsquoespace des traitsQuatre espegraveces sont repreacutesenteacuteesavec leur fonction drsquoappartenance119891119904(119909) Le volume de lrsquoespace destraits occupeacute FR119868119898 est obtenu

en inteacutegrant les fonctionsdrsquoappartenance crsquoest la zone

griseacutee de la figure

Appendix B Multi-dimensional functional richness (FRIm)

FRIm is a new index specifically designed to account for gaps in multidimensional functional trait space and for intraspecific variability The idea is to consider each species as a fuzzy set in trait space Thus species are characterized by their membership functions (or degree of truth functions) fi At a point x of trait space the membership function of species i is equal to fi ( ) f x( ) point x belongs surely to species x which is comprised between 0 and 1 When i =1

i When f x( ) = 0 x does not belong at all to species i For intermediate values of fi ( ) xxi

may belong to species i with the degree of truth of this proposition quantified by fi ( ) x

Two operations on membership functions are useful to compute functional richness First the ldquovolumerdquo of a set in trait space is computed by integrating its membership function over all trait space Second the membership function of a union of sets is equal to the maximum of all membership functions Thus the total ldquovolumerdquo of trait space occupied by a community is FRIm = intmax [ fi ( ) ]dx (B1) x

An example of such a computation is given in Fig B1

Fig B1 ndash An example of FRIm computation (for one-dimensional data) following equation (A2) Four species are present in the community with mean trait values 10 13 15 and 20 and trait standard deviations 01 02 03 and 01 respectively The four fs functions are represented using colored dashed lines (red yellow purple and green resp) The value of FRIm is the area in gray

We chose a simple form for membership functions that could use information on both mean trait values ( μi ) and trait variance-covariance matrices ( Σi ) for each species

⎡ 1 T minus1 ⎤i ( ) = exp ⎢minus (x minus μi ) Σi (x i )⎥f x minus μ (B2)

⎣ 2 ⎦

When covariances among traits are equal to 0 the expression for matrix Σi reduces to a diagonal matrix with elements σ ij

2 describing the variance of trait j in species i

⎡ 1 (x j minus μij )2 ⎤i

⎢ sum 2 ⎥f x( ) = exp minus (B3)

⎢ 2 σ ⎥j ij⎣ ⎦

Volume de niches

La deacutefinition de la niche eacutecologique de Hutchinson6 est lrsquohy-pervolume dans lrsquoespace des ressources environnementalesqursquoune espegravece peut occuper Lrsquoespace des traits fonctionnelspeut ecirctre consideacutereacute comme une approximation de lrsquoespace desressources Le volume de lrsquoenveloppe convexe de lrsquoespace destraits occupeacute par la communauteacute (convex hull volume) estdonc une mesure de richesse fonctionnelle multidimensionnelle

71 Richesse eacutequitabiliteacute et divergence fonctionnelle 111

7B Blonder et al laquo The N-Dimensional Hypervolume raquo In Glo-bal Ecology and Biogeography 23(2014) p 595-609 doi 101111geb12146

8L Zadeh laquo Fuzzy Sets raquo In Information and Control 83 (1965)p 338-353 doi 10 1016 S0019 -9958(65)90241-X

9Schleuter et al laquo A UserrsquosGuide to Functional Diversity In-dices raquo cf note 4 p 109

10Mouchet et al laquo Towardsa Consensus for CalculatingDendrogram-Based FunctionalDiversity Indices raquo cf note 27p 104

11O L Petchey et K J Gastonlaquo Functional Diversity (FD) SpeciesRichness and Community Composi-tion raquo In Ecology Letters 5 (2002)p 402-411 doi 101046j1461-0248200200339x

13D Mouillot et al laquo FunctionalRegularity A Neglected Aspect ofFunctional Diversity raquo In Oecolo-gia 1423 (2005) p 353-359 doi 101007s00442-004-1744-7

La prise en compte des trous crsquoest-agrave-dire la restriction du vo-lume agrave lrsquoespace reacuteellement occupeacute agrave lrsquointeacuterieur de cette enve-loppe est possible gracircce agrave une meacutethode drsquoestimation drsquohyper-volume plus eacutelaboreacutee impleacutementeacutee dans le package hypervo-lume pour R7

De mecircme que pour lrsquoeacutetendue fonctionnelle Schleuteret al deacuteveloppent une mesure proche FR119868119898 prenant encompte la variabiliteacute intraspeacutecifique et les espaces nonoccupeacutes Chaque espegravece est supposeacutee occuper un espaceautour de sa position moyenne dans lrsquoespace des traits avecune fonction drsquoappartenance8 gaussienne multidimensionnelle(une repreacutesentation unidimensionnelle se trouve en figure 71Schleuter et al9) la fonction drsquoappartenance issue de lalogique floue peut ecirctre vue comme une densiteacute de probabiliteacutenon normaliseacutee

Les variances et covariances intraspeacutecifiques des traits (ras-sembleacutes dans la matrice carreacutee 119904 de dimension 119905 pour chaqueespegravece 119904) sont neacutecessaires La fonction drsquoappartenance de lrsquoes-pegravece 119904 dans lrsquoespace des traits est pour le vecteur T de valeurde lrsquoensemble des traits

119891119904(T) = 119890minus 12 (TminusT119904)⊤minus1

119904 (TminusT119904) (72)

La richesse fonctionnelle est lrsquointeacutegrale des valeurs maxi-males de 119891119904 dans lrsquoensemble de lrsquoespace des traits

FR119868119898 = int max119904

(119891119904(T)) 119889T (73)

Apregraves transformation de la matrice de distance en dendro-gramme fonctionnel eacuteventuellement sous la forme drsquoun arbre-consensus10 la longueur totale des branches FD11 est uneautre mesure de richesse multidimensionnelle

Equitabiliteacute fonctionnelleLrsquoeacutequitabiliteacute fonctionnelle ou reacutegulariteacute12 rend compte

de lrsquohomogeacuteneacuteiteacute de lrsquooccupation des nichesLrsquoindice drsquoeacutequitabiliteacute de Mouillot et al13 que les auteurs

nomment laquo indice de reacutegulariteacute fonctionnelle raquo est inspireacute delrsquoindice drsquoeacutequitabiliteacute de Bulla (51) Crsquoest un indice unidimen-sionnel un seul trait est pris en compte Les espegraveces sont clas-seacutees par valeur croissante du trait Lrsquoeacutequitabiliteacute maximale estobtenue si lrsquoeacutecart entre deux valeurs de traits est proportionnelaux abondances cumuleacutees des deux espegraveces La statistique fon-damentale est appeleacutee eacutequitabiliteacute pondeacutereacutee (weighted even-ness) Pour lrsquointervalle entre lrsquoespegravece 119904 et lrsquoespegravece 119904 + 1

EW119904 = 119879119904+1 minus 119879119904119873119904+1 + 119873119904

14S Villeacuteger et al laquo New Multi-dimensional Functional Diversity In-dices for a Multifaceted Frameworkin Functional Ecology raquo In Ecolo-gy 898 (2008) p 2290-2301 doi 10189007-12061

15Clarke et Warwick laquo A FurtherBiodiversity Index Applicable to Spe-cies Lists Variation in TaxonomicDistinctness raquo cf note 3 p 25

16B Meacuterigot et J-C Gaert-ner laquo Incorporation of Phylogeny inBiological Diversity Measurement Drawbacks of Extensively Used In-dices and Advantages of Quadra-tic Entropy raquo In BioEssays 3311(2011) p 819-822 doi 101002bies201100103

17N W H Mason et al laquo AnIndex of Functional Diversity raquo In Journal of Vegetation Science 144(2003) p 571-578 doi 101111j1654-11032003tb02184x

18B Walker et al laquo Plant Attri-bute Diversity Resilience and Eco-system Function The Nature andSignificance of Dominant and Mi-nor Species raquo In Ecosystems 22(1999) p 95-113 doi 10 1007 s100219900062

Cette valeur est normaliseacutee PEW119904 = EW119904sum119904 EW119904 Savaleur de PEW119904 attendue pour le maximum drsquoeacutequitabiliteacute est1(119878 minus 1) Lrsquoindice est celui de Bulla appliqueacute aux 119878 minus 1 in-tervalles entre espegraveces

FE119904 =119878minus1sum119904=1

min(PEW119904 1119878 minus 1) (75)

Lrsquoindice FE119904 a eacuteteacute eacutetendu pour ecirctre multidimensionnel parVilleacuteger et al14 Lrsquoarbre recouvrant de longueur minimum (mi-nimum spanning tree) est drsquoabord calculeacute agrave partir des distanceseuclidiennes entre les espegraveces dans lrsquoespace des traits il srsquoagitde lrsquoarbre de longueur totale minimale reliant tous les pointsLa longueur des branches est ensuite traiteacutee de la mecircme faccedilonque 120575119879119904 preacuteceacutedemment

Un autre indice Λ+15 mesure la variance des distancesentre paires drsquoespegraveces

Λ+ =sum119904 sum119905 (119889119904119905 minus 119889)2

119878 (119878 minus 1) (76)

Comme le montrent Meacuterigot et Gaertner16 les mesures dereacutegulariteacute nrsquoont absolument pas les mecircmes proprieacuteteacutes que lesmesures de diversiteacute elles peuvent par exemple augmenterquand on retire des espegraveces originales

Divergence fonctionnelle

Les mesures de divergence fonctionnelle deacutecrivent la varia-biliteacute de position des espegraveces dans lrsquoespace des traits Ce sonttout simplement des mesures de diversiteacute au sens classique duterme

Quand un seul trait est consideacutereacute la mesure la plus simpleest sa variance Mason et al17 effectuent une transformationlogarithmique de la valeur du trait et pondegraverent le calcul dela variance par les probabiliteacutes 119901119904 Ils transforment finalementle reacutesultat en son arc-tangente pour qursquoil soit compris entre 0et 1

Schleuter et al proposent drsquoutiliser la diffeacuterence entre letroisiegraveme et le premier quartile de la valeur du trait normali-seacutee par son eacutetendue maximale possible

FAD a eacuteteacute proposeacute par B Walker et al18 agrave partir drsquounematrice de distances dans lrsquoespace des traits 119889119904119905 est la dis-tance entre deux espegraveces indiceacutees par 119904 et 119905 alors

FAD = sum119904

sum119905

119889119904119905 (77)

19D Schmera et al laquo A Measurefor Assessing Functional Diversity inEcological Communities raquo In Aqua-tic Ecology 431 (2009) p 157-167doi 101007s10452-007-9152-9

20G D Kader et M Perry laquo Va-riability for Categorical Variables raquoIn Journal of Statistics Education152 (2007) doi 10108010691898200711889465

21Villeacuteger et al cf note 14

FAD est tregraves sensible au nombre drsquoespegraveces Sa version nor-maliseacutee MFAD19 est

MFAD = sum119904 sum119905 119889119904119905119878 (78)

Les deux indices violent lrsquoaxiome de jumelage Agrave un facteurde normalisation pregraves ce sont des cas particuliers de lrsquoindicede Rao pour des effectifs eacutegaux

Le calcul sous R est immeacutediat avec un arbre au for-mat phylog du package ade4 Un arbre au format phylodu package ape neacutecessite une conversion la fonctionPreprocessTree du package entropart la reacutealise

phyTree lt- Paracou618Taxonomy La conversion ashclust() double les distances Il faut donc les diviser par deuxphyTree$edgelength lt- phyTree$edgelength2library(ape)

Attaching package ape

The following objects are masked from packagespatstatgeom edges rotate

Conversion au format hclusthTree lt- ashclustphylo(phyTree) Conversion au format phyloglibrary(ade4)

Attaching package ade4

The following object is masked from packagespatstatgeom disc

Tree lt- hclust2phylog(hTree) Tree$Wdist contient les valeurs de sqrt(2distance)(FAD lt- sum(Tree$Wdist^22))

[1] 264159

(MFAD lt- FADlength(Tree$leaves))

[1] 6215506

Kader et Perry20 regroupent les valeurs de trait par cateacute-gories et calculent lrsquoentropie de Simpson des cateacutegories

Enfin Villeacuteger et al21 utilisent la distance euclidiennemoyenne des espegraveces au centre de graviteacute de la communauteacuteplutocirct que la variance Preacuteciseacutement le centre de graviteacute dela communauteacute (sans pondeacuteration par les freacutequences) est

22E Laliberteacute et P Legendrelaquo A Distance-Based Framework forMeasuring Functional Diversity fromMultiple Traits raquo In Ecology 911(2010) p 299-305 doi 10189008-22441

23Villeacuteger et al laquo New Multidi-mensional Functional Diversity In-dices for a Multifaceted Frameworkin Functional Ecology raquo cf note 14p 112

24D P Faith laquo Threatened Spe-cies and the Potential Loss of Phylo-genetic Diversity Conservation Sce-narios Based on Estimated ExtinctionProbabilities and Phylogenetic RiskAnalysis raquo In Conservation Biology226 (2008) p 1461-70 doi 101111j 1523- 1739 2008 01068 x PMID 18798854

25Vane-Wright et al laquo What toProtect mdashSystematics and the Ago-ny of Choice raquo cf note 6 p 101

26N J Isaac et al laquo Mammals onthe EDGE Conservation PrioritiesBased on Threat and Phylogeny raquo In PLoS ONE 23 (2007) e296 doi 101371journalpone0000296

calculeacute La distance euclidienne de lrsquoespegravece 119904 au centre degraviteacute est 119889119866119904 la moyenne pour toutes les espegraveces 119889119866Lrsquoeacutecart moyen des individus de la communauteacute agrave la distancemoyenne est Δ119889 = sum119904 119901119904(119889119866119904 minus 119889119866) Lrsquoeacutecart moyen absoluest Δ|119889| = sum119904 119901119904|119889119866119904 minus 119889119866|

Lrsquoindice estFD119898 = Δ119889 + 119889119866

Δ|119889| + 119889119866 (79)

Sa forme lui permet drsquoecirctre compris entre 0 et 1Laliberteacute et P Legendre22 geacuteneacuteralisent FD119898 en proposant

lrsquousage de nrsquoimporte quelle dissimilariteacute entre espegraveces obtenueagrave partir de la meacutethode de Gower (vue en section 63) auto-risant des variables qualitatives et des donneacutees manquantesau-delagrave de la seule distance euclidienne entre traits quantita-tifs Ils fournissent le package FD pour calculer leur indiceFDis et ceux de Villeacuteger et al23

72 Originaliteacute richesse et eacutequitabiliteacutephylogeacuteneacutetique

La litteacuterature de la diversiteacute phylogeacuteneacutetique srsquoest inteacuteres-seacutee tocirct agrave lrsquooriginaliteacute taxonomique des espegraveces parce que lesquestions traiteacutees concernaient la conservation concerneacutee parla valeur de lrsquoheacuteritage eacutevolutif24

Mesures speacutecifiques drsquooriginaliteacuteVane-Wright et al25 deacutefinissent la distinction taxonomique

(taxonomic distinctness) TD119904 de chaque espegravece comme lrsquoin-verse du nombre de noeuds entre elle et la racine de lrsquoarbrephylogeacuteneacutetique normaliseacute pour que sum119904 TD119904 = 1 Dans lrsquoarbrede la figure 72 les valeurs de TD non normaliseacutees sont 12pour les deux premiegraveres espegraveces et 13 pour les trois autres laracine de lrsquoarbre est comptabiliseacutee dans le nombre de noeudsLes valeurs de TD119904 sont respectivement 14 et 16 apregraves nor-malisation

Fig 72 Arbre phylogeacuteneacutetique oufonctionnel hypotheacutetique Lrsquoarbre

comprend 5 espegraveces dont lesprobabiliteacutes sont noteacutees 119901119904 3

peacuteriodes de dureacutees 119879119896 deacutelimiteacuteespar les noeuds Les branches sontnoteacutees 119887 et indiceacutees par la peacuteriodeagrave laquelle elles se terminent et un

numeacutero drsquoordre

1198791 1199011 1199015 1199012 1199013 1199014

1198792

1198793 b31

b11 b12 b13 b14 b15

La particulariteacute eacutevolutive26 (evolutive distinctiveness ED119904)

72 Originaliteacute richesse et eacutequitabiliteacute phylogeacuteneacutetique 115

27C Ricotta laquo A Parametric Di-versity Measure Combining the Rela-tive Abundances and Taxonomic Dis-tinctiveness of Species raquo In Diver-sity and Distributions 102 (2004)p 143-146 doi 101111j1366-9516200400069x

29H-P Weikard et al laquo Diversi-ty Measurement Combining RelativeAbundances and Taxonomic Distinc-tiveness of Species raquo In Diversityand Distributions 122 (2006) p 215-217 doi 101111j1366-9516200600234x

30C Ricotta laquo Strong Require-ments for Weak Diversities raquo In Di-versity and Distributions 122 (2006)p 218-219 doi 101111j1366-9516200500233x

de lrsquoespegravece 119904 est la somme de la longueur des branches qui larelient agrave la racine de lrsquoarbre partageacutees entre tous les descen-dants de chaque branche Pour lrsquoespegravece 3 de la figure 72 ED3est eacutegal agrave 119897(11988713) la longueur de la branche terminale propre agravelrsquoespegravece 3 plus un tiers de la longueur de la branche qui reliela racine de lrsquoarbre agrave la polytomie dont lrsquoespegravece 3 est issueClairement la diversiteacute phylogeacuteneacutetique PD (section 75) estla somme des particulariteacutes eacutevolutives de toutes les espegraveces delrsquoarbre

Originaliteacute taxonomique de Ricotta

1 10 100Taille de leacutechantillon

pegravece

Fig 73 Contribution des espegravecesagrave lrsquoindice de Hurlbert Lescontributions de 4 espegraveces drsquounecommunauteacute agrave lrsquoindice sontrepreacutesenteacutees en fonction de la taillede lrsquoeacutechantillon 119899 Les freacutequencesdes espegraveces sont lisibles pour119899 = 1 une espegravece freacutequente(probabiliteacute eacutegale agrave 07 supeacuterieureagrave 1119878) deux espegraveces peufreacutequentes (019 et 01) et uneespegravece rare (001) Quand 119899 estassez grand toutes lescontributions tendent vers1119878 = 14 (ligne horizontale)

Ricotta27 construit un indice parameacutetrique (permettant dedonner plus ou moins drsquoimportance aux espegraveces rares) agrave partirde lrsquoespeacuterance du nombre drsquoespegraveces tireacutees dans un eacutechantillonde taille 119899 fixeacutee (lrsquoindice de S H Hurlbert28)

120124 (119878119899) = sum119904

[1 minus (1 minus 119901119904)119899] (710)

Ricotta pondegravere cette espeacuterance par lrsquooriginaliteacute taxono-mique de chaque espegravece noteacutee 119908119904 et normalise la mesure

119899119879 = sum119904 119908119904 [1 minus (1 minus 119901119904)119899]120124 (119878119899) (711)

Lrsquooriginaliteacute taxonomique est deacutefinie comme la distancephylogeacuteneacutetique moyenne entre lrsquoespegravece 119904 et les autres 119908119904 =sum119904 119889119904119905(119878 minus 1)

Weikard et al29 montrent que cette deacutefinition de 119908119904 nepermet pas de satisfaire lrsquoaxiome de monotoniciteacute drsquoensembleLa deacutefinition correcte de 119908119904 = sum119904 119889119904119905 valideacutee par Ricotta30

Lrsquointerpreacutetation de 119899119879 est plus intuitive en inversant lalogique de sa construction

31Warwick et Clarke laquo New rsquobio-diversityrsquo Measures Reveal a Decreasein Taxonomic Distinctness with In-creasing Stress raquo cf note 7 p 101

32M R Helmus et al laquo Phy-logenetic Measures of Biodiversity raquoIn The American naturalist 1693(2007) E68-83 doi 101086511334

33Felsenstein laquo Phylogenies andthe Comparative Method raquo cfnote 34 p 105

119908119904 est lrsquooriginaliteacute de lrsquoespegravece 119904 [1 minus (1 minus 119901119904)119899]120124(119878119899) estla contribution de lrsquoespegravece 119904 agrave lrsquoespeacuterance du nombre drsquoespegravecescomprise entre 0 et 1 119899119879 est donc lrsquooriginaliteacute moyenne desespegraveces de la communauteacute pondeacutereacutee par la contribution dechaque espegravece agrave lrsquoespeacuterance du nombre drsquoespegraveces observeacute dansun eacutechantillon de taille 119899 Cette contribution est preacutesenteacutee enfigure 73

Quand 119899 = 1 crsquoest simplement la freacutequence des espegravecesQuand 119899 augmente le poids des espegraveces freacutequentes (dont laproabiliteacute est supeacuterieure agrave 1

119878 ) diminue alors que celui des es-pegraveces intermeacutediaires augmente Ce dernier atteint 1120124(119878119899)(une espegravece est eacutechantillonneacutee agrave coup sucircr degraves que lrsquoeacutechantillonest assez grand) drsquoautant plus rapidement que 119901119904 est grand Ilbaisse ensuite alors que les espegraveces rares atteignent agrave leur tourprogressivement leur poids maximal

Quand 119899 rarr +infin le numeacuterateur tend vers FAD et le deacuteno-minateur tend vers le nombre drsquoespegraveces 119899119879 tend vers MFAD

Ps lt- c(07 019 01 001)S lt- length(Ps)nRange lt- 1500 Indice de HurlbertESn lt- c(1 sapply(nRange[-1] function(n) Hurlbert(Ps n))) Preacuteparation du graphiqueXlab lt- Taille de leacutechantillonYlab lt- Contribution des espegraveces Contribution de chaque espece agrave chaque valeur de nCsn lt- sapply(1S function(s) sapply(nRange

function(n) (1-(1-Ps[s])^n))ESn) Dataframe contenant les donneacuteesdf lt- asdataframe(cbind(nRange Csn))colnames(df) lt- c(n s07 s019 s01 s001) GraphiqueESnplot lt- ggplot(gather(df Sp Contribution -n) aes(x=n)) +

geom_line(aes(y = Contribution lty=Sp)) +geom_hline(yintercept=14 col=red) +scale_x_log10() +labs(x = Xlab y = Ylab) +theme(legendposition = none)

ESnplot

Richesse phylogeacuteneacutetiqueLa particulariteacute taxonomique moyenne31 (Average Taxo-

nomic Distinctiveness AvTD) est la distance moyenne danslrsquoarbre entre deux espegraveces choisies au hasard Crsquoest donc lrsquoeacutequi-valent taxonomique de MFAD La variabiliteacute phylogeacuteneacutetiquedes espegraveces32 (Phylogenetic Species Variability PSV ) est lamecircme mesure obtenue agrave partir du modegravele drsquoeacutevolution sui-vant un mouvement brownien33 La distance moyenne entredeux espegraveces est dans ce cadre proportionnelle agrave la covariancede leurs traits fonctionnels La richesse phylogeacuteneacutetique des es-pegraveces PSR est PSV multiplieacutee par le nombre drsquoespegraveces crsquoestlrsquoeacutequivalent taxonomique de FAD

34M W Cadotte et al laquo Phylo-genetic Diversity Metrics for Ecolo-gical Communities Integrating Spe-cies Richness Abundance and Evolu-tionary History raquo In Ecology Letters131 (2010) p 96-105 doi 101111j1461-0248200901405x

La diversiteacute FD de Faith (section 75) eacutegale agrave la somme deslongueurs des branches de lrsquoarbre semble avoir fait consensusdrsquoougrave un moindre deacuteveloppement des mesures de richesse quedans la litteacuterature fonctionnelle

Indices de CadotteCadotte et al34 proposent un ensemble de mesure phylo-

geacuteneacutetiques eacutequitabiliteacute deacuteseacutequilibre drsquoabondance et diversiteacutede la particulariteacute evolutive

Equitabiliteacute phylogeacuteneacutetique

Les branches terminales de lrsquoarbre phylogeacuteneacutetique sontici agrave la base de la deacutefinition de lrsquoeacutequitabiliteacute figure 74 lesbranches 1198871119904 sont les segments termineacutes par une feuille (aubas de lrsquoarbre) crsquoest-agrave-dire que leur longueur est la partiede lrsquoarbre que les espegraveces ne partagent pas La mesuredrsquoeacutequitabiliteacute est

PAE = PD + sum119904 119897(1198871119904)(119899119904 minus 1)PD + ( 119899

119878 minus 1) sum119904 119897(1198871119904) (712)

1198791 1199011 1199015 1199012 1199013 1199014

1198792

1198793 b31

b11 b12 b13 b14 b15

Fig 74 Arbre phylogeacuteneacutetique oufonctionnel hypotheacutetique

PAE vaut 1 quand les espegraveces sont sont distribueacutees eacutequita-blement pour la longueur des branches Une valeur plus grandeest obtenue quand les espegraveces sont concentreacutees au bout deslongues branches et inversement si 0 lt PAE lt 1

Deacuteseacutequilibre drsquoabondance

Lrsquoeacutequilibre drsquoabondance est deacutefini par une distributionaleacuteatoire des espegraveces par division de lrsquoeffectif total agrave partirde la racine de lrsquoarbre phylogeacuteneacutetique En figure 74 enpartant de la racine la moitieacute des individus est supposeacutee sereacutepartir sur chaque branche Agrave la peacuteriode 2 les effectifs dela branche de gauche se partagent en deux parties eacutegales Agravepartir du nombre total drsquoindividus de la communauteacute 119899 lenombre attendu drsquoindividus 1198990

119904 de lrsquoespegravece 119904 est une fractionde 119899 correspondant au nombre de noeuds et au nombre debranches partant de chaque noeud On note 119910119896119904 le nombre

de branches partant du noeud ancestral de lrsquoespegravece 119904 agrave lapeacuteriode 119896 srsquoil existe 119910119896119904 = 1 sinon

1198990119904 = 119899

prod119870119896=2 119910119896119904

En figure 74 pour lrsquoespegravece 3 11991013 = 3 (lrsquoespegravece est issuedrsquoune polytomie) 11991023 = 1 (absence de noeud) et 11991033 = 2 (laracine de lrsquoarbre est dichotomique) On srsquoattend donc agrave ce quelrsquoespegravece 3 soit repreacutesenteacutee par un sixiegraveme des individus

Lrsquoindice de deacuteseacutequilibre drsquoabondance mesure lrsquoeacutecart agrave cettedistribution theacuteorique

IAC = sum119904 |119899119904 minus 1198990119904|

120584 (714)

120584 est le nombre de noeuds de lrsquoarbre (3 dans lrsquoexemple dela figure 74)

Diversiteacute de la particulariteacute eacutevolutive

Lrsquoentropie de Shannon peut ecirctre appliqueacutee pour mesurerla diversiteacute des particulariteacutes eacutevolutives

119867ED = minus sum119904

ED119904PD ln ED119904

PD (715)

Lrsquoeacutequitabiliteacute des particulariteacutes eacutevolutives est celle de Pie-lou

119864ED = 119867EDln 119878 (716)

Ces mesures ne prennent pas en compte les abondancesdes espegraveces Pour y remeacutedier il suffit drsquoajouter une peacuteriodede dureacutee nulle agrave chaque feuille de lrsquoarbre correspondant agrave unepolytomie entre les 119899119904 individus de chaque espegravece La particu-lariteacute eacutevolutive AED119904 des individus de lrsquoespegravece 119904 est calculeacuteeen partageant la longueur de chaque branche ancestrale entrele nombre drsquoindividus qui en descendent (et non le nombredrsquoespegraveces) Alors PD = sum119904 119899119904AED119904 Lrsquoentropie devient

119867AED = minus sum119904

119899119904AED119904PD ln 119899119904AED119904

PD (717)

et lrsquoeacutequitabiliteacute correspondante est

119864AED = 119867AEDln 119873 (718)

Ces indices ne mesurent pas la diversiteacute phylogeacuteneacutetique ausens des autres mesures preacutesenteacutees dans ce chapitre Ils me-surent la diversiteacute de le particulariteacute eacutevolutive autrement dit

73 Diversiteacute de Scheiner 119

35S M Scheiner laquo A Metric ofBiodiversity That Integrates Abun-dance Phylogeny and Function raquo In Oikos 1218 (2012) p 1191-1202doi 101111j1600-0706201220607x

36S J Presley et al laquo Evalua-tion of an Integrated Framework forBiodiversity with a New Metric forFunctional Dispersion raquo In PloS one98 (2014) e105818 doi 10 1371 journalpone0105818

du temps drsquoeacutevolution accumuleacute par chaque espegravece ou chaqueindividu Pour un nombre drsquoespegraveces fixeacute 119864ED atteint son maxi-mum quand les valeurs de ED119904 sont toutes identiques Unarbre phylogeacuteneacutetique composeacute drsquoune seule branche depuis laracine termineacute par une polytomie de longueur nulle portanttoutes les espegraveces correspond agrave cette description Dans cetexemple les espegraveces ont une divergence eacutevolutive nulle mais119864ED = 119878 son maximum possible

73 Diversiteacute de Scheiner

Scheiner35 deacuteveloppe un cadre unifieacute pour mesurer la diver-siteacute speacutecifique phylogeacuteneacutetique ou fonctionnelle seacutepareacutement ousimultaneacutement Lrsquoideacutee geacuteneacuterale est que toute quantiteacute parta-geacutee par les espegraveces (le nombre drsquoindividus le temps drsquoeacutevolutionaccumuleacute la taille des niches eacutecologique) peut ecirctre traduite ennombre de Hill

La diversiteacute speacutecifique est simplement 119902119863 Scheiner la note119902119863(119860) pour diversiteacute drsquoabondance

La diversiteacute phylogeacuteneacutetique 119902119863(119875) ne prend pas en compteles abondances mais mesure la diversiteacute de la divergence eacutevo-lutive des espegraveces La divergence totale dans un arbre phylogeacute-neacutetique (pas forceacutement ultrameacutetrique) est la longueur totaledes branches (crsquoest-agrave-dire FD) Elle est reacutepartie entre toutesles espegraveces la longueur de chaque branche (repreacutesentant unequantiteacute drsquoeacutevolution) est partageacutee agrave parts eacutegales entre les es-pegraveces qui en descendent La divergence de lrsquoespegravece 1 de lafigure 77 est 119879 1 + 119879 2 la longueur de la branche terminaleplus 119879 32 parce que la branche est partageacutee par les espegraveces 1et 2 La divergence de lrsquoespegravece 1 est donc 1198711 = 119879 1+119879 2+119879 32La part de la divergence de lrsquoespegravece 119904 est 119897119904 = 119871119904119865119863 La di-versiteacute phylogeacuteneacutetique est le nombre de Hill des divergences

119902119863 = (119878

sum119904=1

119897119902119904)1

1minus119902

La diversiteacute fonctionnelle 119902119863(119865) est la diversiteacute des taillesdes niches La taille de la niche est deacutefinie par Scheiner commele volume de lrsquohypersphegravere (dans lrsquoespace des traits fonction-nels de dimension 119898) centreacutee sur chaque espegravece dont le rayonest la moitieacute de la distance agrave lrsquoespegravece la plus proche pourque les sphegraveres ne se superposent pas Une meilleure deacutefini-tion36 de la taille de la niche est la somme des distances auxautres espegraveces 119905119904 = sum119905 119889119904119905 La part de chaque espegravece est119891119904 = 119905119904sum119905 119905119905 et la deacutefinition de la diversiteacute fonctionnelle est

119902119863(119879 ) = (119878

sum119904=1

119891119902119904 )

11minus119902

La diversiteacute peut prendre en compte plusieurs com-posantes pas exemple lrsquoabondance et la phylogeacutenie pourdeacutefinir

119902119863(119860119875) = (119878

sum119904=1

( 119899119904119871119904sum119878

119905=1 119899119905119871119905)

119902

1minus119902

La diversiteacute drsquoabondance et phylogeacuteneacutetique est la diversi-teacute des divergences pondeacutereacutees par les effectifs des espegraveces Lamesure de biodiversiteacute de Scheiner incluant les trois compo-santes est

119902119863(119860119875119865) = (119878

sum119904=1

( 119899119904119871119904119905119904sum119878

119905=1 119899119905119871119905119905119905)

119902

1minus119902

Son interpreacutetation est moins immeacutediate Chaque espegravece estassocieacutee agrave une fraction drsquoune des trois dimensions de la diver-siteacute (abondance temps drsquoeacutevolution cumuleacute taille des niches)Elle occupe un paralleacuteleacutepipegravede de dimensions (119901119904 119897119904 119891119904) dansle cube de dimension 1 qui les contient toutes Cette repreacutesen-tation ne donne pas drsquoimportance particuliegravere agrave lrsquoabondanceet peut ecirctre appliqueacutee agrave un nombre quelconque de dimensionsLa mesure de biodiversiteacute est la diversiteacute des volumes occupeacutespar les espegraveces normaliseacutes par leur somme (qui nrsquoest pas eacutegaleagrave 1)

En se limitant agrave deux dimensions pour la lisibiliteacute la fi-gure 75 preacutesente les rectangles correspondant agrave la diversi-teacute drsquoabondance et fonctionnelle occupeacutes par les espegraveces dela meacuteta-communauteacute Paracou618 classeacutees par freacutequences deacute-croissantes

Code R

ProbabiliteacutesPs lt- Paracou618MC$Ps[Paracou618MC$Psgt0]Ps lt- sort(Ps decreasing = TRUE) Freacutequences cumuleacuteesPsCum lt- cumsum(Ps)Xgauche lt- c(0 PsCum)Xdroite lt- c(PsCum 1) Matrice de distances fonctionnellesDistanceMatrix lt- asmatrix(Paracou618dist) Mise en correspondance de la matrice et du vecteur de probabiliteacutesDistanceMatrix lt- DistanceMatrix[names(Ps) names(Ps)] Taille des nichests lt- rowSums(DistanceMatrix)fs lt- tssum(ts)

000 025 050 075 100Freacutequence

Fig 75 Rectangles de surfacefreacutequence times taille de niche desespegraveces de la meacuteta-communauteacuteParacou618 La diversiteacute deScheiner 119902119863(119860119865) est la diversiteacutede leur surface

Freacutequences cumuleacuteesfsCum lt- cumsum(fs)Ybas lt- c(0 fsCum)Yhaut lt- c(fsCum 1) Rectangles occupeacutes par chaque espegraveceggplot(dataframe(Xgauche Ybas Xdroite Yhaut)) +

geom_rect(aes(xmin= Xgauche xmax= Xdroite ymin= Ybas ymax= Yhaut)color = black fill = white) +

coord_fixed() +labs(x = Freacutequence y=Niche)

La diversiteacute drsquoabondance et fonctionnelle est la diversiteacutede la surface des rectangles

Surface lt- Ps fsRs lt- Surfacesum(Surface)Diversity(Rs q = 2)

None 7172482

Le profil de diversiteacute drsquoabondance et fonctionnelle est enfigure 76

teacute

Fig 76 Profil de diversiteacutedrsquoabondance et fonctionnelle deScheiner de la meacuteta-communauteacuteParacou618 Pointilleacutes longs diversiteacute drsquoabondance pointilleacutescourts diversiteacute fonctionnelle trait plein diversiteacute drsquoabondanceet fonctionnelle

37A R Solow et Polasky laquo Mea-suring Biological Diversity raquo cfnote 45 p 107

Code R

autoplot(CommunityProfile(Diversity Rs)xlab=Ordre de diversiteacute ylab=Diversiteacute) +

geom_line(data = asdataframelist(CommunityProfile(Diversity Ps))mapping = aes(x y) lty = 2) +

geom_line(data = asdataframelist(CommunityProfile(Diversity fs))mapping = aes(x y) lty=3)

La notion de diversiteacute phylogeacuteneacutetique ou fonctionnelle trai-teacutee par Scheiner est assez diffeacuterente de celles vues preacuteceacutedem-ment parce qursquoelle considegravere toutes les dimensions de faccedilonsymeacutetrique lrsquoordre de diversiteacute 119902 srsquoapplique agrave toutes les di-mensions Si 119902 est grand les espegraveces dont le produit des dimen-sions de la diversiteacute est petit (que lrsquoespegravece soit rare ait unedivergence phylogeacuteneacutetique faible ou une niche eacutetroite) sont neacute-gligeacutees alors que 119902 nrsquoaffecte que la freacutequence dans le cadre dela phylodiversiteacute 119902 ou la banaliteacute pour 119902119863Z

74 Diversiteacute de Solow et PolaskyA R Solow et Polasky37 relient la richesse fonctionnelle ou

phylogeacuteneacutetique agrave la probabiliteacute de trouver au moins une espegraveceinteacuteressante (par exemple capable de fournir une moleacuteculeutile) dans une communauteacute

Les distances entre espegraveces sont supposeacutees connuesqursquoelles soient fonctionnelle phylogeacuteneacutetique ou autre Laprobabiliteacute qursquoune espegravece quelconque soit inteacuteressante estfixeacutee agrave 119901 par exemple agrave partir de lrsquoexpeacuterience passeacutee (si uneespegravece cribleacutee sur 100 fournit une moleacutecule utile 119901 = 1) Enabsence drsquoinformation sur les espegraveces 119901 est a priori identiquepour toutes mais on suppose une correacutelation entre les probabi-liteacutes deacutependant de la distance entre les espegraveces Formellementune fonction de similariteacute entre les espegraveces 119904 et 119905 est deacutefinie 119911119904119905 = 119891(119889119904119905) Cette fonction est deacutecroissante entre 1 (quandla distance est nulle) et 0 (agrave distance infinie) par exemple119891(119889119904119905) = 119890minus119906119889119904119905 ougrave 119906 est une constante strictement positiveLa matrice Z reacuteunit les eacuteleacutements 119911119904119905

On deacutefinit ensuite la variable de Bernoulli 119861119904 (drsquoespeacuterance119901119904) qui vaut 1 si lrsquoespegravece 119904 est inteacuteressante 119911119904119905 est parconstruction du modegravele la correacutelation entre 119861119904 et 119861119905 deux espegraveces tregraves proches ont la mecircme probabiliteacute drsquoecirctreinteacuteressante deux espegraveces tregraves eacuteloigneacutees ont des probabiliteacutesindeacutependantes La probabiliteacute qursquoau moins une espegravece soitinteacuteressante est minoreacutee par 11990121prime

119878Zminus11119878 ougrave 1119878 est le vecteurde longueur 119878 ne contenant que des 1 prime indique la transposeacuteeet Zminus1 est la matrice inverse de Z (son existence est garantiepuisque Z est une matrice de variance-covariance) La valeurde 119901 est incertaine et sans grand inteacuterecirct

75 FD et PD 123

38D P Faith laquo ConservationEvaluation and Phylogenetic Diver-sity raquo In Biological Conservation611 (1992) p 1-10 doi 1010160006-3207(92)91201-3

39Petchey et Gaston laquo Functio-nal Diversity (FD) Species Richnessand Community Composition raquo cfnote 11 p 111

40D Sol et al laquo Urbanisation andthe Loss of Phylogenetic Diversityin Birds raquo In Ecology Letters 20(2017) p 721-729 doi 101111ele12769

119881 = 1prime119878Zminus11119878 est la mesure de diversiteacute de Solow et Po-

lasky Elle rend compte de la dispersion des espegraveces moinsles espegraveces sont similaires plus la probabiliteacute que lrsquoune drsquoelleau moins soit inteacuteressante est eacuteleveacutee conditionnellement aunombre drsquoespegraveces et agrave 119901 Si les espegraveces sont infiniment eacuteloi-gneacutees les unes des autres Z est la matrice identiteacute et la di-versiteacute est eacutegale agrave la richesse 119881 est donc un nombre effectifdrsquoespegraveces crsquoest-agrave-dire le nombre drsquoespegraveces totalement dissimi-laires neacutecessaires pour obtenir la diversiteacute observeacutee Agrave lrsquoopposeacutesi toutes les espegraveces sont identiques Z ne contient que des 1et la diversiteacute vaut 1

75 FD et PD

1198791 119896 =1

119896 = 2 119896 = 119870 = 3 1198713 = 2 1198712 = 3

1198711 = 119878 = 5 1199011

11990631= 1199011 + 1199012

1199015 1199012 1199013 1199014

11990632= 1199013 + 1199014 + 1199015

11990622= 1199012

11990621= 1199011

11990623= 1199013 + 1199014 + 1199015

1199061119904 = 119901119904

1198793 1198792

1198792

1198793 (a)

(b) (c)

Fig 77 Arbre phylogeacuteneacutetique oufonctionnel hypotheacutetique (a)Arbre complet 5 espegraveces sontpreacutesentes (119878 = 5) Une peacuteriode delrsquoarbre est deacutefinie entre deuxnoeuds successifs lrsquoarbre contient119870 = 3 peacuteriodes Les hauteurs despeacuteriodes sont noteacutees 119879119896 Agrave chaquepeacuteriode correspond un arbre plussimple (b) pour la peacuteriode 2 (c)pour la peacuteriode 3 dans lequel lesespegraveces originales sont regroupeacuteesLe nombre de feuilles de ces arbresest noteacute 119871119896 Les probabiliteacutes pourun individu drsquoappartenir agrave unefeuille sont noteacutees 119906119896119897

Si la dissimilariteacute entre les espegraveces est repreacutesenteacutee par undendrogramme les indices de diversiteacute les plus simples sontla diversiteacute phylogeacuteneacutetique38 et sa transposition la diversiteacutefonctionnelle39

Eacutetant donneacute un arbre contenant toutes les espegraveces ou tousles individus eacutetudieacutes PD ou FD sont eacutegaux agrave la somme de lalongueur des branches (figure 77 PD = 5 times 1198791 + 3 times 1198792 +2 times 1198793) Si les noeuds de lrsquoarbre phylogeacuteneacutetique sont dateacutesPD peut ecirctre consideacutereacute comme une accumulation de tempsdrsquoeacutevolution par la communauteacute eacutetudieacutee Sol et al40 montrentpar exemple que les milieux urbaniseacutes ont un deacuteficit de 450millions drsquoanneacutees drsquoeacutevolution dans les communauteacutes drsquooiseauxrelativement aux environnements naturels voisins

Dans le cas particulier ou toutes les branches sont de lon-gueur 1 crsquoest-agrave-dire que toutes les espegraveces sont lieacutees agrave la mecircmeracine (on dira que lrsquoarbre est parfaitement reacutegulier) PD etFD sont eacutegales agrave la richesse speacutecifique

Le package entropart fournit la fonction PDFD Vecteur des probabiliteacutesPs lt- Paracou618MC$PsPDFD(Ps Paracou618Taxonomy)

41A Chao et al laquo Rarefaction andExtrapolation of Phylogenetic Diver-sity raquo In Methods in Ecology andEvolution 64 (2015) p 380-388 doi 1011112041-210X12247

42Weitzman laquo On Diversity raquo cfnote 46 p 107

43M L Weitzman laquo What to Pre-serve An Application of DiversityTheory to Crane Conservation raquo In The Quarterly Journal of Economics1081 (1993) p 157-183 doi 10 23072118499 JSTOR 2118499

44L Witting et V Loeschckelaquo The Optimization of Biodiversi-ty Conservation raquo In BiologicalConservation 712 (1995) p 205-207doi 1010160006-3207(94)00041-N

None 395

Chao et al41 fournissent un estimateur de PD (ou FD)permettant de lrsquoestimer sans biais pour un eacutechantillon pluspetit que celui observeacute et de faccedilon fiable pour un eacutechantillonde taille double au maximum Ces estimateurs permettent detracer des courbes de rareacutefaction et drsquoextrapolation

En mecircme temps que Faith Weitzman42 a eacutetabli une fonc-tion de diversiteacute identique agrave PD Agrave partir drsquoune matrice dedissimilariteacutes entre espegraveces un arbre est construit par la meacute-thode suivante Les deux espegraveces les plus proches sont ras-sembleacutees Lrsquoune drsquoelles celle qui diminue le moins la longueurtotale des branches de lrsquoarbre final en la retirant est lrsquoespegravecede lien lrsquoautre est lrsquoespegravece repreacutesentative du clade Lrsquoespegravecede lien est retireacutee et le regroupement poursuivi entre les deuxnouvelles espegraveces les plus proches Agrave chaque eacutetape lrsquoespegravecede lien est retireacutee jusqursquoau regroupement final entre les deuxderniegraveres espegraveces La difficulteacute est que lrsquoarbre final nrsquoest pasconnu aux premiers stades de regroupement donc tous lesarbres doivent ecirctre testeacutes pour trouver la solution unique Ladiversiteacute est la somme des distances entre les espegraveces de lien etleur espegravece repreacutesentative crsquoest-agrave-dire la longueur totale desbranches de lrsquoarbre obtenu Lrsquoapplication agrave la conservation estque les espegraveces repreacutesentatives doivent ecirctre favoriseacutees par rap-port aux espegraveces de lien en drsquoautres termes les espegraveces dontles branches sont les plus courtes dans lrsquoarbre sont celles quiapportent le moins de diversiteacute Ce reacutesultat est assez eacutevidentquand on dispose drsquoun arbre phylogeacuteneacutetique Lrsquooriginaliteacute dela meacutethode de Weitzman est de fournir un algorithme pourcreacuteer lrsquoarbre agrave partir drsquoune matrice de distances qui est coheacute-rent avec la mesure de diversiteacute appliqueacutee

La mesure de diversiteacute peut ecirctre combineacutee avec une proba-biliteacute drsquoextinction de chaque espegravece (agrave dire drsquoexpert) pour cal-culer lrsquoespeacuterance de la diversiteacute agrave une eacutecheacuteance donneacutee 43 2119878

arbres peuvent ecirctre construit en faisant disparaicirctre certainesdes 119878 espegraveces de la communauteacute la probabiliteacute de chaquearbre est calculable agrave partir des probabiliteacutes drsquoextinction dechaque espegravece (supposeacutees indeacutependantes) et lrsquoespeacuterance de di-versiteacute est simplement la moyenne des diversiteacutes de chaquearbre pondeacutereacutee par sa probabiliteacute Lrsquoespeacuterance de la perte dediversiteacute peut ecirctre calculeacutee de faccedilon plus simple44 comme lamoyenne de la longueur des branches pondeacutereacutee par la proba-biliteacute de leur disparition qui est le produit de la probabiliteacutede disparition de toutes les espegraveces descendant de la branche

Diverses optimisations eacuteconomiques sont possibles dont lechoix des espegraveces agrave proteacuteger agrave partir de lrsquoeacutelasticiteacute de la diver-

76 Indice de Rao 125

45J Izsaacutek et L Papp laquo A Linkbetween Ecological Diversity Indicesand Measures of Biodiversity raquo In Ecological Modelling 130 (2000)p 151-156 doi 10 1016 S0304 -3800(00)00203-9 K Shimatani laquo Onthe Measurement of Species DiversityIncorporating Species Differences raquoIn Oikos 931 (2001) p 135-147doi 10 1034 j 1600 - 0706 2001 930115 x Z Botta-Dukaacutet laquo RaorsquosQuadratic Entropy as a Measure ofFunctional Diversity Based on Mul-tiple Traits raquo In Journal of Vege-tation Science 165 (2005) p 533-540 doi 10 1111 j 1654 - 1103 2005 tb02393 x A Escalas et allaquo A Unifying Quantitative Frameworkfor Exploring the Multiple Facets ofMicrobial Biodiversity across DiverseScales raquo In Environmental Micro-biology 1510 (2013) p 2642-2657doi 1011111462-292012156

46Rao laquo Diversity and Dissimi-larity Coefficients A Unified Ap-proach raquo cf note 5 p 101

47S Pavoine et al laquo Measu-ring Diversity from Dissimilaritieswith Raorsquos Quadratic Entropy AreAny Dissimilarities Suitable raquo In Theoretical Population Biology 674(2005) p 231-239 doi 101016jtpb200501004

siteacute crsquoest-agrave-dire le gain de diversiteacute entraicircneacute par la diminutionde la probabiliteacute de disparition de chaque espegravece les espegravecesayant la plus grande eacutelasticiteacute sont celles sur lesquelles les ef-forts auront les plus grands reacutesultats

76 Indice de RaoLrsquoindice de Rao est une mesure de divergence pondeacutereacutee

Son utilisation srsquoest largement deacuteveloppeacutee depuis le deacutebut desanneacutees 200045 en raison de ses proprieacuteteacutes particuliegraverement in-teacuteressantes

PrincipeAgrave partir de releveacutes fournissant la freacutequence de chaque

espegravece par communauteacute et drsquoune matrice de dissimilariteacuteentre paires drsquoespegraveces lrsquoindice de Rao46 donne la dissimilariteacutemoyenne entre deux individus choisis au hasard

Lrsquoindice de Rao est souvent appeleacute laquo entropie quadratique raquoen raison de sa forme matheacutematique

FormalisationLes espegraveces sont prises deux agrave deux et sont donc noteacutees ici

119904prime et 119904PrimeOn note la matrice de dissimilariteacute dont les eacuteleacutements sont

120575119904prime119904Prime la dissimilariteacute entre lrsquoespegravece 119904prime et lrsquoespegravece 119904Prime Il nrsquoest pasneacutecessaire agrave ce stade que soit une distance p est le vecteurdes probabiliteacutes dont 119901119904prime et 119901119904Prime sont des eacuteleacutements

Lrsquoindice de Rao est

119867 (p) = sum119904prime

sum119904Prime

119901119904prime119901119904Prime120575119904prime119904Prime (723)

ProprieacuteteacutesLa deacutefinition de la distance est essentielle

bull en fixant 120575119904prime119904Prime = 1 si deux espegraveces sont diffeacuterentes on ob-tient lrsquoindice de Simpson Sa valeur peut ecirctre interpreacuteteacuteecomme la probabiliteacute qursquoune paire drsquoindividus choisie auhasard soit de deux espegraveces diffeacuterentes

bull Dans un espace unidimensionnel ougrave la valeur 119910119904 asso-cieacutee agrave lrsquoespegravece 119904 est une variable quantitative 119884 choisir120575119904prime119904Prime = (119910119896 minus 119910119897)

22 rend lrsquoindice de Rao eacutegal agrave la va-riance de 119884

Pavoine et al47 ont montreacute que lrsquoutilisation de distances

48Pavoine et al laquo Is the Origina-lity of a Species Measurable raquo cfnote 30 p 105

50S Champely et D Ches-sel laquo Measuring Biological DiversityUsing Euclidean Metrics raquo In Envi-ronmental and Ecological Statistics92 (2002) p 167-177 doi 101023A1015170104476

51S Pavoine et al laquo From Dissi-milarities among Species to Dissimila-rities among Communities A DoublePrincipal Coordinate Analysis raquo In Journal of Theoretical Biology 2284(2004) p 523-537 doi 101016jjtbi200402014

ordinaires fait que la valeur maximale de lrsquoentropie quadra-tique pour un effectif donneacute est obtenue en eacuteliminant les es-pegraveces intermeacutediaires en ne retenant que les espegraveces extrecircmes(le reacutesultat est eacutevident en une dimension la variance est maxi-male en ne retenant que les valeurs extrecircmes drsquoun eacutechantillon)Ce reacutesultat est contraire aux proprieacuteteacutes attendues drsquoun indicede diversiteacute Les auteurs ont eacutetabli que lrsquoutilisation de dis-tances ultrameacutetriques corrige ce deacutefaut Lrsquoindice atteint alorsson maximum pour des freacutequences drsquoautant plus grandes quelrsquoespegravece est originale48

Lrsquoestimation empirique de lrsquoindice se fait simplement enestimant les probabiliteacutes par les freacutequences Le biais drsquoestima-tion est tregraves faible 49 par analogie avec lrsquoestimateur de lrsquoindicede Simpson les espegraveces rares interviennent peu

Calcul sous RLe package entropart fournit la fonction Rao

Vecteur des probabiliteacutesPs lt- Paracou618MC$PsRao(Ps Paracou618Taxonomy)

None 2878133

Le package ADE4 permet le calcul avec la fonction divcqui utilise un format diffeacuterent pour les probabiliteacutes et surtoutla matrice des racines carreacutees du double des distances de lrsquoob-jet phylog (chaque eacuteleacutement de $Wdist vaut radic2120575119904prime119904Prime Cetteparticulariteacute drsquoADE4 vient de lrsquoanalyse multivarieacutee 50 lrsquoentro-pie quadratique de Rao peut ecirctre repreacutesenteacutee dans lrsquoespaceeuclidien engendreacute par une matrice de distances D entre es-pegraveces (par une Analyse en Coordonneacutees Principales PCoA)Lrsquoinertie des points repreacutesentants les espegraveces preacuteciseacutement lamoyenne des carreacutes des distances entre les espegraveces et leurcentre de graviteacute (les probabiliteacutes p des espegraveces constituentleur poids) est alors eacutegale agrave lrsquoentropie de Rao 119867 (p) ougrave lamatrice de distances est D∘22 les valeurs de valent la moi-tieacute du carreacute de celles de D Cette repreacutesentation est eacutetenduedans la double analyse en composantes principales de Pavoineet al51 section 125

Dans ADE4 les arbres phylogeacuteneacutetiques sont donc stockeacutessous la forme drsquoobjets de type phylog ougrave la matrice des dis-tances ($Wdist) est D mais les longueurs des branches delrsquoarbre ($droot) correspondent aux valeurs de

library(ade4)divc(asdataframe(Ps) Paracou618Taxonomy$Wdist)

diversity Ps 09854485

divc peut traiter plusieurs communauteacutes simultaneacutement Rao peut ecirctre utiliseacute avec la fonction apply

divc(asdataframe(Paracou618MC$Psi) Paracou618Taxonomy$Wdist)

diversity P006 09727197 P018 09794563

apply(Paracou618MC$Psi 2 Rao Tree = Paracou618Taxonomy)

P006 P018 2820856 2876405

Maximum theacuteoriquePavoine et al52 ont deacutefini lrsquooriginaliteacute drsquoune espegravece comme

sa freacutequence maximisant lrsquoentropie quadratique sachant lamatrice de distances entre espegraveces Les espegraveces les plus ori-ginales sont celles ayant le moins drsquoespegraveces proches dans laclassification

Lrsquooriginaliteacute nrsquoest pas inteacuteressante dans une taxonomie une phylogeacutenie doit ecirctre creacuteeacutee pour illustrer cette notion Lefichier raotraitscsv contient une espegravece par ligne identi-fieacutee par le champ Code et un certain nombre de valeurs detraits en colonnes

Lecture des donneacutees traits pour 34 espegravecesreadcsv2(dataraotraitscsv rownames = 1 header = T) -gt

traits

Le reacutesultat est un data frame nommeacute traits agrave 8 lignes(espegraveces) et 6 colonnes (traits)

Aperccedilutraits[14 13]

SLA Am Gm Ess 1010341 9788627 1454455 Me 1427473 6352255 1493502 S1 1371211 7357748 1963457 Sr 1071081 6803988 1305796

La matrice de distances est creacuteeacutee par classification auto-matique hieacuterarchique

ACP sur les traits foliairespcaf lt- dudipca(traits scale = T scannf = FALSE nf = 2)

pcaf (figure 78) est une liste qui contient les reacutesultats delrsquoACP agrave utiliser pour la classification

Fig 78 Analyse en composanteprincipale des traits foliaires

Eigenvalues

CAH Ward des traits foliaireshf lt- hclust(dist(pcaf$tab) wardD)

scatter(pcaf)

Fig 79 Arbre phylogeacuteneacutetiqueissu de la classification

automatique

Ess Me

Cluster Dendrogram

hclust ( wardD)dist(pcaf$tab)

Le reacutesultat de la classification est un objet hclust (figure79 qui doit ecirctre transformeacute en phylog pour la suite de lrsquoana-lyse

Transformation de larbre du format hclust au format phylogphyf lt- hclust2phylog(hf)

plot(hf h = -1)

Le reacutesultat est en figure 710Code R pour la figure 710

minus15 minus05 05 15 25

Fig 710 Preacutesentation de lrsquoarbrephylogeacuteneacutetique avec lacontribution de chacune desvariables

tablephylog(pcaf$tab[names(phyf$leaves) ] phyf)

La limite des distances ultrameacutetriques est leur tendance agravedeacuteformer le jeu de points53 Dans cet exemple les deux pre-miers axes de lrsquoACP rendent compte de presque toute lrsquoinertieLe nuage de points est pratiquement contenu dans un planalors que sa repreacutesentation en distance ultrameacutetrique est unehypersphegravere en 7 dimensions

Le calcul de lrsquooriginaliteacute des espegraveces utilise la fonctionoriginality (figure 711)

minus1 0 1 2 3

QEbased

Fig 711 Originaliteacute des espegraveces

dotchartphylog(phyf originality(phyf 5))

La fonction a pour paramegravetres lrsquoobjet phylog contenant laclassification et le numeacutero de la meacutethode de calcul agrave utiliser 5pour lrsquoentropie quadratique Sa repreacutesentation graphique estfaite par dotchartphylog

54S Pavoine et M B Bonsalllaquo Biological Diversity Distinct Dis-tributions Can Lead to the Maximi-zation of Raorsquos Quadratic Entropy raquoIn Theoretical Population Biology752-3 (2009) p 153-163 doi 10 1016jtpb200901008

55C Ricotta et G C Avena laquo Arsquofast-Food Approachrsquo to the Stan-dardization of Quadratic Diversi-ty raquo In Plant Biosystems 1393(2005) p 411-413 doi 10 1080 11263500500158736

56E Marcon et B Heacuterault laquo De-composing Phylodiversity raquo In Me-thods in Ecology and Evolution 63(2015) p 333-339 doi 10 1111 2041-210X12323

57E Garnier et al laquo Plant Func-tional Markers Capture EcosystemProperties during Secondary Succes-sion raquo In Ecology 859 (2004)p 2630-2637 doi 10189003-0799

58S Lavorel et al laquo AssessingFunctional Diversity in the Field -Methodology Matters raquo In Func-tional Ecology 22 (2008) p 134-147doi 101111j1365-2435200701339x

59C Ricotta et M Morettilaquo CWM and Raorsquos Quadratic Diver-sity A Unified Framework for Func-tional Ecology raquo In Oecologia 167(2011) p 181-188 doi 10 1007 s00442-011-1965-5

60J Izsaacutek et S Pavoine laquo NewConcentration Measures as Kinds ofthe Quadratic Entropy raquo In Ecolo-gical Indicators 112 (2011) p 540-544 doi httpdxdoiorg101016jecolind201007010

61R C Guiasu et S Guiasulaquo The Weighted Quadratic Index ofBiodiversity for Pairs of Species AGeneralization of Raorsquos Index raquo In Natural Science 39 (2011) p 795-801 doi 10 4236 ns 2011 39104 R C Guiasu et S Guiasu laquo TheWeighted Gini-Simpson Index Re-vitalizing an Old Index of Biodiver-sity raquo In International Journal ofEcology 2012478728 (2012) p 1-10doi 1011552012478728

Lrsquooriginaliteacute ne repose que sur lrsquoarbre pas sur la freacutequencedes espegraveces

Si la distance utiliseacutee nrsquoest pas ultrameacutetrique il existe plu-sieurs distributions possibles drsquoespegraveces qui maximisent la di-versiteacute54 le concept drsquooriginaliteacute nrsquoa pas de sens dans ce cas

La valeur de lrsquoentropie quadratique deacutepend de la hauteurde lrsquoarbre Plusieurs normalisations ont eacuteteacute proposeacutees par savaleur maximale ou par la diversiteacute de Simpson (correspondantagrave un arbre dont toutes les espegraveces seraient eacutequidistantes)55 ouen fixant la hauteur de lrsquoarbre agrave 156

77 Diversiteacute et moyenneGarnier et al57 deacutefinissent la moyenne pondeacutereacutee drsquoun trait

agrave lrsquoeacutechelle de la communauteacute (CWM Community WeigthedMean) simplement eacutegal agrave la moyenne de la valeur du traitpondeacutereacutee par la freacutequence des espegraveces

CWM = sum119904

119901119904119910119904 (724)

CWM nrsquoest pas une mesure de diversiteacute fonctionnelle bienqursquoil ait eacuteteacute utiliseacute parfois en tant que tel58 mais une mesurede la composition de la communauteacute CWM peut ecirctre eacutetendu agraveplusieurs traits le vecteur formeacute par les valeurs de CWM pourchaque trait correspond au centre de graviteacute de la communau-teacute repreacutesenteacutee dans lrsquoespace des traits Lrsquoentropie quadratiquede Rao mesure la dispersion des espegraveces autour de ce point les deux mesures se complegravetent donc59

78 Variations sur lrsquoentropiequadratique

Izsaacutek et Pavoine60 proposent deux variantes de lrsquoindice deRao dans lesquelles la distance entre espegraveces deacutepend de leursprobabiliteacutes

1198711 = sum119904

sum119905

119901119904119901119905(119901119904 minus 119901119905)2 (725)

1198712 = sum119904

sum119905

119901119904119901119905(ln 119901119904 minus ln 119901119905)2 (726)

Ces indices sont proposeacutes pour leurs proprieacuteteacutes matheacutema-tiques assurant lrsquoexistence de sa deacutecomposition sans supporteacutecologique bien eacutetabli

est la matrice de dissimilariteacute dont les eacuteleacutements sont 120575119904119905la dissimilariteacute entre lrsquoespegravece 119904 et lrsquoespegravece 119905 R C Guiasu et

79 Diversiteacute fonctionnelle de Chiu et Chao 131

62C-H Chiu et A Chaolaquo Distance-Based FunctionalDiversity Measures and TheirDecomposition A FrameworkBased on Hill Numbers raquo In PloSone 97 (2014) e100014 doi 101371journalpone0100014

S Guiasu61 proposent lrsquoindice GSD pour ses proprieacuteteacutes matheacute-matiques et fournissent sa deacutecomposition

GSD = sum119904

sum119905

120575119904119905119901119904119901119905 (1 minus 119901119904119901119905) (727)

79 Diversiteacute fonctionnelle de Chiu etChao

Chiu et Chao62 proposent de pondeacuterer lrsquoentropie quadra-tique par la distance entre les paires drsquoespegraveces et obtiennentun nombre de Hill permettant de mesurer la diversiteacute fonction-nelle agrave partir drsquoune matrice de dissimilariteacute

119902119863 (119876) = [sum119904

sum119905

120575119904119905119876 (119901119904119901119905)

119902]1

2(1minus119902)

1119863 (119876) = 11989012 [sum119904 sum119905 119901119904119901119905

120575119904119905119876 ln 119901119904119901119905] (729)

La notation 119902119863(119876) fait reacutefeacuterence agrave lrsquoentropie quadratique119876 = 2(119879 ) Une approche compleacutementaire est deacuteveloppeacutee ci-dessous Chiu et Chao notent que GSD = 119876 minus119902119863(119876)

La deacutefinition de Chiu et Chao revient agrave calculer lrsquoentropiedes paires drsquoindividus agrave partir de la fonction drsquoinformation

119868(119901119904119901119905) = ln119902[( 120575119904119905

119876 ) 11minus119902

119901119904119901119905]

pour 119902 ne 1 et119868(119901119904119901119905) = ln[ 1

(119901119904119901119905)120575119904119905

119876]

pour 119902 = 1 Le nombre effectif de paires est [119902119863(119876)]2 Lenombre effectif drsquoespegraveces est donc 119902119863(119876)

Le nombre effectif de paires est le nombres de paires eacutequi-freacutequentes dont la distance entre les deux espegraveces est 119876 Leproblegraveme de cette approche est que les paires constitueacutees dela mecircme espegravece doivent aussi avoir une distance 120575119904119904 eacutegale agrave119876 Chiu et Chao considegraverent ce point comme la possibiliteacutede prendre en compte la variabiliteacute intraspeacutecifique mais elledoit ecirctre identique agrave la variabiliteacute interspeacutecifique ce qui nrsquoestpas tregraves convaincant En absence de variabiliteacute intraspeacutecifiqueChiu et Chao redeacutefinissent la distance de reacutefeacuterence 120575119904119904 = 0et 120575119904119905 = ( 119863

119863minus1)119876 Il nrsquoest donc pas possible de comparer lenombre effectif drsquoespegraveces de deux communauteacutes diffeacuterentespuisque la deacutefinition mecircme du nombre effectif deacutepend de ladiversiteacute ce qui invalide cette deacutefinition de la diversiteacute fonc-tionnelle

63A Solow et al laquo On the Measu-rement of Biological Diversity raquo In Archives of biochemistry and biophy-sics 24 (1993) p 60-68 doi 101016S0003-9861(71)80064-4

64Z Botta-Dukaacutet laquo The Genera-lized Replication Principle and thePartitioning of Functional Diversityinto Independent Alpha and BetaComponents raquo In Ecography 411(jan 2018) p 40-50 doi 101111ecog02009

65S Pavoine et al laquo Hierarchi-cal Partitioning of Evolutionary andEcological Patterns in the Organi-zation of Phylogenetically-StructuredSpecies Assemblages Application toRockfish (Genus Sebastes) in theSouthern California Bight raquo In Eco-logy Letters 129 (2009) p 898-908doi 101111j1461-0248200901344x

66B Allen et al laquo A New Phyloge-netic Diversity Measure Generalizingthe Shannon Index and Its Applica-tion to Phyllostomid Bats raquo In Ame-rican Naturalist 1742 (2009) p 236-243 doi 101086600101

Enfin cette deacutefinition de la diversiteacute ne respecte pas le prin-cipe de A Solow et al63 selon lequel le remplacement drsquounepartie des effectifs drsquoune espegravece par le mecircme nombre drsquoindivi-dus drsquoune espegravece diffeacuterente mais fonctionnellement identiquene doit pas faire varier la diversiteacute64

710 119867119901 et 1198681

Simultaneacutement Pavoine et al65 et Allen et al66 ont pro-poseacute la geacuteneacuteralisation de lrsquoindice de Shannon agrave la diversiteacutephylogeacuteneacutetique La preacutesentation de Allen et al est donneacutee icicelle de Pavoine et al plus geacuteneacuterale sera deacutetailleacutee dans leparagraphe suivant

Fig 712 Arbre phylogeacuteneacutetiqueou fonctionnel hypotheacutetique

1198791 1199011 1199015 1199012 1199013 1199014

1198792

1198793 b31

b11 b12 b13 b14 b15

Eacutetant donneacute une phylogeacutenie comme celle de la figure 712on deacutefinit une branche 119887119896119897 comme un segment termineacute parune feuille (au bas de lrsquoarbre) ou un noeud (dans lrsquoarbre) 119896indique la peacuteriode de lrsquoarbre agrave laquelle la branche se termine 119897le numeacutero drsquoordre Une branche nrsquoexiste que si elle se termineeffectivement par un noeud ou une feuille il nrsquoy a pas debranche 11988721 par exemple Sa probabiliteacute 119901(119887119896119897) est la sommedes probabiliteacutes des feuilles de la branche crsquoest-agrave-dire 119906119896119897 et119897(119887) est sa longueur Sur la figure la branche commenccedilant enhaut de lrsquoarbre et se terminant au noeud reacuteunissant les espegraveces3 agrave 5 a une valeur 119901(11988723) eacutegale agrave la somme des probabiliteacutesdrsquooccurrence des espegraveces 3 agrave 5 alors que 119901(11988711) est seulementla probabiliteacute de lrsquoespegravece 1 Leurs longueurs respectives sont1198792 + 1198793 et 1198791 + 1198792 Lrsquoarbre possegravede 7 branches

Lrsquoindice drsquoentropie phylogeacuteneacutetique est

119867119901 = minus sum119887

119897(119887)119901(119887) ln 119901(119887) (730)

Dans un arbre parfaitement reacutegulier toutes les branchessont de longueur 1 et 119867119901 est lrsquoindice de Shannon

1Pavoine et Bonsall laquo BiologicalDiversity Distinct Distributions CanLead to the Maximization of RaorsquosQuadratic Entropy raquo cf note 54p 130

2Chao et al laquo Phylogenetic Di-versity Measures Based on Hill Num-bers raquo cf note 44 p 70

Chapitre 8

Entropie phylogeacuteneacutetique

Lrsquoentropie phylogeacuteneacutetique est la moyenne de lrsquoentropie HCDT le longdrsquoun arbre phylogeacuteneacutetique Son estimation est simplement celle de lrsquoen-tropie HCDT agrave chaque peacuteriode de lrsquoarbre Elle va de pair avec la diver-siteacute phylogeacuteneacutetique qui est son nombre effectif drsquoespegraveces crsquoest-agrave-dire lenombre drsquoespegraveces eacutequiprobables dans un arbre ougrave toutes les espegraveces des-cendraient drsquoun ancecirctre unique dont lrsquoentropie serait la mecircme que cellede la communauteacute reacuteelle Dans un tel arbre la diversiteacute phylogeacuteneacutetiquese reacuteduit agrave la diversiteacute neutre

Lrsquoessentiel

Lrsquoentropie HCDT peut ecirctre eacutetendue pour deacutefinir une me-sure de diversiteacute prenant en compte lrsquohistoire eacutevolutive desespegraveces

81 Geacuteneacuteralisation de lrsquoentropie HCDTPavoine et Bonsall1 deacutecoupent lrsquoarbre phylogeacuteneacutetique en

peacuteriodes Agrave partir de la racine de lrsquoarbre une nouvelle peacuteriodeest deacutefinie agrave chaque ramification drsquoune branche quelconqueLes deacutebuts et fins de peacuteriodes sont noteacutes 119905119896 la racine de lrsquoarbreest fixeacutee agrave 1199050 = 0 Lrsquoarbre est ultrameacutetrique

Nous suivrons plutocirct les notations de Chao et al2 en nu-meacuterotant les peacuteriodes agrave partir du preacutesent et en notant 119879119896 leurdureacutee Figure 77 la premiegravere peacuteriode se termine quand lesbranches des espegraveces 3 agrave 5 se rejoignent Lrsquoarbre comprend119870 = 3 peacuteriodes

Lrsquoentropie HCDT (119902119867 de lrsquoeacutequation (46)) est calculeacutee agravechaque peacuteriode Figure 81 agrave la deuxiegraveme peacuteriode (1198792) lrsquoarbrea trois feuilles avec des probabiliteacutes eacutegales agrave celle des espegraveces1 et 2 et la somme de celles des espegraveces 3 agrave 5 119902119867 peut ecirctre cal-culeacutee avec ces valeurs de probabiliteacutes On notera cette valeurdrsquoentropie 119902

119896119867 ougrave 119896 est le quantiegraveme de la peacuteriodeLrsquoindice 119868119902 de Pavoine et al est la somme des 119902

119896119867 pondeacutereacuteepar la dureacutee de chaque peacuteriode Nous le normalisons par lahauteur totale de lrsquoarbre (119879 ) pour deacutefinir 119902(119879 )

134 Entropie phylogeacuteneacutetique

Fig 81 Arbre phylogeacuteneacutetique oufonctionnel hypotheacutetique 5

espegraveces sont preacutesentes (119878 = 5)leurs probabiliteacutes noteacutees 1199011 agrave 1199015

Les noms des branches sontafficheacutes

1198791 1199011 1199015 1199012 1199013 1199014

1198792

1198793 b31

b11 b12 b13 b14 b15

3K Shimatani laquo MultivariatePoint Processes and Spatial Varia-tion of Species Diversity raquo In Fo-rest Ecology and Management 1421-3 (2001) p 215-229 doi 101016s0378-1127(00)00352-2

4C Ricotta laquo Additive Partitio-ning of Raorsquos Quadratic Diversity AHierarchical Approach raquo In Ecolo-gical Modelling 1834 (2005) p 365-371 doi 101016jecolmodel200408020

119902 (119879 ) =119870

sum119896=1

119879119896119879

119902

119896119867 (81)

Dans un arbre parfaitement reacutegulier toutes les branchessont de longueur 1 il nrsquoy a qursquoune seule peacuteriode et 119868119902 = 119902119867

Shimatani3 puis Ricotta4 avaient montreacute que lrsquoindice deRao est la somme pondeacutereacutee sur chaque peacuteriode de lrsquoindicede Simpson crsquoest-agrave-dire lrsquoeacutegaliteacute (81) pour le cas particulier119902 = 2

Les indices 119902(119879 ) geacuteneacuteralisent les mesures drsquoentropie clas-sique agrave la diversiteacute phylogeacuteneacutetique 119879 [0(119879 )+1] est eacutegal agrave PDou FD 1(119879 ) est 119867119901 et 2(119879 ) est lrsquoindice de Rao On peutles interpreacuteter intuitivement comme une somme pondeacutereacutee parla longueur des peacuteriodes des valeurs de lrsquoentropie agrave chaquepeacuteriode Agrave la derniegravere peacuteriode (pregraves des feuilles) toutes lesclasses sont preacutesentes la diversiteacute est donc maximale En re-montant dans lrsquoarbre les classes se confondent et la diversiteacutediminue progressivement Deux classes peu distantes commeles espegraveces 3 agrave 5 de la figure 81 apportent peu de diversiteacutesuppleacutementaire par rapport agrave une situation ougrave les deux espegravecesseraient confondues (et leurs effectifs ajouteacutes) contrairementaux espegraveces 1 et 2

82 EstimationLa correction du biais drsquoestimation applicable agrave lrsquoentropie

geacuteneacuteraliseacutee lrsquoest aussi agrave chaque peacuteriode de lrsquoarbre Les biaissont de moins en moins importants quand on se rapproche dela racine de lrsquoarbre il est de moins en moins probable de nepas observer une classe quand les classes sont de plus en plusvastes

Le package entropart fournit la fonction PhyloEntropypour calculer 119902(119879 ) agrave partir drsquoun vecteur de probabiliteacute oudrsquoabondances Dans le dernier cas la correction de Tsallisest appliqueacutee agrave chaque peacuteriode

Exemple le package contient les donneacutees drsquoinventaire dedeux hectares du dispositif de Paracou et la taxonomie des

83 Entropie et diversiteacute 135

5C Ricotta et A T Acosta laquo Onthe Functional Diversity of PartiallyDistinct Species Some Theory and aPractical Example raquo In CommunityEcology 152 (2014) p 205-211 doi 101556ComEc15201429

espegraveces concerneacutees Le calcul de lrsquoindice de Rao corrigeacute dubiais drsquoestimation utilise le code suivant

data(Paracou618)PhyloEntropy(Paracou618MC$Ns 2 Paracou618Taxonomy)

$Distribution [1] Paracou618MC$Ns $Function [1] PhyloEntropy $Tree [1] Paracou618Taxonomy $Normalized [1] TRUE $Cuts 1 2 3 09863189 09709766 09232516 $Corrections 1 2 3 UnveilJ UnveilJ UnveilJ $Total [1] 09601824 $Type [1] alpha or gamma $Order [1] 2 $Correction [1] Best attr(class) [1] PhyloEntropy PhyloValue

La fonction retourne la valeur de 119902119896119867 dans chaque intervalle

(lrsquoarbre est ici une taxonomie espegravece-genre-famille correspon-dant aux limites des peacuteriodes (Cuts) 1 2 et 3 dont lrsquoentropieva en deacutecroissant) et la valeur de 119902(119879 )

83 Entropie et diversiteacuteLa diversiteacute phylogeacuteneacutetique est le nombre drsquoespegraveces eacutequi-

freacutequentes et dont la distance agrave toutes les autres dans la phy-logeacutenie est maximale dont lrsquoentropie serait eacutegale agrave lrsquoentropieobserveacutee

La possibiliteacute de choisir comme distance de reacutefeacuterence entreespegraveces une valeur infeacuterieure agrave la distance maximale est dis-cuteacutee par Ricotta et Acosta5 pour la diversiteacute fonctionnelle sa signification biologique est lieacutee agrave lrsquoespace fonctionnel dis-ponible pour la communauteacute qui peut ecirctre trop reacuteduit pourpermettre la coexistence drsquoespegraveces dont la dissimilariteacute seraitmaximale

7C Ricotta et L Szeidl laquo Diver-sity Partitioning of Raorsquos QuadraticEntropy raquo In Theoretical Popula-tion Biology 764 (2009) p 299-302doi 101016jtpb200910001

9Allen et al laquo A New Phylo-genetic Diversity Measure Generali-zing the Shannon Index and Its Ap-plication to Phyllostomid Bats raquo cfnote 66 p 132

Lrsquoentropie 119902(119879 ) peut ecirctre transformeacutee en diversiteacute6 de lamecircme faccedilon que 119902119863 = 119890119902119867

119902 (119879 ) = 119890119902(119879 )119902 (82)

Le nombre effectif drsquoespegraveces de lrsquoentropie de Rao 2(119879 ) =1

[1minus2(119879 )] a eacuteteacute eacutetabli par Ricotta et Szeidl7

Chao et al8 obtiennent ce reacutesultat sans recourir explicite-ment agrave lrsquoentropie mais en faisant le mecircme calcul

119902 (119879 ) = (sum119887

119897(119887)119879 119901(119887)119902)

11minus119902

La somme est sur lrsquoensemble des branches de lrsquoarbre deacutefinide faccedilon identique agrave celle de Allen et al9 710

Les entropies ont un comportement lineacuteaire elles srsquoad-ditionnent tout au long de lrsquoarbre pour donner 119902(119879 ) Lesdiversiteacutes 119902

119896119863 calculeacutees agrave chaque peacuteriode ne peuvent pas ecirctresommeacutees sur le modegravele de lrsquoeacutequation (81) 119902(119879 ) nrsquoest pas lamoyenne pondeacutereacutee des diversiteacutes aux diffeacuterentes peacuteriodes saufdans le cas particulier 119902 = 1 ougrave comme pour la deacutecomposi-tion de lrsquoindice de Shannon il en est la moyenne geacuteomeacutetriquepondeacutereacutee

La fonction PhyloDiversity de entropart permet de calcu-ler 119902(119879 ) avec ou sans correction de biais selon qursquoelle traiteun vecteur drsquoabondances ou de probabiliteacutes Agrave la suite delrsquoexemple preacuteceacutedent les reacutesultats sont preacutesenteacutes sous formede diversiteacute au lieu drsquoentropie

PhyloDiversity(Paracou618MC$Ns 2 Paracou618Taxonomy)

$Distribution [1] Paracou618MC$Ns $Function [1] bcPhyloDiversity $Tree [1] Paracou618Taxonomy $Normalized [1] TRUE $Cuts 1 2 3 7309335 3445501 1302960 $Corrections 1 2 3 UnveilJ UnveilJ UnveilJ $Total [1] 2511451 $Type

84 Diversiteacute individuelle 137

11Ibid figure 1b

[1] alpha or gamma $Order [1] 2 $Correction [1] Best attr(class) [1] PhyloDiversity PhyloValue

84 Diversiteacute individuelleLa construction de la diversiteacute fonctionnelle ou phylogeacuteneacute-

tique nrsquoimplique pas de regrouper les individus par espegraveces chaque cateacutegorie peut se reacuteduire agrave un individu si des donneacuteesindividuelles moleacuteculaires ou de traits sont disponibles

Le regroupement des individus en une espegravece revient sim-plement agrave consideacuterer leur distance comme nulle Diviser uneespegravece en deux espegraveces infiniment proches revient seulementagrave creacuteer une peacuteriode suppleacutementaire dans lrsquoarbre de longueurinfiniteacutesimale en drsquoautres termes la mesure de diversiteacute estcontinue face au regroupement Cette proprieacuteteacute permet de li-miter les conseacutequences du problegraveme de lrsquoespegravece seacuteparer lesindividus drsquoune espegravece en deux espegraveces proches dans lrsquoarbrenrsquoa que peu drsquoeffet sur la diversiteacute

85 Arbres non ultrameacutetriques

It is always less than or equal to the present diversityof order q

There are many ways to take this average If we wantthe replication principle to be valid in its strongestpossible form then we must average the diversitiesqD(t) according to Jostrsquos (2007) derivation of the for-mula for the mean (a) diversity of a set of equallyweighted assemblages This mean diversity over thetime interval [2T 0] will be called q DethTTHORN (mean diver-sity of order q over T years) With this choice of meanwhen N maximally distinct trees with equal meandiversities (for fixed T ) are combined the mean diver-sity of the combined tree is N times the mean diversityof any individual tree The branching patterns abun-dances and richnesses of the N trees can all bedifferent as long as each of the trees is completely dis-tinct (all branching off from the earliest point in thetree at or before time T ) Some choices of averagingformulae obey weaker versions of the principle andthese may be useful for some purposes We discussan alternative choice of mean in sect8

We may want to consider not just the mean diversitybut the branch or lineage diversity of the tree as awhole over the interval from ndashT to present At anypoint within a branch the abundance or importanceof each branch lineage is the sum of the abundancesof the present-day species descending from thatpoint as described above Then the total diversity of

all the lsquospeciesrsquo that evolved in the tree during thetime interval [2T 0] is found by taking the Hillnumber of this entire virtual assemblage of ancestralspecies The Hill numbers depend only on the relativeabundances of each species so we need to divide theabundances by the total abundance of all the speciesin the tree If each branch is weighted by its corre-sponding branch length then we show below thatthis diversity depends only on the branching patternand on the relative abundances of the species in thepresent-day assembly We call this measure lsquophyloge-netic diversity of order q through T years agorsquo or lsquobranchdiversityrsquo and denote it by qPD(T ) This turns outto be just the product of the interval duration Tand the mean diversity over that interval q DethTTHORN Forq frac14 0 (only species richness is considered) and T frac14the age of the first node this branch diversity is justFaithrsquos PD

Instead of using time as the metric for a phylo-genetic tree we often want to use a more directmeasure of evolutionary work such as the number ofbase changes at a selected locus or the amount offunctional or morphological differentiation from acommon ancestor The branches of the resulting treewill then be uneven so the tree will not be ultrametricHowever we can easily apply the idea of branch diver-sity to such non-ultrametric trees The branch lengthsare calculated in the appropriate units such as base

t = 0(present time)

p1 + p2 + p3

p2 + p3

p1 p2 p3 p4

t = ndashT

(a) (b)

slice 3

slice 2

slice 1

p1 = 05

p2 = 02

p3 = 03

p2 + p3 = 05

Figure 1 (a) A hypothetical ultrametric rooted phylogenetic tree with four species Three different slices corresponding tothree different times are shown For a fixed T (not restricted to the age of the root) the nodes divide the phylogenetic treeinto segments 1 2 and 3 with duration (length) T1 T2 and T3 respectively In any moment of segment 1 there are

four species (ie four branches cut) in segment 2 there are three species and in segment 3 there are two species Themean species richness over the time interval [2T 0] is (T1T ) 4 thorn (T2T ) 3 thorn (T3T ) 2 In any moment of segment1 the species relative abundances (ie node abundances correspond to the four branches) are f p1 p2 p3 p4g in segment2 the species relative abundances are fg1 g2 g3g frac14 fp1 p2 thorn p3 p4g in segment 3 the species relative abundances arefh1 h2g frac14 f p1 thorn p2 thorn p3 p4g (b) A hypothetical non-ultrametric tree Let T be the weighted (by species

abundance) mean of the distances from root node to each of the terminal branch tipsT frac14 4 05thorn eth35thorn 2THORN 02thorn eth1thorn 2THORN 03 frac14 4 Note T is also the weighted (by branch length) total node abundancebecause T frac14 05 4thorn 02 35thorn 03 1thorn 05 2 frac14 4 Conceptually the lsquobranch diversityrsquo is defined for an assemblageof four branches each has respectively relative abundance 05=T frac14 0125 02=T frac14 005 03=T frac14 0075 and05=T frac14 0125 and each has respectively weight (ie branch length) 4 35 1 and 2 This is equivalent to an assemblage

with 105 equally weighted lsquobranchesrsquo there are 4 branches with relative abundance 05=T frac14 0125 35 branches with rela-tive abundance 02=T frac14 005 1 branch with relative abundance 03=T frac14 0075 and 2 branches with relative abundance05=T frac14 0125

3602 A Chao et al Phylogenetic diversity measures

Phil Trans R Soc B (2010)

on October 31 2010rstbroyalsocietypublishingorgDownloaded from

Fig 82 Arbre phylogeacuteneacutetiquehypotheacutetique non ultrameacutetrique

Chao et al10 deacutefinissent la diversiteacute phylogeacuteneacutetique selonlrsquoeacutequation (83) quelle que soit la forme de lrsquoarbre y comprissrsquoil nrsquoest pas ultrameacutetrique Dans ce cas 119879 est remplaceacute par 119879 la longueur moyenne des branches pondeacutereacutee par la freacutequencedes espegraveces Cette geacuteneacuteralisation est tregraves discutable son sensnrsquoest pas clair sur le plan de la mesure de la diversiteacute au-delagravedu paralleacutelisme de la forme matheacutematique

Lrsquoarbre de la figure 8211 peut ecirctre deacutecoupeacute en peacuteriodes

mais les deux premiegraveres (1198791 seule lrsquoespegravece 2 est preacutesente 1198792 les espegraveces 1 et 2 sont preacutesentes) sont incomplegravetes ausens ougrave la somme des probabiliteacutes nrsquoy est pas eacutegale agrave 1 donc(sum 119901119902

119894 )1

1minus119902 ne deacutefinit pas une diversiteacute agrave ces peacuteriodesPavoine et Bonsall12 traitent en deacutetail les reacutesultats aber-

rants que cause un arbre non ultrameacutetrique dans le cas par-ticulier de lrsquoentropie de Rao Leinster et Cobbold13 montrentqursquoun arbre non ultrameacutetrique implique que la dissimilariteacuteentre les espegraveces deacutepende de leur freacutequence ce qui est contra-dictoire avec le cadre dans lequel la diversiteacute phylogeacuteneacutetiquea eacuteteacute deacutefinie

Dans lrsquoeacutetat actuel des connaissances aucune meacutethodenrsquoest applicable de faccedilon satisfaisante aux arbres nonultrameacutetriques

1T Leinster laquo The Magnitude ofMetric Spaces raquo In Documenta Ma-thematica 18 (2013) p 857-905

4G H Hardy et al InequalitiesCambridge University Press 1952

Chapitre 9

Diversiteacute de Leinster et Cobbold

La diversiteacute de Leinster et Cobbold est lrsquoinverse de la banaliteacute moyennedes espegraveces qui est elle-mecircme la similariteacute moyenne drsquoune espegravece auxautres Elle va de pair avec lrsquoentropie de Ricotta et Szeidl dont la fonc-tion drsquoinformation est le logarithme deacuteformeacute de lrsquoinverse la banaliteacute Ladiversiteacute peut ecirctre calculeacutee directement agrave partir de la distance entre es-pegraveces sans recourir agrave un dendrogramme intermeacutediaire qui deacuteformerait latopologie des espegraveces

Lrsquoessentiel

Agrave partir de la theacuteorie matheacutematique des cateacutegories1 Leins-ter et Cobbold2 ont proposeacute une mesure de diversiteacute applicableagrave une communauteacute dont la position des espegraveces dans un es-pace multidimensionnel euclidien est connue Crsquoest donc unemesure applicable agrave la diversiteacute fonctionnelle

91 DeacutefinitionsLeinster et Cobbold3 proposent une unification des me-

sures de diversiteacute agrave partir de la deacutefinition de la banaliteacute desespegraveces Une matrice carreacutee de dimension eacutegale au nombredrsquoespegraveces Z deacutecrit par ses valeurs 119911119904119905 la similariteacute entre lrsquoes-pegravece 119904 et lrsquoespegravece 119905 comprises entre 0 et 1 (119911119904119904 = 1)

La banaliteacute drsquoune espegravece 119904 est deacutefinie par sum119905 119901119905119911119904119905 crsquoest-agrave-dire la moyenne pondeacutereacutee de sa similariteacute avec toutes lesautres espegraveces au minimum 119901119904 si elle est totalement diffeacute-rente des autres (approche de la diversiteacute neutre Z est lamatrice identiteacute I119904) au maximum 1 si toutes les espegraveces sonttotalement similaires (Z ne contient que des 1) Une espegravecerare totalement diffeacuterente des autres est peu banale

La moyenne geacuteneacuteraliseacutee drsquoordre 1199034 generalized mean oupower mean en anglais est deacutefinie pour une distribution devaleurs de 119909119904 dont la probabiliteacute drsquooccurrence est 119901119904 par

119909 = (sum119904

119901119904119909119903119904)

1119903

140 Diversiteacute de Leinster et Cobbold

Fig 91 Moyenne geacuteneacuteraliseacuteedrsquoordre 119903 (en abscisse) drsquoune

distribution uniforme de 10000valeurs tireacutees entre 0 et 1 Lamoyenne arithmeacutetique 05 est

obtenue pour 119903 = 1 La moyennegeacuteneacuteraliseacutee tend vers la plus petitevaleur (pregraves de 0) quand 119903 rarr minusinfinet vers la plus grande valeur (pregraves

de 1) quand 119903 rarr +infin

minus5 0 5 10r

La moyenne geacuteneacuteraliseacutee se reacuteduit agrave la moyenne arithmeacute-tique pondeacutereacutee pour 119903 = 1 Elle donne un fort poids aux pe-tites valeurs de 119909119904 dans la moyenne pour les faibles valeurs de119903 (qui peuvent ecirctre neacutegatives) et un fort poids aux grandesvaleurs quand 119903 est grand (figure 91)

X lt- runif(10000) La moyenne nest pas deacutefinie agrave r=0 deacutecalage de 10^-8r lt- seq(-5 10 1) + 1E-8 Preacuteparation des donneacuteesdf lt- dataframe(r Moyenne = sapply(r function(r) (mean(X^r))^(1r)))ggplot(df aes(x = r y = Moyenne)) +

geom_line() +geom_hline(yintercept = 5 lty = 2) +geom_vline(xintercept = 1 lty = 2)

La banaliteacute peut srsquoeacutecrire sous forme matricielle en notant ple vecteur des probabiliteacutes 119901119904 on note alors (Zp)119904 = sum119905 119901119905119911119904119905

La banaliteacute moyenne des espegraveces de la communauteacute estcalculeacutee en prenant 119903 = 119902 minus 1

(Zp) = (sum119904

119901119904(Zp)119902minus1119904 )

1119902minus1

La diversiteacute de la communauteacute est simplement lrsquoinverse dela banaliteacute moyenne des espegraveces

119902119863Z = (sum119904

119901119904(Zp)119902minus1119904 )

11minus119902

119902119863Z converge vers 1119863Z quand 119902 tend vers 1

1119863Z = 1prod119904 (Zp)119901119904

119904 (94)

92 Diversiteacute neutre 141

92 Diversiteacute neutreLeinster et Cobbold montrent que la diversiteacute HCDT est

un cas particulier de 119902119863Z pour la matrice identiteacute

119902119863 = 119902119863I (95)

93 Diversiteacute non neutreUne mesure de diversiteacute non neutre est obtenue en utili-

sant une matrice Z qui contient lrsquoinformation sur la similariteacuteentre les espegraveces La dissimilariteacute entre espegraveces peut ecirctre obte-nue agrave partir des arbres Lrsquoexemple suivant utilise les donneacuteesdu calcul drsquooriginaliteacute section 76 Pour un arbre de classehclust la fonction cophenetic fournit une demi-matrice dedistances (classe dist)

print(cophenetic(hf) digits = 4)

Ess Me S1 Sr Vm Bg Ef Me 1224 S1 1224 1003 Sr 2464 2464 2464 Vm 9731 9731 9731 9731 Bg 9731 9731 9731 9731 5653 Ef 9731 9731 9731 9731 1694 5653 Dg 9731 9731 9731 9731 1101 5653 1694

La matrice doit ecirctre normaliseacutee puis transformeacutee en ma-trice de similariteacute Une transformation simple est 1 moinsla dissimilariteacute (preacutealablement normaliseacutee pour ecirctre compriseentre 0 et 1)

Dis lt- cophenetic(hf)print((Z lt- 1 - asmatrix(Dismax(Dis))) digits = 4)

Ess Me S1 Sr Vm Bg Ef Dg Ess 10000 08742 08742 07468 00000 00000 00000 00000 Me 08742 10000 08969 07468 00000 00000 00000 00000 S1 08742 08969 10000 07468 00000 00000 00000 00000 Sr 07468 07468 07468 10000 00000 00000 00000 00000 Vm 00000 00000 00000 00000 10000 04191 08259 08868 Bg 00000 00000 00000 00000 04191 10000 04191 04191 Ef 00000 00000 00000 00000 08259 04191 10000 08259 Dg 00000 00000 00000 00000 08868 04191 08259 10000

La diversiteacute peut ecirctre calculeacutee par la fonction Dqz de en-tropart

Vecteur contenant 8 espegraveces(readcsv2(dataraoeffectifscsv rownames = 1 header = T) -gt

effectifs)

5Ricotta et Szeidl laquo Towards aUnifying Approach to Diversity Mea-sures Bridging the Gap between theShannon Entropy and Raorsquos Quadra-tic Index raquo cf note 26 p 67

P1 P2 P3 P4 Ess 97 36 34 61 Me 62 24 49 4 S1 4 6 6 75 Sr 71 78 99 36 Vm 76 29 34 2 Bg 58 49 47 19 Ef 9 34 91 35 Dg 98 14 95 14

Ps lt- rowSums(effectifs)sum(effectifs)Dqz(Ps q = 2 Z)

None 2520938

Dans le cas particulier 119902 = 2 2119863Z est eacutegal agrave 2(119879 )

PhyloDiversity(Ps q = 2 phyf)$Total

None 2520938

Mais ce nrsquoest pas le cas en geacuteneacuteral

94 Entropie de Ricotta et SzeidlRicotta et Szeidl5 ont montreacute une similitude entre les en-

tropies de Shannon et de Rao en geacuteneacuteralisant lrsquoentropie deShannon en deux temps Tout drsquoabord en remarquant que laprobabiliteacute drsquooccurrence drsquoune espegravece est 1 moins la sommede celle des autres drsquoougrave

1119867 = minus sum119904

119901119904 ln (1 minus sum119905ne119904

119901119905) (96)

1 minus sum119905ne119904 119901119905 est la banaliteacute de lrsquoespegravece 119904 si on mesure ladiversiteacute neutre De faccedilon plus geacuteneacuterale (Zp)119904 peut exprimercette banaliteacute Enfin lrsquoentropie HCDT peut geacuteneacuteraliser lrsquoentro-pie de Shannon pour deacutefinir une mesure 119876120572 que nous noterons119902119867Z pour la coheacuterence de nos notations (119902 = 120572)

119902119867Z = sum119904

119901119904 ln1199021

(Zp)119904 (97)

De faccedilon plus rigoureuse on peut remarquer que (Zp)119904deacutecroicirct quand 119901119904 deacutecroicirct parce que la similariteacute drsquoune espegraveceavec elle-mecircme est maximale Une entropie deacutefinie agrave partirdrsquoune fonction drsquoinformation de 119901119904 reste donc une entropiequand on utilise la mecircme fonction drsquoinformation sur (Zp)119904 la fonction reste deacutecroissante et vaut 0 pour 119901119904 = 1 puisque(Zp)119904 = 1 dans ce cas 119902119867Z est donc bien une entropie La

95 Deacutefinition de la similariteacute 143

6M Nei laquo Genetic Distance bet-ween Populations raquo In The Ameri-can Naturalist 106949 (1972) p 283-292 doi 1023072459777 JSTOR 2459777

7Chiu et Chao laquo Distance-BasedFunctional Diversity Measures andTheir Decomposition A FrameworkBased on Hill Numbers raquo cf note 62p 131

fonction drsquoinformation ln119902(1119901119904) de lrsquoentropie HCDT (417)est simplement remplaceacutee par ln119902(1(Zp)119904)

Lrsquoentropie de Ricotta et Szeidl eacutetend lrsquoentropie HCDT enutilisant une fonction drsquoinformation plus geacuteneacuterale deacutependantde la banaliteacute de lrsquoespegravece plutocirct que de sa seule probabiliteacuteles deux eacutetant eacutegales dans le cas particulier de la diversiteacuteneutre Lrsquoordre de la diversiteacute 119902 permet de donner un plusou moins grand poids aux espegraveces banales (et non aux espegravecesfreacutequentes 119901119904 est agrave la puissance 1) La freacutequence et la banaliteacutese confondent seulement pour la diversiteacute neutre

Le logarithme drsquoordre 119902 de 119902119863Z est 119902119867Z

ln119902119902119863Z =119902 119867Z (98)

95 Deacutefinition de la similariteacuteLa transformation drsquoune matrice de dissimilariteacute en une

matrice de similariteacute neacutecessite une fonction strictement deacute-croissante dont le reacutesultat est compris entre 0 et 1 La plussimple est

119911119904119905 = 1 minus 119889119904119905max (119889119904119905)

Leinster et Cobbold argumentent en faveur drsquoune transforma-tion exponentielle neacutegative deacutejagrave utiliseacutee par Nei6

000 025 050 075 100r

Fig 92 Approximation de(Zp)119902minus1

119904 par son deacuteveloppementlimiteacute au premier ordre pour (a)119902 = 15 (119903 = 119902 minus 1) et (b) 119902 = 05

Le problegraveme majeur de la diversiteacute 119902119863Z est qursquoelle four-nit souvent des valeurs presque indeacutependantes de 119902 quand onlrsquoapplique agrave une matrice de similariteacute fonctionnelle7 De nom-breux exemples y compris dans lrsquoarticle original de Leinster etCobbold montrent une tregraves faible deacutecroissance de la diversiteacutede 119902 = 0 agrave 119902 = 2 Ce nrsquoest pas un problegraveme theacuteorique maisnumeacuterique Si la banaliteacute de lrsquoespegravece 119904 est proche de 1 sa puis-sance 119902 peut ecirctre approcheacutee par son deacuteveloppement limiteacute aupremier ordre

(Zp)119902minus1119904 asymp 1 + (119902 minus 1)[(Zp)119904 minus 1]

8Leinster laquo The Magnitude ofMetric Spaces raquo cf note 1 p 139

Cette approximation lineacuteaire implique que

sum119904

119901119904(Zp)119902minus1119904 asymp [sum

119904119901119904(Zp)119904]119902minus1

La puissance 119902 minus1 disparaicirct donc dans le calcul de la diversiteacuteet lrsquoeacutequation (93) devient

119902119863Z asymp 119911

ougrave 119911 = sum119904 119901119904(Zp)119904 Dans les faits cette approximation vautpour des valeurs de banaliteacute assez eacuteloigneacutees de 1 (Figure 92)

Si une majoriteacute des espegraveces (au sens de la somme de leursprobabiliteacutes respectives) a une banaliteacute supeacuterieure agrave 05 lrsquoap-proximation lineacuteaire est assez bonne et la moyenne geacuteneacuteraliseacuteede la banaliteacute est proche de sa moyenne arithmeacutetique Ce nrsquoestpas un problegraveme pour la comparaison de profils de diversiteacute decommunauteacutes diffeacuterentes calculeacutes agrave partir de la mecircme matricede similariteacute mais lrsquointerpreacutetation de la diversiteacute en termesde nombres effectifs drsquoespegraveces deacutependant de 119902 nrsquoest pas tregravesintuitive

r lt- 05seqZp lt- seq(0 1 0001)gga lt- ggplot(dataframe(r = seqZp xr = seqZp^r) aes(r xr)) +

geom_line() + geom_abline(intercept = 1 - r slope = r col = redlty = 2) + labs(y = expression(x^r)) + labs(tag = a)

r lt- -05ggb lt- ggplot(dataframe(r = seqZp xr = seqZp^r) aes(r xr)) +

geom_line() + geom_abline(intercept = 1 - r slope = r col = redlty = 2) + labs(y = expression(x^r)) + labs(tag = b)

La transformation exponentielle neacutegative

119911119904119905 = 119890minus119906 119889119904119905max (119889119904119905)

est justifieacutee par Leinster8 119906 est une constante positive Plus 119906est grand plus la transformation est convexe les similariteacutessont tasseacutees vers 0 (figure 93)

ggplot(dataframe(x = seq(0 1 by = 01)) aes(x)) +stat_function(fun = function(x) exp(-x)) +stat_function(fun = function(x) exp(-2x) lty = 2) +stat_function(fun = function(x) exp(-10x) lty = 3) +labs(y = expression(exp(-ux)))

Augmenter la valeur de 119906 diminue les similariteacutes et donc labanaliteacute des espegraveces ce qui regravegle (arbitrairement) le problegravemede la faible sensibiliteacute de la diversiteacute au paramegravetre 119902

Du point de vue theacuteorique lrsquoordre des valeurs de la ma-trice des distances est justifieacute (par les diffeacuterences entre traits

96 Estimation 145

000 025 050 075 100x

minusux

Fig 93 Transformation desdistances (en abscisse) ensimilariteacutes (en ordonneacutees) selon lavaleur de 119906 Trait plein 119906 = 1 pointilleacutes longs 119906 = 2 pointilleacutes 119906 = 10 Plus 119906 est grand plus lessimilariteacutes sont tasseacutees vers 0

9E Marcon et al laquo The Decom-position of Similarity-Based Diversityand Its Bias Correction raquo In HAL00989454 (version 3 2014)

fonctionnels par exemple) mais leur distribution ne lrsquoest pas elle nrsquoest que la conseacutequence de la meacutethode de calcul Le choixde 119906 ne change pas lrsquoordre des distances mais deacuteforme la dis-tribution des similariteacutes La distance eacutetant normaliseacutee 119906 fixelrsquoeacutechelle des distances avant la transformation

Leinster relie la valeur de 119902119863Z agrave la magnitude de lrsquoespacedes espegraveces (espace dans lequel les espegraveces sont des points dontles distances deux agrave deux sont deacutecrites par la matrice Δ quidoit ecirctre euclidienne) la magnitude de lrsquoespace est la valeurmaximale que peut atteindre la diversiteacute La magnitude estune proprieacuteteacute qui deacutecrit la taille drsquoun espace dans le cadre dela theacuteorie des cateacutegories Modifier 119906 modifie la magnitude delrsquoespace selon une relation non triviale 119906 est un paramegravetreau mecircme titre que 119902 Quand 119906 rarr +infin Z rarr I119904 la diversiteacutetend vers la diversiteacute neutre Leinster et Cobbold suggegraverentde comparer les profils de diversiteacute en fonction agrave la fois de 119902et de 119906

96 EstimationComme les autres mesures de diversiteacute 119902119863Z est sujette

au biais drsquoestimation Deux estimateurs reacuteduisant le biaisexistent9 Le premier utilise la technique de Chao et T-JShen10 deacutejagrave vue pour la correction du biais de lrsquoentropie deShannon (339) Lrsquoestimateur de 119902119867Z est

119902Z = sum119904

119862 119901119904 ln1199021

(Zp)119904

1 minus (1 minus 119862 119901119904)119899 (99)

ougrave

(Zp)119904

= sum119905

119862 119901119905119911119904119905 + (1 minus 119862) 119911 (910)

Lrsquoestimateur de la diversiteacute est 119902Z = 119890119902Z119902

Lrsquoautre estimateur suppose que la similariteacute des espegravecesnon observeacutees avec toutes les autres est la similariteacute moyenneobserveacutee Lrsquoestimation utilise la technique de Z Zhang etGrabchak11 qui consiste agrave deacutevelopper lrsquoestimateur en seacuterieentiegravere au voisinage de 119901119904 = 1 Lrsquoestimateur de 119902119863Z est pour119902 ne 1

119902Z =⎧⎨⎩

+ 119881 minus sum119904le119904ne0

119862 119901119904[ 119911 (1 minus 119862 119901119904) + 119862 119901119904]119902minus1⎫

⎬⎭

11minus119902

(911)ougrave

= sum119904le119904ne0

119862 119901119904⎡⎢⎣

⎛⎜⎝

sum119905le119904ne0

119862 119901119905119911119904119905⎞⎟⎠

+ (1 minus 119862) 119911⎤⎥⎦

119902minus1

119881 = 1+ sum119904le119904ne0

119899119904119899

119899minus119899119904

sum119907=1

(1 minus 119911)119907 [119907

prod119894=1

119894 minus 119902119894 ] [

119907prod119895=1

(1 minus 119899119904 minus 1119899 minus 119895 )]

(913)Lrsquoestimateur de 119902119867Z est

119902Z = + 119881 minus sum119904le119904ne0

119862 119901119904[ 119911 (1 minus 119862 119901119904) + 119862 119901119904]119902minus1

minus 11 minus 119902

(914)Pour 119902 = 1

1Z = + + sum119904le119904ne0

119862 119901119904 ln [ 119911 (1 minus 119862 119901119904) + 119862 119901119904] (915)

1Z = 1198901Z (916)

ougrave

= minus sum119904le119904ne0

119862 119901119904 ln ⎡⎢⎣

⎛⎜⎝

sum119905le119904ne0

119862 119901119895119911119904119905⎞⎟⎠

+ (1 minus 119862) 119911⎤⎥⎦

= sum119904le119904ne0

119899119904119899

119899minus119899119904

sum119907=1

(1 minus 119911)119907

119907 [119907

prod119895=1

97 Diversiteacute phylogeacuteneacutetique 147

Tab 91 Matrice de similariteacute correspondant agrave lrsquoarbre phylogeacuteneacutetique enexemple Les noms des lignes et colonnes sont les couples (espegravece actuelle branche ancestrale)

(1 11988711)(1 11988731)(2 11988712)(2 11988731)(3 11988713)(3 11988723)(4 11988714)(4 11988723)(5 11988715)(5 11988723)(1 11988711) 1 1 0 0 0 0 0 0 0 0(1 11988731) 1 1 1 1 0 0 0 0 0 0(2 11988712) 0 0 1 1 0 0 0 0 0 0(2 11988731) 1 1 1 1 0 0 0 0 0 0(3 11988713) 0 0 0 0 1 1 0 0 0 0(3 11988723) 0 0 0 0 1 1 1 1 1 1(4 11988714) 0 0 0 0 0 0 1 1 0 0(4 11988723) 0 0 0 0 1 1 1 1 1 1(5 11988715) 0 0 0 0 0 0 0 0 1 1(5 11988723) 0 0 0 0 1 1 1 1 1 1

12Leinster et Cobbold laquo Measu-ring Diversity The Importance ofSpecies Similarity raquo cf note 107p 58 proposition A7

Le package entropart fournit les fonctions Dqz et HqZ pourcalculer ces estimateurs

data(Paracou618) Matrice de distances fonctionnellesDistanceMatrix lt- asmatrix(Paracou618dist) Matrice de similariteacuteZ lt- 1 - DistanceMatrixmax(DistanceMatrix) Calcul de la diversiteacuteDqz(Paracou618MC$Ns q = 1 Z)

Best 1488083

97 Diversiteacute phylogeacuteneacutetique

1198791 1199011 1199015 1199012 1199013 1199014

1198792

1198793 b31

b11 b12 b13 b14 b15

La diversiteacute phylogeacuteneacutetique 119902(119879 ) appliqueacutee agrave un arbre ul-trameacutetrique est un cas particulier de 119902119863Z pour une matrice Zdont les lignes et colonnes sont la similariteacute des laquo espegraveces his-toriques raquo12 crsquoest-agrave-dire les couples (espegravece actuelle brancheancestrale)

Par exemple lrsquoespegravece 1 et les branches 11988711 et 11988731 four-nissent les deux premiegraveres lignes et colonnes de la matrice lrsquoespegravece 5 et les branches 11988715 et 11988723 les deux derniegraveres

La diversiteacute phylogeacuteneacutetique 119902(119879 ) est obtenue quand leseacuteleacutements de la matrice Z suivent les regravegles suivantes leseacuteleacutements de toutes les colonnes correspondant agrave une espegravecedonneacutee (par exemple les deux premiegraveres colonnes qui corres-pondent agrave lrsquoespegravece 1) valent 1 pour toutes les lignes corres-pondant agrave une branche dont lrsquoespegravece descend (les trois lignescorrespondant aux branches 11988711 et 11988731) les eacuteleacutements dont lrsquoes-pegravece en colonne ne descend pas de la branche en ligne valent 0La matrice nrsquoest donc pas symeacutetrique mais crsquoest une matricede similariteacute dont la diagonale vaut 1

La probabiliteacute de chaque espegravece historique est la sommede celles des espegraveces actuelles qui en descendent multiplieacuteepar la longueur de la branche normaliseacutee par la hauteur delrsquoarbre Dans lrsquoexemple la hauteur totale de lrsquoarbre est 119879 =1198791 + 1198792 + 1198793 Les probabiliteacutes des espegraveces historiques sont

(1199011119897(11988711)

119879 (1199011 + 1199012) 119897(11988731)119879 1199012

119897(11988712)119879 hellip (1199013 + 1199014 + 1199015) 119897(11988723)

119879 )

Les dimensions de la matrice de similariteacute et du vecteur deprobabiliteacutes deviennent rapidement tregraves grandes et leur eacutecri-ture peacutenible il est bien plus simple de calculer la diversiteacutephylogeacuteneacutetique agrave partir des distances dans lrsquoarbre et des pro-babiliteacutes des espegraveces Cette eacutequivalence de meacutethodes nrsquoa doncpas drsquointeacuterecirct pratique mais montre que la diversiteacute de Leinsteret Cobbold geacuteneacuteralise la diversiteacute phylogeacuteneacutetique Cependantle calcul de 119902Z agrave partir drsquoune matrice Z qui serait la simpletransformation des distances de lrsquoarbre phylogeacuteneacutetique crsquoest-agrave-dire 1 moins les distances normaliseacutees par la hauteur delrsquoarbre ne donne pas la valeur de la diversiteacute phylogeacuteneacutetique119902(119879 ) sauf dans le cas particulier de la diversiteacute de Rao 119902 = 2

Pour un arbre non ultrameacutetrique il est possible de deacutefinirune matrice Z similaire agrave celle de la table 91 mais ses va-leurs non nulles ne sont pas eacutegales agrave 1 Elles sont eacutegales aurapport de 119879 la longueur moyenne des branches pondeacutereacutee parla freacutequence des espegraveces sur la longueur de la branche ellesdeacutependent donc des freacutequences des espegraveces et empecircchent parconseacutequent la comparaison de la diversiteacute entre communauteacutesdiffeacuterentes

98 Diversiteacute individuelleLa diversiteacute 119902119863Z et tous ses cas particuliers (phylodiversiteacute

et diversiteacute neutre) peuvent ecirctre envisageacutes au niveau indivi-duel plutocirct qursquoau niveau de lrsquoespegravece

Le calcul de la diversiteacute nrsquoest pas affecteacute par le remplace-ment drsquoune espegravece par deux espegraveces identiques La ligne et lacolonne de la matrice Z correspondant agrave lrsquoespegravece 119904 sont rem-placeacutees par deux lignes et colonnes identiques correspondant

13S Pavoine et C Ricottalaquo Functional and Phylogenetic Simi-larity among Communities raquo In Me-thods in Ecology and Evolution 57(2014) p 666-675 doi 10 1111 2041 - 210X 12193 Chiu et Chaolaquo Distance-Based Functional Diversi-ty Measures and Their Decomposi-tion A Framework Based on HillNumbers raquo cf note 62 p 131

aux espegraveces 119904prime et 119904Prime dont la similariteacute avec les autres espegravecesest la mecircme que celle de lrsquoespegravece 119904 et la similariteacute entre elleseacutegale agrave 1 les probabiliteacutes veacuterifiant 119901119904 = 119901119904prime + 119901119904Prime Lrsquoopeacutera-tion peut ecirctre reacutepeacuteteacutee jusqursquoagrave la deacutesagreacutegation complegravete dela matrice ougrave chaque ligne correspondrait agrave un individu et lesprobabiliteacutes seraient eacutegales agrave 1119873 Il nrsquoy donc pas de diffeacuterenceentre la mesure de la diversiteacute individuelle et celle de la diversi-teacute speacutecifique qui nrsquoest qursquoune faccedilon pratique de regrouper desindividus ayant la mecircme banaliteacute Dit autrement lrsquoentropiedrsquoune communauteacute est la somme des entropie de ses espegravecesqui nrsquoest que la somme pondeacutereacutee des entropies individuelles sitous les individus drsquoune espegravece ont la mecircme entropie

La variabiliteacute intraspeacutecifique peut ecirctre traiteacutee par un rai-sonnement similaire Lrsquoideacutee drsquointeacutegrer aux mesures de diversi-teacute la possibiliteacute que tous les individus drsquoune espegravece ne soientpas semblables eacutemerge dans la litteacuterature13 Mais si des indi-vidus de la mecircme espegravece ne sont pas totalement similaires ilsne peuvent pas ecirctre regroupeacutes en prenant pour similariteacute delrsquoespegravece avec elle-mecircme une valeur unique qui reacutesumerait la si-milariteacute entre les individus (au lieu de 1) pour tous les ordresde diversiteacute

Formellement si lrsquoespegravece 119904 est composeacutee de deux groupes119904prime et 119904Prime la banaliteacute du groupe 119904prime est

(Zp)119904prime = sum119905ne119904prime119904Prime

119901119905119911119904prime119905 + 119901119904prime + 119901119904Prime119911119904prime119904Prime

celle du groupe 119904Prime est

(Zp)119904Prime = sum119905ne119904prime119904Prime

119901119905119911119904Prime119905 + 119901119904prime119911119904prime119904Prime + 119901119904Prime

Les similariteacutes avec les autres espegraveces sont identiques 119911119904119905 =119911119904prime119905 = 119911119904Prime119905 La contribution agrave la diversiteacute des deux groupes

sum119904prime

119901119904prime(Zp)119902minus1119904prime + sum

119904Prime119901119904Prime(Zp)119902minus1

119904Prime

est remplaceacutee apregraves regroupement par

sum119904

119901119904(Zp)119902minus1119904

Puisque 119901119904 = 119901119904prime +119901119904Prime le regroupement nrsquoest possible quel quesoit 119902 que si les banaliteacutes des deux groupes sont identiques cequi interdit toute variabiliteacute intraspeacutecifique 119911119904prime119904Prime est obliga-toirement eacutegal agrave 1 La non-lineacuteariteacute de la moyenne geacuteneacuteraliseacuteene permet pas de deacutefinir une matrice de similariteacute inteacutegrantla variabiliteacute intraspeacutecifique

Dans le cas de la diversiteacute de Rao (119902 = 2) on peut chercherla valeur de 119911119904119904 diffeacuterente de 1 deacutefinissant la similariteacute de

lrsquoespegravece avec elle mecircme pour prendre en compte sa variabiliteacuteLa reacutesolution de lrsquoeacutequation

sum119904prime

119901119904prime(Zp)119904prime + sum119904Prime

119901119904Prime(Zp)119904Prime = sum119904

119901119904(Zp)119904

permet de trouver

119911119904119904 = 1 + 2119901119904prime119901119904Prime(119911119904prime119904Prime minus 1)1199012119904

Dans le cas le plus simple ougrave 119901119904prime = 119901119904Prime la similariteacute intras-peacutecifique est (1 + 119911119904prime119904Prime)2 La valeur de 119911119904119904 peut ecirctre cher-cheacutee pour nrsquoimporte quelle valeur de 119902 mais la reacutesolution delrsquoeacutequation est en geacuteneacuteral impossible analytiquement et 119911119904119904varie avec 119902 Se limiter agrave 119902 = 2 simplifie le problegraveme

Lrsquoexemple suivant considegravere deux espegraveces dont une com-prenant deux groupes

Similariteacute entre les deux groupeszs12 lt- 09 Probabiliteacutes des deux groupesps1 lt- 15ps2 lt- 15 Matrice de similariteacute(Z2s lt- matrix(c(1 zs12 05 zs12 1 05 05 05 1) nrow = 3))

[1] [2] [3] [1] 10 09 05 [2] 09 10 05 [3] 05 05 10

Probabiliteacutes(P2s lt- c(ps1 ps2 1 - ps1 - ps2))

[1] 02 02 06

DiversiteacuteDqz(P2s 2 Z2s)

None 1329787

Similariteacute intraspeacutecifique apregraves regroupement(zss lt- 1 + 2 ps1 ps2(ps1 + ps2)^2 (zs12 - 1))

[1] 095

Matrice de similariteacute apregraves regroupement(Z1s lt- matrix(c(zss 05 05 1) nrow = 2))

[1] [2] [1] 095 05 [2] 050 10

99 Diversiteacute des valeurs propres 151

14S Pavoine et J Izsaacutek laquo NewBiodiversity Measure That IncludesConsistent Interspecific and Intraspe-cific Components raquo In Methods inEcology and Evolution 52 (2014)p 165-172 doi 1011112041-210X12142

15D Campos et J F Isaza laquo AGeometrical Index for Measuring Spe-cies Diversity raquo In Ecological Indi-cators 94 (2009) p 651-658 doi 101016jecolind200807007

Probabiliteacute apregraves regroupement(P1s lt- c(ps1 + ps2 1 - ps1 - ps2))

[1] 04 06

None 1329787

En pratique si les similariteacutes entre individus ou groupessont connues le regroupement nrsquoa aucun inteacuterecirct Mais en ab-sence de donneacutees individuelles il est possible de choisir arbi-trairement une similariteacute intraspeacutecifique diffeacuterente de 1 (ou defaccedilon eacutequivalente une distance diffeacuterente de 0) pour calculerune diversiteacute drsquoordre fixeacute de preacutefeacuterence 2

99 Diversiteacute des valeurs propresLrsquoapproche de Pavoine et Izsaacutek14 permet de prendre en

compte la variabiliteacute intraspeacutecifique de faccedilon rigoureuse Pourmesurer la diversiteacute neutre les espegraveces sont placeacutees dans unespace multidimensionnel de dimension 119878 Chaque espegravece estrepreacutesenteacutee par un vecteur de longueur 119901119904 sur son axe Cetterepreacutesentation a eacuteteacute utiliseacutee par Campos et Isaza15 qui ont relieacutela diversiteacute de Simpson au volume de la sphegravere sur laquelle setrouve le point deacutefinissant la communauteacute (figure 95)

that ranges in interval 0 D 1 while the Gini-Simpson index

DGS frac14 1 D frac14PS

nfrac141 pneth1 pnTHORN is a measure of heterogeneity or

diversity in that values of D near zero representing high diver-

sity and values near one corresponding to low diversity While

Simpson index D describes the probability that two organisms

drawn randomly and independently from a population belong-

ing to the same species DGS is the probability that two randomly

sampled individuals are of two different classes

In this paper we propose a new set of biodiversiy indices

BkethS rTHORN by using the fact that (1) describes a sphere of radius

r frac14ffiffiffiffiDp

in an euclidian space of S dimensions with coordinate

axes p1 p2 pS The conditions 0 pn 1 andPnfrac14S

nfrac141 pn frac14 1

on the probability distribution p frac14 f p1 p2 pSg also imply

the existence of an hyperplane in S dimensions This hyper-

plane intersects each coordinate axis at the point 1 and the

point P frac14 eth p1 p2 pSTHORN representing p always lies in the first

quadrant of S-dimensional space on a sphere of radius r 1

centered at origin (see Fig 1)

Note that almost six decades after Edward H Simpson

(1949) proposedD as a measure of species concentration as far

as we know no person has taken advantage of the fact that

Eq (1) represents a S-dimensional sphere for which the

formula for finding its volume is known (Kubo 1974) There-

fore the major contribution of this paper consists in using this

property for introducing a new biodiversity index that is based

on a mathematical comparison of the volumes of two spheres

both having the same Simpson index D but differing in the

number of species S and S thorn k respectively (k a non-negative

integer)

A major practical advantage of index BkethS rTHORN frac14 akethSTHORN bkethrTHORN is

that it can be partitioned as the product of two components a

function akethSTHORN dependent of species richness and a function

bkethr frac14ffiffiffiffiDpTHORN dependent of the Simpson index It follows the

relation ln BkethS rTHORN frac14 ln akethSTHORN thorn ln bkethrTHORN that allows to interpret

changes in biodiversity as the combination of two contribu-

tions species richness and abundance distribution

We are also able to get a visual and geometrical

representation of biodiversity by using a cartesian bidimen-

sional plane hereafter called biodiversity plane It has r frac14ffiffiffiffiDp

x-axis biodiversity index BkethS rTHORN as y-axis Biodiversity

conditions of the region under study can be always summar-

ized in a standard diagram as those shown in examples below

(see Figs 3 and 4) In similarity to thermodynamical isothermal

curves (Greek isos equal thermos heat) the r- BkethS rTHORNbiodiversity plane is arranged in layers of lsquolsquoisonumberrsquorsquo of

species curves (S-curves) resulting in an onion-like structure

(structure composed of a set of S-curves) This feature allows

for comparison of communities eg if they have the same

species richness all BkethS rTHORN values belong to same S-curve

Other means of measuring biological diversity is the

Shannon index also called Shannon entropy or Shannon

information index (Izsak and Papp 2000)

Heth pTHORN frac14 Hethp1 p2 pSTHORN frac14 XSnfrac141

pnln pn (2)

where if any pn is assumed to be zero then 0ln 0 is to be

interpreted as zero The quantity HethpTHORN is a function of dis-

tribution p and the unit depends on the base b of logarithm

used (ln frac14 ln b) b frac14 2 bit b frac14 e nat b frac14 3 trit b frac14 10 hartley

Heth pTHORN is the information gained on the biological diversity

in the region assuming that the total number of species Sand the probability distribution p of them are known As

0 HethpTHORN lnS there are two extreme situations (i) minimum

biological diversity occurs when only one species exists (all pn

are zero but one takes value 1 HethpTHORN frac14 0) (ii) Maximum biolo-

gical diversity occurs when the probability distribution p is

homogeneous (all pn take the same value pn frac14 1=S and there-

fore Hmax ethpTHORN frac14 lnS)

Further motivation for introducing a new biological

diversity index is concerned with a remark by Kolasa and

Biesladka (1984) Computing the Shannon index or Simpson

index constitutes an error because they combine levels

(number of species and distribution of their abundances) into

one value of unknown ecological meaning and in this

procedure information is lost By taking advantage of the

descomposition ln BkethS rTHORN frac14 ln akethSTHORN thorn ln bkethrTHORN we conclude

that this is not the case with the index introduced in present

paper In fact for a given numerical couple ethS rTHORN the BkethS rTHORN-value (say g) is located on a well-defined unique S-curve (eg

see Figs 3 and 4) The reverse process that in the bidodiversity

plane starts from a fixed S-curve and the value g also leads to

a unique value r Another way of preserving the full

information is to record the couple ethakethSTHORNbkethrTHORNTHORNIndex BkethS rTHORN is also an ordering system Index value

associated with ethS pTHORN be greater than the value corresponding

to ethS0 p0THORN if either D frac14 D0 (same value of r) and SgtS0 (S-curve

above S0 curve) or S frac14 S0 (just the same S-curve) and DltD0

(that is rlt r0)

In Section 2 the promised diversity index BkethS rTHORN is

introduced and the method is illustrated by considering

examples with hypothetical communities For a practical

application of the method a full example is developed (Section

3) by using data from the weevil (Coleoptera Curculionidae)

species richness published by Ohsawa (2005) and discussed

further by Ito (2007) In Section 4 we conclude with some

Fig 1 ndash Geometrical interpretation of Eq (1) for the case of

three species S frac14 3 The plane passing through the points

eth100THORN eth010THORN and eth001THORN is given by p1 thorn p2 thorn p3 frac14 1

e c o l o g i c a l i n d i c a t o r s 9 ( 2 0 0 9 ) 6 5 1 ndash 6 5 8652

Fig 95 Repreacutesentation drsquounecommunauteacute dans un espacemultidimensionnel dont chaqueaxe correspond agrave une espegravece Lacommunauteacute est composeacutee de troisespegraveces Le point repreacutesentant lacommunauteacute se trouve sur lasphegravere de rayon 119903 = radicsum119904 1199012119904 Leplan (qui est en reacutealiteacute unhyperplan de dimension 119878 minus 1)drsquoeacutequation sum119904 119901119904 = 1 estrepreacutesenteacute par un triangle

La matrice de similariteacute entre les espegraveces Z permet drsquoaf-finer la repreacutesentation Soit la matrice C =

radicZ Chaque es-

pegravece 119904 est maintenant repreacutesenteacutee par le vecteur dont la coor-donneacutee sur lrsquoaxe 119905 est radic119901119904119901119905119888119904119905 Les axes correspondent auxespegraveces laquo pures raquo totalement dissimilaires les vecteurs des es-pegraveces reacuteelles prennent en compte la similariteacute Dans le cas ex-trecircme de la diversiteacute neutre C = I chaque espegravece est situeacuteeuniquement sur son axe Dans lrsquoautre cas extrecircme de totale

similariteacute ougrave C ne contient que des 1 toutes les espegraveces sontcolineacuteaires

Il est possible de calculer les 119878 valeurs propres noteacutees 120582119904de la matrice des coordonneacutees des espegraveces et de les normaliser 120583119904 = 120582119904sum119904 120582119904 La communauteacute peut maintenant ecirctre repreacute-senteacutee par ses valeurs propres 120583119904 correspondant agrave la proportiondrsquoune laquo espegravece composite raquo pure sur chaque axe geacuteneacutereacute par lesvecteurs propres cette transformation est une ACP non cen-treacutee non reacuteduite La diversiteacute HCDT des valeurs propres estla diversiteacute de la communauteacute qui sera noteacutee ici 119902119863Z(Λ)

La deacutefinition de cette diversiteacute autorise toute matrice Csymeacutetrique dont les valeurs de similariteacute sont positives ounulles strictement positives sur la diagonale Si C est la racinecarreacutee drsquoune matrice de similariteacute au sens strict Z crsquoest-agrave-dire contenant des valeurs comprises entre 0 et 1 et dont leseacuteleacutements de la diagonale sont tous eacutegaux agrave 1 alors 2119863Z(Λ)est eacutegale agrave la diversiteacute de Rao appliqueacutee agrave une matrice dedistances D = 1 minus Z La deacutefinition de C comme racine carreacuteede Z se justifie par des raisons geacuteomeacutetriques la norme dechaque vecteur repreacutesentant une espegravece est la racine carreacutee dela somme des carreacutes de ses coordonneacutees Le carreacute de la normedu vecteur de lrsquoespegravece 119904 est donc 119901119904 multiplieacute par la banaliteacutede lrsquoespegravece

Si Z = I119904 lrsquoACP ne modifie pas le nuage de points originalet 119902119863Z(Λ) = 119902119863

Lrsquoexemple suivant calcule la diversiteacute de la meacuteta-communauteacute Paracou618 selon la matrice de distancesParacou618dist

ProbabiliteacutesPs lt- Paracou618MC$Ps[Paracou618MC$Ps gt 0] Matrice de distances fonctionnellesDistanceMatrix lt- asmatrix(Paracou618dist) Mise en correspondance de la matrice et du vecteur de probabiliteacutesD lt- DistanceMatrix[names(Ps) names(Ps)] NormalisationD lt- Dmax(D) Transformation en matrice de similariteacuteZ lt- 1 - D Matrice diagonale contenant les probabiliteacutesQ lt- diag(Ps) Matrice des espegraveces (les lignes de Sp sont les coordonneacutees des vecteurs)Sp lt- sqrt(Q) sqrt(Z) sqrt(Q) Valeurs propres normaliseacuteesLambda lt- svd(Sp)$dMu lt- Lambdasum(Lambda) Comparaison des valeurs agrave q=2Diversity(Mu 2)

None 1540061

Diversiteacute de RaoDqz(Ps 2 Z)

None 1490786

La valeur agrave q=0 est le nombre despegravecesDiversity(Mu 0)

None 229

length(Ps)

[1] 229

La valeur de la diversiteacute des valeurs propres est diffeacuterentede celle de la diversiteacute de Rao agrave cause des approximationsnumeacuteriques lieacutees au calcul des valeurs propres (qui neacutecessitentlrsquoinversion drsquoune matrice carreacutee de dimension 119878) La valeurexacte est celle donneacutee par Dqz()

Le profil de diversiteacute se trouve en figure 96

teacute

Fig 96 Profil de diversiteacute desvaleurs propres de lameacuteta-communauteacute Paracou618

Code R pour la figure

DqZLambda lt- CommunityProfile(Diversity Mu)Xlab lt- Ordre de diversiteacuteYlab lt- Diversiteacuteautoplot(DqZLambda xlab = Xlab ylab = Ylab) + scale_y_log10()

La diversiteacute des valeurs propres permet de ramener le pro-blegraveme de la diversiteacute drsquoespegraveces partiellement similaires au cal-cul de la diversiteacute neutre drsquoune communauteacute drsquoespegraveces compo-sites totalement dissimilaires

Les eacuteleacutements de la diagonale de la matrice de similariteacute nesont pas forceacutement eacutegaux agrave 1 des valeurs infeacuterieures corres-pondent agrave la variabiliteacute intraspeacutecifique selon le meacutecanisme de

regroupement traiteacute au paragraphe preacuteceacutedent Les raisons quiempecircchent drsquoutiliser des valeurs de similariteacute intraspeacutecifiquediffeacuterentes de 1 dans le calcul de la diversiteacute de Leinster etCobbold ne srsquoappliquent pas ici quelle que soit la valeur de119902 les valeurs propres sont les mecircmes

Les limites de la diversiteacute des valeurs propres sont cepen-dant nombreuses La premiegravere est numeacuterique son calcul estimpreacutecis dans des communauteacutes tregraves riches Lrsquoinversion drsquounematrice de dimension 200 ou plus est toujours probleacutematique

Les espegraveces non eacutechantillonneacutees entraicircnent un biais drsquoesti-mation le nombre de dimensions est sous-estimeacute Comme lesespegraveces manquantes ont une faible probabiliteacute leur vecteur estpetit et nrsquoinflue pas beaucoup sur la diagonalisation de la ma-trice Les valeurs propres manquantes sont donc petites Ellesinfluent sur la diversiteacute pour les faibles valeurs de 119902 notam-ment la diversiteacute drsquoordre 0 qui est le nombre de dimensionsde la matrice des espegraveces (en geacuteneacuteral le nombre drsquoespegraveces ouune valeur infeacuterieure si des espegraveces sont colineacuteaires) Il nrsquoexistepas de technique pour corriger ce biais drsquoestimation

La composition de la communauteacute en espegraveces compositesdeacutepend agrave la fois de la matrice de similariteacute et des probabiliteacutesdes espegraveces reacuteelles Elle est donc unique pour chaque com-munauteacute ce qui empecircche toute deacutecomposition de la diversiteacuteselon les meacutethodes preacutesenteacutees plus loin

910 Synthegravese119902119863(119879 ) est lrsquoexponentielle drsquoordre 119902 de la moyenne pondeacute-

reacutee de lrsquoentropie HCDT calculeacutee agrave chaque peacuteriode de lrsquoarbrephylogeacuteneacutetique

119902119863Z est lrsquoexponentielle drsquoordre 119902 de lrsquoentropie de Ricotta etSzeidl mais aussi lrsquoinverse de la banaliteacute moyenne des espegravecesde la communauteacute

119902119863Z et 119902119863 sont des nombres effectifs drsquoespegraveces respectenttoutes les proprieacuteteacutes demandeacutees agrave une mesure de diversiteacute dontle principe de reacuteplication Leurs valeurs sont identiques pour119902 = 2 (diversiteacute de Rao) 119902119863Z est moins sensible au paramegravetre119902 que 119902119863(119879 ) la figure 97 compare les deux mesures

Le rocircle du paramegravetre est assez diffeacuterent dans 119902119863Z la ba-naliteacute des espegraveces est agrave la puissance 119902 alors que leur probabiliteacuteest agrave la puissance 1 Le paramegravetre deacutetermine lrsquoimportance don-neacutee aux espegraveces originales crsquoest-agrave-dire dont la banaliteacute est pe-tite et non aux espegraveces rares Les deux notions se confondentquand la diversiteacute neutre est consideacutereacutee la banaliteacute drsquouneespegravece se reacuteduit alors agrave sa freacutequence

910 Synthegravese 155

0 1 2 3q

teacute

Fig 97 Diversiteacute phylogeacuteneacutetique(lrsquoarbre est une taxonomie) drsquoordre119902 de deux hectares de forecirct deParacou 119902119863Z (trait plein) et119902(119879 ) (pointilleacute)

16Pavoine et al laquo Is the Origina-lity of a Species Measurable raquo cfnote 30 p 105 Podani et Schmeralaquo On Dendrogram-Based Measures ofFunctional Diversity raquo cf note 25p 104 Podani et Schmera laquo HowShould a Dendrogram-Based Measureof Functional Diversity Function ARejoinder to Petchey and Gaston raquocf note 30 p 105

q lt- c(seq(0 3 01)) Reacuteutilisation de Paracou618Taxonomy au format phylog (cf calcul de FAD)DistanceMatrix lt- asmatrix(Tree$Wdist^22)Z lt- 1 - DistanceMatrixmax(DistanceMatrix)Divqz lt- sapply(q function(q) Dqz(Paracou618MC$Ps q Z))Divq lt- sapply(q function(q) ChaoPD(Paracou618MC$Ps q = q

PhyloTree = Paracou618Taxonomy))ggplot(dataframe(q Divq Divqz) aes(q)) + geom_line(aes(y = Divqz)) +

geom_line(aes(y = Divq) lty = 2) + labs(y = Diversiteacute)

119902119863Z est particuliegraverement inteacuteressante pour mesurer la di-versiteacute fonctionnelle souvent deacutefinie agrave partir drsquoune matrice dedistances entre les espegraveces La transformation drsquoune matriceen un arbre phylogeacuteneacutetique deacuteforme les donneacutees16 La diversi-teacute de Leinster et Cobbold est calculeacutee directement agrave partir dela matrice

Si lrsquoarbre phylogeacuteneacutetique nrsquoest pas ultrameacutetrique le calculde la diversiteacute est possible mais la matrice Z contient alors desvaleurs comprises entre 0 et 1 qui deacutependent des effectifs desespegraveces actuelles (ils interviennent dans le calcul de la hauteurde lrsquoarbre qui est la moyenne de la longueur des branches) Ladeacutependance entre similariteacute et freacutequence des espegraveces constitueun problegraveme theacuteorique qui empecircche drsquointerpreacuteter la diversiteacutecalculeacutee agrave partir drsquoun arbre non ultrameacutetrique

Enfin il est possible de deacutesagreacuteger les donneacutees jusqursquoauniveau individuel si la distance entre paires drsquoindividus estconnue En revanche la prise en compte de la variabiliteacute in-traspeacutecifique par une similariteacute intraspeacutecifique infeacuterieure agrave 1nrsquoest possible que pour un ordre de diversiteacute fixeacute il nrsquoest paspossible drsquoobtenir un profil de diversiteacute de cette faccedilon

Quatriegraveme partie

Diversiteacute beta etdeacutecomposition

1Whittaker laquo Vegetation of theSiskiyou Mountains Oregon and Ca-lifornia raquo cf note 8 p 5

2M J Anderson et al laquo Naviga-ting the Multiple Meanings of Diver-sity A Roadmap for the PracticingEcologist raquo In Ecology Letters 141(2011) p 19-28 doi 101111j1461-0248201001552x

Chapitre 10

La diversiteacute 120573 deacutesigne la diffeacuterentiation entre communauteacutes crsquoest-agrave-direune mesure de divergence de composition speacutecifique entre elle ou bienla divergence entre elles et leur assemblage appeleacutee diversiteacute propor-tionnelle La conciliation de ces deux deacutefinitions fait toujours lrsquoobjet derecherches

Lrsquoessentiel

La notion de diversiteacute 120573 a eacuteteacute introduite par Whittaker1page 320 comme le niveau de changement dans la compositiondes communauteacutes ou le degreacute de diffeacuterenciation des commu-nauteacutes en relation avec les changements de milieu La traduc-tion de cette notion intuitive en une deacutefinition sans ambiguiumlteacuteest encore une question de recherche et de deacutebats

Anderson et al2 fournissent une revue des analyses utilesde la diversiteacute 120573 en forme de guide agrave destination des eacutecologuesreprise ici en introduction La distinction entre diversiteacute de dif-feacuterenciation et diversiteacute proportionnelle est preacutesenteacutee ensuite

Pour simplifier lrsquoexposeacute les individus seront eacutechantillonneacutesdans des communauteacutes appartenant agrave une meacuteta-communauteacuteLe tableau 101 reacutesume les notations

Des exemples montrent comment calculer cette diversi-teacute principalement agrave lrsquoaide du package entropart Le packagecontient les donneacutees drsquoinventaire de deux hectares du disposi-tif de Paracou Les donneacutees sont organiseacutees dans le packagesous la forme drsquoun objet MetaCommunity qui contient notam-ment la matrice des 119899119904119894 Les parcelles de Paracou sont danslrsquoobjet Paracou618MC

library(entropart)summary(Paracou618MC)

Meta-community (class MetaCommunity) made of 1124 individuals in 2 communities and 425 species Its sample coverage is 092266748426447 Community weights are

160 Cadre

Tab 101 Notations des effectifs tableau espegraveces-communauteacutes

Communauteacute 119894 hellip Total meacuteta-communauteacute

Espegravece 119904 119899119904119894 nombredrsquoindividus delrsquoespegravece 119904 dans lacommunauteacute 119894119904|119894 = 119899119904119894119899+119894 estlrsquoestimateur de laprobabiliteacute 119901119904|119894qursquoun individu de lacommunauteacute 119894 soitde lrsquoespegravece 119904

119899119904+ = sum119894 119899119904119894119901119904 = sum119894 119908119894119901119904|119894

hellipTotal 119899119904+ = sum119894 119899119904119894

119901119904 = sum119894 119908119894119901119904|119894

119899 nombre totaldrsquoindividuseacutechantillonneacutes

3Anderson et al laquo Navigatingthe Multiple Meanings of Diversity A Roadmap for the Practicing Ecolo-gist raquo cf note 2 p 159

4M Vellend laquo Do CommonlyUsed Indices of -Diversity MeasureSpecies Turnover raquo In Journal ofVegetation Science 12 (2001) p 545-552 doi 1023073237006

[1] 05720641 04279359 Community sample numbers of individuals are P006 P018 643 481 Community sample coverages are P006 P018 08943859 08463782

101 Deacutefinition de la diversiteacute 120573 parobjectifs

Anderson et al3 proposent une revue des deacutefinitions dela diversiteacute 120573 selon les analyses eacutecologiques auxquelles ellespeuvent contribuer plutocirct que selon leurs proprieacuteteacutes matheacute-matiques

Deux types de diversiteacute 120573 peuvent ecirctre deacutefinies4 en accordavec les notions originales de Whittaker le remplacement (tur-nover) des espegraveces le long drsquoun gradient environnemental spa-tial ou temporel et la variation de la composition speacutecifiqueentre communauteacutes qui diffegraverent de la meacuteta-communauteacute etentre elles Ces deux deacutefinitions sont preacutesenteacutees sur les figures101 et 1025

Les mesures de remplacement ne sont pas traiteacutees en deacutetaildans ce chapitre mais simplement preacutesenteacutees ici

La plus simple (figure 101 T1) est la dissimilariteacute entredeux communauteacutes noteacutee Δ119910 De nombreuses mesures de dissi-milariteacute existent elles sont deacutetailleacutees dans le chapitre 11 Whit-taker nrsquoenvisageait que la preacutesence ou lrsquoabsence des espegravecesmais leur abondance peut ecirctre prise en compte

Cette dissimilariteacute peut ecirctre analyseacutee en fonction du gra-dient de reacutefeacuterence La dissimilariteacute entre des paires de com-munauteacutes preacutesentant la mecircme diffeacuterence (par exemple ayant

101 Deacutefinition de la diversiteacute 120573 par objectifs 161

d frac14 1m

Pi jlti dij (eg Whittaker 1960 1972 Vellend et al 2007) or the average distance-

to-centroid of the N points in the space defined by the resemblance measure (here

referred to as dcen see Anderson 2006 Anderson et al 2006 for further details)

For Euclidean distances and one species (p = 1) r2 is the classical unbiased estimate of

the univariate sample variance Legendre et al (2005) suggested SS(Y) the sum of the

individual sum of squares across all species as a measure of b diversity For Euclidean

distances r2 frac14 SSethYTHORN=ethN 1THORN that is r2 frac14 trethRTHORN the sum of the estimated variances

across all species where R is the estimated variancendashcovariance matrix of dimension

p middot p More generally for non-Euclidean measures (Jaccard Soslashrensen BrayndashCurtis

etc) r2 frac14 trethGTHORN=ethN 1THORN where G is Gowers centred matrix obtained directly from

matrix D (McArdle amp Anderson 2001) Taking the square root r frac14ffiffiffiffiffir2p

yields a

measure of variation expressed in the same units as the chosen resemblance measure

MISSION STATEMENTS AND ASSOCIATED ANALYSES

We articulate a series of mission statements regarding the analysis of b diversity These

are numbered and discussed in two separate groups by reference to the two conceptual

types of b diversity turnover and variation (Fig 2) Figures 3 and 4 show schematic

representations of the relevant sampling designs and associated analyses in each case

Surnover

T1 Measure the turnover in community structure between two communities The focus here is on

simply estimating Dy between two communities

T2 Measure the turnover in community structure between two communities and model this along an

environmental gradient or other factor For example if we estimate the turnover in

community structure between serpentine and non-serpentine soils (Dy) does this

change with latitude (x) Interest lies in modelling Dy vs x directly which can be done

by fitting a linear or nonlinear model Note that each Dy value is obtained

independently in this scenario with one (or more if one has independent replicates of

such pairs) for each value of x Note these are not all possible pairwise values in a

distance matrix

T3 Explore and model the relationship between pairwise dissimilarities in community structure

and pairwise differences in space time or environment Here interest lies in modelling all

pairwise Dy values as a function of Dx For example are differences in insect

community structure related to differences in precipitation The Mantel test (Mantel

1967) may be used to test statistical significance of such relationships This approach

unwinds the dissimilarity matrix into a single vector of k frac14 1 m values but

permutations are done correctly by treating the N sample units (not the m pairs) as

TURNOVER

Figure 3 Schematic representation and appropriate analyses of ecolog-

ical b diversity for each of a series of mission statements with a focus on

turnover along one or more spatial temporal or environmental

gradients

Idea and Perspective Roadmap for beta diversity 21

2010 Blackwell Publishing LtdCNRS

Fig 101 Diversiteacute 120573 lieacutee auremplacement des espegraveces le longdrsquoun gradient Δ119910 est la mesure dela dissimilariteacute entre deuxcommunauteacutes x est un gradientenvironnemental spatial outemporel Δ119909 est lrsquoeacutecart entredeux points du gradient

6J C Nekola et P S Whitelaquo The Distance Decay of Similarityin Biogeography and Ecology raquo In Journal of Biogeography 264 (1999)p 867-878 doi 101046j1365-2699199900305x

7P Legendre et M J Andersonlaquo Distance-Based Redundancy Analy-sis Testing Multispecies Responsesin Multifactorial Ecological Experi-ments raquo In Ecological Monographs691 (1999) p 1-24 doi 1018900012-9615(1999)069[0001DBRATM]20CO2

8P Legendre et E Gallagherlaquo Ecologically Meaningful Transfor-mations for Ordination of Spe-cies Data raquo In Oecologia 1292(2001) p 271-280 doi 10 1007 s004420100716

9P Legendre et al laquo AnalyzingBeta Diversity Partitioning the Spa-tial Variation of Community Compo-sition Data raquo In Ecological Mono-graphs 754 (2005) p 435-450 doi 10189005-0549

10Pavoine et al laquo From Dissimi-larities among Species to Dissimilari-ties among Communities A DoublePrincipal Coordinate Analysis raquo cfnote 51 p 126

subi ou non un traitement) situeacutees le long drsquoun gradient (parexemple la fertiliteacute du sol) peut ecirctre analyseacutee en fonction de cegradient (figure 101 T2) Plus classiquement la diversiteacute 120573peut ecirctre reacutegresseacutee contre la valeur du gradient (T3) La dissi-milariteacute de chaque paire de communauteacutes est confronteacutee agrave soneacutecart sur le gradient Les deux analyses preacuteceacutedentes peuventecirctre combineacutees pour mesurer le remplacement des espegraveces se-lon deux gradients emboicircteacutes (T6)

Une variation sur le modegravele T2 consiste agrave le repreacutesentersous la forme drsquoun modegravele de deacutecroissance en fonction de ladistance6 eacuteventuellement pour plusieurs groupes de commu-nauteacutes (figure 101 T4 et T5) Lrsquoindice de Simpson spatiale-ment explicite (Section 231) entre dans ce cadre bien qursquoilsoit construit diffeacuteremment

Les mesures de variation (figure 102 V1) concernent la dis-similariteacute entre plusieurs communauteacutes ou entre chaque com-munauteacute et la meacuteta-communauteacute Lrsquoeacutequivalence de ces deuxconcepts nrsquoest pas eacutevidente elle a eacuteteacute montreacutee pour les me-sures de dissimilariteacute entre paires de communauteacutes par P Le-gendre et Anderson 7 P Legendre et Gallagher 8 P Legendreet al9 et pour lrsquoentropie de Rao par Pavoine et al10 mais resteune question ouverte pour lrsquoentropie HCDT en geacuteneacuteral

162 Cadre

Fig 102 Diversiteacute 120573 lieacutee agrave lavariation de la composition

speacutecifique 120573119882 est le rapport entrela diversiteacute 120574 et la diversiteacute 120572

120573119860119889119889 leur diffeacuterence 119889119894119895 est ladissimilariteacute entre les

communauteacutes 119894 et 119895 2 est lavariance de cette dissimilariteacute 119889 sa

moyenne Si 119889 est une distanceeuclidienne 119889119888119890119899 est la distance

moyenne des communauteacutes agrave leurcentre de graviteacute

exchangeable under the null hypothesis of no relationship between Dy and Dx

(Legendre amp Legendre 1998) These m values are not independent of one another so

one cannot use classical regression methods (partitioning and associated tests) directly

on the Dy values (Manly 2007) Note that the Mantel test which may be useful for

analysing a single gradient is not recommended for investigating more than one

gradient at a time (such as spatial gradients in two dimensions) due to the omni-

directional nature of dissimilarities and lack of power (Legendre amp Fortin 2010)

T4 Estimate the rate of turnover in community structure along a spatial temporal or

environmental gradient Interest lies in modelling Interest lies in modelling Dy vs Dx

which is essentially the same thing as T3 but specifically now with the goal of

estimating the rate of turnover (paray frasl parax) as in a distancendashdecay model (Qian amp Ricklefs

2007) In most cases similarity [(1 ) Dy) where 0 pound Dy pound 1] is modelled as a linear or

nonlinear function of Dx (usually an exponential decay) for simplicity we shall refer to

the estimated slope as paray frasl parax One might also consider the relative strength of the

relationship (r2) which is not necessarily monotonic on the estimated slope Thus we

recommend that both the r2 and slope values be reported in comparative studies of

distancendashdecay models A potential issue arises when there is no evidence against the

null hypothesis of the slope being zero (tested using the Mantel test as in T3 above)

It is unlikely that this corresponds to there being zero b diversity Rather there may

well be variation that is simply unrelated to the measured gradient

T5 Compare turnover along a specific gradient for two different sets of species or taxonomic groups

For example is the rate of species turnover along a gradient in soil type different for

native species than it is for exotic species Here one examines two rates along a

common gradient Interest lies in comparing (say) paraynative frasl parax with parayexotic frasl parax This can

be done visually by looking at plots of the models but note that lack of independence

among the Dy values precludes the use of a classical ANCOVA A test of the null

hypothesis of no difference in the slopes may be done however by randomly

re-allocating the species into the groups (native vs exotic) but leaving x fixed to

generate a null distribution for the difference in slopes The concept of halving distance

(Soininen et al 2007) might also be considered here

T6 Explore and model the rate of turnover along a gradient across different levels of another

factor or along another gradient For example is the rate of turnover in marine benthic

invertebrates along a depth gradient different for different latitudes or through time

Here the response variable is turnover (paray frasl parax) along a chosen gradient and one may

model this in response to a complex experimental design (eg with several factors and

their interactions) or sets of other continuous predictor variables (eg temperature

salinity nutrients etc) There are no limitations on the types of models that could be

used here (linear or nonlinear classical or nonparametric) provided independent (and

preferably replicated) values of paray frasl parax are estimated at each point within the sampling

design For example separate independent estimates of turnover along a depth

variation among sample units

22 M J Anderson et al Idea and Perspective

La diversiteacute 120573 peut ecirctre mesureacutee pour un assemblage decommunauteacutes au choix comme la moyenne des dissimilariteacutesentre les paires de communauteacutes ou agrave partir des diversiteacutes 120574et 120572 crsquoest-agrave-dire en tant que mesure deacuteriveacutee Cette derniegravereapproche est traiteacutee dans ce chapitre ougrave il sera montreacute quela mesure deacuteriveacutee est aussi une dissimilariteacute moyenne entrecommunauteacutes et meacuteta-communauteacute

Si la diversiteacute est mesureacutee comme moyenne des dissimila-riteacutes elle peut ecirctre analyseacutee par des meacutethodes drsquoordinationindirectes (figure 102 V2) ou directes (V3) Elle peut aussiecirctre compareacutee entre meacuteta-communauteacutes ou modeacuteliseacutee en fonc-tion drsquoun gradient environnemental (V4) de faccedilon similaireau modegravele T6

La diversiteacute 120573 peut ecirctre deacutecomposeacutee en niveaux hieacuterar-chiques emboicircteacutes (V5) Des tests statistiques sont neacutecessairespour comparer les niveaux par exemple montrer que la diver-siteacute (inter) entre des communauteacutes supposeacutees diffeacuterentes estsignificativement plus grande que celle (intra) des placettesdrsquoeacutechantillonnage de chacune drsquoentre elles agrave la maniegravere drsquouneanalyse de variance (V6) Drsquoautres analyses sont bien sucircr envi-sageables comme la comparaison de la forme de la courbe de

11M Reacutejou-Meacutechain et al laquo Spa-tial Aggregation of Tropical Trees atMultiple Spatial Scales raquo In Journalof Ecology 996 (2011) p 1373-1381doi 101111j1365-2745201101873x

12G Jurasinski et al laquo InventoryDifferentiation and Proportional Di-versity A Consistent Terminology forQuantifying Species Diversity raquo In Oecologia 1591 (2009) p 15-26 doi 101007s00442-008-1190-z

16H-R Gregorius laquo Effec-tive Numbers in the Partitioningof Biological Diversity raquo In Journal of Theoretical Biology409 (2016) p 133-147 doi 101016jjtbi201608037

17H Tuomisto laquo A Diversity ofBeta Diversities Straightening up aConcept Gone Awry Part 1 DefiningBeta Diversity as a Function of Al-pha and Gamma Diversity raquo In Eco-graphy 331 (2010) p 2-22 doi 101111j1600-0587200905880x

dissimilariteacute moyenne entre paires de communauteacutes en fonc-tion de la distance agrave des patrons connus issus de simulationde processus agrave identifier11

102 Typologie des mesuresCette approche utilitaire est compleacuteteacutee par le cadre theacuteo-

rique de Jurasinski et al12 qui distinguent plusieurs types demesures de diversiteacute

bull La diversiteacute drsquoinventaire (inventory diversity) qui traitedes donneacutees reacutecolteacutees sur une uniteacute spatiale ce qui cor-respond agrave la deacutefinition des diversiteacutes 120572 et 120574

bull La diversiteacute de diffeacuterenciation (differentiation diversity)qui mesure agrave quel point les uniteacutes spatiales sont diffeacute-rentes ce qui correspond agrave la deacutefinition litteacuterale de ladiversiteacute 120573 de Whittaker

bull La diversiteacute proportionnelle (proportional diversity) di-versiteacute 120573 qui se construit par diffeacuterence ou rapport desdiversiteacutes 120574 et 120572 Marcon et al13 ont montreacute qursquoavecune deacutecomposition approprieacutee de la diversiteacute la diver-siteacute proportionnelle est aussi la divergence entre la dis-tribution des communauteacutes locales et celle de la meacuteta-communauteacute la diversiteacute 120573 mesure alors agrave quel pointles uniteacutes spatiales sont diffeacuterentes de leur assemblageplutocirct qursquoentre elles

Dans son article fondateur Whittaker14 deacutefinit la diversi-teacute 120573 comme le niveau de changement dans la composition descommunauteacutes la nomme laquo diversiteacute secondaire raquo et lui attri-bue la lettre 120573 en reacutefeacuterence agrave la diversiteacute laquo primaire raquo mesu-rable par lrsquoindice 120572 de Fisher15 voir le chapitre 20 Il illustrecette deacutefinition par une mesure de diffeacuterentiation lrsquoindice deJaccard mais utilise ensuite une mesure proportionnelle lerapport des indice 120572 de lrsquoassemblage des communauteacutes agrave samoyenne sur les communauteacutes La conciliation des deux ap-proches nrsquoest pas simple Gregorius16 montre notamment queles mesures habituelles de diversiteacute proportionnelle ne rendentpas compte correctement de la diffeacuterentiation

103 Deacutecomposition de la diversiteacuteLa faccedilon de deacutecomposer la diversiteacute aboutissant donc agrave

une diversiteacute 120573 proportionnelle ne fait pas consensus Les eacuteleacute-ments du deacutebat sont preacutesenteacutes ici

Deacutefinitions de la diversiteacute 120573 mesure deacuteriveacuteeTuomisto17 passe en revue lrsquoensemble des deacutefinitions de la

164 Cadre

18Jost laquo Entropy and Diversity raquocf note 34 p 67 Jost laquo PartitioningDiversity into Independent Alpha andBeta Components raquo cf note 34 p 67

19H Tuomisto laquo Commentary Do We Have a Consistent Termino-logy for Species Diversity Yes If WeChoose to Use It raquo In Oecologia1674 (2011) p 903-911 doi 10 1007s00442-011-2128-4

20Whittaker laquo Vegetation of theSiskiyou Mountains Oregon and Ca-lifornia raquo cf note 8 p 5 Whittakerlaquo Evolution and Measurement of Spe-cies Diversity raquo cf note 24 p 16

21Lande laquo Statistics and Partitio-ning of Species Diversity and Simila-rity among Multiple Communities raquocf note 73 p 49

diversiteacute 120573 deacuteriveacutee des diversiteacutes 120574 et 120572 Toutes ont en com-mun

bull Une deacutefinition de la mesure de diversiteacute appliqueacutee agrave ladiversiteacute 120574 qui est geacuteneacuteralement une des mesures vuesdans le chapitre 3

bull Une deacutefinition de la diversiteacute 120572 qui peut ecirctre parexemple

ndash La diversiteacute locale mesureacutee dans chaque communau-teacute indeacutependamment de toute reacutefeacuterence hors de lacommunauteacute

ndash De faccedilon eacutequivalente le nombre drsquoespegraveces effectivesdans les communauteacutes

ndash Une faccedilon de combiner les diversiteacutes 120574 et 120572 pourobtenir la diversiteacute 120573 par exemple

lowast 120573 = 120574120572 lowast 120573 = 120574 minus 120572

Lrsquoutilisation des nombres de Hill la mesure locale de ladiversiteacute 120572 et la deacutefinition de la diversiteacute 120573 comme rapportdes diversiteacutes 120574 et 120572 permet de deacutefinir la laquo vraie diversiteacute raquo18

120573 qui est un nombre de communauteacutes eacutequivalentes (composi-tionnal units) similaire au nombre drsquoespegraveces eacutequivalentes desdiversiteacutes 120572 et 120574 Tuomisto19 milite pour que le terme diversiteacutesoit reacuteserveacute agrave la vraie diversiteacute (homogegravene agrave un nombre drsquoes-pegraveces) et que les autres mesures soient appeleacutees diffeacuteremment laquo entropie raquo de Shannon ou laquo probabiliteacute raquo de Gini-Simpson no-tamment

Le deacutebat sur la deacutecompositionLrsquoobjectif est de deacutecomposer la diversiteacute totale noteacutee 120574

en une composante inter-groupes noteacutee 120573 et une composanteintra-groupes noteacutee 120572

Whittaker20 est lrsquoauteur de ce concept Il a poseacute le principeque la diversiteacute 120574 devait ecirctre le produit des diversiteacutes 120572 et 120573

Lande21 a une approche additive et postule que les me-sures de diversiteacute doivent ecirctre concaves la diversiteacute drsquoun jeude donneacutees regroupant plusieurs communauteacutes doit ecirctre su-peacuterieure ou eacutegale agrave la somme pondeacutereacutee des diversiteacutes danschaque communauteacute De cette faccedilon il est possible de deacutefinirune diversiteacute totale eacutegale agrave la somme pondeacutereacutee des diversiteacutes120572 (intra-communauteacutes) et 120573 (inter-communauteacutes) toutes lesdiversiteacutes eacutetant positives ou nulles Il note que laquo la partitionserait plus facilement interpreacutetable si les diffeacuterentes compo-santes de la diversiteacute pouvaient ecirctre exprimeacutes au moyen de lamecircme formule raquo (ce qui nrsquoest en fait jamais le cas) Une revue

103 Deacutecomposition de la diversiteacute 165

22J A Veech et al laquo The Addi-tive Partitioning of Species Diversi-ty Recent Revival of an Old Idea raquoIn Oikos 991 (2002) p 3-9 doi 101034j1600-07062002990101x

23C Ricotta laquo On HierarchicalDiversity Decomposition raquo In Jour-nal of Vegetation Science 162(2009) p 223-226 doi 101111j1654-11032005tb02359x

24A Baselga laquo MultiplicativePartition of True Diversity YieldsIndependent Alpha and Beta Compo-nents Additive Partition Does Not raquoIn Ecology 917 (2010) p 1974-1981 doi doi 10189009- 03201 J A Veech et T O Crist laquo DiversityPartitioning without Statistical Inde-pendence of Alpha and Beta raquo In Ecology 917 (2010) p 1964-1969doi doi10189008-17271

25A Chao et al laquo Proposing a Re-solution to Debates on Diversity Par-titioning raquo In Ecology 939 (2012)p 2037-2051 doi 10189011-18171

26Marcon et al laquo The Decompo-sition of Shannonrsquos Entropy and aConfidence Interval for Beta Diversi-ty raquo cf note 11 p 64

27C Ricotta et M Marignanilaquo Computing -Diversity with RaorsquosQuadratic Entropy A Change ofPerspective raquo In Diversity and Dis-tributions 132 (2007) p 237-241doi 101111j1472-4642200700316x

30Chao et al cf note 25

31S Pavoine et al laquo lsquoEquivalentNumbersrsquo for Species Phylogenetic orFunctional Diversity in a Nested Hie-rarchy of Multiple Scales raquo In Me-thods in Ecology and Evolution 710(2016) p 1152-1163 doi 1011112041-210X12591

32M V Wilson et A Shmi-da laquo Measuring Beta Diversity withPresence-Absence Data raquo In TheJournal of Ecology 723 (1984)p 1055 doi 1023072259551 JS-TOR 2259551 Gregorius laquo LinkingDiversity and Differentiation raquo cfnote 43 p 70

sur les avantages de la deacutecomposition additive est proposeacuteepar Veech et al22

Un deacutebat assez steacuterile a deacutecouleacute de lrsquoopposition entre lesdeux approches principalement ducirc agrave la transformation loga-rithmique23 agrave des deacutefinitions impreacutecises et des deacutemonstrationsempiriques remises en question24 Il reste que la deacutecompositionmultiplicative permet seule la deacutefinition de la diversiteacute 120573 entant que diversiteacute au sens strict25

Marcon et al26 montrent que lrsquoentropie de Shannon 119867120573est une mesure de diversiteacute de diffeacuterenciation en donnant sadeacutefinition indeacutependamment de 119867120572 et 119867120574 comme lrsquoavaient faitRicotta et Marignani pour lrsquoentropie quadratique de Rao27

Crsquoest eacutegalement une diversiteacute proportionnelle comme toutesles mesures passeacutees en revue par Tuomisto la diversiteacute deShannon permet drsquounifier les deux approches

Lrsquoindice de Shannon coupleacute agrave son expression sous forme denombre de Hill respecte finalement tous les critegraveres imposeacutesou souhaiteacutes Sa deacutecomposition est deacutetailleacutee ci-dessous EnfinMarcon et al28 geacuteneacuteralisent ce reacutesultat agrave toutes les mesuresde diversiteacutes deacuteriveacutees de lrsquoentropie geacuteneacuteraliseacutee de Tsallis

Deacutecomposition multiplicative de la diversiteacuteJost29 et Chao et al30 ont montreacute que la deacutecomposition des

nombres de Hill en eacuteleacutements indeacutependants est multiplicative

119902119863120574 =119902 119863119902120572119863120573 (101)

119902119863120572 et 119902119863120574 sont les nombres de Hill drsquoordre 119902 eacutegaux auxdiversiteacutes 120572 et 120574 Ce sont des nombres eacutequivalents drsquoespegraveces119902119863120573 est le laquo nombre de communauteacutes effectives raquo ou laquo nombreeacutequivalent de communauteacutes raquo crsquoest-agrave-dire le nombre de com-munauteacutes de poids eacutegal ne posseacutedant aucune espegravece en com-mun (et dont la dissimilariteacute entre les espegraveces de communauteacutesdiffeacuterentes est maximale quand la diversiteacute est phylogeacuteneacutetiqueou fonctionnelle)31 qui fourniraient la mecircme valeur de diver-siteacute 120573

La diversiteacute 120573 est indeacutependante de la diversiteacute 120572 si lespoids des communauteacutes sont eacutegaux Lrsquoindeacutependance signifieque la valeur de 119902119863120573 nrsquoest pas contrainte par celle de 119902119863120572Cette proprieacuteteacute est souvent consideacutereacutee comme importante32

et sera discuteacutee largement ici

Deacutefinitions de la diversiteacute 120572La diversiteacute 120572 est calculeacutee pour chaque communauteacute et

noteacutee 119902119894 119863120572 (lrsquoentropie correspondante est noteacutee 119902

119894119867120572) La diver-siteacute 120572 de la meacuteta-communauteacute est intuitivement la moyenne

166 Cadre

33Chao et al laquo Proposing a Reso-lution to Debates on Diversity Parti-tioning raquo cf note 25 p 165

34R D Routledge laquo Diversity In-dices Which Ones Are Admissible raquoIn Journal of Theoretical Biology764 (1979) p 503-515 doi 1010160022-5193(79)90015-8

36Ibid

37C Ricotta laquo Computing Para-metric Beta Diversity with UnequalPlot Weights A Solution Based onResampling Methods raquo In Theoreti-cal Ecology 21 (2009) p 13-17 doi 101007s12080-008-0028-y

38C-H Chiu et al laquo PhylogeneticBeta Diversity Similarity and Dif-ferentiation Measures Based on HillNumbers raquo In Ecological Mono-graphs 841 (2014) p 21-44 doi 10189012-09601

de celle des communauteacutes En raison de leurs proprieacuteteacutes ma-theacutematiques il est plus simple de consideacuterer la moyenne desentropies 120572

Le poids de chaque groupe est 119908119894 souvent choisi eacutegal aunombre drsquoindividus de la communauteacute diviseacute par le nombretotal ou agrave la surface de chaque groupe mais qui peut ecirctrearbitraire tant que 119901119904 = sum119894 119908119894119901119904|119894 Deux faccedilons de pondeacutererla somme eacutemergent de la litteacuterature33 La deacutefinition classiqueest selon Routledge34

119902119867120572 = sum119894

119908119894119902119894119867120572 (102)

119902119863120572 = (sum119904

sum119894

119908119894119901119902119904|119894)

1(1minus119902)

La pondeacuteration proposeacutee par Jost35 est

119902119867120572 = sum119894

119908119902119894

sum119894 119908119902119894

119902119894119867120572 (104)

119902119863120572 = (sum119904

sum119894

119908119902119894

sum119894 119908119902119894119901119902

119904|119894)1(1minus119902)

La premiegravere est la pondeacuteration naturelle La seconde quiutilise les poids agrave la puissance 119902 donne donc drsquoautant moinsdrsquoimportance que 119902 est grand aux communauteacutes dont le poidsest faible Les deux deacutefinitions se confondent pour 119902 = 1

Si les poids sont diffeacuterents Jost36 a montreacute que lrsquoindeacutepen-dance nrsquoest possible que si la diversiteacute 120572 est deacutefinie selon sapondeacuteration En revanche cette pondeacuteration ne garantit pasque la diversiteacute 120574 soit supeacuterieure agrave la diversiteacute 120572 si 119902 nrsquoest eacutegalni agrave 0 ni agrave 1 Jost conclut donc que la deacutecomposition nrsquoestpossible que pour des communauteacutes de mecircme poids ou pour119902 = 0 ou 119902 = 1 Ricotta37 contourne cette difficulteacute en propo-sant une meacutethode de reacute-eacutechantillonnage qui permet drsquoeacutegaliserles poids

Chiu et al38 eacutetablissent une nouvelle deacutefinition de la diver-siteacute 120572 qui permet drsquoassurer lrsquoindeacutependance et garantit que ladiversiteacute 120573 est positive quels que soient les poids des commu-nauteacutes

119902119863120572 = 1119868 (sum

119904sum

119894(119908119894119901119904|119894)

119902)1(1minus119902)

Cette deacutefinition pose problegraveme alors que le choix de 119902 apour but de donner une importance plus ou moins grande aux

espegraveces rares son effet est le mecircme sur la taille des commu-nauteacutes La diversiteacute deacutependra essentiellement des espegraveces raresdans les communauteacutes de faible poids si 119902 est petit deacutefinissantune diversiteacute bi-dimensionnelle Cette question est traiteacutee endeacutetail au chapitre 18

Marcon et al39 preacutefegraverent la deacutefinition de Routledge quiest plus intuitive et garantit que la diversiteacute 120574 est supeacuterieureagrave la diversiteacute 120572 La deacutependance entre 119902119863120573 et 119902119863120572 est le prix agravepayer

1H Wolda laquo Similarity IndicesSample Size and Diversity raquo In Oe-cologia 503 (1981) p 296-302 doi 101007BF00344966

2P Jaccard laquo Eacutetude Compara-tive de La Distribution Florale DansUne Portion Des Alpes et Du Jura raquoIn Bulletin de la Socieacuteteacute Vaudoisedes Sciences Naturelles 37 (1901)p 547-579 doi httpdxdoiorg105169seals-266450

3J Czekanowski Zarys MetodStatystycznych w Zastosowaniu DoAntropologii Warsaw TowarzystwoNaukowe Warszawskie 1913 L RDice laquo Measures of the Amount ofEcologic Association between Spe-cies raquo In Ecology 263 (1945) p 297-302 doi 1023071932409 T Soslash-rensen laquo A Method of EstablishingGroups of Equal Amplitude in PlantSociology Based on Similarity of Spe-cies Content and Its Application toAnalyses of the Vegetation on DanishCommons raquo In Biologiske SkrifterBiologiske Skrifter 54 (1948) p 1-34

Chapitre 11

Diversiteacute de diffeacuterentiation

La diversiteacute 120573 de diffeacuterentiation mesure la dissimilariteacute entre commu-nauteacutes geacuteneacuteralement consideacutereacutees par paires Les dissimilariteacutes les plusconnues sont celles de Jaccard ou de Soslashrensen Ces mesures peuventprendre en compte la seule preacutesence ou absence des espegraveces leur abon-dance ou mecircme la similariteacute entre les espegraveces peuvent ecirctre traiteacutees parlrsquoanalyse multivarieacutee et ecirctre testeacutees contre lrsquohypothegravese de nulliteacute de ladissimilariteacute

Lrsquoessentiel

La litteacuterature des indices de similariteacute est bien anteacuterieure agravecelle de la biodiversiteacute De nombreuses mesures de dissimilariteacuteentre paires de communauteacutes existent donc et leurs proprieacuteteacutesont eacuteteacute bien eacutetudieacutees Elles seront preacutesenteacutees ici en fonctiondes types de donneacutees qursquoelles traitent preacutesence-absence abon-dance ou abondance et similariteacute des espegraveces Enfin des testsstatistiques ont eacuteteacute construits pour rejeter lrsquohypothegravese que lescommunauteacutes sont issues drsquoune mecircme meacuteta-communauteacute parun simple tirage multinomial des espegraveces

Une limite importante des mesures de dissimilariteacute estqursquoelles sont tregraves sensibles agrave la taille des communauteacutes eacutechan-tillonneacutees1

111 Donneacutees de preacutesence-absence

Indices de similariteacute

Les indices les plus simples et probablement les plus connuspour calculer la diversiteacute 120573 sont lrsquoindice de Jaccard2 et de Soslash-rensen3 Ils sont deacutefinis pour deux communauteacutes et comptentla proportion drsquoespegraveces qursquoelles partagent Plus elle est faiblemoins la composition speacutecifique des communauteacutes est sem-blable plus la diversiteacute 120573 est consideacutereacutee comme grande

Preacuteciseacutement notons 11990411 les espegraveces observeacutees dans lesdeux communauteacutes 11990410 celles observeacutees dans la premiegravere com-munauteacute mais pas la deuxiegraveme (et de mecircme 11990401) Lrsquoindice de

170 Diversiteacute de diffeacuterentiation

4J C Gower et P Legendrelaquo Metric and Euclidean Properties ofDissimilarity Coefficients raquo In Jour-nal of classification 48 (1986) p 5-48 doi 101007BF01896809

5R R Sokal et P H A SneathPrinciples of Numerical TaxonomySan Francisco W H Freeman amp Co1963

6A Ochiai laquo Zoogeographic Stu-dies on the Soleoid Fishes Foundin Japan and Its Neighbouring Re-gions raquo In Bulletin of the JapaneseSociety of Scientific Fisheries 229(1957) p 526-530 doi 10 2331 suisan22526

Jaccard est le rapport entre le nombre drsquoespegraveces communes etle nombre drsquoespegraveces total

1198783 = 1199041111990411 + 11990410 + 11990401

Lrsquoindice de Soslashrensen vaut deux fois le nombre drsquoespegravecescommunes diviseacute par la somme du nombre drsquoespegraveces des deuxcommunauteacutes

1198787 = 211990411211990411 + 11990410 + 11990401

Les notations 119878119899 correspondent agrave celles de lrsquoarticle de reacutefeacute-rence de Gower et P Legendre4 qui fait la revue de ces indicesde similariteacute (13 autres sont traiteacutes) et en eacutetudie les proprieacuteteacutesCertains indices prennent en compte les espegraveces absentes desdeux communauteacutes mais qui auraient pu ecirctre observeacutees 11990400

Deux autres indices sont mentionneacutes ici celui de Sokal etSneath5 et celui drsquoOchiai 6

1198785 = 1199041111990411 + 2 (11990410 + 11990401) (113)

11987812 = 11990411

radic(11990411 + 11990410) (11990411 + 11990401) (114)

Une proprieacuteteacute importante est la possibiliteacute de comparerplusieurs communauteacutes en calculant la matrice de leurs dis-similariteacutes deux agrave deux et en en faisant une repreacutesentationgraphique Pour cela la similariteacute est transformeacutee en dissimi-lariteacute 119863119899 = 1 minus 119878119899 (les similariteacutes sont construites pour ecirctrecomprises entre 0 et 1) 119863119899 nrsquoest pas toujours une distance eu-clidienne mais radic119863119899 lrsquoest pour la majoriteacute des indices On uti-lisera donc geacuteneacuteralement la matrice de distances euclidiennesΔ dont chaque eacuteleacutement 119889119894119895 est la racine de la dissimilariteacuteradic119863119899 calculeacutee entre les communauteacutes 119894 et 119895

Exemple lrsquoindice de Jaccard peut ecirctre calculeacute pourtous les carreacutes de BCI compareacutes deux agrave deux La fonctiondistbinary du package ade4 calcule radic119863119899 pour 10 indicesde similariteacute eacutetudieacutes par Gower et Legendre (voir lrsquoaide de lafonction) Le reacutesultat est une demi-matrice de distances declasse distlibrary(vegan)data(BCI)library(ade4)DistJaccard lt- distbinary(BCI method = 1)

La distribution des valeurs de lrsquoindice de Jaccard 1198783 =1minus1198632

3 est en figure 111 Le mode est proche de 05 la moitieacutedes espegraveces sont communes entre deux carreacutes

111 Donneacutees de preacutesence-absence 171

04 05 06Jaccard

Fig 111 Distribution des indicesde Jaccard calculeacutes pour les 50carreacutes de BCI deux agrave deux

7A Chao et al laquo A New Statis-tical Approach for Assessing Simila-rity of Species Composition with In-cidence and Abundance Data raquo In Ecology Letters 82 (2004) p 148-159 doi 101111j1461-0248200400707x

ggplot(dataframe(Jaccard = asnumeric(1 - DistJaccard^2))) +geom_density(aes(x = Jaccard))

Pour afficher lrsquoindice de Jaccard entre les carreacutes 1 et 2 ilfaut transformer la demi-matrice des distances en matrice desimilariteacute

Jaccard lt- 1 - (asmatrix(DistJaccard))^2Jaccard[1 2]

[1] 05663717

Biais drsquoestimationTous les indices de similariteacute vus plus haut sont sensibles

au biais drsquoestimation Chao et al7 fournissent un estimateurde la probabiliteacute qursquoun individu de la premiegravere communauteacuteappartienne agrave une espegravece commune aux deux communauteacutes

119880 =11990411

sum119904

1198991199041119899 + 119899+2 minus 1

119899+2

119904(2)1

2119904(2)2

11990411

sum119904

119899119904119899 1 (1198991199042 = 1) (115)

Les sommes srsquoentendent pour toutes les espegraveces communesindiceacutees de 1 agrave 11990411 Le premier terme de la somme est doncla probabiliteacute qursquoun individu de la premiegravere communauteacute ap-partienne agrave une espegravece commune aux deux communauteacutes 119899+2est le nombre drsquoindividus de la deuxiegraveme communauteacute 119904(2)

1 et119904(2)

2 sont le nombre drsquoespegraveces communes qui sont des single-tons et doubletons dans la deuxiegraveme communauteacute Lrsquoindica-trice 1(1198991199042 = 1) vaut 1 si lrsquoespegravece 119904 est un singleton dans ladeuxiegraveme communauteacute la derniegravere somme est donc la proba-biliteacute qursquoun individu de la premiegravere communauteacute appartienne

agrave une espegravece commune qui soit un singleton dans la deuxiegravemecommunauteacute Srsquoil nrsquoy a pas de doubletons dans la deuxiegravemecommunauteacute leur nombre est remplaceacute par 1 Enfin il estpossible que lrsquoestimateur soit supeacuterieur agrave 1 il est alors fixeacute agrave1

Lrsquoestimateur de la probabiliteacute qursquoun individu de ladeuxiegraveme communauteacute appartienne agrave une espegravece communeest noteacute 119881 et est calculeacute de faccedilon symeacutetrique agrave 119880 Le nombredrsquoespegraveces communes 11990411 est estimeacute par 119880 119881 11990410 par (1minus 119880) 119881et 11990410 par 119880(1 minus 119881 ) Lrsquoestimateur de lrsquoindice de Jaccard estdonc

1198783 =119880 119881

119880 + 119881 minus 119880 119881 (116)

Lrsquoestimateur de lrsquoindice de Soslashrensen est

1198787 = 2 119880 119881119880 + 119881

La matrice de dissimilariteacute corrigeacutee est assez diffeacuterente delrsquooriginale Lrsquoindice de Jaccard entre les deux premiers carreacutesdevient

Calcul de U et V N2Col est une matrice ou un dataframe de deux colonnes contenant les effectifs de chaque parcelleChaoUV lt- function(N2Col)

NCommunity lt- colSums(N2Col)Common lt- (N2Col[ 1] gt 0) amp (N2Col[ 2] gt 0)Single lt- N2Col == 1NSingleCommon lt- colSums(Common amp Single)Double lt- N2Col == 2NDoubleCommon lt- colSums(Common amp Double)NsCommon lt- N2Col[Common ]PsCommon lt- t(t(NsCommon)colSums(N2Col))U lt- sum(PsCommon[ 1]) + (NCommunity[2] - 1)NCommunity[2]

NSingleCommon[2]2max(NDoubleCommon[2] 1) sum(PsCommon[1][(NsCommon == 1)[ 2]])

V lt- sum(PsCommon[ 2]) + (NCommunity[1] - 1)NCommunity[1] NSingleCommon[1]2max(NDoubleCommon[1] 1) sum(PsCommon[2][(NsCommon == 1)[ 1]])

return(list(U = U V = V)) Indice de Jaccard corrigeacutebcJaccard lt- function(N2Col)

ChaoEst lt- ChaoUV(N2Col)return(min(ChaoEst$U ChaoEst$V(ChaoEst$U + ChaoEst$V -

ChaoEst$U ChaoEst$V) 1)) Calcul de lindice entre les carreacutes i et j de BCI iltjBCIjaccard lt- function(i j)

if (i gt= j)return(NA) else return(bcJaccard(t(BCI[c(i j) ])))

Calcul de la matrice de dissimilariteacute entre les 50 carreacutesChaoJaccard lt- sapply(150 function(i)

sapply(150 function(j) BCIjaccard(i j)))

8J B Plotkin et H C Muller-Landau laquo Sampling the Species Com-position of a Landscape raquo In Ecolo-gy 8312 (2002) p 3344-3356 doi 10 1890 0012 - 9658(2002 ) 083[3344 STSCOA]20CO2

9J C Gower laquo Some DistanceProperties of Latent Root and VectorMethods Used in Multivariate Ana-lysis raquo In Biometrika 533 (1966)p 325-338 doi 101093biomet533-4325

Indice de Jaccard carreacutes 1 et 2 corrigeacuteBCIjaccard(1 2)

[1] 09391222

La distribution des valeurs de lrsquoindice corrigeacute se trouve enfigure 112

06 08 10ChaoJaccard

Fig 112 Distribution des indicesde Jaccard corrigeacutes du biaisdrsquoetimation pour les 50 carreacutes deBCI deux agrave deux

La majoriteacute des paires de carreacutes a une similariteacute supeacuterieureagrave 08 apregraves correction

ggplot(dataframe(ChaoJaccard = asnumeric(ChaoJaccard))) +geom_density(aes(x=ChaoJaccard))

Plotkin et Muller-Landau8 founissent des estimateurs de lasimilariteacute de Soslashrensen pour les SAD les plus courantes lognor-male broken-stick geacuteomeacutetrique log-seacuteries et mecircme gammaune geacuteneacuteralisation de la distibution broken-stick Ils traitentle cas drsquoun eacutechantillonnage dans lequel les individus sont indeacute-pendants les uns des autres et le cas de lrsquoagreacutegation spatialeIls montrent que la similariteacute augmente beaucoup avec la tailledes placettes eacutechantillonneacutees et est nettement plus faible encas drsquoagreacutegation spatiale

Repreacutesentation graphiqueLa matrice de distances peut ecirctre repreacutesenteacutee par une ana-

lyse en coordonneacutees principales (PCoA) 9

DistChaoJaccard lt- asdist(sqrt(1 - ChaoJaccard))PcoChaoJaccard lt- dudipco(DistChaoJaccard scannf = FALSE)

La repreacutesentation de lrsquoanalyse est en figure 113 Les 50 car-reacutes de BCI sont repreacutesenteacutes sur le plan des deux premiers fac-teurs Les valeurs propres sont repreacutesenteacutees dans le cartouche

Fig 113 Repreacutesentation des 50carreacutes de BCI dans une analyse encoordonneacutees principale fondeacutee sur

les distances de Jaccard

d = 01

31 32 33

Eigenvalues

10Dissimilariteacute 1198631 de Gower etP Legendre laquo Metric and Eucli-dean Properties of Dissimilarity Co-efficients raquo cf note 4 p 170

11J Motyka O Celach i Meto-dach Badan Geobotanicznych SurLes Buts et Les Meacutethodes Des Re-cherches Geacuteobotaniques Lublin Po-land Nakladem universytftu MariiCurie-Sklodowskiej 1947

12E P Odum laquo Bird Populationsof the Highlands (North Carolina)Plateau in Relation to Plant Succes-sion and Avian Invasion raquo In Eco-logy 314 (1950) p 587-605 doi 10 2307 1931577 J R Bray etJ T Curtis laquo An Ordination of theUpland Forest Communities of Sou-thern Wisconsin raquo In EcologicalMonographs 274 (1957) p 325-349doi 1023071942268

13P Legendre et L Legendre Nu-merical Ecology cf note 28 p 104

14O Renkonen laquo Statisch-Oumlkologische Untersuchungen UumlberDie Terrestrische Kaumlferwelt DerFinnischen Bruchmoore raquo In An-nales botanici Societatis ZoologicaeligBotanicaelig Fennicaelig Vanamo 6 (1938)p 1-231

15Gower laquo A General Coefficientof Similarity and Some of Its Proper-ties raquo cf note 22 p 104

en haut agrave gauche de la figure Les distances entre les pointssont les valeurs de radic1198633 projeteacutees sur le plan La matrice dedistances nrsquoest pas euclidienne agrave cause des approximations delrsquoestimation mais les conseacutequences sont faibles sur les premiersaxes

scatter(PcoChaoJaccard posieig = bottomright)

112 Donneacutees drsquoabondanceLa distance la plus eacutevidente entre communauteacutes quand

les effectifs des espegraveces sont connus est simplement la dis-tance euclidienne eacuteventuellement normaliseacutee par le nombredrsquoespegraveces10 Son problegraveme principal est qursquoelle est tregraves sensibleaux ordres de grandeurs relatifs des variables

La dissimilariteacute de Steinhaus11 est plus connue sous le nomde Bray-Curtis12 voir lrsquoanalyse historique de P Legendre etL Legendre13 note de bas de page eq 758 et pourrait ecirctreattribueacutee agrave Renkonen14 Elle est tregraves utiliseacutee par deacutefaut dansplusieurs analyses du package vegan par exemple

1198638 = sum119904 ∣1198991199041 minus 1198991199042∣sum119904 (1198991199041 + 1198991199042) (118)

1198991199041 et 1198991199042 sont le nombre drsquoindividus de lrsquoespegravece 119904 dansla premiegravere et la deuxiegraveme communauteacute La racine carreacutee dela dissimilariteacute de Bray-Curtis est euclidienne

Gower15 propose une extension de la dissimilariteacute de Bray-Curtis

119863119866 = sum119904 119908119904 ∣1198991199041 minus 1198991199042∣119877119904 sum119904 119908119904

113 Emboicirctement et substitution 175

16M J Anderson et al laquo Multi-variate Dispersion as a Measure ofBeta Diversity raquo In Ecology letters96 (2006) p 683-93 doi 101111j 1461- 0248 2006 00926 x PMID 16706913

17M Ružička laquo AnwendungMathematisch-Statisticher Methodenin Der Geobotanik (SynthetischeBearbeitung von Aufnahmen) raquoIn Biologia Bratislava 13 (1958)p 647-661

18A Baselga laquo Partitioning theTurnover and Nestedness Compo-nents of Beta Diversity raquo In Glo-bal Ecology and Biogeography 191(2010) p 134-143 doi 101111j1466-8238200900490x

119877119904 est lrsquoeacutetendue ou lrsquoeacutecart-type de lrsquoabondance de lrsquoespegravece119904 qui permet de ne pas surpondeacuterer lrsquoeffet des espegraveces tregravesabondantes 119908119904 est le poids attribueacute agrave lrsquoespegravece 119904 qui peut ecirctreutiliseacute pour eacuteliminer les doubles absences (119908119904 = 0 si lrsquoespegraveceest absente des deux communauteacutes 1 sinon)

Anderson et al16 proposent une mesure de dissimilariteacute(de Gower modifieacutee) donnant le mecircme poids agrave une diffeacuterencedrsquoun ordre de grandeur entre les abondances qursquoagrave la diffeacuterenceentre preacutesence et absence qui permet donc de se passer dela normalisation par 119877119904 Les effectifs sont transformeacutes de lafaccedilon suivante 119909119904 = log 119899119904 + 1 si 119899119904 ne 0 119909119904 = 1 sinon (lelogarithme est deacutecimal) La dissimilariteacute est

119863MG = sum119904 119908119904 ∣1199091199041 minus 1199091199042∣sum119904 119908119904

(1110)

Elle nrsquoest pas euclidienneLes dissimilariteacutes de Jaccard et de Soslashrensen se geacuteneacutera-

lisent aux donneacutees drsquoabondance Le nombre drsquoespegraveces com-munes aux deux sites 11990411 est remplaceacute par le nombre drsquoin-dividus de mecircme espegravece preacutesents sur les deux sites 11989911 =sum119904 min(1198991199041 1198991199042) le nombre drsquoespegraveces seulement preacutesentessur le premier site 11990410 est remplaceacute par le nombre drsquoindividussommeacute sur toutes les espegraveces preacutesents uniquement sur le site 11989910 = sum119904 max(0 1198991199041 minus 1198991199042) de mecircme 11990401 est remplaceacute par11989901 = sum119904 max(0 1198991199042 minus 1198991199041)

La dissimilariteacute de Ružička17 geacuteneacuteralise celle de Jaccard

1198633 = 1 minus 1198991111989911 + 11989910 + 11989901

(1111)

La diffeacuterence de pourcentage (percentage difference) geacuteneacute-ralise la dissimilariteacute de Soslashrensen

1198637 = 1 minus 211989911211989911 + 11989910 + 11989901

(1112)

La plupart des dissimilariteacutes sont impleacutementeacutees par la fonc-tion distldc du package adespatial

113 Emboicirctement et substitutionLrsquoindice de Soslashrensen et les indices similaires prennent en

compte deux types de dissimilariteacute lrsquoemboicirctement des com-position speacutecifiques (nestedness) et la substitution drsquoespegraveces(turnover) On parle drsquoemboicirctement quand une communau-teacute diffegravere drsquoune autre parce que sa composition est un sous-ensemble des espegraveces de lrsquoautre La substitution correspondau remplacement de certaines espegraveces drsquoune communauteacute par

19G G Simpson laquo Mammals andthe Nature of Continents raquo In Ame-rican Journal of Science 241 (1943)p 1-31 doi 102475ajs24111

20A Baselga laquo The Relationshipbetween Species Replacement Dis-similarity Derived from Nestednessand Nestedness raquo In Global Ecolo-gy and Biogeography 2112 (2012)p 1223-1232 doi 101111j1466-8238201100756x

21J Podani et D Schmera laquo ANew Conceptual and Methodologi-cal Framework for Exploring and Ex-plaining Pattern in Presence - Ab-sence Data raquo In Oikos 12011 (2011)p 1625-1638 doi 101111j1600-0706201119451x

de nouvelles espegraveces Baselga18 montre que la diversiteacute 120573 delongicornes en Europe du nord est similaire agrave celle observeacutee enEurope du sud mais pour des raisons totalement diffeacuterentesEn Europe du nord les communauteacutes perdent des espegraveces avecla latitude leur dissimilariteacute est due principalement agrave lrsquoemboicirc-tement En Europe du sud les communauteacutes sont composeacuteesdrsquoespegraveces diffeacuterentes la diversiteacute 120573 est due agrave la substitutiondes espegraveces Baselga deacutecompose lrsquoindice de dissimilariteacute de Soslash-rensen 1 minus 1198787 en un terme mesurant la substitution et unmesurant lrsquoemboicirctement

Le premier composant est lrsquoindice de dissimilariteacute de G GSimpson 19

119863119904119894119898 = min(11990410 11990401)11990411 + min(11990410 11990401) (1113)

Il vaut 0 quand les communauteacutes sont emboicircteacutees Son com-pleacutement 119863119899119890119904 prend en compte la partie de la dissimilariteacute dueagrave lrsquoemboicirctement

119863119899119890119904 = 11990410 + 11990401211990411 + 11990410 + 11990401

minus 119863119904119894119898 (1114)

Ces mesures de dissimilariteacute sont geacuteneacuteraliseacutees au-delagrave dedeux communauteacutes les formules sont disponibles dans lrsquoar-ticle de Baselga

Baselga20 eacutetend cette deacutecomposition agrave la dissimilariteacute deJaccard

1198633 = 119863119904119894119898 + 119863119899119890119904 (1115)

= 2 min(11990410 11990401)11990411 + 2 min(11990410 11990401) + 11990411

11990411 + 2 min(11990410 11990401)|11990410 minus 11990401|

11990411 + 11990410 + 11990401

(1116)

Le premier terme de la somme est le terme lieacute agrave la substi-tution et le second celui lieacute agrave lrsquoemboicirctement

Podani et Schmera21 deacutefendent un point de vue diffeacuterentsur la faccedilon de comptabiliser les deux composantes de la deacute-composition de la dissimilariteacute de Jaccard Le terme de substi-tution comptabilise les espegraveces preacutesentes sur un seul site ennombre eacutegal 2 min(11990410 11990401) plutocirct que lrsquoindice de dissimila-riteacute de Simpson Ainsi le terme drsquoemboicirctement comptabilisela diffeacuterence de richesse entre les deux sites |11990410 minus 11990401|

Apregraves normalisation par le nombre total drsquoespegravece la deacute-composition est

1198633 = 2 min(11990410 11990401)11990411 + 11990410 + 11990401

+ |11990410 minus 11990401|11990411 + 11990410 + 11990401

(1117)

114 Donneacutees drsquoabondance et similariteacute des espegraveces 177

22J Podani et D Schmera laquo OnceAgain on the Components of PairwiseBeta Diversity raquo In Ecological In-formatics 32 (2016) p 63-68 doi 101016jecoinf201601002

23Podani et Schmera cf note 21

24J Podani et al laquo A General Fra-mework for Analyzing Beta DiversityNestedness and Related Community-Level Phenomena Based on Abun-dance Data raquo In Ecological Com-plexity 15 (2013) p 52-61 doi 101016jecocom201303002

25P Legendre laquo Interpreting theReplacement and Richness DifferenceComponents of Beta Diversity raquo In Global Ecology and Biogeography2311 (2014) p 1324-1334 doi 101111geb12207

26C Ricotta et G Bacaro laquo OnPlot-to-Plot Dissimilarity MeasuresBased on Species Functional Traits raquoIn Community Ecology 111 (2010)p 113-119 doi 101556ComEc112010116

La controverse entre les deux deacutecompositions perdure22

These are used to calculate means on the 1D simplices namely

Mean relativized beta diversity βrel D Rrel rel

Mean relativized richness agreement A S Rrel Jac rel= +

Mean relativized nestedness

N S Drel Jac rel

if 0 and j k=

minus=

2 | | b c njk jk jk

jk ajk

mm m2 minus

in which the last term is called the anti-nestedness fraction of mean relativized richness difference which does not contrib-ute to nestedness This derives from the sum of richness dif-ference values for pairs of sites with no species in common If nestedness is understood to exist for unequally rich sites only then another term is also subtracted which is called the richness identity fraction calculated from similarities of pairs of sites with equal species richness as seen below

Mean relativized strict nestedness

Nrsquo Nrel rel

jk if and j k= minus

minuslt

b cjk jk

Note that the above fraction includes site pairs that are com-pletely identical (points on the bottom right corner) As said above percentage contributions are obtained by multiplying the mean values by 100

Computer program SDRSimplex was written by the first author for calculating simplex scores and the above-defined percentages from presencendashabsence data The application and the user manual may be downloaded from httprameteltehusimpodani The output scores were graphically illus-trated by the Ternary Plot option in the NonHier routine of the SYN-TAX 2000 package (Podani 2001)

pairs to the an corner the higher their similarity while closeness to the opposing side of the triangle implies high beta diversity If site pairs fall close to the |b ndash c|n corner it means that they have larger relativized differences in species number whereas closeness to the opposing side of the tri-angle reflects great similarity in species number of the sites This relates to the concept of alpha diversity if all site pairs are at the A-end of the A-simplex then they are identical in species richness (although its exact value is not seen) On the third 1D simplex the N-simplex we see the antagonistic relationship between species replacement and nestedness

In addition to graphical illustration numerical results are also useful because many points may coincide on the ternary plot especially if the number of sites is large relative to the number of species As a measure of the relative contribu-tion of similarity for example we suggest to sum up all SJac values and then divide this sum by (m2 ndash m)2 (averaging pairwise similarities or dissimilarities is a common pratice in diversity studies Whittaker 1972 Vellend 2001 Schmera et al 2009 and is also used in nestedness measures such as NODF Almeida-Neto et al 2008) To obtain a percentage this mean value SJac

is multiplied by 100 Percentages for the relative contribution of richness difference and species replacement in shaping the dissimilarity structure of sites are obtained in a similar way More formally if ajk bjk cjk and njk denote the contingency table frequencies for site pair j k then the averages are obtained as

Mean similarity SJac =minus

Mean relativized richness difference

Drel =minus

| | b c n

jk jk jk

Mean relativized species replacement

R rel =minus

min b c n

jk jk jk

Random

Species replacement

Perfect nestedness

Richnessdifference

Species shared(similarity)

Beta diversity(species turnoverdissimilarity)

Richnessagreement

Nestedness

s Perfect gradient

Rrel = 2minbc n

SJac = a nDrel = |bndashc| n

βrel = (b+c) n Arel = (n ndash|bndashc|) n

β-simplexA-simplex

Figure 2 Conceptual framework (a) and measurement (b) of different ecological phenomena in presence-absence data matrices based on the suggested decomposition of pairwise (a b c) values via 2D and 1D simplices

Fig 114 Triangle du simplexSimilariteacute-Substitution-Emboicirctement (a) Similariteacuteemboicirctement et substitutionsomment agrave 1 donc les troiscomposantes peuvent ecirctrerepreacutesenteacutees dans un triangle etcombineacutees deux agrave deux Ladissimilariteacute est par exemplerepreacutesenteacutee par la proximiteacute aucocircteacute gauche du triangle somme delrsquoemboicirctement et de la substitution(ses sommets adjacents) etcompleacutement agrave 1 de la dissimilariteacute(le sommet opposeacute) (b) Lesformules de calcul dont donneacuteespour la similariteacute de Jaccard Avecces notations classiques 119886 est lenombre drsquoespegraveces communes 11990411119887 et 119888 sont les espegraveces propres agravechaque communauteacute 11990401 et 11990410et 119899 est le nombre total drsquoespegraveces119886 + 119887 + 119888

Comme la dissimilariteacute est la somme de lrsquoemboicirctement etde la substitution et que la dissimilariteacute est le compleacutement agrave1 de la similariteacute la somme de la similariteacute de lrsquoemboicirctementet de la substitution vaut 1 Podani et Schmera23 repreacutesententcette eacutegaliteacute dans un triangle dont les sommets correspondentaux trois termes (Figure 114)

Podani et al24 eacutetendent cette approche agrave des mesuresde dissimilariteacute prenant en compte les abondances particu-liegraverement la dissimilariteacute de Ružička La deacutecomposition estidentique agrave celle de lrsquoeacutequation (1117) apregraves remplacement dechaque terme

P Legendre25 considegravere cette deacutecomposition de la diversiteacute120573 en emboicirctement et substitution comme une deacutecompositionde variance et lui applique des meacutethodes drsquoordination pour larelier aux variables environnementales par exemple

Les mesures de diversiteacute 120573 fondeacutees sur lrsquoentropie HCDT(chapitre 12) ne permettent pas de distinguer directement em-boicirctement et substitution La variabiliteacute des contributions 119902

119894119867120573des communauteacutes agrave lrsquoentropie 120573 augmente avec lrsquoemboicirctementmais cette voie nrsquoa pas eacuteteacute exploreacutee

114 Donneacutees drsquoabondance et similariteacutedes espegraveces

Dissimilariteacute minimale moyenneRicotta et Bacaro26 deacutefinissent une mesure de dissimilariteacute

parameacutetrique entre deux communauteacutes Une matrice de dissi-milariteacute est deacutefinie entre toutes les paires drsquoespegraveces min 1198891199042

27C Ricotta et S Burrascanolaquo Beta Diversity for Functional Eco-logy raquo In Preslia 801 (2008) p 61-72

28K R Clarke et R M Warwicklaquo Quantifying Structural Redundancyin Ecological Communities raquo In Oe-cologia 1132 (1998) p 278-289 doi 101007s004420050379

29Ricotta et Burrascano cfnote 27

30C Izsak et A R G Pricelaquo Measuring -Diversity Using a Taxo-nomic Similarity Index and Its Re-lation to Spatial Scale raquo In MarineEcology Progress Series 215 (2001)p 69-77 doi 103354meps215069

31C O Webb et al laquo Phylocom Software for the Analysis of Phyloge-netic Community Structure and TraitEvolution raquo In Bioinformatics 2418(2008) p 2098-2100 doi 101093bioinformaticsbtn358

32Pavoine et Ricotta laquo Functionaland Phylogenetic Similarity amongCommunities raquo cf note 13 p 149

deacutesigne la dissimilariteacute entre lrsquoespegravece 119904 preacutesente dans la pre-miegravere communauteacute et lrsquoespegravece la plus proche drsquoelle dans ladeuxiegraveme communauteacute min 1198891199051 est la mecircme notation pourlrsquoespegravece 119905 de la deuxiegraveme communauteacute et lrsquoespegraveces la plusproche dans la communauteacute 1 Ces valeurs sont nulles pourtoutes les espegraveces communes

120587119904(119899) deacutesigne la contribution de lrsquoespegravece 119904 agrave lrsquoindice deHurlbert deacutejagrave vue dans le cadre de lrsquooriginaliteacute taxonomique(Section 72) La contribution des espegraveces rares augmenteavec le paramegravetre 119899 (figure 73) Pour chaque communauteacute lamoyenne des dissimilariteacutes minimales entre chaque espegravece etlrsquoautre communauteacute est calculeacutee pondeacutereacutee par la contributionde lrsquoespegravece agrave lrsquoindice de Hurlbert

La dissimilariteacute pondeacutereacutee (W pour weighted) entre les deuxcommunauteacutes (C pour community) en est la moyenne entre lesdeux communauteacutes

119889CW(119899) = 12 (sum

119904120587119904(119899) min 1198891199042 + sum

119905120587119905(119899) min 1198891199051) (1118)

Sa version non pondeacutereacutee (U pour unweighted) par les abon-dances est27

119889CU = sum119904 min 1198891199042 + sum119905 min 1198891199051211990411 + 11990410 + 11990401

(1119)

Ces mesures sont des eacutevolutions de mesures plus anciennesavec des pondeacuterations diffeacuterentes Dans lrsquoindice de Clarke etWarwick28 la moyenne est calculeacutee dans chaque communauteacutesans pondeacuteration

119889CW = 12 (sum119904 min 1198891199042

11990411 + 11990410+ sum119905 min 1198891199051

11990411 + 11990401) (1120)

mais avec pondeacuteration par lrsquoabondance des espegraveces chezRicotta et Burrascano29

119889RB = 12 (sum

119904119901119904|1 min 1198891199042 + sum

119905119901119905|2 min 1198891199051) (1121)

alors qursquoelle lrsquoest globalement dans lrsquoindice de Izsak etPrice30

119889IP = sum119904 min 1198891199042 + sum119905 min 119889119905111990411 + 11990410 + 11990411 + 11990401

(1122)

redeacutecouvert et nommeacute COMDISTNN par Webb et al31

Similariteacute moyenne entre individusPavoine et Ricotta32 deacutefinissent une famille de similari-

teacutes entre communauteacutes construite agrave partir de la similariteacutemoyenne entre les paires drsquoindividus de chaque communauteacuteet les paires intercommunautaires Une matrice de similariteacuteZ est deacutefinie entre les paires drsquoespegraveces 119911119904119905 est la similari-teacute entre lrsquoespegravece 119904 et lrsquoespegravece 119905 comprise entre 0 et 1 de lamecircme faccedilon que pour le calcul de la diversiteacute 119902119863Z (chapitre9) La matrice Z doit de plus ecirctre semi-deacutefinie positive ce quiimplique que

radic1 minus Z est euclidienne de cette faccedilon les es-

pegraveces peuvent ecirctre repreacutesenteacutees graphiquement par une PCoALes freacutequences des espegraveces dans les deux communauteacutes sontp et q La similariteacute moyenne dans chaque communauteacute estsum119904119905 119901119904119901119905119911119904119905 et sum119904119905 119902119904119902119905119911119904119905 La similariteacute moyenne des pairesdrsquoindividus de communauteacutes diffeacuterentes est sum119904119905 119901119904119902119905119911119904119905

La dissimilariteacute entre communauteacutes de Rao (Section 125)peut ecirctre normaliseacutee (en la divisant par sa valeur maximalepour qursquoelle soit comprise entre 0 et 1) puis transformeacutee ensimilariteacute (en prenant son compleacutement agrave 1) pour obtenir

119878Sorensen =sum119904119905 119901119904119902119905119911119904119905

12 sum119904119905 119901119904119901119905119911119904119905 + 1

2 sum119904119905 119902119904119902119905119911119904119905 (1123)

Les probabiliteacutes peuvent ecirctre remplaceacutees par nrsquoimportequel vecteur de valeurs positives par exemple les abondancesou des valeurs 1 et 0 pour des donneacutees de preacutesence-absenceDans ce dernier cas et si Z est la matrice identiteacute I (la simila-riteacute de deux espegraveces diffeacuterentes est nulle et 119911119904119904 = 1) 119878Sorensense reacuteduit agrave lrsquoindice de Soslashrensen vu plus haut

La geacuteneacuteralisation de lrsquoindice de Jaccard aux donneacuteesdrsquoabondances est

119878Jaccard =sum119904119905 119901119904119902119905119911119904119905

sum119904119905 119901119904119901119905119911119904119905 + sum119904119905 119902119904119902119905119911119904119905 minus sum119904119905 119901119904119902119905119911119904119905

(1124)Il se reacuteduit agrave lrsquoindice de Jaccard original pour les donneacutees

de preacutesence-absence et Z = ILrsquoindice de Sokal et Sneath se geacuteneacuteralise par

119878Sokal =sum119904119905 119901119904119902119905119911119904119905

2 sum119904119905 119901119904119901119905119911119904119905 + 2 sum119904119905 119902119904119902119905119911119904119905 minus 3 sum119904119905 119901119904119902119905119911119904119905

(1125)celui drsquoOchiai par

119878Ochiai =sum119904119905 119901119904119902119905119911119904119905

radicsum119904119905 119901119904119901119905119911119904119905radicsum119904119905 119902119904119902119905119911119904119905 (1126)

33C Ricotta et al laquo A Cautiona-ry Note on Some Phylogenetic Dissi-milarity Measures raquo In Journal ofPlant Ecology 81 (2014) p 12-16doi 101093jpertu008

34Ibid

36N G Swenson et al laquo Determi-nistic Tropical Tree Community Tur-nover Evidence from Patterns ofFunctional Beta Diversity along anElevational Gradient raquo In Procee-dings of the Royal Society of Lon-don Series B Biological Sciences2781707 (2011) p 877-884 doi 101098rspb20101369

37C J F ter Braak laquo PrincipalComponents Biplots and Alpha andBeta Diversity raquo In Ecology 643(1983) p 454-462 doi 10 2307 1939964 JSTOR 1939964

38K Pearson laquo On Lines andPlanes of Closest Fit to Systems ofPoints in Space raquo In PhilosophicalMagazine 2 (1901) p 559-572

Ces quatre similariteacutes permettent une repreacutesentation descommunauteacutes par PCoA de la mecircme faccedilon que lrsquoindice deJaccard traiteacute plus haut

Ricotta et al33 ont aussi proposeacute de mesurer la dissimilari-teacute par la somme des diffeacuterences (en valeur absolue) de banaliteacutedes espegraveces des deux communauteacutes normaliseacutee par la banaliteacutetotale

119863RBP = sum119904 | sum119905 (119901119904 minus 119902119905)119911119904119905|sum119904 sum119905 (119901119904 + 119902119905)119911119904119905

(1127)

Drsquoautres similariteacutes ont eacuteteacute proposeacutees mais ont des pro-prieacuteteacutes qui empecircchent de les utiliser 34 leur valeur nrsquoest pastoujours nulle pour deux communauteacutes identiques Ce sontlrsquoindice proposeacute par Rao35

11987612 = sum119904119905

119901119904119902119905119911119904119905 (1128)

comme les indices de Swenson et al 36

119889pw = 12 ( sum119904

119889119904211990411 + 11990410

+ sum1199051198891199051

11990411 + 11990401) (1129)

119889primepw = 1

2 (sum119904

119901119904 1198891199042 + sum119905

119902119905 1198891199051) (1130)

ougrave 1198891199042 est la dissimilariteacute moyenne entre lrsquoespegravece 119904 de lacommunauteacute 1 et toutes les espegraveces de la communauteacute 2

115 Distance entre paires decommunauteacutes et diversiteacute 120573proportionnelle

Dans certains cas preacutesenteacutes ici la diversiteacute de diffeacuterentia-tion est parfaitement conciliable avec la diversiteacute proportion-nelle

Diversiteacute de Simpsonter Braak37 a le premier rapprocheacute lrsquoentropie de Simpson et

lrsquoAnalyse en Composantes Principales38 En repreacutesentant lescommunauteacutes dans lrsquoespace des espegraveces la norme du vecteurde la communauteacute 119894 est sum119904 1199012

119904|119894 crsquoest-agrave-dire 1 moins lrsquoentro-pie de Simpson La repreacutesentation graphique de lrsquoACP (noncentreacutee non reacuteduite) montre les communauteacutes les moins di-verses (les plus eacuteloigneacutees de lrsquoorigine du repegravere) Ter Braakdeacutefinit la diversiteacute 120573 comme la distance entre deux commu-nauteacutes (et la moyenne des distances entre paires de commu-nauteacutes si leur nombre est supeacuterieur agrave 2) Cette laquo deacutefinition raquo

115 Distance entre paires de communauteacutes et diversiteacute 120573 proportionnelle 181

est valide puisque cette distance est la composante inter de ladeacutecomposition de lrsquoentropie 120573 de Simpson (1212)

d = 01

14 15 16

18 19 20

27 28 29

48 49 50

Abaremamacradenia Vachelliamelanoceras Acalyphadiversifolia

Acalyphamacrostachya Adeliatriloba

Aegiphilapanamensis Alchorneacostaricensis Alchornealatifolia

Alibertiaedulis Allophyluspsilospermus

Alseisblackiana

Amaiouacorymbosa Anacardiumexcelsum Andirainermis Annonaspraguei Apeibaglabra Apeibatibourbou Aspidospermadesmanthum Astrocaryumstandleyanum Astroniumgraveolens Attaleabutyracea Banaraguianensis

Beilschmiediapendula Brosimumalicastrum Brosimumguianense Calophyllumlongifolium Caseariaaculeata Caseariaarborea

Caseariacommersoniana Caseariaguianensis Caseariasylvestris Cassipoureaguianensis Cavanillesiaplatanifolia Cecropiainsignis Cecropiaobtusifolia Cedrelaodorata Ceibapentandra Celtisschippii Cespedesiaspathulata Chamguavaschippii Chimarrhisparviflora Macluratinctoria Chrysochlamyseclipes Chrysophyllumargenteum Chrysophyllumcainito Coccolobacoronata Coccolobamanzinellensis Colubrinaglandulosa Cordiaalliodora

Cordiabicolor Cordialasiocalyx Coussareacurvigemma Crotonbillbergianus Cupaniacinerea Cupanialatifolia Cupaniarufescens Cupaniaseemannii Dendropanaxarboreus Desmopsispanamensis Diospyrosartanthifolia Dipteryxoleifera

Drypetesstandleyi

Elaeisoleifera Enterolobiumschomburgkii Erythrinacostaricensis

Erythroxylummacrophyllum Eugeniaflorida Eugeniagalalonensis Eugenianesiotica Eugeniaoerstediana Farameaoccidentalis Ficuscolubrinae Ficuscostaricana Ficusinsipida Ficusmaxima Ficusobtusifolia Ficuspopenoei

Ficustonduzii Ficustrigonata Ficusyoponensis Garciniaintermedia Garciniamadruno Genipaamericana Guapiramyrtiflora Guareafuzzy Guareagrandifolia

Guareaguidonia Guatteriadumetorum

Guazumaulmifolia Guettardafoliacea

Gustaviasuperba

Hampeaappendiculata Hasseltiafloribunda Heisteriaacuminata Heisteriaconcinna Hirtellaamericana

Hirtellatriandra

Huracrepitans Hieronymaalchorneoides Ingaacuminata Ingacocleensis Ingagoldmanii Ingalaurina Ingasemialata Inganobilis Ingaoerstediana Ingapezizifera Ingapunctata Ingaruiziana Ingasapindoides Ingaspectabilis Ingaumbellifera

Jacarandacopaia Lacistemaaggregatum Lacmelleapanamensis Laetiaprocera Laetiathamnia Lafoensiapunicifolia Licaniahypoleuca

Licaniaplatypus Lindackerialaurina Lonchocarpusheptaphyllus Lueheaseemannii

Macrocnemumroseum

Maquiraguianensiscostaricana Margaritarianobilis Marilalaxiflora Maytenusschippii Miconiaaffinis Miconiaargentea Miconiaelata Miconiahondurensis Mosannonagarwoodii Myrciagatunensis

Myrospermumfrutescens Nectandracissiflora

Nectandralineata Nectandrapurpurea Ochromapyramidale Ocoteacernua Ocoteaoblonga Ocoteapuberula

Ocoteawhitei Oenocarpusmapora

Ormosiaamazonica Ormosiacoccinea

Ormosiamacrocalyx Pachiraquinata Pachirasessilis

Perebeaxanthochyma Cinnamomumtriplinerve Picramnialatifolia Piperreticulatum Platymisciumpinnatum Platypodiumelegans Posoquerialatifolia

Poulseniaarmata

Pouroumabicolor Pouteriafossicola Pouteriareticulata Pouteriastipitata Prioriacopaifera Protiumcostaricense Protiumpanamense Protiumtenuifolium

Pseudobombaxseptenatum Psidiumfriedrichsthalianum Psychotriagrandis Pterocarpusrohrii

Quararibeaasterolepis

Quassiaamara Randiaarmata Sapiumbroadleaf

Sapiumglandulosum Schizolobiumparahyba Sennadariensis Simaroubaamara Siparunaguianensis Siparunapauciflora Sloaneaterniflora

Socrateaexorrhiza

Solanumhayesii Soroceaaffinis

Spacheamembranacea Spondiasmombin Spondiasradlkoferi Sterculiaapetala Swartziasimplexvargrandiflora Swartziasimplexcontinentalis Symphoniaglobulifera

Handroanthusguayacan Tabebuiarosea Tabernaemontanaarborea Tachigaliversicolor Talisianervosa Talisiaprinceps Terminaliaamazonia Terminaliaoblonga Tetragastrispanamensis

Tetrathylaciumjohansenii Theobromacacao Thevetiaahouai Tocoyenapittieri Trattinnickiaaspera Tremamicrantha Trichantheragigantea Trichiliapallida Trichiliatuberculata Trichospermumgaleottii

Triplariscumingiana Trophiscaucana

Trophisracemosa Turpiniaoccidentalis Unonopsispittieri

Virolamultiflora Virolasebifera Virolasurinamensis

Vismiabaccifera Vochysiaferruginea

Xylopiamacrantha Zanthoxylumekmanii Zanthoxylumjuniperinum Zanthoxylumpanamense Zanthoxylumsetulosum Zuelaniaguidonia

Eigenvalues

Fig 115 Repreacutesentation desdeux premiers axes factoriels delrsquoACP des 50 carreacutes de BCI Lesdonneacutees sont les probabiliteacutes desespegravece ni centreacutees ni reacuteduites pourlrsquoACP Les carreacutes sont repreacutesenteacutesavec les espegraveces Les carreacutes 35 et40 ont une diversiteacute faible et sontassocieacutes aux espegraveces Gustaviasuperba et Alseis blackiana

LrsquoACP non centreacutee des 50 carreacutes de BCI est en figure 115Code R pour la figure

pcaBCI lt- dudipca(BCIrowSums(BCI) scannf = FALSE nf = 2center = FALSE scale = FALSE)

scatter(pcaBCI posieig = bottomleft)

d = 01

17 18 19

Eigenvalues

Fig 116 ACP centreacutee des 50carreacutes de BCI pour visualiser ladiversiteacute 120573

LrsquoACP centreacutee (mais non reacuteduite figure 116) permet demieux repreacutesenter la diversiteacute 120573 la distance de chaque carreacuteau centre du repegravere est sa contribution

39P Legendre et Andersonlaquo Distance-Based RedundancyAnalysis Testing Multispecies Res-ponses in Multifactorial EcologicalExperiments raquo cf note 7 p 161

40P Legendre et al laquo AnalyzingBeta Diversity Partitioning the Spa-tial Variation of Community Compo-sition Data raquo cf note 9 p 161

41P Legendre et Gallagher laquo Eco-logically Meaningful Transformationsfor Ordination of Species Data raquo cfnote 8 p 161

Code R

pcaBCI lt- dudipca(BCIrowSums(BCI) scannf = FALSE nf = 2center = TRUE scale = FALSE)

scatter(pcaBCI clabcol = 0)

GeacuteneacuteralisationP Legendre et Anderson39 ont montreacute plus largement que

si les communauteacutes sont repreacutesenteacutees dans lrsquoespace vectorieldes espegraveces la moyenne des carreacutes des distances euclidiennesentre communauteacutes eacutegale la somme des carreacutes des eacutecarts agrave lamoyenne des distributions des espegraveces

1119868

119868minus1sum119894=1

119868sum

119895=119894+11198892

119894119895 =119878

sum119904=1

119868sum119894=1

(119910119904|119894 minus 119910119904)2 (1131)

119910119904|119894 peut ecirctre le nombre drsquoindividus 119899119904119894 ou la probabiliteacute119901119904|119894 Les communauteacutes ont ici le mecircme poids 119910119904 est la moyennedes valeurs de lrsquoespegravece 119904 dans chaque communauteacute La sommedes carreacutes des eacutecarts est une mesure de diversiteacute 120573 Si 119910119904|119894 estla probabiliteacute 119901119904|119894 il srsquoagit de lrsquoentropie 120573 de Simpson

Ce reacutesultat peut ecirctre eacutetendu agrave toute matrice de distanceseuclidiennes entre communauteacutes40 lrsquoargument est qursquoil existeune matrice de 119910119904|119894 transformation des 119901119904|119894 telle que la dis-tance entre les communauteacutes est cette matrice de distancesLa moyenne des dissimilariteacutes 119863119899 ou des compleacutements agrave 1des similariteacutes de Pavoine et Ricotta (qui sont les carreacutes desdistances euclidiennes de la PCoA) est donc une mesure dediversiteacute 120573

Pour un certain nombre de distances la transformation de119901119904|119894 en 119910119904|119894 est bien connue41

Fig 117 Distance de corde entredeux communauteacutes repreacutesenteacuteesdans lrsquoespace engendreacute par deux

espegraveces La distance 11988912 entre lesdeux communauteacutes est la longueurde la corde qui relie leurs vecteurs

de composition normaliseacutes sur lecercle de rayon 1 Crsquoest aussi deux

fois le sinus de lrsquoangle 120572122formeacute par les deux vecteurs decomposition des communauteacutes

1199011|2 1199012|2

1199011|22 + 1199012|2

Espegravece 2

Espegravece 1

11988912

1199011|1 1199012|1

1199011|12 + 1199012|1

12057212

42Ter Braak laquo Principal Compo-nents Biplots and Alpha and Beta Di-versity raquo cf note 37 p 180

44P Legendre et M De Caacutecereslaquo Beta Diversity as the Variance ofCommunity Data Dissimilarity Co-efficients and Partitioning raquo In Eco-logy Letters 168 (2013) p 951-963doi 101111ele12141

45C R Rao laquo The Use and In-terpretation of Principal ComponentAnalysis in Applied Research raquo In Sankhyā The Indian Journal ofStatistics 264 (1964) p 329-358 JS-TOR 25049339

46C J F ter Braak laquo CanonicalCorrespondence Analysis A New Ei-genvector Technique for MultivariateDirect Gradient Analysis raquo In Eco-logy 675 (1986) p 1167-1179 doi 1023071938672

47P Legendre et De Caacuteceres cfnote 44

La distance de corde (Figure 117) est obtenue par la trans-formation

119910119904|119894 =119901119904|119894

radicsum119904 1199012119904|119894

(1132)

Les communauteacutes sont repreacutesenteacutees dans lrsquoespace des es-pegraveces par un vecteur dont les composantes sont proportion-nelles aux probabiliteacutes des espegraveces mais dont la norme est 1La distance entre communauteacutes est donc la longueur de lacorde qui relie les extrecircmiteacutes de leurs vecteurs sur la sphegravere agrave119878 dimensions de rayon 1

La distance de Hellinger est obtenue par

119910119904|119894 = radic119901119904|119894 (1133)

La distance euclidienne entre les profils de communauteacutes(119910119904|119894 = 119901119904|119894) utiliseacutee par ter Braak42 nrsquoest pas optimale parceqursquoelle souffre des deacutefauts de lrsquoentropie de Simpson43 qursquoellerepreacutesente P Legendre et De Caacuteceres44 annexe S3 ont eacuteta-bli une liste de bonnes proprieacuteteacutes que doivent respecter lesmesures de distance entre communauteacutes pour analyser la di-versiteacute de diffeacuterentiation La fonction distldc du packageadespatial permet de calculer toutes les distances preacutesenteacuteesdans lrsquoarticle Les distance de corde et de Hellinger (qui est ladistance entre les racines carreacutees des profils de communauteacutes)les respectent toutes

La diversiteacute 120573 exprimeacutee de cette faccedilon peut faire lrsquoobjetdrsquoanalyses par les meacutethodes drsquoordination classiques (RDA Analyse de Redondance 45 CCA Analyse Canonique de Cor-respondance46) pour la relier agrave des variables environnemen-tales par exemple47

La diversiteacute 120573 de BCI (figure 116) est mieux repreacutesenteacuteepar une analyse en coordonneacutees principales appliqueacutee agrave la dis-tance de corde entre les communauteacutes (figure 118) La limitede la meacutethode est que lrsquoorigine du repegravere ne repreacutesente plusici la meacuteta-communauteacute sa position correspond agrave la moyennedes probabiliteacutes des espegraveces transformeacutees 119910119904|119894 pas agrave celle des119901119904|119894

Code R

library(adespatial)dCorde lt- distldc(BCI method = chord)pcoaBCI lt- dudipco(dCorde scannf = FALSE nf = 2)scatter(pcoaBCI)

Fig 118 PCoA appliqueacutee agrave ladistance de corde des 50 carreacutes deBCI pour visualiser la diversiteacute 120573

d = 02

27 2829

3637 38

464748

Eigenvalues

48J M Chase et al laquo Using NullModels to Disentangle Variation inCommunity Dissimilarity from Varia-tion in -Diversity raquo In Ecosphere22 (2011) art 24 doi 10 1890 ES10-001171

49C M Tucker et al laquo Differen-tiating between Niche and NeutralAssembly in Metacommunities UsingNull Models of -Diversity raquo In Oi-kos 1256 (2016) p 778-789 doi 101111oik02803

116 Tests de significativiteacute

Test de non-nulliteacute

Chase et al48 testent la valeur de diversiteacute 120573 observeacuteecontre sa valeur attendue sous lrsquohypothegravese nulle drsquoune distri-bution aleacuteatoire des individus dans les communauteacutes

Leur motivation principale est drsquoeacuteliminer la deacutependancede la diversiteacute 120573 agrave la diversiteacute 120572 due agrave la mesure de diver-siteacute qursquoils utilisent lrsquoindice de Jaccard appliqueacute aux don-neacutees de preacutesence-absence Des communauteacutes theacuteoriques sonttireacutees selon le modegravele nul (selon une distribution multino-miale correspondant aux probabiliteacutes des espegraveces dans la meacuteta-communauteacute et la taille de chaque communauteacute dans le casle plus courant) La distribution de la diversiteacute 120573 sous lrsquohy-pothegravese nulle est obtenue en reacutepeacutetant les simulations La dif-feacuterence entre la diversiteacute 120573 reacuteelle et la moyenne simuleacutee estnormaliseacutee par la moyenne simuleacutee pour obtenir une valeurcomprise entre -1 et +1 (lrsquoindice de Jaccard est compris entre0 et 1) compareacutee agrave sa distribution sous lrsquohypothegravese nulle poureacutevaluer sa significativiteacute

Tucker et al49 eacutetendent cette meacutethode aux donneacutees drsquoabon-dance en utilisant la dissimilariteacute de Bray-Curtis et testentagrave partir de communauteacutes simuleacutees sa capaciteacute agrave distinguerles meacutecanismes drsquoassemblage des communauteacutes niche contremodegravele neutre et modegraveles deacuteterministes contre stochastiques(crsquoest-agrave-dire dont les paramegravetres varient aleacuteatoirement) Cesdeux oppositions peuvent ecirctre traiteacutees indeacutependamment poureacuteviter la confusion entre niche et deacuteterminisme et entre neu-traliteacute et stochasticiteacute Ils concluent qursquoune valeur de diversiteacute

116 Tests de significativiteacute 185

50J M Chase et J A Myerslaquo Disentangling the Importance ofEcological Niches from StochasticProcesses across Scales raquo In Philoso-phical Transactions of the Royal So-ciety of London Series B Biologi-cal Sciences 3661576 (2011) p 2351-2363 doi 101098rstb20110063

51Anderson et al laquo MultivariateDispersion as a Measure of Beta Di-versity raquo cf note 16 p 175

52C Ricotta et S Burrascanolaquo Testing for Differences in Beta Di-versity with Asymmetric Dissimilari-ties raquo In Ecological Indicators 94(2009) p 719-724 doi 101016jecolind200809003

53G Bacaro et al laquo Testing forDifferences in Beta Diversity fromPlot-to-Plot Dissimilarities raquo In Ecological Research 272 (2012)p 285-292 doi 101007s11284-011-0899-z

120573 significativement diffeacuterente de celle du modegravele nul permetde deacutetecter le meacutecanisme de niche (alors que le modegravele neutredonne une valeur identique agrave celle de lrsquohypothegravese nulle 0 eacutetantdonneacute la normalisation) Chase et Myers50 interpreacutetait les va-leurs significatives comme preuve de deacuteterminisme (par oppo-sition agrave la stochasticiteacute) Tucker et al montrent que ce nrsquoestpas le cas le niveau de stochasticiteacute influe peu sur les reacutesul-tats quand la diversiteacute est mesureacutee agrave partir de donneacutees drsquoabon-dance En revanche la meacutethode nrsquoest pas fiable quand elle estutiliseacutee avec des donneacutees de preacutesence-absence la stochasticiteacutene permet alors plus de distinguer les meacutecanismes

Analyse de la variabiliteacuteAnderson et al51 fournissent un test drsquoeacutegaliteacute de la diver-

siteacute 120573 entre groupes de communauteacutes Les communauteacutes sontplaceacutees dans un espace euclidien dans lequel les distancesentre elles sont une mesure de dissimilariteacute preacutesenteacutee dansce chapitre Si les dissimilariteacutes ne sont pas euclidiennes unePCoA permet de les placer dans un espace euclidien dont cer-tains axes sont imaginaires sans que cette difficulteacute invalidela meacutethode

Dans chaque groupe la distance entre chaque communau-teacute et le centre de graviteacute du groupe est calculeacutee Une Ano-va est reacutealiseacutee agrave partir de ces distances La statistique F delrsquoAnova suit une loi de Fisher si la distribution des distancesaux centres de graviteacute est normale Si ce nrsquoest pas le cas letest peut ecirctre reacutealiseacute par permutation des distances entre lesgroupes La statistique de test de lrsquoAnova est le rapport de ladispersion des centres de graviteacute des groupes agrave celle des disper-sion des communauteacutes dans chaque groupe Elle est compareacuteeagrave sa distribution obtenue par permutation

Une alternative consiste agrave utiliser la distance aux meacutedianesspatiales des groupes La meacutediane spatiale est le point quiminimise la somme des distances entre les points et lui (alorsque le centre de graviteacute minimise la somme des carreacutes de cesdistances)

La fonction betadisper du package vegan impleacutemente cetest

Ricotta et Burrascano52 utilisent comme point centralde chaque groupe celui repreacutesentant lrsquoassemblage de sescommunauteacutes Ils deacutefinissent ainsi la diversiteacute 120573 commela dissimilariteacute moyenne entre chaque communauteacute et lameacuteta-communauteacute

Bacaro et al53 preacutefegraverent tester la distribution des dissimi-lariteacutes entre paires des communauteacutes plutocirct que la dissimila-riteacute entre chaque communauteacute et un point de reacutefeacuterence Unestatistique F est calculeacutee agrave partir de ces dissimilariteacutes et com-

54G Bacaro et al laquo Beta Diversi-ty Reconsidered raquo In Ecological Re-search 283 (2013) p 537-540 doi 101007s11284-013-1043-z

pareacutee agrave sa distribution obtenue par permutation La meacutethodede permutation originale est inapproprieacutee et donc corrigeacutee 54

les dissimilariteacutes doivent ecirctre redistribueacutees aleacuteatoirement entreles groupes

1A M Ellison laquo Partitioning Di-versity raquo In Ecology 917 (2010)p 1962-1963 doi doi10189009-16921

2Baselga laquo Multiplicative Parti-tion of True Diversity Yields In-dependent Alpha and Beta Compo-nents Additive Partition Does Not raquocf note 24 p 165 L Jost laquo Indepen-dence of Alpha and Beta Diversities raquoIn Ecology 917 (2010) p 1969-1994 doi 10189009-03681 Veechet Crist laquo Diversity Partitioning wi-thout Statistical Independence of Al-pha and Beta raquo cf note 24 p 165

4Tuomisto laquo A Diversity of Be-ta Diversities Straightening up aConcept Gone Awry Part 1 DefiningBeta Diversity as a Function of Alphaand Gamma Diversity raquo cf note 17p 163 H Tuomisto laquo A Diversity ofBeta Diversities Straightening up aConcept Gone Awry Part 2 Quanti-fying Beta Diversity and Related Phe-nomena raquo In Ecography 331 (2010)p 23-45 doi 101111j1600-0587200906148x

6C R Rao et T K Nayaklaquo Cross Entropy Dissimilarity Mea-sures and Characterizations of Qua-dratic Entropy raquo In IEEE Tran-sactions on Information Theory 315(1985) p 589-593 doi 101109tit19851057082

Chapitre 12

Deacutecomposition de lrsquoentropie HCDT

Lrsquoentropie HCDT 120574 peut ecirctre deacutecomposeacutee en somme de lrsquoentropie 120572 etla moyenne de la divergence entre la distribution de chaque communau-teacute et celle de la meacuteta-communauteacute Lrsquoentropie 120573 est donc interpreacutetablecomme le gain drsquoinformation apporteacute par la connaissance de la distribu-tion deacutetailleacutee des communauteacutes en plus de celle aggreacutegeacutee de la meacuteta-communauteacute Lrsquoentropie 120573 va de pair avec le nombre effectif de com-munauteacutes crsquoest-agrave-dire le nombre de communauteacutes de mecircme poids sansaucune espegravece commune qui fourniraient la mecircme valeur drsquoentropie 120573que les communauteacutes reacuteelles La diversiteacute 120574 se deacutecompose donc en pro-duit du nombre effectif drsquoespegraveces de la diversiteacute 120572 et du nombre effectifde communauteacutes

Lrsquoessentiel

Ce chapitre traite de la diversiteacute proportionnelle qui me-sure agrave quel point les communauteacutes diffegraverent de leur assemblageDans la litteacuterature la diversiteacute 120573 est geacuteneacuteralement une mesuredeacuteriveacutee1 crsquoest-agrave-dire calculeacutee agrave partir des diversiteacutes 120572 et 120574 drsquoougraveun abondant deacutebat sur lrsquoindeacutependance souhaiteacutee mais pas tou-jours observeacutee entre les valeurs de diversiteacute 120572 et 1205732 Un foruma eacuteteacute consacreacute agrave la question dans la revue Ecology conclu parChao et al3 et une revue a eacuteteacute faite par Tuomisto4

La deacutecomposition de lrsquoentropie HCDT constitue un cadrecoheacuterent dans lequel la diversiteacute 120573 est non seulement unemesure deacuteriveacutee mais eacutegalement une mesure de la divergenceentre les distributions des communauteacutes et celle de la meacuteta-communauteacute

121 Deacutecomposition de lrsquoindice deShannon

DeacutefinitionLa deacutecomposition explicite (tableau 121) est due agrave Mar-

con et al5 mais avait eacuteteacute eacutetablie plus ou moins clairement plu-sieurs fois dans la litteacuterature notamment par Rao et Nayak6 la diversiteacute 120573 est la divergence de Kullback-Leibler entre la

188 Deacutecomposition de lrsquoentropie HCDT

Tab 121 Deacutefinition explicite de la diversiteacute de Shannon en tant que diver-gence entre une distribution observeacutee et une distribution attendue Les indices119867120572 et 119867120574 sont les compleacutements au logarithme du nombre drsquoespegraveces de cettedivergence

Indice Distributionobserveacutee

Distributionattendue

Formule

119867120572 Freacutequence desespegraveces dans lacommunauteacute

Freacutequenceseacutegales horsformule

119894119867120572 =sum119904 119901119904|119894 ln 119901119904|119894119867120572 =sum119894 119908119894 119894119867120572

Freacutequencetotale desespegraveces

119894119867120573 =sum119904 119901119904|119894 ln 119901119904|119894119901119904119867120573 =sum119894 119908119894 119894119867120573

119867120574 Freacutequence desespegraveces dans lameacuteta-communauteacute

119867120574 =sum119904 119901119904 ln 119901119904

7J Lin laquo Divergence MeasuresBased on the Shannon Entropy raquo In IEEE Transactions on InformationTheory 371 (1991) p 145-151 doi 1011091861115

8R Lewontin laquo The Apportion-ment of Human Diversity raquo In Evo-lutionary Biology Sous la dir de TDobzhansky et al T 6 Springer US1972 p 381-398 doi 101007978-1-4684-9063-3_14

9C Ricotta et G C Avena laquo AnInformation-Theoretical Measure ofBeta-Diversity raquo In Plant Biosys-tems 1371 (2003) p 57-61 doi 10108011263500312331351331

10A Ludovisi et M I Tatic-chi laquo Investigating Beta Diversity byKullback-Leibler Information Mea-sures raquo In Ecological Modelling1921-2 (2006) p 299-313 doi 101016jecolmodel200505022

distribution des espegraveces dans chaque parcelle et la distribu-tion moyenne appeleacutee divergence de Jensen-Shannon7 Lesdiversiteacutes 120572 et 120574 sont les compleacutements agrave ln 119878 des indices dedissimilariteacute de Theil (41) divergences de Kullback-Leiblerentre les distributions des espegraveces et leur eacutequiprobabiliteacute

Lewontin8 dans son ceacutelegravebre article sur la diversiteacute geacuteneacute-tique humaine deacutefinit la diversiteacute de Shannon inter-groupecomme la diffeacuterence entre la diversiteacute totale et la diversiteacutemoyenne intra-groupe mais ne cherche pas agrave explorer ses pro-prieacuteteacutes

La forme de 119867120573 a eacuteteacute eacutetablie par Ricotta et Avena9 sansla relier agrave celle de 119867120572 et 119867120574 Enfin lrsquoideacutee de la deacutecompositionde la divergence de Kullback-Leibler mais avec une approchediffeacuterente sans rapprochement avec lrsquoindice de Shannon a eacuteteacutepublieacutee par Ludovisi et Taticchi10

Les meacuteta-communauteacutes peuvent agrave leur tour ecirctre regrou-peacutees agrave un niveau supeacuterieur la diversiteacute 120574 du niveau infeacuterieurdevenant diversiteacute 120572 pour le niveau supeacuterieur La deacutecomposi-tion ou le regroupement peuvent ecirctre effectueacutes sur un nombrequelconque de niveaux

Calcul sous R La fonction BetaEntropy calcule lrsquoentropie120573 de la meacuteta-communauteacute (lrsquoargument 119902 = 1 permet de choisirlrsquoentropie de Shannon)

Pas de correction du biais destimationsummary(BetaEntropy(Paracou618MC q = 1 Correction = None))

Neutral beta entropy of order 1 of metaCommunity Paracou618MC with correction None Entropy of communities P006 P018 03499358 05771645 Average entropy of the communities

121 Deacutecomposition de lrsquoindice de Shannon 189

[1] 04471751

Biais drsquoestimationLrsquoestimateur du taux de couverture de la communauteacute 119894

est noteacute 119862119894 le taux de couverture total 119862 Lrsquoestimateur corrigeacutede 119894119867120573 est

119894120573 =119904ne0

sum119894=1

119862119894 119901119904|119894 ln119862119894119904|119894119862119904

1 minus (1 minus 119862119894 119901119904|119894)119899 (121)

Calcul sous R BetaEntropy applique cette correction

summary(BetaEntropy(Paracou618MC q = 1 Correction = ChaoShen))

Neutral beta entropy of order 1 of metaCommunity Paracou618MC with correction ChaoShen Entropy of communities P006 P018 02949188 04514132 Average entropy of the communities [1] 03618884

Chao et al11 utilisent une approche diffeacuterente pour corri-ger le biais drsquoestimation lrsquoinformation mutuelle Les donneacuteessont organiseacutees comme dans le tableau 101 mais les probabili-teacutes qursquoun individu appartienne agrave la communauteacute 119894 et agrave lrsquoespegravece119904 sont calculeacutees pour que leur somme soit eacutegale agrave 1 sur lrsquoen-semble du tableau sum119904 sum119894 119904119894 = 1 (au lieu de sum119894 119901119904|119894 = 1)

Lrsquoinformation mutuelle est la divergence de Kullback-Leibler entre la distribution de 119901119904119894 et celle du produit desdistributions marginales 119901119904 et 119901119894 Si les distributions mar-ginales sont indeacutependantes la probabiliteacute 119901119904119894 qursquoun individuappartienne agrave lrsquoespegravece 119904 et se trouve dans la communauteacute 119894est donneacutee par le produit des probabiliteacutes marginales 119901119904 et 119901119894et lrsquoinformation mutuelle est nulle

Lrsquoinformation mutuelle se calcule comme la diffeacuterenceentre lrsquoentropie de Shannon calculeacutee sur lrsquoensemble dutableau 119867(119901119904119894) et les entropies marginales 119867(119901119904) et119867(119901119894) 119867(119901119904) est lrsquoentropie 120574 de la meacuteta-communauteacuteSi on choisit de pondeacuterer les communauteacutes par leurs effectifs(119908119894 = 119901119894) alors 119867(119901119904119894) minus 119867(119901119894) est lrsquoentropie 120572 de lameacuteta-communauteacute crsquoest-agrave-dire la moyenne pondeacutereacutee desentropies 120572 des communauteacutes Dans ce cas lrsquoentropie 120573 esteacutegale agrave lrsquoopposeacutee de lrsquoinformation mutuelle Comme chaqueterme du calcul est une entropie 120572 il peut ecirctre corrigeacute selonlrsquoeacutequation ref(eq Chao2013 pour obtenir un estimateurmoins biaiseacute de 119867120573

Calcul sous R

12Z Zhang et M Grabchaklaquo Nonparametric Estimation ofKullback-Leibler Divergence raquoIn Neural computation 2611(2014) p 2570-2593 doi 10 1162NECO_a_00646 PMID 25058703

Shannon(Paracou618MC$Ns) + Shannon(colSums(Paracou618MC$Nsi)) -Shannon(Paracou618MC$Nsi)

UnveilJ 03439827

Cet estimateur est le moins biaiseacute agrave ce jour mais nrsquoestapplicable qursquoagrave lrsquoentropie de Shannon sous la condition quela pondeacuteration des communauteacutes soit donneacutee par les effectifs

Z Zhang et Grabchak12 proposent un estimateur de ladivergence de Kullback-Leibler avec un biais reacuteduit selon lamecircme meacutethode que pour lrsquoestimation de lrsquoentropie HCDT oude lrsquoentropie de Shannon

119894120573 =119904ne0

sum119904=1

119899119904119894119899 (122)

119899minus119899119904

sum119907=1

1119907

119907prod119895=1

(1 minus 119899119904119899 minus 119895 + 1) minus

119899119894minus119899119904119894

sum119907=1

1119907

119907prod119895=1

(1 minus 119899119904119894 minus 1119899119894 minus 119895 )

Cette correction est incluse dans la fonction ShannonBetade entropart

Divergence de Kullback-Leibler entre chaque communauteacute de Paracou618MC et la meacutetacommunauteacute(Beta lt- apply(Paracou618MC$Nsi 2 ShannonBeta Nexp = Paracou618MC$Ns

Correction = ZhangGrabchak))

P006 P018 01442318 02994995

Entropie betasum(Paracou618MC$Wi Beta)

[1] 02106764

La correction de Zhang et Grabchak reacuteduit beaucoup plusfortement lrsquoestimation que celle de Chao et Shen Le meilleurestimateur peut ecirctre eacutevalueacute agrave partir de la diffeacuterence entre lesentropies 120574 et 120572 corrigeacutees par le meilleur estimateur disponible(celui de Chao Wang et Jost voir section 33)

Entropie alpha de chaque communauteacute de Paracou618MC(Alpha lt- apply(Paracou618MC$Nsi 2 Shannon CheckArguments = FALSE))

P006 P018 4427559 4772981

Entropie beta estimeacutee par diffeacuterencebcShannon(Paracou618MC$Ns) - sum(Paracou618MC$Wi Alpha)

122 Deacutecomposition de lrsquoentropie geacuteneacuteraliseacutee 191

14F Bourguignon laquo Decompo-sable Income Inequality Measures raquoIn Econometrica 474 (1979) p 901-920 doi 1023071914138 JSTOR 1914138

UnveilJ 03526572

Lrsquoestimateur de Chao et Shen est apparemment le meilleurla correction de celui de Zhang et Grabchak est trop forte

122 Deacutecomposition de lrsquoentropiegeacuteneacuteraliseacutee

La deacutecomposition additive de lrsquoentropie selon Lande13 doitecirctre la suivante

119902119867120574 = 119902119867120572 + 119902119867120573 (124)

Bourguignon14 comme Lande15 deacutefinissent une mesuredrsquoineacutegaliteacute deacutecomposable comme respectant les proprieacuteteacutessuivantes

bull La population totale eacutetant partitionneacutee chaque parti-tion recevant un poids 119908119894 la composante intra-groupede la mesure 119867120572 est eacutegale agrave la somme pondeacutereacutee des me-sures dans chaque-groupe 119867120572 = sum119894 119908119894119894119867120572

bull La composante intergroupe 119867120573 est la mesure drsquoineacutegaliteacuteentre les groupes

bull La mesure totale 119867120574 est la somme des mesures intra etintergroupes

En passant par les nombres de Hill Jost16 montre quelrsquoindice de Shannon est le seul pouvant ecirctre deacutecomposeacute decette faccedilon

La deacutemonstration de Jost repose sur le postulat que latransformation de lrsquoentropie en nombre de Hill deacutefinie pourla diversiteacute 120572 doit avoir la mecircme forme pour la diversiteacute 120573La remise en cause de ce postulat17 permet de deacutecomposer ladiversiteacute drsquoordre quelconque quel que soit le poids des commu-nauteacutes

La deacutecomposition de lrsquoentropie est faite en eacutecrivant le loga-rithme drsquoordre 119902 de la deacutecomposition de la diversiteacute eacutequation(101)

119902119867120574 = 119902119867120572 + ln119902119902119863120573 minus (119902 minus 1) 119902119867120572 ln119902

119902119863120573 (125)

Ceci est la deacutecomposition de Jost18 Jost deacutesigne sous lenom de laquo composante 120573 de lrsquoentropie raquo le logarithme drsquoordre119902 de la diversiteacute qursquoil note 119867119861 La deacutecomposition nrsquoest pasadditive mais 119867119861 est indeacutependant de lrsquoentropie 120572

19L Borland et al laquo InformationGain within Nonextensive Thermo-statistics raquo In Journal of Mathema-tical Physics 3912 (1998) p 6490-6501 doi 1010631532660 C Tsal-lis et al laquo The Role of Constraints wi-thin Generalized Nonextensive Statis-tics raquo In Physica A-statistical Me-chanics and Its Applications 2613(1998) p 534-554 doi 10 1016 S0378-4371(98)00437-3

21N Cressie et Read laquo Multi-nomial Goodness-of-Fit Tests raquo cfnote 100 p 82

22P W Lamberti et A PMajtey laquo Non-Logarithmic JensenndashShannon Divergence raquo In PhysicaA-statistical Mechanics and Its Ap-plications 3291ndash2 (2003) p 81-90doi http dx doi org 10 1016 S0378-4371(03)00566-1

Les deux derniers termes peuvent ecirctre regroupeacutes et reacutear-rangeacutes pour obtenir 119902119867120573 conformeacutement agrave la deacutecomposition ad-ditive de lrsquoeacutequation (124)

119902119867120573 = sum119894

119908119894 sum119904

119901119902119904|119894 ln119902

119901119904|119894119901119904

Lrsquoentropie 120573 est la somme pondeacutereacutee par 119908119894 (et pas autre-ment) des contributions de chaque communauteacute

119902119894119867120573 = sum

119904119901119902

119904|119894 ln119902119901119904|119894119901119904

119902119894119867120573 est une divergence de Kullback-Leibler geacuteneacuteraliseacutee19

119902119867120573 en est la moyenne sur lrsquoensemble des communauteacutes crsquoestdonc une geacuteneacuteralisation de la divergence de Jensen-Shannon20

119902119867120574 peut srsquoeacutecrire sous la forme 119902119867120574 = minus sum119904 119901119902119904 ln119902 119901119904 la for-

malisation de la deacutecomposition est une geacuteneacuteralisation de ladeacutecomposition de lrsquoentropie de Shannon reacutesumeacutee dans le ta-bleau 122

Il est inteacuteressant drsquoeacutecrire 119902119894119867120573 et 119902119867120574 sous la forme drsquoentro-

pies pour faire apparaicirctre leur fonction drsquoinformation Pour 119902diffeacuterent de 1 lrsquoentropie 120574 est

119902119867120574 = sum119904

1199011199041 minus 119901119902minus1

119904119902 minus 1 = sum

119904119901119904 ln119902

1119901119904

Sa fonction drsquoinformation a eacuteteacute traceacutee figure 41Lrsquoentropie 120573 est

119902119894119867120573 = sum

119904119901119904|119894

119901119902minus1119904|119894 minus 119901119902minus1

119904119902 minus 1 = sum

119904119901119904|119894 (ln119902

1119901119904

minus ln1199021

119901119904|119894)

(129)La forme de lrsquoentropie 120573 eacutevoque la divergence de puis-

sance21 qui est une statistique qui mesure la divergence entredeux distributions dont les proprieacuteteacutes asymptotiques sontconnues La divergence de puissance peut ecirctre eacutecrite sousla forme 119868119902 = minus2

119902 sum119904 119901119904|119894 ln119902119901119904

119901119904|119894 Elle est eacutegale agrave (deux fois)

la divergence de Kullback-Leibler pour 119902 = 1 mais diffegraverede lrsquoentropie 120573 pour les autres valeurs de 119902 La divergencenon-logarithmique de Jensen-Shannon22 est identique agrave unenormalisation pregraves 119870119902 = minus sum119904 119901119904|119894 ln119902

119901119904119901119904|119894

Elle mesurelrsquoeacutecart entre la diversiteacute 120572 et la valeur de sum119904 119908119894119901119902

119904|119894 ln119902 119901119904119902

qui nrsquoest pas la diversiteacute 12057423

Calcul sous R La fonction DivPart calcule entropie etdiversiteacute en mecircme temps

123 Deacutecomposition du nombre drsquoespegraveces 193

DivPart(q = 1 Paracou618MC Biased = FALSE)

$MetaCommunity [1] Paracou618MC $Order [1] 1 $Biased [1] FALSE $Correction [1] UnveilJ $Normalized [1] TRUE $TotalAlphaDiversity [1] 9706467 $TotalBetaDiversity UnveilJ 1422843 $GammaDiversity UnveilJ 1381078 $CommunityAlphaDiversities P006 P018 837268 1182713 $TotalAlphaEntropy [1] 4575378 $TotalBetaEntropy UnveilJ 03526572 $GammaEntropy UnveilJ 4928035 $CommunityAlphaEntropies P006 P018 4427559 4772981 $CommunityBetaEntropies [1] NA $Method [1] HCDT attr(class) [1] DivPart

123 Deacutecomposition du nombredrsquoespegraveces

Les reacutesultats geacuteneacuteraux se simplifient pour 119902 = 0 Lrsquoentropie120574 est le nombre drsquoespegraveces de la meacuteta-communauteacute moins un(0119867120574 = 119878minus1) lrsquoentropie 120572 est la moyenne pondeacutereacutee du nombre

drsquoespegraveces des communauteacutes moins un (0119867120572 = 119878minus1) lrsquoentropie120573 est la diffeacuterence 0119867120573 = 119878 minus 119878

En termes de diversiteacute

0119863120573 = 119878119878 (1210)

0119863120573 peut ecirctre supeacuterieur au nombre de communauteacutes24 siles poids sont tregraves ineacutegaux ce qui complique son interpreacuteta-tion La pondeacuteration de Jost donne pour le nombre drsquoespegravecesle mecircme poids agrave toutes les communauteacutes et garantit 0119863120573 le 119868 ce qui constitue pour Chao et al un argument en faveur deson utilisation Un contre-argumentaire est fourni par Marconet al25 Quel que soit la distribution des poids des commu-nauteacutes il est toujours possible de ramener les donneacutees agrave unensemble de communauteacutes de poids identiques dont certainessont reacutepeacuteteacutees La communauteacute dont le poids 119908119898119894119899 est le plusfaible est repreacutesenteacutee une seule fois les autres 119908119894119908119898119894119899 foisLrsquoindeacutependance entre les diversiteacutes 120572 et 120573 est donc bien veacuteri-fieacutee Le diversiteacute 120573 maximale theacuteorique est 1119908119898119894119899 (et non 119868)Elle nrsquoest pas atteinte parce que plusieurs communauteacutes sontidentiques

La deacutefinition de la diversiteacute 120573 par Whittaker26 srsquoappliquaitaux donneacutees de preacutesence-absence La diversiteacute 120573 eacutetait le rap-port entre le nombre drsquoespegraveces total de lrsquoassemblage des com-munauteacutes (diversiteacute 120574) et le nombre moyen drsquoespegraveces danschaque communauteacute (diversiteacute 120572) Crsquoest preacuteciseacutement la deacutefini-tion de 0119863120573 (1210)

124 Deacutecomposition de lrsquoindice deGini-Simpson

Lrsquoentropie de Simpson peut aussi ecirctre deacutecomposeacutee commeune variance La probabiliteacute qursquoun individu appartienne agrave lrsquoes-pegravece 119904 est 119901119904 Elle suit une loi de Bernoulli dont la variance est119901119904 (1 minus 119901119904) Cette variance peut ecirctre deacutecomposeacutee entre les com-munauteacutes ougrave la probabiliteacute est 119901119904|119894 La deacutecomposition entrevariance intra et inter-communauteacutes est

119901119904 (1 minus 119901119904) = sum119894

119908119894 [119901119904|119894 (1 minus 119901119904|119894) + (119901119904|119894 minus 119901119904)2] (1211)

Cette eacutegaliteacute peut ecirctre sommeacutee sur toutes les espegraveces pourdonner

119864120574 = sum119894

119908119894119864120572119894 + sum119894

119908119894 sum119904

(119901119904|119894 minus 119901119904)2 = 119864120572 + 119864120573 (1212)

124 Deacutecomposition de lrsquoindice de Gini-Simpson 195

27M Nei laquo Analysis of Gene Di-versity in Subdivided Populations raquoIn Proceedings of the NationalAcademy of Sciences of the Uni-ted States of America 7012 (1973)p 3321-3323 doi 101073pnas70123321

28Jost laquo Partitioning Diversityinto Independent Alpha and BetaComponents raquo cf note 34 p 67 LJost laquo GST and Its Relatives Do NotMeasure Differentiation raquo In Mole-cular Ecology 1718 (2008) p 4015-4026 doi 101111j1365-294X200803887x

29R Heller et H R Siegis-mund laquo Relationship between ThreeMeasures of Genetic DifferentiationG(ST) D-EST and Grsquo(ST) HowWrong Have We Been raquo In Mole-cular Ecology 1810 (2009) p 2080-2083 doi 101111j1365-294X200904185 x N Ryman et O Leimarlaquo G(ST) Is Still a Useful Measure ofGenetic Differentiation - a Commenton Jostrsquos D raquo In Molecular Ecolo-gy 1810 (2009) p 2084-2087 doi 101111j1365- 294X200904187x L Jost laquo D vs GST Response toHeller and Siegismund (2009) and Ry-man and Leimar (2009) raquo In Mole-cular Ecology 1810 (2009) p 2088-2091 doi 101111j1365-294X200904186x M C Whitlock laquo GrsquoST andd Do Not Replace FST raquo In Mole-cular Ecology 206 (2011) p 1083-1091 doi 101111j1365-294X201004996x

30Gregorius laquo Partitioning of Di-versity The rdquowithin CommunitiesrdquoComponent raquo cf note 24 p 66

Lrsquoentropie 120574 de Simpson peut ecirctre deacutecomposeacutee en sa di-versiteacute 120572 somme pondeacutereacutee des entropies 120572 des communauteacuteset son entropie 120573 eacutegale agrave la somme pondeacutereacutee des distances 1198972entre la distribution des freacutequences dans chaque communauteacuteet celle de lrsquoensemble de la communauteacute

En geacuteneacutetique lrsquoeacutegaliteacute srsquoeacutecrit27 119867119905 = 119867119904 + 119863119904119905 119867119905 estlrsquoheacuteteacuterozygotie totale deacutecomposeacutee en 119867119904 lrsquoheacuteteacuterozygotiemoyenne des populations et 119863119904119905 la diffeacuterenciation absolueentre populations 119866119904119905 = 119863119904119905119867119905 est la diffeacuterenciationrelative

Lrsquoentropie 119864120573 calculeacutee de cette maniegravere est eacutegale agrave 2119867120573calculeacutee agrave lrsquoeacutequation (129) pour le cas geacuteneacuteral mais la contri-bution de chaque communauteacute est diffeacuterente la deacutecomposi-tion de la variance est une faccedilon alternative de deacutecomposerlrsquoentropie valable uniquement pour lrsquoentropie de Simpson

Cette deacutecomposition est remise en cause par Jost28 qui ageacuteneacutereacute le deacutebat29 119864120574 eacutetant infeacuterieure ou eacutegale agrave 1 119864120573 nrsquoest pasindeacutependante de 119864120572 seule la deacutecomposition multiplicativepermet lrsquoindeacutependance et Jost propose drsquoutiliser une transfor-mation de 2119863120573 comme mesure de diffeacuterenciation (voir section127) Gregorius30 montre que ce problegraveme nrsquoest pas limiteacute agravelrsquoentropie de Simpson mais srsquoapplique agrave toutes les entropiesHCDT drsquoordre supeacuterieur agrave 1

Jost postule que la diversiteacute 120573 de Simpson a la mecircme rela-tion agrave 119864120573 que les diversiteacutes 120572 et 120574

119902119863120574 = 119902119863120572119902119863120573 hArr 1

1 minus 119864120574= 1

1 minus 119864120572

11 minus 119864120573

(1213)

drsquoougrave une deacutecomposition additive diffeacuterente qui correspondagrave sa deacutecomposition geacuteneacuterale (125)

119864120574 = 119864120572 + 119864120573 minus 119864120572119864120573 (1214)

Il nrsquoy a en reacutealiteacute aucune raison pour que le nombre eacutequi-valent de la diversiteacute 120573 ait la mecircme forme que celle de la di-versiteacute 120572 les deux diversiteacutes sont par nature tregraves diffeacuterenteset Hill ne traitait pas la diversiteacute 120573 La diversiteacute de Shannonest exceptionnelle parce que pour des raisons diffeacuterentes sonnombre de Hill est lrsquoexponentielle de lrsquoentropie et lrsquoexponen-tielle de la deacutecomposition additive (124) est la deacutecompositionmultiplicative (101)

Le nombre eacutequivalent de communauteacutes a une forme leacutegegrave-rement diffeacuterente drsquoun nombre de Hill (tableau 122)

Tab 122 Entropie diversiteacute et deacutecomposition Lrsquoentropie 120572 de chaque com-munauteacute se calcule comme lrsquoentropie 120574

Mesure de diversiteacute Entropie geacuteneacuteraliseacutee Shannon

Entropie 120574 119902119867120574 = minus sum119904 119901119902119904 ln119902 119901119904 1119867120574 = minus sum119904 119901119904 ln 119901119904

Entropie 120573 119902119867120573 =sum119894 119908119894 sum119904 119901119904|119894 (ln119902 1

119901119904 minus ln119902 1119901119904|119894

1119867120573 =sum119894 119908119894 sum119904 119901119904|119894 ln

119901119904|119894119901119904

Diversiteacute 120574 (nombre deHill)

119902119863120574 = 119890119902119867120574119902 1119863120574 = 1198901119867120574

Diversiteacute 120573 (nombreeacutequivalent

119902119863120573 = 119890

1199021198671205731minus(119902minus1)119902119867120572119902 1119863120573 = 119890

1119867120573

125 Deacutecomposition de lrsquoindice de RaoLes notations sont celles de la preacutesentation de lrsquoindice de

Rao section 76La diversiteacute de la meacuteta-communauteacute peut ecirctre deacutecompo-

seacutee en une somme (pondeacutereacutee) de diversiteacutes intra et une diver-siteacute inter31 en deacutefinissant une dissimilariteacute entre les commu-nauteacutes 119894 et 119895

119863119867Δ(p119894 p119895) = 2119867Δ (p119894 + p119895

2 ) minus 119867Δ (p119894) minus 119867Δ (p119895) (1215)

Elle est deacutefinie par Rao comme la diffeacuterence entre lrsquoentro-pie quadratique du meacutelange des deux communauteacutes et cellesdes deux communauteacutes prises individuellement Elle peut ecirctreutiliseacutee pour calculer un indice de diversiteacute entre communau-teacutes de la mecircme faccedilon qursquoon calcule la diversiteacute entre espegravecesdrsquoune communauteacute

119867Δ (p) = sum119894

119908119894119867Δ (p119894) + sum119894

sum119895

119908119894119908119895119863119867Δ(p119894 p119895) (1216)

Le deuxiegraveme terme de la somme est la diversiteacute inter-communauteacutes Crsquoest un indice de Rao les poids descommunauteacutes sont eacutequivalents aux tableaux de freacutequences etles dissimilariteacutes entre communauteacutes sont eacutequivalentes auxdissimilariteacutes entre espegraveces de lrsquoeacutequation (723) La divergenceentre communauteacutes est construite agrave partir des entropies dechacune lrsquoentropie 120573 est deacutefinie comme la diffeacuterence entreles entropies 120574 et 120572

Lrsquoexemple suivant utilise les communauteacutes du fichierraoeffectifscsv

effectifs)

P1 P2 P3 P4

125 Deacutecomposition de lrsquoindice de Rao 197

Ess 97 36 34 61 Me 62 24 49 4 S1 4 6 6 75 Sr 71 78 99 36 Vm 76 29 34 2 Bg 58 49 47 19 Ef 9 34 91 35 Dg 98 14 95 14

traits ACP sur les traits foliairespcaf lt- dudipca(traits scale = T scannf = FALSE nf = 2) CAH Ward des traits foliaireshf lt- hclust(dist(pcaf$tab) wardD) Transformation de larbre du format hclust au format phylogphyf lt- hclust2phylog(hf)

Il contient 4 communauteacutesPour obtenir tous les eacuteleacutements de lrsquoeacutequation (1216)

bull 119867Δ (p) diversiteacute totale Calculer p en sommant les com-munauteacutes Calculer ensuite lrsquoentropie quadratique avecdivc

(tabF lt- apply(effectifs[names(phyf$leaves) ] MARGIN = 1 sum))

Sr Ess Me S1 Bg Ef Vm Dg 284 228 139 91 173 169 141 221

divc(asdataframe(tabF) phyf$Wdist)

diversity tabF 5870667

bull 119867Δ (p119894) diversiteacute de chaque communauteacute fournie pardivc

divc(effectifs[names(phyf$leaves) ] phyf$Wdist)

diversity P1 5816719 P2 5897210 P3 5744483 P4 4790586

bull La variabiliteacute inter-communauteacutes peut ecirctre calculeacutee pardivc en utilisant la distance fournie par disc en deacutefi-nissant la matrice des poids (eacutegale aux effectifs)

divc(asdataframe(colSums(effectifs)) disc(effectifs[names(phyf$leaves)] phyf$Wdist))

diversity colSums(effectifs) 02362187

33Gower laquo Some Distance Pro-perties of Latent Root and Vector Me-thods Used in Multivariate Analysis raquocf note 9 p 173

34C Ricotta et al laquo A ClassicalMeasure of Phylogenetic Dissimilarityand Its Relationship with Beta Diver-sity raquo In Basic and Applied Ecology161 (2015) p 10-18 doi 101016jbaae201410003

35Rao laquo Diversity and Dissimi-larity Coefficients A Unified Ap-proach raquo cf note 5 p 101 S Villeacute-ger et D Mouillot laquo Additive Parti-tioning of Diversity Including SpeciesDifferences A Comment on Hardyamp Senterre (2007) raquo In Journal ofEcology 965 (2008) p 845-848 doi 101111j1365-2745200701351x

36O J Hardy et B Senterrelaquo Characterizing the PhylogeneticStructure of Communities by anAdditive Partitioning of PhylogeneticDiversity raquo In Journal of Ecology953 (2007) p 493-506 doi 101111j1365-2745200701222x

37O J Hardy et L Jost laquo In-terpreting and Estimating Measuresof Community Phylogenetic Structu-ring raquo In Journal of Ecology 965(2008) p 849-852 doi 101111j1365-2745200801423x

38F de Bello et al laquo The Partitio-ning of Diversity Showing Theseusa Way out of the Labyrinth raquo In Journal of Vegetation Science 215(2010) p 992-1000 doi 101111j1654-1103201001195x

39R C Guiasu et S Guiasulaquo The Weighted Quadratic Index ofBiodiversity for Pairs of Species AGeneralization of Raorsquos Index raquo cfnote 61 p 130

40Champely et Chessel laquo Measu-ring Biological Diversity Using Eucli-dean Metrics raquo cf note 50 p 126

La fonction disc calcule radic2119863119867Δ(p119894 p119895)

disc(effectifs[names(phyf$leaves) ] phyf$Wdist)

P1 P2 P3 P2 04698121 P3 04888729 06487916 P4 10018983 08776582 13157902

Une interpreacutetation geacuteomeacutetrique de la deacutecomposition estla suivante32 Les espegraveces peuvent ecirctre placeacutees dans un es-pace multidimensionnel construit par une Analyse en Coor-donneacutees Principales33 de la matrice de dissimilariteacute D telleque = D∘22 (les distances dans lrsquoespace multidimensionnelsont radic2120575119904prime119904Prime autrement dit la dissimilariteacute entre deux es-pegraveces est la moitieacute du carreacute de la distance entre elles dans larepreacutesentation geacuteomeacutetrique) Chaque communauteacute se trouveau centre de graviteacute des espegraveces qursquoelle contient pondeacutereacuteespar leur freacutequence La moitieacute du carreacute de la distance entredeux communauteacutes dans ce mecircme espace est le coefficient dedissimilariteacute entre communauteacutes de Rao La distance entrecommunauteacutes est donc interpreacutetable directement comme unemesure de diversiteacute 12057334 dans la tradition de lrsquoutilisation de ladissimilariteacute entre paires de communauteacutes (chapitre 11)

Cette partition suppose que les poids des communauteacutessont proportionnels agrave leur nombre drsquoindividus35 O J Har-dy et Senterre36 deacutecomposent (par diffeacuterence entre 120574 et 120572)lrsquoindice de Rao de communauteacutes de poids eacutegaux O J Har-dy et Jost37 montrent que les deux pondeacuterations sont validesmais lrsquoabsence de cadre geacuteneacuteral assurant que la diversiteacute 120574de Rao est supeacuterieure agrave la diversiteacute 12057238 motive R C Guiasuet S Guiasu39 agrave proposer une alternative agrave lrsquoindice de Raolrsquoindice de Gini-Simpson quadratique pondeacutereacute (727) dont laconcaviteacute est deacutemontreacutee (ce qui implique que 120574 ge 120572) La pon-deacuteration peut en fait ecirctre quelconque tant que la matrice dontles eacuteleacutements sont la racine carreacute des eacuteleacutements de la matrice dedissimilariteacute est euclidienne40 Ce reacutesultat a eacuteteacute obtenu pourles arbres ultrameacutetriques dans le cadre plus geacuteneacuteral de la deacute-composition de lrsquoentropie phylogeacuteneacutetique (voir chapitre 12

La partition peut ecirctre faite avec la fonction DivPart

Creacuteation dune meacuteta-communauteacute poids eacutegaux aux effectifsMC lt- MetaCommunity(effectifs colSums(effectifs))summary(DivPart(q = 2 MC Tree = phyf Normalize = FALSE))

HCDT diversity partitioning of order 2 of metaCommunity MC Phylogenetic or functional diversity was calculated according to the tree phyf Diversity is not normalized

41Ricotta et Szeidl laquo DiversityPartitioning of Raorsquos Quadratic En-tropy raquo cf note 7 p 136

42Ricotta et Burrascano laquo Tes-ting for Differences in Beta Diversi-ty with Asymmetric Dissimilarities raquocf note 52 p 185

43T O Crist et al laquo PartitioningSpecies Diversity across Landscapesand Regions A Hierarchical Analy-sis of Alpha Beta and Gamma Di-versity raquo In The American Natu-ralist 1626 (2003) p 734-743 doi 101086378901 Marcon et al laquo TheDecomposition of Shannonrsquos Entropyand a Confidence Interval for Beta Di-versity raquo cf note 11 p 64

44Marcon et al laquo The Decompo-sition of Shannonrsquos Entropy and aConfidence Interval for Beta Diversi-ty raquo cf note 11 p 64 J Beck etal laquo Undersampling and the Measure-ment of Beta Diversity raquo In Methodsin Ecology and Evolution 44 (2013)p 370-382 doi 1011112041-210x12023

45Marcon et al laquo Generalizationof the Partitioning of Shannon Di-versity raquo cf note 37 p 69 Mar-con et al laquo The Decomposition ofSimilarity-Based Diversity and ItsBias Correction raquo cf note 9 p 145

Alpha diversity of communities P1 P2 P3 P4 2419203 2470000 2375363 1916686 Total alpha diversity of the communities 9 2311553 Beta diversity of the communities 9 1061198 Gamma diversity of the metacommunity 9 2453015

La deacutecomposition de la diversiteacute (et non seulement de lrsquoen-tropie) de Rao a eacuteteacute eacutetablie par Ricotta et Szeidl41

126 Synthegravese

La diversiteacute mesureacutee par lrsquoentropie geacuteneacuteraliseacutee peut ecirctredeacutecomposeacutee dans tous les cas de figure y compris lorsque lespoids des communauteacutes ne sont pas eacutegaux Les formules drsquoen-tropie et de diversiteacute sont reacutesumeacutees dans le tableau 122 Lrsquoen-tropie 120573 est une mesure de divergence entre la distribution dechaque communauteacute et celle de la meacuteta-communauteacute commelrsquoavaient suggeacutereacute Ricotta et Burrascano42

Lrsquoentropie de Shannon est un cas particulier dans lequeltoutes les controverses disparaissent lrsquoentropie 120573 est indeacutepen-dante de lrsquoentropie 120572 et la pondeacuteration de Jost se confondavec celle de Routledge

Lrsquoentropie de Simpson peut ecirctre deacutecomposeacutee de deux fa-ccedilons comme une variance quand les poids des communauteacutessont donneacutes par leurs effectifs ou selon le cas geacuteneacuteral Lesdeux deacutecompositions produisent les mecircmes valeurs drsquoentropie120573 mais la contribution de chaque communauteacute nrsquoest pas lamecircme

Lrsquoentropie peut ecirctre deacutecomposeacutee hieacuterarchiquement sur plu-sieurs niveaux43

Les probabiliteacutes drsquooccurrence des espegraveces ne sont pasconnues mais estimeacutees agrave partir des donneacutees Les diversiteacutes 120572et 120574 sont sous-estimeacutees et la diversiteacute 120573 surestimeacutee44 drsquoautantplus que lrsquoordre de diversiteacute est faible (le biais est neacutegligeableau-delagrave de lrsquoindice de Simpson) Des meacutethodes de correctionexistent mais pas pour lrsquoentropie 120573 agrave lrsquoexception de ShannonLa meacutethode geacuteneacuterale consiste donc agrave corriger les entropies 120572et 120574 calculer lrsquoentropie 120573 par diffeacuterence et transformer lesreacutesultats en nombres eacutequivalents45

127 NormalisationLa mesure de diversiteacute 119902119863120573 est le nombre eacutequivalent de

communauteacutes totalement distinctes qui fourniraient ce niveaude diversiteacute

Neacutecessiteacute de normaliser la diversiteacute 120573Selon une premiegravere approche cette mesure nrsquoa de sens que

compareacutee agrave nombre de communauteacutes La diversiteacute entre unhectare de forecirct tropicale et un hectare de forecirct tempeacutereacutee (demecircme poids sans espegravece commune) est eacutegale agrave 2 quel que soit119902 La diversiteacute entre un nombre suffisant drsquoeacutechantillons de forecircttropicale relativement homogegravene (avec de nombreuses espegravecescommunes) peut facilement deacutepasser 2 crsquoest le cas des 50carreacutes de BCI pour 119902 = 0 Pour ne pas conclure de faccedilon er-roneacutee que les carreacutes de BCI sont plus diffeacuterents entre eux queBCI et la forecirct de Fontainebleau Jost46 suggegravere de diviser ladiversiteacute 120573 par le nombre de communauteacutes pour la normali-ser Ce raisonnement a un sens quand la diversiteacute maximaleenvisageable est effectivement eacutegale au nombre de communau-teacutes par exemple si les communauteacutes sont choisies dans deshabitats diffeacuterents la diversiteacute 120573 mesure cette diffeacuterence

Un autre cas est envisageable les communauteacutes peuventecirctre des eacutechantillons drsquoune meacuteta-communauteacute clairement deacutefi-nie La diversiteacute 120573 mesure alors la variabiliteacute de lrsquoeacutechantillon-nage agrave lrsquointeacuterieur de la meacuteta-communauteacute agrave une eacutechelle donneacuteePour une taille drsquoeacutechantillon fixeacutee (par exemple un hectare deforecirct) la diversiteacute 120573 ne deacutepend pas du nombre de commu-nauteacutes lrsquoentropie 120573 est lrsquoespeacuterance (estimeacutee par la moyenneeacutequation (126) de la divergence de Jensen-Shannon entre ladistribution des espegraveces drsquoune communauteacute et celle de la meacuteta-communauteacute fixe Cette variabiliteacute deacutepend de lrsquoeacutechelle delrsquoeacutechantillonnage dans le sens ougrave elle diminue si les eacutechantillonssont de taille plus grande lrsquoentropie 120572 de deux hectares deforecircts est la diversiteacute 120572 moyenne de chacun des deux hectaresplus lrsquoentropie 120573 entre eux Lrsquoentropie 120573 entre les eacutechantillonsde deux hectares est donc diminueacutee de cette entropie 120573 laquo in-tra raquo qui est absorbeacutee par la nouvelle entropie 120572 quand la tailledes eacutechantillons augmente

La figure 121 preacutesente les valeurs estimeacutees de diversiteacuteneutre 120573 entre carreacutes de BCI tireacutes aleacuteatoirement en fonctiondu nombre de carreacutes

Code pour reacutealiser la figure

Metacommunauteacute de BCIMC lt- MetaCommunity(asdataframe(t(BCI)))

Creacuteation dune meacuteta-communauteacute agrave partir de n carreacutes de BCISamplePlots lt- function (n q)

127 Normalisation 201

0 10 20 30Nombre de carreacutes

teacute β

Fig 121 Estimation de ladiversiteacute 120573 entre carreacutes de BCI Ladiversiteacute est calculeacutee agrave partir dunombre de carreacutes en abscisse de 2agrave 30 tireacutes aleacuteatoirement La valeuren ordonneacutee est la diversiteacute drsquoordre2 moyenne sur 100 tirages lesbarres repreacutesentent lrsquoeacutecart-typeAux erreurs drsquoestimation pregraves etdegraves 5 carreacutes (neacutecessaires pourrepreacutesenter lrsquoensemble dudispositif) la valeur de la diversiteacute120573 ne deacutepend pas du nombre decarreacutes La ligne horizontalerepreacutesente la diversiteacute 120573 entre tousles carreacutes

Plots lt- sample(150 n)Nsi lt- MC$Nsi[ Plots] MCsample lt- MetaCommunity(Nsi)dp lt- DivPart(q MCsample Biased = FALSE) Retourne la diversiteacute betareturn(dp$TotalBetaDiversity)

Calcul de la diversiteacute moyenne agrave partir des simulationsBetaPlots lt- function (q nPlots nSimulations) buiw lt- b lt- vector(numeric length(nPlots)) i lt- 1for (Size in nPlots)

Sims lt- replicate(nSimulations SamplePlots(Size q))b[i] lt- mean(Sims)buiw[i] lt- sd(Sims)i lt- i+1

Retour dun dataframereturn(dataframe(x=nPlots y=b ymin=b-buiw ymax=b+buiw))

Echantillonnage de la diversiteacute betaBetaD lt- BetaPlots(q = 2 nPlots=c(2 5 10 15 20 25 30)

nSimulations = 100) Diversiteacute beta totaledpBCI lt- DivPart(q = 2 MC Biased = FALSE) Figureggplot(BetaD) +

geom_point(aes(x=x y=y)) +geom_errorbar(aes(x=x ymin=ymin ymax=ymax)) +geom_hline(yintercept = dpBCI$TotalBetaDiversity lty=2) +labs(x=Nombre de carreacutes

y=expression(paste(Diversiteacute beta)))

Lrsquoestimation de la diversiteacute preacutesente les difficulteacutes clas-siques dues au biais drsquoestimation la diversiteacute 120574 est sous-estimeacutee si lrsquoeacutechantillonnage est trop faible la diversiteacute 120573 aug-mente avec le nombre de communauteacutes comme la diversiteacute 120574augmente avec la taille de lrsquoeacutechantillon il srsquoagit drsquoun problegravemedrsquoestimation pas de normalisation

La diversiteacute 120573 ne doit donc pas ecirctre normaliseacutee systeacutemati-quement mais seulement dans le premier cas

47A Chao et al laquo A Two-StageProbabilistic Approach to Multiple-Community Similarity Indices raquo In Biometrics 644 (2008) p 1178-1186doi 101111j1541-0420200801010x

Lrsquoindice de chevauchement 119862119902119873

Plutocirct qursquoune simple normalisation Chao et al47 deacutefi-nissent un indice de chevauchement crsquoest-agrave-dire la proportiondrsquoespegraveces partageacutees en moyenne par une communauteacute Si 119873communauteacutes (le nombre de communauteacutes est noteacute 119873 ici etnon 119868 pour conserver le nom de lrsquoindice eacutetabli dans la litteacutera-ture) de mecircmes diversiteacutes 120572 et 120574 que les donneacutees contenaientchacune 119878 espegraveces eacutequifreacutequentes dont 119860 seraient communesagrave toutes les communauteacutes et les autres repreacutesenteacutees dans uneseule 119860119878 serait cet indice de chevauchement

Pour 119902 ne 1

119862119902119873 = [( 1119902119863120573

)119902minus1

minus ( 1119873 )

119902minus1][1 minus ( 1

119873 )119902minus1

] (1217)

1198621119873 = 1ln 119873

119878sum119904=1

119873sum119894=1

119901119904|119894119873 ln (1 +

sum119895ne119894 119901119904119895119901119904|119894

) = 1 minus 119867120573ln 119873

(1218)119862119902119873 a eacuteteacute deacutefini agrave lrsquoorigine pour 119902 ge 2 Chao et al48

lrsquoeacutetendent sans preacutecaution agrave 119902 quelconque Sa valeur peut ecirctreneacutegative pour 119902 lt 1 on se limitera donc agrave 119902 ge 1

1Marcon et Heacuterault laquo Decompo-sing Phylodiversity raquo cf note 56p 130

Chapitre 13

Deacutecomposition de la diversiteacutephylogeacuteneacutetique et fonctionnelle

Lrsquoentropie phylogeacuteneacutetique et lrsquoentropie de Ricotta et Szeidl se deacutecom-posent comme lrsquoentropie HCDT La diversiteacute 120573 phylogeacuteneacutetique et la di-versiteacute 120573 de Leinster et Cobbold sont des nombres effectifs de commu-nauteacutes crsquoest-agrave-dire des communauteacutes de mecircme poids et dont les espegravecesseraient totalement dissimilaires qui fourniraient la mecircme entropie 120573 queles communauteacutes reacuteelles

Lrsquoessentiel

Lrsquoentropie phylogeacuteneacutetique est une combinaison lineacuteaire delrsquoentropie HCDT donc sa deacutecomposition est identique1

131 Deacutecomposition de la diversiteacutephylogeacuteneacutetique

En combinant lrsquoeacutequation (81) et le tableau 122 on obtient

119902120574 (119879 ) =119902 120572 (119879 ) +119902120573 (119879 ) (131)

Lrsquoentropie 120574 est celle de la meacuteta-communauteacute lrsquoentropie120572 est la somme pondeacutereacutee de celles des communauteacutes la pon-deacuteration est libre mais doit respecter 119901119904 = sum119894 119908119894119901119904|119894

119902120572 (119879 ) = sum119894

119908119894119902119894120572 (119879 ) (132)

Lrsquoentropie 120573 est

204 Deacutecomposition de la diversiteacute phylogeacuteneacutetique et fonctionnelle

3M A Mouchet et D Mouillotlaquo Decomposing Phylogenetic Entropyinto and Components raquo In Bio-logy Letters 72 (2011) p 205-209doi 101098rsbl20100769

4Pavoine et al laquo lsquoEquivalentNumbersrsquo for Species Phylogeneticor Functional Diversity in a NestedHierarchy of Multiple Scales raquo cfnote 31 p 165

119902120573 (119879 ) = sum119894

119908119894119902119894120573 (119879 ) (133)

= sum119894

119908119894 sum119896

119879119896119879

119902

119894119896119867120573 (134)

= sum119894

119908119894 sum119896

119879119896119879 sum

119906119901119902

119896119906119894 ln119902119901119896119906119894119901119896119906

ougrave 119901119896119906 est la probabiliteacute drsquoobserver une des espegraveces dela branche 119906 de lrsquoarbre agrave la peacuteriode 119896 (figure 77) dans lameacuteta-communauteacute et 119901119896119906119894 la mecircme probabiliteacute dans la com-munauteacute 119894

La deacutecomposition de lrsquoentropie phylogeacuteneacutetique au sens deAllen et al2 crsquoest-agrave-dire dans la cas particulier 119902 = 1 a eacuteteacuteeacutetablie par Mouchet et Mouillot3

La fonction DivPart de entropart permet de deacutecomposerlrsquoentropie Les reacutesultats contiennent la valeur de la diversiteacute

data(Paracou618)summary(DivPart(q = 1 Paracou618MC Biased = FALSE

Tree = Paracou618Taxonomy))

HCDT diversity partitioning of order 1 of metaCommunity Paracou618MC with correction UnveilJ UnveilJ UnveilJ Phylogenetic or functional diversity was calculated according to the tree Paracou618Taxonomy Diversity is normalized Alpha diversity of communities P006 P018 3742057 5373643 Total alpha diversity of the communities [1] 436882 Beta diversity of the communities [1] 1273686 Gamma diversity of the metacommunity [1] 5564502

La figure 131 donne une repreacutesentation graphique de ladeacutecomposition de la diversiteacute La diffeacuterence de taille entre lesrectangles hachureacutes et les rectangles transparents est due agrave laprise en compte de la phylogeacutenie La diversiteacute 120574 (rectanglesde hauteur 1) est eacutegale au produit des diversiteacutes 120572 et 120573 (cocircteacutesdu rectangle plus haut) Si les communauteacutes eacutetaient de mecircmepoids et complegravetement diffeacuterentes crsquoest agrave dire contenant desespegraveces totalement dissimilaires entre communauteacutes4 la hau-teur du rectangle serait eacutegale agrave leur nombre (2 ici)

132 Partitionnement de la diversiteacute de Leinster et Cobbold 205

0 20 40 60 80 100 120 140

α γ diversity

ityFig 131 Repreacutesentationgraphique de la diversiteacute des deuxparcelles du jeu de donneacuteesParacou618 Les rectanglestransparents repreacutesentent ladiversiteacute neutre les rectangleshachureacutes la diversiteacutephylogeacuteneacutetique (lrsquoarbre est lataxonomie des espegraveces 119902 = 1)Dans chaque cas le rectangle leplus large de hauteur 1repreacutesente la diversiteacute119892119886119898119898119886 Le rectangle plus haut apour largeur et longueur lesdiversiteacutes 120572 et 120573 Les surfaces desdeux rectangles sont identiques

5Marcon et al laquo The Decompo-sition of Similarity-Based Diversityand Its Bias Correction raquo cf note 9p 145

q lt- 1Neutre lt- DivPart(q Paracou618MC Biased = FALSE)plot(c(0 Neutre$GammaDiversity) c(0 Paracou618MC$Ncommunities)

type = nxlab = expression(paste(alpha gamma diversity))ylab = expression(paste(beta diversity)))

rect(0 0 Neutre$GammaDiversity 1 lty=2)rect(0 0 Neutre$TotalAlphaDiversity Neutre$TotalBetaDiversity

lty = 2)Phylo lt- DivPart(q Paracou618MC Biased = FALSE

Tree = Paracou618Taxonomy)rect(0 0 Phylo$GammaDiversity 1 angle=135 density=10)rect(0 0 Phylo$TotalAlphaDiversity Phylo$TotalBetaDiversity

density = 10)

132 Partitionnement de la diversiteacute deLeinster et Cobbold

Selon les mecircmes principes que pour la deacutecomposition delrsquoentropie HCDT Marcon et al5 ont deacutecomposeacute lrsquoentropie deRicotta et Szeidl6 Lrsquoentropie 120572 de la communauteacute 119894 est

119902119894119867Z

120572 =1 minus sum119904 119901119904|119894(Zp)119902minus1

119904|119894119902 minus 1 (136)

Lrsquoentropie 120572 est la somme pondeacutereacutee des entropies des com-munauteacutes

119902119867Z120572 = sum

119894119908119894

119902119894119867Z

120572 =1 minus sum119894 119908119894 sum119904 119901119904|119894(Zp)119902minus1

119904|119894119902 minus 1 (137)

Lrsquoentropie 120573 est similaire agrave lrsquoentropie 120573 HCDT crsquoest la di-vergence geacuteneacuteraliseacutee de Jensen-Shannon entre les distributionsde Zp des communauteacutes Formellement

119902119867Z120573 = sum

119894119908119894 sum

119904119901119904|119894 (ln119902

1(Zp)119904

minus ln1199021

(Zp)119904|119894) (138)

La diversiteacute 120573 est obtenue en calculant lrsquoexponentielle deacute-formeacutee de la deacutecomposition additive de lrsquoentropie

119902119863Z120573 = 119890

119902119867Z1+(1minus119902) 119902119867Z120572119902 (139)

La deacutecomposition de la diversiteacute peut ecirctre faite directe-ment sans passer par lrsquoentropie

Lrsquoinverse de 119902119863Z120574 est la moyenne geacuteneacuteraliseacutee drsquoordre 119902 minus 1

de (Zp)119904

1119902119863Z120574

= [sum119904

119901119904(Zp)119904119902minus1]

1119902minus1

(1310)

Partant de 119902119863120574 = 119902119863120572119902119863120573 et de la deacutefinition de Routledge

de la diversiteacute 120572 on obtient

119902119863Z120573 = ⎡⎢

⎣sum

119894119908119894(

1119902119894119863Z

1205721119902119863Z120574

)119902minus1

⎤⎥⎦

1119902minus1

(1311)

De la mecircme faccedilon que 1119902119863Z120574 est la banaliteacute moyenne des

espegraveces 119902119863Z120573 est la banaliteacute moyenne normaliseacutee des commu-

nauteacutes ougrave la banaliteacute normaliseacutee de la communauteacute 119894 est deacutefi-nie comme (1119902

119894119863Z120572)(1119902119863Z

120574 ) crsquoest-agrave-dire la banaliteacute moyennede ses espegraveces diviseacutee par celle de la meacuteta-communauteacute

La fonction DivPart (comme les autres fonctions avanceacuteesde entropart) supporte la deacutecomposition de la diversiteacute deLeinster et Cobbold quand une matrice de similariteacute lui estpasseacutee comme argument agrave la place drsquoun arbre phylogeacuteneacutetiquepour le calcul de la phylodiversiteacute HCDT

Matrice de distances fonctionnellesDistanceMatrix lt- asmatrix(Paracou618dist) Transformation en matrice de similariteacuteZ lt- 1 - DistanceMatrixmax(DistanceMatrix) Partition de la diversiteacutesummary(DivPart(q = 1 Paracou618MC Z = Z Biased = FALSE))

Similarity-based diversity partitioning of order 1 of metaCommunity Paracou618MC with correction Best Phylogenetic or functional entropy was calculated according to the similarity matrix Z Alpha diversity of communities P006 P018

1483722 1482119 Total alpha diversity of the communities [1] 1483036 Beta diversity of the communities Best 1003403 Gamma diversity of the metacommunity Best 1488083

Le partitionnement de la diversiteacute fonctionnelle de la meacuteta-communauteacute Paracou618MC selon la matrice de distances destraits fonctionnels montre que la diversiteacute 120573 est extrecircmementfaible entre les deux parcelles

1Crist et al laquo Partitioning Spe-cies Diversity across Landscapes andRegions A Hierarchical Analysis ofAlpha Beta and Gamma Diversity raquocf note 43 p 199

2D Jones et N Matloff laquo Statis-tical Hypothesis Testing in Biology A Contradiction in Terms raquo In Jour-nal of Economic Entomology 795(1986) p 1156-1160 doi 101093jee7951156

Chapitre 14

Tests de significativiteacute

Les tests de significativiteacute permettent drsquoaffirmer que des communauteacutessont reacuteellement diffeacuterentieacutees En compleacutement les intervalles de confiancedes mesures de diversiteacute peuvent ecirctre calculeacutes sous lrsquohypothegravese drsquounedistribution multinomiale

Lrsquoessentiel

La diversiteacute 120573 calculeacutee entre plusieurs eacutechantillons succes-sifs drsquoune mecircme communauteacute nrsquoest pas nulle par simplefluctuation des effectifs due au hasard les distributions deseacutechantillons ne sont pas identiques Des tests statistiques onteacuteteacute deacuteveloppeacutes pour rejeter cette hypothegravese nulle agrave partir dedonneacutees drsquoinventaires

Ce chapitre ne traite pas de la diversiteacute de diffeacuterentiation les tests correspondants ont eacuteteacute preacutesenteacutes en section 116

141 Test de non-nulliteacuteLrsquoobjectif est de tester si deux communauteacutes ne sont pas

simplement deux eacutechantillons drsquoune mecircme communauteacute dontles diffeacuterences ne sont que des fluctuations dues au hasardSous lrsquohypothegravese nulle les observations 119902119904|119894 sont des reacutealisa-tions des mecircmes probabiliteacutes 119901119904 Il est possible1 mais contro-verseacute2 de tester la significativiteacute de la diffeacuterence entre commu-nauteacutes Une meilleure approche consiste agrave calculer lrsquointervallede confiance de la diversiteacute 120573 due agrave lrsquoincertitude sur les esti-mateurs de probabiliteacutes

Le test est reacutealiseacute de la faccedilon suivante 3

bull Les effectifs de chaque communauteacute 119894 sont tireacutes dans uneloi multinomiale ℳ(119899+119894 119899119904119894119899+119894) et 120573 est estimeacute

bull La simulation est reacutepeacuteteacutee un grand nombre de fois parexemple 10000 et les valeurs extrecircmes sont eacutelimineacuteesAu seuil de risque 120572 = 5 les 251e et 9750e valeurs

4D Jones et Matloff laquo Statisti-cal Hypothesis Testing in Biology AContradiction in Terms raquo cf note 2p 209

simuleacutees deacutefinissent les bornes de lrsquointervalle de confiancede lrsquohypothegravese nulle

Lrsquohypothegravese nulle est rejeteacutee si la valeur observeacutee de 120573nrsquoest pas dans cet intervalle en geacuteneacuteral au-delagrave de la bornesupeacuterieure Il peut arriver que les deux communauteacutes soientplus semblables que sous lrsquohypothegravese nulle crsquoest-agrave-dire que lesfreacutequences varient moins que dans le tirage drsquoune loi multino-miale si deux communauteacutes ont eacuteteacute creacuteeacutees artificiellement avecle mecircme nombre drsquoindividus de chaque espegravece par exemple

Lorsque les donneacutees sont issues de communauteacutes reacuteelles lesens mecircme de ce type de test est remis en question4 les com-munauteacutes reacuteelles ne pouvant pas ecirctre exactement identiques ilsuffit drsquoaugmenter la taille de lrsquoeacutechantillonnage pour prouverleur diffeacuterence

Intervalle de confianceLrsquointervalle de confiance de lrsquoestimateur de 119867120573

5 peut ecirctrecalculeacute en simulant les communauteacutes par des tirages dans deslois multinomiales suivant leurs freacutequences ℳ (119899+119894 119899119904119894119899+119894)

Si lrsquointervalle de confiance ne contient pas 0 lrsquoeacutegaliteacute desdistributions est rejeteacutee

Fig 141 Estimation de ladiversiteacute de la meacuteta-communauteacute

Paracou618

65 70 75 80

Alpha Diversity

Simulated Values

150 155 160 165

Beta Diversity

Simulated Values

100 110 120 130

Gamma Diversity

Simulated Values

Null DistributionTrue Estimate95 confidence interval

Calcul sous R la fonction DivEst produit un graphiqueavec lrsquointervalle de confiance (figure 141)

Code R

de lt- DivEst(q = 1 Paracou618MC Simulations = 1000)plot(de)

8C Richard-Hansen et allaquo Landscape Patterns InfluenceCommunities of Medium- to Large-Bodied Vertebrate in UndisturbedTerra Firme Forests of FrenchGuiana raquo In Journal of TropicalEcology 315 (2015) p 423-436 doi 101017S0266467415000255

Par deacutefaut DivEst ne corrige pas les biais drsquoestimationLes reacutesultats sont preacutesenteacutes sous forme de diversiteacute et nondrsquoentropie la valeur attendue en cas drsquoeacutegaliteacute des communau-teacutes est 1

Correction des biaisLes simulations neacutecessaires aux tests creacuteent un biais drsquoesti-

mation les espegraveces les plus rares dans les communauteacutes sontsouvent eacutelimineacutees par les tirages La correction du biais destirages recentre leur distribution autour des valeurs originalesdes communauteacutes non deacutebiaiseacutees Il nrsquoexiste pas de correctionanalytique pour corriger successivement le biais ducirc aux simula-tions (ducirc agrave la perte des espegraveces rares des communauteacutes reacuteelles)puis celui ducirc agrave lrsquoeacutechantillonnage des communauteacutes elles-mecircmes(ducirc agrave la non-observation des espegraveces rares de la communauteacute)Marcon et al6 comme Chao et Jost7 effectuent la deuxiegravemecorrection par un recentrage de la distribution de 119867120573 simuleacuteeautour de sa valeur observeacutee deacutebiaiseacutee ce qui permet drsquoobtenirlrsquointervalle de confiance de lrsquoestimateur de 119867120573

142 Analyse de la variabiliteacuteOn se place maintenant dans un cadre un peu diffeacuterent

les communauteacutes sont elles-mecircmes obtenues par regroupementde placettes drsquoeacutechantillonnage Pour tester la significativiteacutede la diversiteacute 120573 entre communauteacutes lrsquoapproche pourrait ecirctrecelle de lrsquoanalyse de variance lrsquoentropie totale de la meacuteta-communauteacute est la somme des entropies des sites de lrsquoentro-pie 120573 entre sites des communauteacutes et de lrsquoentropie 120573 entrecommunauteacutes Lrsquoentropie 120573 inter-communauteacutes pourrait ecirctrecompareacutee agrave lrsquoentropie 120573 intra-communauteacutes en calculant unestatistique F Cette approche souffre de la deacutependance de lrsquoen-tropie 120573 agrave lrsquoentropie 120572 si une communauteacute est plus diverseque lrsquoautre son entropie 120573 sera forceacutement plus faible

Le test correct porte sur la diversiteacute plutocirct que sur lrsquoen-tropie8 La statistique de test est le ratio de la diversiteacute 120573inter-communauteacutes sur la la diversiteacute 120573 intra-communauteacutesSa valeur observeacutee est compareacutee agrave la distribution de sa valeursimuleacutee en redistribuant les placettes aleacuteatoirement dans lescommunauteacutes

1R Peacutelissier et P Couteronlaquo An Operational Additive Frame-work for Species Diversity Partitio-ning and Beta-Diversity Analysis raquoIn Journal of Ecology 952 (2007)p 294-300 doi 101111j1365-2745200701211x

2R Peacutelissier et al laquo Consistencybetween Ordination Techniques andDiversity Measurements Two Stra-tegies for Species Occurrence Data raquoIn Ecology 841 (2003) p 242-251 doi 1018900012- 9658(2003)084[0242 CBOTAD ] 2 0 CO 2 P Couteron et R Peacutelissier laquo Addi-tive Apportioning of Species Diversi-ty Towards More Sophisticated Mo-dels and Analyses raquo In Oikos 1071(2004) p 215-221 doi 101111j0030-1299200412766x

Chapitre 15

Autres approches

Des deacutefinitions diffeacuterentes de la diversiteacute 120573 ou du parti-tionnement de la diversiteacute sont preacutesenteacutees ici parce qursquoellessont importantes dans la litteacuterature mecircme si elles nrsquoentrentpas dans le cadre preacuteceacutedent

151 Le partitionnement de la diversiteacuteselon Peacutelissier et Couteron

CadreUn cadre geacuteneacuteral de partitionnement de la diversiteacute appli-

cable aux trois indices classiques est proposeacute par Peacutelissier etCouteron1 en conclusion drsquoune seacuterie drsquoarticles2

Les donneacutees sont deacutesagreacutegeacutees jusqursquoau niveau de lrsquoindividuSuivant les notations preacuteceacutedentes les placettes sont consideacute-reacutees comme le regroupement drsquoarbres indiceacutes par ℎ

Le tableau 151 est appeleacute tableau drsquooccurrence des espegravecesIl ne contient que des 0 et des 1 Chaque arbre (colonne) a uneseule valeur 1 dans la cellule correspondant agrave son espegravece

Un arbre moyen srsquoil pouvait exister appartiendrait partiel-lement agrave chaque espegravece proportionnellement agrave son effectif

Tab 151 Tableau drsquooccurrence des espegraveces

Forecirct 119896Parcelle 119895Placette 119894Arbre ℎ

hellip Total

Famille 119906 Genre 119905 Espegravece 119904 119899119904ℎ = 1 silrsquoarbre ℎappartient agravelrsquoespegravece 119904 0sinon 119899119904sdot =119899119904+119899

hellip hellip hellipTotal 119902+ℎ =

119901+ℎ = 11

214 Autres approches

Chaque arbre ℎ apporte une quantiteacute drsquoinformation eacutegale agravela somme sur toutes les espegraveces des eacutecarts quadratiques entrela valeur 119899119904ℎ indicatrice de son appartenance agrave lrsquoespegravece 119904 etla valeur 119899119904sdot correspondant agrave lrsquoarbre moyen sum119904 (119899119904ℎ minus 119899119904sdot)

2La somme peut ecirctre pondeacutereacutee pour donner une importanceplus ou moins grande des espegraveces selon leur freacutequence sum119904 119908119904 (119899119904ℎ minus 119899119904sdot)

2 La mesure totale sommeacutee sur tous lesarbres est noteacutee TSS

TSS = sum119904

119908119904 sumℎ

(119899119904ℎ minus 119899119904sdot)2 (151)

Si le poids 119908119904 vaut toujours 1 TSS119899 est lrsquoindice de Simp-son

Si 119908119904 = ln (1119899119904sdot)(1 minus 119899119904sdot) on obtient lrsquoindice de Shan-non et 119908119904 = 1119908119904sdot donne le nombre drsquoespegraveces moins 1

Deacutecomposition

Lrsquointeacuterecirct de la meacutethode est de permettre lrsquoutilisation demodegraveles lineacuteaires et des outils informatiques associeacutes classiquespour deacutecomposer la diversiteacute de diffeacuterentes maniegraveres Nousnous inteacuteresserons ici agrave la deacutecomposition de la diversiteacute totale120574 en diversiteacutes 120572 et 120573 Dans ce cadre la diversiteacute 120573 est la partieexpliqueacutee par le modegravele (les diffeacuterentes communauteacutes sont lesparamegravetres explicatifs) noteacutee MSS alors que la diversiteacute 120572est reacutesiduelle noteacutee RSS

La diversiteacute totale est TSS119899 La diversiteacute 120572 est calculeacuteede la mecircme maniegravere en prenant pour reacutefeacuterence la freacutequencedes espegraveces agrave lrsquointeacuterieur de chaque placette Dans la placette119894

RSS119894 = sum119904

119908119904 sumℎisinℐ

(119899119904ℎ minussumℎisinℐ 119899119904ℎ

119899 )2 (152)

La diversiteacute 120573 est calculeacutee de faccedilon similaire par la diffeacute-rence entre les freacutequences des espegraveces dans chaque placette(sumℎisinℐ 119899119904ℎ)119899 et leur freacutequence apregraves regroupement 119899119904sdot

Le problegraveme est que le poids attribueacute agrave chaque espegravece119908119904 deacutepend de la distribution totale des espegraveces RSS nrsquoestdonc pas une diversiteacute 120572 puisque sa valeur deacutepend de donneacuteesexteacuterieures agrave la placette

Le poids 119908119904 = 1 pour toutes les espegraveces regravegle le problegravemeLe modegravele est alors celui de la deacutecomposition de lrsquoindice deSimpson preacutesenteacute plus haut

3E Kosman laquo Measuring Diver-sity From Individuals to Popula-tions raquo In European Journal ofPlant Pathology 1383 (2013) p 467-486 doi 101007s10658-013-0323-3

4E Kosman et K J Leonardlaquo Similarity Coefficients for Molecu-lar Markers in Studies of Genetic Re-lationships between Individuals forHaploid Diploid and Polyploid Spe-cies raquo In Molecular ecology 142(2005) p 415-24 doi 10 1111 j 1365 - 294X 2005 02416 x PMID 15660934

5E Kosman laquo Difference and Di-versity of Plant Pathogen Popula-tions A New Approach for Mea-suring raquo In Phytopathology 8611(1996) p 1152-1155 E Kosman etK J Leonard laquo Conceptual Analy-sis of Methods Applied to Assess-ment of Diversity within and Distancebetween Populations with Asexual orMixed Mode of Reproduction raquo In The New phytologist 1743 (2007)p 683-96 doi 101111j1469-8137200702031x PMID 17447922

6R Bellman et al AlgorithmsGraphs and Computers New York Academic Press Inc 1970

152 Diversiteacute de KosmanKosman3 nomme diversiteacute geacuteneacutetique la diversiteacute des indi-

vidus drsquoune population (non regroupeacutes par espegraveces) pour les-quels une mesure de dissimilariteacute a eacuteteacute choisie Les mesuresde dissimilariteacute acceptables4 sont par exemple les mecircmes quecelles utiliseacutees pour la diversiteacute 120573 des communauteacutes appliqueacuteesaux preacutesencesabsences de bandes de profils AFLP

La mesure de dissimilariteacute moyenne entre les individus no-teacutee 119860119863119882120588 pour Average Dissimilarity Within ougrave 120588 repreacutesentela dissimilariteacute choisie est simplement lrsquoentropie quadratiquede Rao Si la dissimilariteacute nrsquoest pas euclidienne la concaviteacutede 119860119863119882120588 nrsquoest pas garantie ce qui motive Kosman agrave proposerune autre mesure5 119870119882 120588 qui est la dissimilariteacute moyenne des119899 paires drsquoindividus les plus dissimilaires (au lieu de toutes les119899(119899 minus 1)2 paires) Les 119899 paires drsquoindividus sont construitesde faccedilon que chaque individu apparaisse une fois en tant quepremier et une fois en tant que second membre de la paire se-lon un algorithme non trivial6 Tous les individus contribuentdonc agrave la mesure de la diversiteacute

Pour un assemblage de 119868 populations la diversiteacute de Kos-man 119870119882 120588 de lrsquoassemblage des populations est toujours plusgrande que la moyenne des diversiteacutes intra-populations 119870119882 120588pondeacutereacutees par le poids des populations (crsquoest-agrave-dire la diver-siteacute 120572 selon la deacutefinition de Routledge) parce que 119870119882 120588 estconcave La diffeacuterence est la diversiteacute entre populations inter-preacutetable comme une diversiteacute 120573 selon la deacutefinition additive dela deacutecomposition

Pour obtenir une diversiteacute 120573 indeacutependante des diversiteacutes120572 et 120574 Kosman deacutefinit 119870119860119889 comme la moyenne des distancesentre les 119868 paires de populations assigneacutees selon le mecircme al-gorithme que preacuteceacutedemment La distance entre populations119889 est de preacutefeacuterence la distance de Kosman entre populations119870119861120588 la moyenne des 119899 paires drsquoindividus appartenant chacunagrave une population les plus dissimilaires (si la taille des popu-lations nrsquoest pas identique un eacutechantillon de la plus grandepopulation de la taille de la plus petite est tireacute aleacuteatoirementla valeur moyenne de la distance obtenue sur plusieurs tiragesest calculeacutee) La diversiteacute 120574 est la somme de la moyenne desdiversiteacutes intra-populations 119870119882 120588 pondeacutereacutees par le poids despopulations et de la diversiteacute inter-populations 119870119860119889 Ce nrsquoestpas la diversiteacute 119870119882 120588 de lrsquoassemblage des populations ce quilimite fortement lrsquointeacuterecirct de cette approche

Cinquiegraveme partie

Diversiteacute jointediversiteacute structurelle

1Gregorius laquo Linking Diversityand Differentiation raquo cf note 43p 70 Gregorius laquo Partitioning of Di-versity The rdquowithin CommunitiesrdquoComponent raquo cf note 24 p 66

2E Cutrini laquo Specialization andConcentration from a Twofold Geo-graphical Perspective Evidence fromEurope raquo In Regional Studies 443(2010) p 315-336 doi 10 1080 00343400802378743

3Chiu et al laquo Phylogenetic Be-ta Diversity Similarity and Differen-tiation Measures Based on Hill Num-bers raquo cf note 38 p 166

4G Bacaro et al laquo Using Shan-nonrsquos Recursivity to Summarize Fo-rest Structural Diversity raquo In Fo-rests Trees and Livelihoods 233(2014) p 211-216 doi 10 1080 147280282013844933

5J K Das et J Nautiyal laquo Fo-rest Variability Index A VectorQuantifying Forest Stand Diversityand Forest Compactness raquo In ForestPolicy and Economics 63-4 (2004)p 271-288 doi 10 1016 j forpol 200403003

Chapitre 16

Gregorius1 argumente en faveur de la prise en compte dece qursquoil deacutefinit comme la laquo diversiteacute jointe raquo dans le cadreclassique ougrave les classes sont des communauteacutes pour des rai-sons fondamentales de deacutefinition de la diversiteacute Son approcheconsiste agrave traiter de faccedilon symeacutetrique lrsquoappartenance agrave uneclasse ou agrave une espegravece contrairement aux chapitres preacuteceacute-dents ougrave lrsquoeacutechantillonnage des individus avait lieu seacutepareacutementdans chaque communauteacute lrsquoeacutechantillonnage a lieu ici globa-lement dans la meacuteta-communauteacute et lrsquoappartenance drsquoun in-dividu agrave une communauteacute apporte autant drsquoinformation queson appartenance agrave une espegravece Cette approche convient bienagrave des questions de choix de localisation traiteacutes en eacuteconomie(voir par exemple la deacutefinition de la localisation globale2 quitraite de faccedilon symeacutetrique le secteur drsquoactiviteacute et la reacutegiondrsquoimplantation des firmes) Lrsquoentropie des lignes est alors ladiversiteacute de localisation des firmes son compleacutement agrave la va-leur maximale est une mesure de concentration spatiale (lrsquoin-dice de Theil pour 119902 = 1) En eacutecologie cette entropie permetpar exemple de caracteacuteriser le niveau de speacutecialisation drsquouneespegravece si les communauteacutes sont de mecircme taille (plus preacuteciseacute-ment de mecircme probabiliteacute de choix a priori) et situeacutees dansdes environnements diffeacuterents

La deacutecomposition de la diversiteacute jointe apporte en plus dela deacutecomposition de la diversiteacute 120574 une information sur lrsquoubi-quiteacute des espegraveces La deacutecomposition de Chiu et al3 se situeen reacutealiteacute dans ce cadre

La notion de diversiteacute structurelle a eacuteteacute deacutefinie par les fo-restiers4 En plus des espegraveces drsquoautres critegraveres (par exempleles classes de diamegravetres) sont pris en compte pour deacutefinir lastructure forestiegravere Une revue des approches utiliseacutees pourdeacutecrire cette structure et plus particuliegraverement sa complexi-teacute est fournie par Bacaro et al Certaines se sont attacheacuteesagrave deacutefinir une mesure de diversiteacute structurelle notammentDas et Nautiyal5 deacutefinissent un indice qui prend en compte la

220 Cadre

Tab 161 Notations des effectifs tableau espegraveces-classes

Classe 119894 hellip Total Communauteacute

Espegravece 119904 119899119904119894 nombredrsquoindividus delrsquoespegravece 119904 dans laclasse 119894119904|119894 = 119899119904119894119899+119894 estlrsquoestimateur de laprobabiliteacute 119901119904|119894qursquoun individu de laclasse 119894 soit delrsquoespegravece 119904

119899119904+ = sum119894 119899119904119894119901119904 = sum119894 119908119894119901119904|119894

hellipTotal 119899+119894 nombre

drsquoindividus de laclasse 119899+119894119899 = 119908119894 poids de la classe

variabiliteacute des diamegravetresBacaro et al suggegraverent drsquoutiliser lrsquoentropie de Shannon

pour mesurer la diversiteacute structurelle Cette ideacutee est exploreacuteeici pour deacutefinir une mesure de diversiteacute bidimensionnelle (croi-sant par exemple les espegraveces et les classes de diamegravetres) eteacutetendue agrave la diversiteacute HCDT

Pour la suite les donneacutees sont organiseacutees comme dans letableau 161 les individus appartiennent agrave lrsquoespegravece 119904 et agrave laclasse 119894 avec la probabiliteacute 119901119904119894 telle que sum119904 sum119894 119901119904119894 = 1 (aulieu de sum119894 119901119904|119894 = 1 dans les chapitres preacuteceacutedents)

1Bacaro et al laquo Using Shan-nonrsquos Recursivity to Summarize Fo-rest Structural Diversity raquo cf note 4p 219

2J C Baez et al laquo A Characte-rization of Entropy in Terms of In-formation Loss raquo In Entropy 1311(2011) p 1945-1957 doi 103390e13111945

3D K Faddeev laquo On theConcept of Entropy of a FiniteProbabilistic Scheme raquo In Rossiis-kaya Akademiya Nauk MoskovskoeMatematicheskoe ObshchestvoUspekhi Matematicheskikh Nauk167 (1956) p 227-231

Chapitre 17

Information mutuelle

La reacutecursiviteacute est une proprieacuteteacute importante de lrsquoentropie de Shannon quipermet drsquoenvisager la diversiteacute de faccedilon multidimensionnelle par exemplela diversiteacute des espegraveces et des classes de diamegravetre des arbres drsquoune forecirct(appeleacutee diversiteacute structurelle) La reacutecursiviteacute apporte des reacutesultats net-tement moins inteacuteressants quand lrsquoentropie HCDT est consideacutereacuteeLe nombre effectif drsquohabitats occupeacutes par une espegravece peut ecirctre interpreacuteteacutecomme la taille de sa niche eacutecologique la mesure de la diversiteacute descommunauteacutes peut apporter une information aussi inteacuteressante que ladiversiteacute des espegraveces

Lrsquoessentiel

Plusieurs mesures de diversiteacute ont eacuteteacute construite autourde lrsquoinformation mutuelle Elles sont preacutesenteacutees ici apregraves leurproprieacuteteacute matheacutematique fondamentale la reacutecursiviteacute de lrsquoen-tropie

171 Reacutecursiviteacute de lrsquoentropieEntropie de Shannon

Lrsquoentropie de Shannon (et ses multiples) sont les seulesfonctions 119867 telles que

119867 (119901119904119894) minus 119867 (119901119894) = sum119894

119901119894119867 (119901119904119894119901119894

) (171)

119867 (119901119904119894) minus 119867 (119901119904) = sum119904

119901119904119867 (119901119904119894119901119904

) (172)

Cette proprieacuteteacute est appeleacutee reacutecursiviteacute1 Le premier termede chaque eacutequation est la diffeacuterence entre lrsquoentropie de la dis-tribution complegravete (119901119904119894) crsquoest-agrave-dire la diversiteacute jointe de Gre-gorius qui sera appeleacutee plutocirct entropie jointe ici et celle de ladistribution marginale (lrsquoentropie de la distribution des classes

222 Information mutuelle

4J Aczeacutel et Z Daroacuteczy On Mea-sures of Information and Their Cha-racterizations New York AcademicPress 1975 p 234 Reacutenyi laquo On Mea-sures of Entropy and Information raquocf note 14 p 65 Bourguignon laquo De-composable Income Inequality Mea-sures raquo cf note 14 p 191

5Baez et al laquo A Characteriza-tion of Entropy in Terms of Informa-tion Loss raquo cf note 2 p 221

6H Suyari laquo Generalization ofShannon ndash Khinchin Axioms to theNonextensive Entropy raquo In IEEETransactions on Information Theo-ry 508 (2004) p 1783-1787 doi 101109TIT2004831749

7V M Ilić et al laquo Comments onrdquoGeneralization of Shannon-KhinchinAxioms to Nonextensive Systems andthe Uniqueness Theorem for the No-nextensive Entropyrdquo raquo In IEEETransactions on Information Theo-ry 5910 (2013) p 6950-6952 doi 101109TIT20132259958

ou celle des espegraveces) Une deacutemonstration rigoureuse est fourniepar Baez et al2 drsquoapregraves Faddeev3 mais il srsquoagit drsquoun reacutesultatassez reacutepandu dans la litteacuterature sous des formes diverses4119867(119901119904119894)minus119867(119901119894)minus119867(119901119904) est lrsquoinformation mutuelle vueen section 121

Le terme de droite de lrsquoeacutequation (171) est lrsquoentropie 120572 delrsquoensemble des classes si on les pondegravere par 119901119894 car 119901119904119894119901119894 = 119901119904|119894Par ailleurs 119867(119901119904) est lrsquoentropie 120574 En combinant les eacutequa-tions (171) et (172) on voit que lrsquoentropie 120573 est lrsquoopposeacutee delrsquoinformation mutuelle Lrsquoinformation mutuelle est nulle quandles distributions des lignes et des colonnes sont indeacutependantes(119901119904119894 = 119901119904119901119894) autrement dit quand les distributions marginales119901119904 et 119901119894 suffisent agrave deacutecrire la meacuteta-communauteacute lrsquoinfor-mation contenue par chaque communauteacute se limite agrave son poidsLrsquoeacutecart agrave lrsquoindeacutependance implique que les distributions de pro-babiliteacutes sont diffeacuterentes dans les communauteacutes ce qui deacutefinitla diversiteacute 120573

Si les colonnes sont les classes de diamegravetre par exempleles informations fournies par la deacutecomposition de la diversiteacutesont nombreuses

bull Les diversiteacutes des colonnes sont les classiques diversiteacutesspeacutecifiques par classe de diamegravetre (120572) globale (120574) etinter-classes (120573)

bull La diversiteacute des lignes renseigne sur lrsquohomogeacuteneacuteiteacute desdiamegravetres de chaque espegravece et globalement

bull La diversiteacute jointe est le nombre effectif de cateacutegories(espegraveces times classes de diamegravetre) de la communauteacute

Entropie HCDTBaez et al5 geacuteneacuteralisent la reacutecursiviteacute agrave lrsquoentropie HCDT

et montrent que

119902119867 (119901119904119894) minus 119902119867 (119901119894) = sum119894

119901119902119894

119902119867 (119901119904119894119901119894

) (173)

119902119867 (119901119904119894) minus 119902119867 (119901119904) = sum119904

119901119902119904

119902119867 (119901119904119894119901119904

) (174)

Ce reacutesultat avait deacutejagrave eacuteteacute obtenu par Suyari6 corrigeacute parIlić et al7 Par le mecircme raisonnement que pour lrsquoentropie deShannon on trouve donc que lrsquoentropie entre les classes estlrsquoopposeacutee de lrsquoinformation mutuelle calculeacutee dans le cadre delrsquoentropie HCDT agrave condition de deacutefinir les poids des classeseacutegaux agrave 119901119894 et lrsquoentropie intraclasse comme la somme des en-tropies des classes pondeacutereacutees par leur poids agrave la puissance 119902

8J D Allan laquo Components ofDiversity raquo In Oecologia 184(1975) p 359-367 doi 10 1007 BF00345855 JSTOR 4215087

9R Levins Evolution in Chan-ging Environments Some Theoreti-cal Explorations Princeton Universi-ty Press 1968

10R K Colwell et D J Futuy-ma laquo On the Measurement of NicheBreadth and Overlap raquo In Ecology524 (1971) p 567-576 doi 1023071934144 JSTOR 1934144

11E C Pielou laquo Niche Width andNiche Overlap A Method for Measu-ring Them raquo In Ecology 534 (1972)p 687-692 doi 1023071934784

Inteacuterecirct de lrsquoinformation mutuelleSi les individus sont classeacutes dans une matrice selon deux

critegraveres et non dans un simple vecteur drsquoespegraveces lrsquoentropieHCDT de la distribution appeleacutee entropie jointe est calculeacuteepar 119902119867(119901119904119894)

Lrsquoentropie jointe peut ecirctre deacutecomposeacutee en la somme desentropies marginales et de lrsquoinformation mutuelle Lrsquoentropieintra-lignes (respectivement intra-colonnes) est deacutefinie commela moyenne pondeacutereacutee par le poids des lignes (resp des co-lonnes) agrave la puissance 119902 de lrsquoentropie de chaque ligne (respcolonne) Les lignes et les colonnes jouent un rocircle interchan-geable

119902119867intra = sum119894

119901119902119894

119902119867(119901119904119894) (175)

119902119867inter = minus [119902119867 (119901119904119894) minus119902119867 (119901119904) minus119902119867 (119901119894)] (176)

et119902119867marginale =119902 119867 (119901119904) (177)

Le rocircle symeacutetrique des lignes et des colonnes signifie que lataille des communauteacutes nrsquoest pas un choix arbitraire drsquoeacutechan-tillonnage la distribution des poids des communauteacutes est eacutequi-valente agrave celle des probabiliteacutes des espegraveces De la mecircme faccedilonque lrsquoordre de la diversiteacute 119902 donne plus ou moins drsquoimpor-tance aux espegraveces rares dans le calcul de la diversiteacute intra etmarginale il donne plus ou moins drsquoimportance aux commu-nauteacutes de petite taille dans le calcul des diversiteacutes intra etinter

Lrsquoentropie ne peut ecirctre transformeacutee en diversiteacute que pour119902 = 1 (diversiteacute de Shannon) Pour 119902 ne 1 lrsquoentropie intra-classes nrsquoest pas une entropie 120572 (elle nrsquoest pas eacutegale agrave lrsquoentropiede chacune des classes si toutes les classes sont identiques) lenombre effectif drsquoespegraveces correspondant nrsquoest pas deacutefini Lrsquoin-formation mutuelle de lrsquoentropie HCDT nrsquoa donc qursquoun inteacuterecirctlimiteacute pour mesurer la diversiteacute

172 Taille de nicheAllan8 preacutesente plusieurs deacutecompositions de lrsquoentropie

jointe (de Shannon) fondeacutees sur lrsquoinformation mutuelle dansune matrice en trois dimensions microhabitats times sites timesespegraveces

Apregraves Levins9 Colwell et Futuyma10 et Pielou11 Allansrsquointeacuteresse notamment agrave la taille de la niche (niche width) desespegraveces Si les classes de la matrice espegraveces-classes (Table 161)

12Pielou laquo Niche Width andNiche Overlap A Method forMeasuring Them raquo cf note 11p 223

13Levins Evolution in ChangingEnvironments Some TheoreticalExplorations cf note 9 p 223

14Colwell et Futuyma laquo On theMeasurement of Niche Breadth andOverlap raquo cf note 10 p 223

sont des habitats distincts les uns des autres la diversiteacute deshabitats occupeacutes par une espegravece est la taille de sa niche etla diversiteacute 120574 mesureacutee sur lrsquoensemble des habitats peut ecirctrecomprise comme le chevauchement des niches12 La taille de laniche peut ecirctre mesureacutee par lrsquoentropie de Shannon mais aussile nombre de Hill drsquoordre 2 qui est donc le nombre effectifdrsquohabitats de Simpson13

Cette approche est tregraves similaire agrave celle des eacuteconomistesqui utilisent lrsquoindice de Theil comme mesure de concentrationspatiale en inteacutegrant une signification eacutecologique si les locali-sations possibles correspondent agrave des habitats diffeacuterents uneespegravece preacutesente dans tous les habitats avec la mecircme probabi-liteacute est aussi geacuteneacuteraliste que possible

Colwell et Futuyma14 traitent le problegraveme poseacute par lefait que les habitats pris en compte dans lrsquoeacutechantillonnagene sont pas totalement distincts Si les habitats eacutetaient tousidentiques la distribution des espegraveces serait proportionnelleagrave la taille de chaque habitat et lrsquoinformation mutuelle seraitnulle Elle ne lrsquoest pas et sa valeur peut ecirctre deacutecomposeacutee ensomme des contributions de chaque habitat Ces contributionssont utiliseacutees pour pondeacuterer les habitats un habitat original(contribuant plus agrave lrsquoinformation mutuelle) a un poids plusgrand Pour revenir au cas simple dans lequel les habitats ontdes poids eacutegaux les colonnes de la matrice sont dupliqueacutees unnombre de fois proportionnel agrave leur poids suffisamment grandpour les proportions des nombres de colonnes (forceacutement en-tiers) soient identiques ou tregraves proches des poids

1H-R Gregorius laquo Distributionof Variation over Populations raquo In Theory in Biosciences 1283 (2009)p 179-89 doi 101007s12064-009-0064-1 Gregorius laquo Linking Diversi-ty and Differentiation raquo cf note 43p 70

Chapitre 18

Deacutecomposition de la diversiteacute jointe

La diversiteacute jointe peut ecirctre deacutecomposeacutee en diversiteacute 120574 (elle-mecircme deacute-composable en diversiteacutes 120572 et 120573) et reacuteplication eacutegale au nombre effectifde reacutepeacutetitions de lrsquoassemblage des communauteacutes neacutecessaire pour obtenirla diversiteacute jointe reacuteelle

Lrsquoessentiel

La deacutecomposition de la diversiteacute jointe1 complegravete cellede la diversiteacute 120574 vue dans les parties preacuteceacutedentes On seplace dans le cadre drsquoun eacutechantillonnage global de la meacuteta-communauteacute dans lequel le poids de chaque communauteacute esteacutegal agrave la probabiliteacute qursquoun individu lui appartienne et nonun choix arbitraire

181 DeacutefinitionsLa diversiteacute 120573 mesure la divergence entre la distribution

moyenne des espegraveces dans les communauteacutes et leur distribu-tion dans la meacuteta-communauteacute Gregorius la qualifie de laquo di-versiteacute de reacutepartition raquo (apportionment)2 Lrsquoexemple suivantmesure la diversiteacute 120573 dans une meacuteta-communauteacute tregraves simple(figure 181)

q lt- 2df1 lt- dataframe(Co1 = c(10 20 30 10) Co2 = c(50 20 20

5) rownames = c(S1 S2 S3 S4))library(entropart)MC1 lt- MetaCommunity(df1)

plot(MC1)

summary(DivPart(q MC1) -gt dp1)

HCDT diversity partitioning of order 2 of metaCommunity MC1 Alpha diversity of communities

226 Deacutecomposition de la diversiteacute jointe

Fig 181 Meacuteta-communauteacutesimple

Co1 Co2 Metacommunity

Co1 Co2 3266667 2714286 Total alpha diversity of the communities [1] 2964968 Beta diversity of the communities None 1182674 Gamma diversity of the metacommunity None 3506591

Reacutepliquer les communauteacutes agrave lrsquoidentique nrsquoa aucun effetsur la diversiteacute la diversiteacute 120572 est la moyenne des diversi-teacutes des communauteacutes et la diversiteacute 120574 est celle de leur assem-blage dont les proportions ne changent pas Lrsquoexemple suivantconcerne une meacuteta-communauteacute contenant les mecircmes commu-nauteacutes mais en double (figure 182)

df2 lt- cbind(df1 df1)MC2 lt- MetaCommunity(df2)

Fig 182 Meacuteta-communauteacutedoublant les communauteacutes de la

preacuteceacutedente

Co1 Co2 Co11 Metacommunity

181 Deacutefinitions 227

plot(MC2)

HCDT diversity partitioning of order 2 of metaCommunity MC2 Alpha diversity of communities Co1 Co2 Co11 Co21 3266667 2714286 3266667 2714286 Total alpha diversity of the communities [1] 2964968 Beta diversity of the communities None 1182674 Gamma diversity of the metacommunity None 3506591

La diversiteacute jointe 119902119863119895 = 119902119863(119901119904119894) est en revanche dou-bleacutee au cours de lrsquoopeacuteration elle mesure le nombre effectif decateacutegories (combinaison de lrsquoespegravece et de la communauteacute) dutableau de donneacutees Meacuteta-communauteacute simpleDiversity(asProbaVector(df1) q)

None 5642487

Meacuteta-communauteacute doubleDiversity(asProbaVector(df2) q)

None 1128497

La distribution de reacutefeacuterence pour deacutefinir ce nombre effectifcorrespond agrave lrsquoeacutequitabiliteacute maximale 119878 espegraveces eacutequiprobablessont reacuteparties dans 119868 communauteacutes eacutequiprobables Le nombreeffectif est alors 119878119868 Si nombre effectif drsquoespegraveces est eacutegal agrave ladiversiteacute 120574 le rapport entre la diversiteacute jointe et la diversi-teacute 120574 noteacute 119902119877119888 est le nombre effectif de meacuteta-communauteacutesidentiques produisant la diversiteacute jointe observeacutee Il mesurela reacuteplication des communauteacutes et complegravete la diversiteacute 120574 enfournissant un niveau drsquoinformation suppleacutementaire Grego-rius le qualifie de laquo diversiteacute de diffeacuterenciation raquo (differentia-tion) parce que 119902119877119888 compare la distribution reacuteelle agrave une dis-tribution de reacutefeacuterence et pas seulement les distributions descommunauteacutes entre elles En reacutesumeacute

bull Le nombre effectif drsquoespegraveces 119902119894119863 de la communauteacute i

est le nombre drsquoespegraveces eacutequifreacutequentes neacutecessaires pourobtenir la diversiteacute observeacutee dans la communauteacute Ladiversiteacute 120572 est le nombre drsquoespegraveces eacutequifreacutequentes neacuteces-saires dans chaque communauteacute pour obtenir la diversiteacuteobserveacutee

bull La diversiteacute 120573 est le nombre de communauteacutes totalementdistinctes (chaque espegravece nrsquoest preacutesente que dans uneseule communauteacute) de mecircme poids et de mecircme diversi-teacute (cette diversiteacute eacutetant eacutegale agrave la diversiteacute 120572) eacutegal aurapport entre la diversiteacute 120574 et la diversiteacute 120572

bull La diversiteacute 120574 est le nombre effectif drsquoespegraveces de lrsquoassem-blage des communauteacutes

bull La reacuteplication des communauteacutes est le nombreeffectif drsquoassemblages identiques constituant la meacuteta-communauteacute

La deacutecomposition complegravete de la diversiteacute jointe srsquoeacutecrit

119902119863119895 =119902 119863120572 times119902119863120573 times119902119877119888 (181)

La meacuteta-communauteacute suivante illustre cette deacutecomposi-tion elle contient 119877119888 = 3 reacutepliques identiques de 119863120573 =2 communauteacutes eacutequiprobables totalement distinctes compre-nant chacune 119863120572 = 2 espegraveces eacutequiprobables (figure 183) Sadiversiteacute jointe est 12 (le nombre de cellules non nulles dansla matrice)

q lt- 2 Peu importe qdf1 lt- dataframe(Co1 = c(10 10 0 0) Co2 = c(0 0 10 10)

rownames = c(S1 S2 S3 S4))df3 lt- cbind(df1 df1 df1)MC lt- MetaCommunity(df3)

Fig 183 Meacuteta-communauteacuteillustrant la deacutecomposition

complegravete de la diversiteacute jointe

plot(MC)

summary(DivPart(q MC) -gt dp)

HCDT diversity partitioning of order 2 of metaCommunity MC Alpha diversity of communities

182 Relations avec drsquoautres mesures de diversiteacute 229

Co1 Co2 Co11 Co21 Co12 Co22 2 2 2 2 2 2 Total alpha diversity of the communities [1] 2 Beta diversity of the communities None 2 Gamma diversity of the metacommunity None 4

(Diversity(asProbaVector(df3) q) -gt Djointe)

None 12

(Dis lt- Djointedp$GammaDiversity)

None 3

La deacutefinition de la diversiteacute 120572 de Chiu et al3 eacutequation(106) est la diversiteacute jointe normaliseacutee par le nombre de com-munauteacutes

119902119863120572 = 1119868 (sum

119904sum

119894(119908119894119901119904|119894)

119902)1(1minus119902)

= 1119868

119902119863119895 (182)

182 Relations avec drsquoautres mesures dediversiteacute

En introduisant la deacutefinition preacuteceacutedente dans la deacutecompo-sition de la diversiteacute jointe eacutequation (181) il vient

119902119863120573 =119902119863120574119902119863120572

= 119868119902119877119888

La deacutefinition de la diversiteacute 120572 de Chiu et al implique quela diversiteacute 120573 soit le rapport entre le nombre de communauteacuteset leur reacuteplication Ce nrsquoest pas une mesure de diversiteacute 120573 dereacutepartition

En inversant le rocircle des lignes et des colonnes de la matrice119901119904119894 on peut calculer la reacuteplication des espegraveces en divisantla diversiteacute jointe par la diversiteacute des poids des communauteacutes

119902119877119904 =119902119863119895

119902119863 (119901119894) (184)

Gregorius montre que 119902119877119904 eacutegale la diversiteacute 120572 selon Jost(104)

119902119877119904 = (sum119904

sum119894

119901119902119894

sum119894 119901119902119894119901119902

119904|119894)1(1minus119902)

Sixiegraveme partie

Diversiteacute spatialementexplicite

1E F Menhinick laquo A Compari-son of Some Species-Individuals Di-versity Indices Applied to Samplesof Field Insects raquo In Ecology 454(1964) p 859-861 doi 10 2307 1934933

2R Margalef laquo Temporal Suc-cession and Spatial Heterogeneity inPhytoplankton raquo In Perspectives inMarine Biology Sous la dir drsquoABuzzati-Traverso Berkeley Califor-nia University of California Press1958 p 323-349

3H A Gleason laquo On the Rela-tion between Species and Area raquo In Ecology 32 (1922) p 158-162 doi 1023071929150

4A E Magurran MeasuringBiological Diversity Oxford Black-well Publishing 2004 p 77

6Hubbell The Unified NeutralTheory of Biodiversity and Biogeo-graphy cf note 27 p 16

Chapitre 19

De faccedilon eacutevidente la richesse augmente avec la surfaceou le nombre drsquoindividus pris en compte Cette constatationpeut ecirctre interpreacuteteacutee de deux faccedilons diffeacuterentes lrsquoaugmen-tation progressive de lrsquoeffort drsquoeacutechantillonnage permet drsquoat-teindre une asymptote quand la diversiteacute est complegravetementinventorieacutee ou au contraire lrsquoaugmentation de la diversiteacuteavec la surface prise en compte est une proprieacuteteacute intrinsegravequeet aucune asymptote nrsquoexiste

Dans une communauteacute de taille deacutefinie avec une distri-bution des espegraveces et un nombre drsquoindividus deacutefinis mecircmesrsquoils sont inconnus lrsquoaugmentation de lrsquoeacutechantillonnage per-met lrsquoaccumulation de la deacutecouverte de nouvelles espegraveces jus-qursquoagrave une asymptote Lrsquoaccumulation de la diversiteacute locale deacute-crite par une courbe drsquoaccumulation (SAC) est preacutesenteacutee auchapitre 21

Il est tentant dans ce cadre de chercher un indicateur dela richesse indeacutependant de la surface ou du nombre drsquoindivi-dus Lrsquoapproche la plus simple consiste agrave normaliser le nombredrsquoespegraveces observeacutees Menhinick1 a proposeacute lrsquoindice 119878119899radic119899 agravepeu pregraves constant dans des communauteacutes drsquoinsectes Lrsquoindicede Margalef2 est 119878119899 minus 1ln 119899 adapteacute agrave une communauteacute deplancton Les deux supposent implicitement une forme de lacourbe drsquoaccumulation des espegraveces dans le premier cas pro-portionnelle agrave la racine du nombre drsquoindividus dans le secondagrave son logarithme (comme dans la relation de Gleason3 page222) Aucune de ces normalisations ne fonctionne en geacuteneacuteral4Lrsquoindice de Fisher5 construit agrave partir drsquoun modegravele explicite dedistribution des probabiliteacutes des espegraveces a nettement plus desuccegraves Il est preacutesenteacute au chapitre suivant Son problegraveme estqursquoil est souvent utiliseacute pour deacutecrire la diversiteacute locale commesrsquoil permettait de normaliser lrsquoeffort drsquoeacutechantillonnage alorsque sa validiteacute est plutocirct agrave lrsquoeacutechelle reacutegionale6

A cette eacutechelle plusieurs communauteacutes sont prises encompte simultaneacutement Il est possible de rechercher une nou-

234 Cadre

7Ter Steege et al laquo Hyperdomi-nance in the Amazonian Tree Flora raquocf note 62 p 47

8F W Preston laquo Time andSpace and the Variation of Species raquoIn Ecology 414 (1960) p 611-627doi 1023071931793

velle asymptote atteinte quand toutes les communauteacutes sontincluses (par exemple la totaliteacute de la forecirct amazonienne7)ou de raisonner en termes de relation aire-espegraveces sansrechercher une richesse totale hypotheacutetique8 Lagrave encore 120572de Fisher est ambigu puisqursquoil peut provenir agrave la fois drsquouneinfiniteacute drsquoespegraveces dans son modegravele original ou ecirctre compriscomme le nombre fondamental de la theacuteorie neutre eacutegal agravedeux fois le taux de speacuteciation fois le nombre total drsquoespegraveces(fini) de la meacuteta-communauteacute9

Enfin la diversiteacute 120573 spatialement explicite est introduiteau chapitre 23

Chapitre 20

Indice 120572 de Fisher

LrsquoIndice 120572 de Fisher est la pente de la relation lineacuteaire entre le nombredrsquoespegraveces observeacutees et le logarithme du nombre drsquoindividus inventorieacutesCette relation correspond agrave une distribution drsquoabondance des espegraveces enlog-seacuteries valide agrave lrsquoeacutechelle de la meacuteta-communauteacute Son utilisation agravelrsquoeacutechelle locale est discutable

Lrsquoessentiel

Le modegravele de Fisher1 aboutissant agrave la SAD en log-seacuteriesa marqueacute lrsquohistoire de lrsquoeacutecologie Il lie le nombre drsquoespegraveces aulogarithme du nombre drsquoindividus de faccedilon lineacuteaire degraves quelrsquoeffectif est suffisant la pente de la droite est le bien connuindice 120572 tombeacute en deacutesueacutetude pendant quelques deacutecennies maisremis en vedette par la theacuteorie neutre de Hubbell2 Il est utiliseacuteagrave lrsquoeacutechelle locale (probablement agrave tort) et agrave lrsquoeacutechelle reacutegionalecrsquoest pourquoi il est preacutesenteacute en premier

201 ConstructionLe nombre drsquoespegraveces eacutechantillonneacutees deacutepend de lrsquoeffort

drsquoeacutechantillonnageFisher a relieacute le nombre drsquoespegraveces 119878119899 au nombre drsquoindivi-

dus 119899 eacutechantillonneacutes agrave partir du modegravele suivant

bull Le nombre drsquoindividus 119873 de lrsquoeacutechantillon suit une loi dePoisson de paramegravetre 120582 par hypothegravese la surface estfixeacutee eacutegale agrave 1 et les individus sont distribueacutes totale-ment aleacuteatoirement (avec la mecircme probabiliteacute partoutet indeacutependamment les uns des autres)

bull Eacutetant donneacute la taille de lrsquoeacutechantillon 119873 et la probabili-teacute 119901119904 drsquoeacutechantillonner lrsquoespegravece 119904 lrsquoespeacuterance du nombredrsquoindividus eacutechantillonneacutes dans lrsquoespegravece 119904 est 119873119901119904

bull Le nombre drsquoindividus reacuteellement observeacute fluctue aleacutea-toirement Il suit une loi de Poisson drsquoespeacuterance 120582119904 ougrave120582119904 = 120582119901119904

236 Indice 120572 de Fisher

3M Greenwood et G U Yulelaquo An Inquiry into the Nature of Fre-quency Distributions Representativeof Multiple Happenings with Parti-cular Reference to the Occurrence ofMultiple Attacks of Disease or of Re-peated Accidents raquo In Journal of theRoyal Statistical Society 832 (1920)p 255-279 doi 1023072341080

bull La probabiliteacute drsquoobserver 120584 individus de lrsquoespegravece 119904 estnoteacutee 120587119904120584

bull La distribution de 120582119904 retenue par Fisher est une loi gam-ma de paramegravetres 119896 et 119901 choisie pour ses proprieacuteteacutesmatheacutematiques qui impliquent que 120587119904120584 suit une loi bi-nomiale neacutegative de paramegravetres 119896 et 1(119901 + 1)

bull Lrsquoespeacuterance du nombre drsquoespegraveces observeacutees 120584 fois estsum119904 120587119904120584

bull Le paramegravetre 119896 = 0 deacutecrit bien les donneacutees de Fisheret permet de calculer lrsquoespeacuterance du nombre drsquoespegravecesdans un eacutechantillon de taille 119899

Le raisonnement est deacutetailleacute ici La loi gamma a deux pa-ramegravetres positifs noteacutes 119896 et 119901 par Fisher le premier fixe saforme le second lrsquoeacutechelle Les valeurs de forme infeacuterieures agrave 1donnent une distribution deacutecroissante preacutesenteacutee sur la figure201 La distribution obtenue est celle de 120582119904 lrsquoespeacuterance dunombre drsquoindividus de lrsquoespegravece 119904 Le paramegravetre de drsquoeacutechellepermet drsquoajuster les nombres drsquoindividus agrave la taille de lrsquoeacutechan-tillon Il est forceacutement tregraves supeacuterieur agrave 1 Plus le paramegravetre deforme 119896 est proche de 0 plus la deacutecroissance des probabiliteacutesest rapide

Fig 201 Densiteacute de probabiliteacutedrsquoune loi gamma de paramegravetres

0 2 et 100 Seules les valeursinfeacuterieures agrave 50 sont afficheacutees

0 10 20 30 40 50λs

siteacute

eacute

library(GoFKernel)k lt- 02p lt- 100d lt- densityreflected(rgamma(10000 shape = k scale = p) lower = 0)ggplot(dataframe(d$x d$y) aes(dx dy)) +

geom_line() +xlim(0 50) +labs(x = expression(lambda[s]) y = Densiteacute de probabliteacute)

Les effectifs de la communauteacute sont un meacutelange de lois dePoisson de paramegravetres aleacuteatoires suivant tous la mecircme loi gam-ma La distribution des probabiliteacutes qui en reacutesulte est une loi

201 Construction 237

4Izsaacutek et Pavoine laquo Links bet-ween the Species Abundance Distri-bution and the Shape of the Cor-responding Rank Abundance Curve raquocf note 20 p 15

binomiale neacutegative3 La probabiliteacute qursquoune espegravece soit repreacute-senteacutee par 120584 individus noteacutee 120587119904120584 suit donc une loi binomialeneacutegative de paramegravetres 119896 et 1119901 + 1 repreacutesenteacutee sur la figure202

0 10 20 30 40 50Abondance ν

liteacute

Fig 202 Reacutealisation drsquoune loigamma de paramegravetres 0 2 et 100Lrsquohistogramme repreacutesente laproportion (qui estime laprobabiliteacute) des valeurs infeacuterieuresagrave 50 Les espegraveces drsquoabondancenulle ne sont pas observeacutees danslrsquoeacutechantillon

nbin lt- rnbinom(10000 size = k prob = 1(p+1))ggplot(dataframe(nbin) aes(x = nbin y = prop)) +

geom_bar(width = 1 color = black fill = white) +xlim(-05 50) +labs(x = expression(paste(Abondance nu)) y = Probabiliteacute)

On notera que la distribution de 120587119904120584 deacutecrit pour une es-pegravece la probabiliteacute drsquoecirctre repreacutesenteacutee par 120584 individus Ce nrsquoestpas la distribution des probabiliteacutes 119901119904 qui donnent la probabi-liteacute qursquoun individu appartienne agrave lrsquoespegravece 119904 Une courbe repreacute-sentant les valeurs de 120587119904120584 en fonction de leur rang nrsquoest doncpas un diagramme rang-abondance mais un laquo pseudo-RAC raquo4

La variance de la loi binomiale neacutegative varie en sens in-verse du paramegravetre 119896 En appliquant son modegravele agrave des don-neacutees Fisher remarque que 119896 rarr 0 ce qui correspond agrave unedistribution comprenant de nombreuses espegraveces de freacutequencestregraves variables donc un pseudo-RAC deacutecroissant rapidementet retient cette proprieacuteteacute pour la suite de son raisonnementLa valeur nulle de 119896 simplifie les calculs et permet de calculerpour une valeur arbitraire de 120584 la somme sur toutes les espegravecesdes valeurs de 120587119904120584 Dans ce cas lrsquoespeacuterance du nombre drsquoes-pegraveces repreacutesenteacutees par 120584 individus est en posant 119909 = 119901(119901+1)et 120572 une constante

120124 (119878119899120584 ) = 120572

120584 119909120584 (201)

Lrsquoespeacuterance du nombre drsquoespegraveces en est la somme pour

5D Alonso et A J McKanelaquo Sampling Hubbellrsquos Neutral Theoryof Biodiversity raquo In Ecology Letters710 (2004) p 901-910 doi 101111j1461-0248200400640x

6R K S Hankin laquo IntroducingUntb an r Package for SimulatingEcological Drift under the UnifiedNeutral Theory of Biodiversity raquo In Journal of Statistical Software 2212(2007) p 1-15 doi 10 18637jss v022i12

7Hubbell The Unified NeutralTheory of Biodiversity and Biogeo-graphy cf note 27 p 16 page 122

toutes les valeurs de 120584

120124 (119878119899) =infin

sum120584=1

120124 (119878119899120584 ) = minus120572 ln(1 minus 119909) (202)

Le nombre drsquoespegraveces est obtenu par la somme du deacutevelop-pement en seacuterie entiegravere du logarithme de 1 minus 119909 drsquoougrave le nomde log-seacuterie

De mecircme le nombre total drsquoindividus est

119899 =infin

sum120584=1

120584120124 (119878119899120584 ) =

infinsum120584=1

120572119909120584 = 1205721199091 minus 119909 (203)

La combinaison des deux eacutequations permet drsquoeacuteliminer 119909 etdrsquoobtenir lrsquoespeacuterance du nombre drsquoespegraveces observeacutees en fonc-tion de la taille de lrsquoeacutechantillon

120124 (119878119899) = 120572 ln (1 + 119899120572) (204)

120572 est un indicateur de la biodiversiteacute qui peut ecirctre inter-preacuteteacute comme le nombre drsquoespegraveces nouvelles deacutecouvertes quandle nombre drsquoindividus eacutechantillonneacutes est multiplieacute par 119890 crsquoesten effet la pente de la courbe de 119878119899 en fonction de ln 119899 quise stabilise agrave partir drsquoune valeur de 119899 suffisante Crsquoest aussile nombre de singletons attendus dans lrsquoeacutechantillon de taille 119899comme le montre lrsquoeacutequation (201) sachant que 119909 asymp 1

120572 est aussi eacutegal agrave 120579 le nombre fondamental de la biodi-versiteacute de Hubbell quand le nombre drsquoespegraveces est grand 5 laSAD de la meacuteta-communauteacute (pas celle de la communauteacutelocale si la dispersion est limiteacutee) du modegravele neutre est enlog-seacuteries 120572 est le produit du nombre total drsquoindividus de lameacuteta-communauteacute noteacute classiquement 119869119898 et du taux de speacute-ciation individuel noteacute 120584 119909 est le rapport entre les taux denaissance 119887 et de mortaliteacute 119889 dans la meacuteta-communauteacute tregravesleacutegegraverement infeacuterieur agrave 1 parce que les espegraveces existantes sontappeleacutees agrave disparaicirctre par deacuterive et remplaceacutees par les nou-velles espegraveces (119887 + 120584)119889 = 1

Dans R les fonctions fisheralpha de la librairie veganet fishersalpha de la librairie untb6 effectuent une reacutesolu-tion numeacuterique de lrsquoeacutequation (204) pour estimer 120572 La fonc-tion optimaltheta dans untb eacutevalue la valeur de 120579 par lameacutethode du maximum de vraisemblance7 en utilisant toutelrsquoinformation de la distribution Le reacutesultat est tregraves diffeacuterentparce que lrsquoapproximation de lrsquoeacutegaliteacute de 120572 et 120579 ne tient pasdans ce cas

library(vegan)data(BCI) Ns est un vecteur contenant les effectifs de chaque espegravece

202 Variantes 239

8Ibid9Engen laquo Exponential and Lo-

garithmic Species-Area Curves raquo cfnote 20 p 92

10B G Bordenave et J-J DeGranville laquo Les Mesures de La Bio-diversiteacute Un Outil de Conserva-tion En Forecirct Guyanaise raquo In JAT-BA Revue drsquoEthnobiologie 401-2(1998) p 433-446 B G Bordenaveet al laquo Quantitative Botanical Di-versity Descriptors to Set Conserva-tion Priorities in Bakhuis MountainsRainforest Suriname raquo In Botani-cal Journal of the Linnean Society1671 (2011) p 94-130 doi 101111j1095-8339201101163x

11R P O Schulte et al laquo A NewFamily of Fisher-Curves EstimatesFisherrsquos Alpha More Accurately raquo In Journal of Theoretical Biology 2323(2005) p 305-313 doi 101016jjtbi200408014

Ns lt- colSums(BCI)fisheralpha(Ns)

[1] 3505475

library(untb)

Registered S3 method overwritten by untb method from plotpreston vegan

Attaching package untb

The following objects are masked from packagedplyr count select

fishersalpha(sum(Ns) length(Ns))

[1] 3505477

optimaltheta(Ns)

[1] 8095173

Le modegravele de Fisher (204) peut ecirctre eacutecrit sous la forme119878119899 = 120572ln (120572 + 119899)minus120572 ln (120572) Pour 119899 assez grand et sous lrsquohypo-

thegravese de saturation de Hubbell8 119860 est proportionnel agrave 120572 + 119899et le modegravele de Fisher est eacutequivalent au modegravele de Gleason9

Bordenave10 propose un indice de richesse speacutecifique (IRSou SDI Species Diversity Index) eacutegal agrave la pente de la relationde Gleason Dans le cadre de lrsquoapproximation preacuteceacutedente ilest eacutegal agrave 120572

202 VariantesSchulte et al11 ont eacutetendu le modegravele de Fisher pour

prendre en compte un nombre drsquoespegraveces fini 119878 et une distri-bution non indeacutependante des individus prise en compte parun paramegravetre drsquoagreacutegation spatiale 119888 valable pour toutes lesespegraveces

119878119899 = 120572119888 ln ( 1 + 119899119888 119902

1 + 119899119888 119902 119890minus119888119878120572 ) (205)

ougrave

119902 = 119890119888120572 minus 11 minus 119890119888(1minus119878)120572 (206)

Fig 203 Courbes nombredrsquoindividus-espegraveces-simuleacutees pour

illustrer lrsquoimportance desparamegravetres 119888 (concentration

spatiale) et 119878max (nombre totaldrsquoespegraveces 119878 dans nos notations)dans le modegravele de Fisher 120572 est

fixeacute agrave 100 pour toutes les courbes(a) et (b) la concentration

spatiale (119888 lt 1) changedrastiquement le nombre drsquoespegravecesattendu En pratique seuls 119878 et 119873(119904119899

ne0 et 119899 dans nos notations) sontobserveacutes Si 119888 est supposeacute eacutegal agrave 1par erreur 120572 est sous-estimeacute (a)et (c) le nombre drsquoespegraveces nrsquoest

eacutevidemment pas infini ce quichange fortement la forme de la

courbe Si le nombredrsquoobservations est grand 120572 sera

aussi tregraves sous-estimeacute

Note that for c frac14 1 (no clustering) Eq (5) can befurther reduced to

S frac14 a lneth1thorn N ethe1=a 1THORNTHORN (6)

The term e1=a can be written as the following infiniteseries

e1=a frac14 1thorn1

athorn

a2 2thorn

a3 3thorn

a4 4thorn (7)

For a410 this series is progressively approached byits first two terms

e1=a a410

1thorn1

and therefore Eq (6) too ultimately returns to theoriginal Fisher curve In practice for a410 Eq (6) isindistinguishable from the original Fisher curve withthis (academic) difference that Eq (6) always exactlyincludes both the points S frac14 0 for N frac14 0 and S frac14 1 for

N frac14 1 whereas the latter point is only approximated byFisherrsquos original curve

42 Model dynamics

Fig 4a presents the SndashN curves generated by Eqs (4)and (5) for a range of values of c and Smax In Fig 4bthe same equations have been used to simulate theextended Fisher curves of Figs 2a and b This illustratesthat Eqs (4) and (5) accurately describe the extendedFisher curve using the same number of parametersEach of these parameters reflects a distinct ecologicaltrait of the community in contrast to the more complexinterpretability of the parameters used by Plotkin et al(2000) and to the interactions between the parametersof the lognormal model (Kempton and Taylor 1974)and the beta model (Kempton 1975) The parametera remains the scale-independent quantification of

ARTICLE IN PRESS

0 1 2 3 4 5 6 7 8 9 10Ln (N)

Smax gtgt (= Fisher)

Smax = 297

Smax =143

Smax =101

00 2 4 6 8 10 12 14 16 18 20

Ln (N)

c = 1 (= Fisher)

c = 09

c = 1 (= Fisher)c = 0963c = 0933

c = 0887

c = 0732

c = 08

c = 07

c = 06

c = 1 Smax= 500

c = 06 Smax= 250

Fig 4 SndashN curves produced by Eq (4) and (5) (a) Presents SndashN curves for a frac14 100 and for a range of values of c and Smax (Smax frac14 1 unless stated

otherwise) (b) The SndashN curves of the extended Fisher model (Figs 2a and b) are simulated using Eq (4) and (5) S and N are the numbers of species

and individuals respectively

RPO Schulte et al Journal of Theoretical Biology 232 (2005) 305ndash313 309

13R A Kempton et L R Taylorlaquo Models and Statistics for Species Di-versity raquo In Nature 2625571 (1976)p 818-820 doi 101038262818a0

14R A Kempton et R W MWedderburn laquo A Comparison ofThree Measures of Species Diversi-ty raquo In Biometrics 341 (1978)p 25-37 doi 1023072529585 JS-TOR 2529585

Si 119878 = infin et 119888 = 1 lrsquoeacutequation (205) se simplifie pourretrouver lrsquoeacutequation (204)

Leurs reacutesultats (figure 203) montrent que la non prise encompte de ces deux paramegravetres aboutit agrave une sous-estimationsysteacutematique de 120572 diffeacuterente selon les sites ce qui invalide lescomparaisons inter-sites

Appliqueacute agrave des donneacutees reacuteelles (figure 204) le modegravele deFisher eacutetendu srsquoajuste forceacutement mieux (il possegravede trois pa-ramegravetres au lieu drsquoun) Lrsquoapproximation du nombre drsquoespegravecesinfini paraicirct ecirctre la plus peacutenalisante parce qursquoelle exclut lrsquoin-flexion de la courbe pour les grandes valeurs de 119873 mecircme sices valeurs sont rarement atteinte dans les faits (11989010 gt 20000)

Lrsquoindice de Fisher repose lourdement sur lrsquohypothegravese que ladistribution reacuteelle des espegraveces est conforme au modegravele Jost12

montre par un exemple que des interpreacutetations absurdes delrsquoindice peuvent ecirctre faites si lrsquohypothegravese nrsquoest pas respecteacutee

Kempton et Taylor13 et Kempton et Wedderburn14 ontdeacutefini lrsquoindice 119876 comme la pente de la courbe de 119878119899 en fonctionde log 119899 mesureacutee entre le premier et le troisiegraveme quartile dunombre drsquoespegraveces observeacutees quelle que soit la distribution desespegraveces 119876 = 120572 si la distribution est en log-seacuteries et 119876 = 119888119878120590si elle est log-normale (119888 est une constante deacutependant de laproportion des espegraveces eacutechantillonneacutee 119878 le nombre drsquoespegravecestotal et 120590 lrsquoeacutecart-type de la distribution du logarithme desprobabiliteacutes)

La simulation suivante tire 10000 arbres dans le jeu de don-neacutees BCI indeacutependamment et selon les freacutequences des espegravecesLrsquoindice Q est calculeacute

202 Variantes 241

biodiversity the maximum slope of the curve thatcorresponds to its empirical counterpart the Q-statisticSmax equals the maximum number of species and isinversely related to kF in the extended Fisher curveSimilar to knb in the extended Fisher curve parameter c

(0oco1) inversely quantifies the effects of clusteringwhich is maximum if c frac14 0 (knb frac14 0) and absent if c frac14 1(knb frac14 1) in which case Eq (5) follows Fisherrsquosoriginal curve (Fig 4) The precise relationship betweenc and knb could not be derived algebraically since theextended Fisher curve is an unsolved double integralHowever in Fig 5 we visualized this relationship byfitting the extended Fisher curve with Eq (5) (R2 valuesbetween 0974 and 1000 for all fits) for a range ofvalues of knb and a It shows that the clusteringparameter c is only reduced at strong degrees of spatialaggregation ie generally for values of knbo1

5 Results

51 Spatial data

In contrast to the extended Fisher curve Eqs (4) and(5) can be readily calibrated to accurately describeempirically observed SndashN data As examples we fittedFisherrsquos original curve and our Eqs (4) and (5) to SndashNobservations on trees (diameter410mm) made byCondit et al (1996) on Barro Colorado Island Panama(Fig 6a) Mudumalai India (Fig 6b) and PasohMalaysia (Fig 6c) We assumed a Poisson distributionfor the number of species and fitted the various SndashNequations by the method of maximum likelihood usingthe NLMIXED procedure in SAS Version 8 Eq (5) wascompared with Fisherrsquos equation to test the extent of theevidence in favour of augmenting Fisherrsquos equation with

ARTICLE IN PRESS

Fig 5 Relationship between the clustering parameters c (Eqs (4) and

(5)) and knb (extended Fisher model) for a range of values of aobtained by fitting SndashN curves of the extended Fisher model with

Eq (5)

observations (Condit et al 1996)

Fisher

Equation 5

Equation 4

Barro Colorado Island

0 2 4 6 8 10 12 14

Fisher

Equation 5

Equation 4

Mudumalai

Fisher

Equation 5

Equation 4

Fig 6 Maximum likelihood fits of Fisherrsquos original model (grey line)

Eq (5) (black line) and Eq (4) (bold line) applied to distribution data

of trees (diameter410mm) at Barro Colorado Island (Fig 5a)

Mudumalai (Fig 5b) and Pasoh (Fig 5c) Observations taken from

Condit et al (1996) S and N are the numbers of species and

individuals respectively

RPO Schulte et al Journal of Theoretical Biology 232 (2005) 305ndash313310

Fig 204 Comparaison entre lemodegravele de Fisher et le modegraveleeacutetendu dans trois parcellesforestiegraveres connues Les modegravelessont ajusteacutes aux donneacutees Lescourbes leacutegendeacutees Equation 4correspondent au modegravele de Fishereacutetendu par Schulte alors quelrsquoEquation 5 est le modegraveleintermeacutediaire supposant lenombre total drsquoespegraveces infini

Ns lt- colSums(BCI)Inventaire lt- rmultinom(10000 1 Nssum(Ns)) Cumul de linventaireCumul lt- apply(Inventaire 1 cumsum) Nombre despegraveces cumuleacuteesnEspeces lt- apply(Cumul 1 function(x) length(x[x gt 0])) Nombre total despegravecesS lt- max(nEspeces) Premier et troisiegravemes quartilesQ13 lt- which(nEspeces gt= max(nEspeces)4 amp nEspeces lt= max(nEspeces)

34)nq1 lt- min(Q13)nq3 lt- max(Q13)Sq1 lt- nEspeces[nq1]Sq3 lt- nEspeces[nq3] Indice Q(Q lt- (Sq3 - Sq1)log(nq3nq1))

[1] 3371977

La SAC correspondante est traceacutee en figure 205

Fig 205 SAC drsquoun inventairesimuleacute de 10000 arbres de BCI Lenombre drsquoespegraveces cumuleacute est traceacute

en fonction du logarithme dunombre drsquoindividus eacutechantillonneacutes119876 est la pente de la droite passant

par les points de la courbecorrespondant aux premier ettroisiegraveme quartiles du nombre

drsquoespegraveces

00 25 50 75log(n)

pegravece

Code R pour reacutealiser la figure

ggplot(dataframe(x = log(1ncol(Inventaire)) y = nEspeces)) +geom_line(aes(x = x y = y)) +geom_vline(xintercept = log(nq1) lty = 3) +geom_vline(xintercept = log(nq3) lty = 3) +geom_hline(yintercept = Sq1 lty = 3) +geom_hline(yintercept = Sq3 lty = 3) +geom_abline(intercept = Sq1-Qlog(nq1) slope = Q) +labs(x = log(n) y = Nombre despegraveces)

1Gotelli et Colwell laquo Quanti-fying Biodiversity Procedures andPitfalls in the Measurement and Com-parison of Species Richness raquo cfnote 92 p 81

Chapitre 21

Accumulation de la diversiteacute locale

La courbe drsquoaccumulation (SAC) deacutecrit comment la richesse ou la diver-siteacute augmente en fonction de lrsquoeffort drsquoeacutechantillonnage Sous lrsquohypothegravesedrsquoun tirage multinomial des individus observeacutes les formules de rareacutefac-tion (estimation du nombre drsquoespegraveces pour une surface infeacuterieure agrave celleinventorieacutee) sont bien contenues La structure spatiale rend les observa-tions deacutependantes entre elles et doit ecirctre prise en compte

Lrsquoessentiel

Les proprieacuteteacutes des courbes drsquoaccumulation ont eacuteteacute large-ment eacutetudieacutees dans la litteacuterature notamment pour preacutedire larichesse speacutecifique (section 31)

Lrsquoinfluence de la structure spatiale est consideacuterable maissouvent neacutegligeacutee parce que difficile agrave prendre en compteQuelques meacutethodes sont pourtant applicables

211 Courbes drsquoaccumulationOn suppose que la communauteacute locale est de taille fixe et

contient donc un nombre fixe drsquoespegraveces et que leur deacutecouverteprogressive aboutira agrave une asymptote de la SAC

In principle for a survey of some well-deregned spatial

scope an asymptote will eventually be reached and no

further taxa will be added

We distinguish four kinds of taxon sampling curves based on

two dichotomies (Fig 1) Although we will present these

curves in terms of species richness they apply just as well to

richness of higher taxa

The regrst dichotomy concerns the sampling protocol used

to assess species richness Suppose one wishes to compare

the number of tree species in two contrasting 10-ha forest

plots One approach is to examine some number of

individual trees at random within each plot recording

sequentially the species identity of one tree after another

We refer to such an assessment protocol as individual-based

(Fig 1) Alternatively one could establish a series of quadrats

in each plot record the number and identity of all the trees

within each and accumulate the total number of species as

additional quadrats are censused (eg Cannon et al 1998

Chazdon et al 1998 Hubbell et al 1999 Vandermeer et al

2000) This is an example of a sample-based assessment

protocol (Fig 1) The relative merit of these approaches for

estimating species richness of trees is not the point here

Rather we emphasize that species richness censuses can be

validly based on datasets consisting either of individuals or of

replicated multi-individual samples The key distinction is

the unit of replication the individual vs a sample of

individuals plusmn a distinction that turns out to be far from trivial

Examples of individual-based protocols include birders

``life lists (eg Howard amp Moore 1984) Christmas bird

counts (eg Robbins et al 1989) time-based ``collectors

curves (eg Clench 1979 Lamas et al 1991) and taxon-

richness counts (often families or genera) from palaeonto-

logical sites (eg Raup 1979) In addition when an

unreplicated mass sample (such as a deep-sea dredge

sample eg Sanders 1968) is treated as if it were set of

randomly captured individuals from the source habitat an

individual-based taxon-sampling curve can be produced for

the sample Examples of sample-based protocols using

sampling units other than quadrats include replicated mist-

net samples for birds (Melhop amp Lynch 1986) and replicated

trap data for arthropods (eg Stork 1991 Longino amp Colwell

1997 Gotelli amp Arnett 2000)

A ``hybrid between individual-based and sample-based

taxon sampling curves is produced by the ``m-species list

method in current use by some ornithologists (eg Poulsen

et al 1997) A list is kept of the regrst m (usually 20) species

observed (disregarding abundances) in a sampling area plusmn an

individual-based list Then additional ``samples each based

on a new list of m species from the same area are

successively pooled The cumulative number of species

observed is plotted as a function of the number of m-species

lists pooled to produce a curve that reaches an asymptote

when all species have been observed

Sample- and individual-based data sets are sometimes

treated interchangeably in statistical analyses For example

depending upon the scale of interest or the focus of a

hypothesis (in the sense of Scheiner et al 2000) a group of

individual-based datasets or mass samples can be analysed as

if they were replicate samples from the same statistical

universe (eg Grassle amp Maciolek 1992) Likewise a set of

replicated samples can usually be pooled and treated as a

single individual-based dataset for some purposes

(Engstrom amp James 1981) (This is not possible with

m-species-list curves since abundances are not recorded)

The second dichotomy distinguishes accumulation curves

from rarefaction curves A species (or higher taxon) accumulation

curve records the total number of species revealed during the

process of data collection as additional individuals or

sample units are added to the pool of all previously observed

or collected individuals or samples (Fig 1) Accumulation

curves may be either individual-based (eg Clench 1979

Robbins et al 1989) or sample-based (eg Novotny amp Basset

Figure 1 Sample- and individual-based rarefaction and accumula-

tion curves Accumulation curves (jagged curves) represent a single

ordering of individuals (solid-line jagged curve) or samples (open-

line jagged curve) as they are successively pooled Rarefaction

curves (smooth curves) represent the means of repeated

re-sampling of all pooled individuals (solid-line smooth curve) or

all pooled samples (open-line smooth curve) The smoothed

rarefaction curves thus represent the statistical expectation for the

corresponding accumulation curves The sample-based curves lie

below the individual-based curves because of the spatial aggrega-

tion of species All four curves are based on the benchmark

seedbank dataset of Butler amp Chazdon (1998) analysed by Colwell

amp Coddington (1994) and available online with EstimateS (Colwell

2000a) The individual-based accumulation curve shows one par-

ticular random ordering of all individuals pooled The individual-

based rarefaction curve was computed by EstimateS using the

Coleman method (Coleman 1981) The sample-based accumulation

curve shows one particular random ordering of all samples in the

dataset The sample-based rarefaction curve was computed by

repeated re-sampling using EstimateS For both sample-based

curves the patchiness parameter in EstimateS set to 08 to

emphasize the effect of spatial aggregation

380 NJ Gotelli and RK Colwell

Oacute2001 Blackwell Science LtdCNRS

Fig 211 Courbesdrsquoaccumulation et de rareacutefactionobtenues par inventairesindividuels ou groupeacutes (samples)Les courbes de rareacutefactionpermettent de lisser les courbesdrsquoaccumulation Les courbesobtenues par inventaire groupeacutesont en geacuteneacuteral en dessous descourbes individuelles agrave cause delrsquoagreacutegation spatiale

Gotelli et Colwell1 proposent une revue des problegravemes lesplus communeacutement rencontreacutes dans lrsquoestimation et la com-paraison de la richesse speacutecifique Ils suggegraverent notamment

244 Accumulation de la diversiteacute locale

2K I Ugland et al laquo TheSpecies-Accumulation Curve and Es-timation of Species Richness raquo In Journal of Animal Ecology 725(2003) p 888-897 doi 101046j1365-2656200300748x

3Oksanen et al laquo Vegan Community Ecology Package raquo cfnote 21 p xi

4B D Coleman laquo On Ran-dom Placement and Species-Area Re-lations raquo In Mathematical Bios-ciences 543-4 (1981) p 191-215doi 1010160025-5564(81)90086-9

5E C Pielou An Introductionto Mathematical Ecology New York Wiley 1969 pages 204-205

de calculer la courbe de rareacutefaction (figure 211) plutocirct quedrsquoutiliser la courbe drsquoaccumulation obtenue en traccedilant simple-ment le nombre drsquoespegraveces deacutecouvert en fonction de lrsquoeffortdrsquoeacutechantillonnage La courbe de rareacutefaction est obtenue ensous-eacutechantillonnant dans lrsquoinventaire complet des effectifs detoutes tailles et en calculant le nombre moyen drsquoespegraveces trouveacutepour chacun ce qui permet de la lisser La formulation exactede la courbe de rareacutefaction et de sa variance est connue2

Fig 212 Courbe drsquoaccumulationdes espegraveces drsquoarbres de Barro

Colorado Island Calcul parspecaccum accumulation des 50

carreacutes avec permutations

0 10 20 30 40 50

La fonction specaccum de la librairie vegan3 permet detracer les SAC (figure 212) selon diffeacuterentes meacutethodes avecun intervalle de confiance obtenu par permutation de lrsquoordredrsquoajout des donneacutees ou agrave partir des formules de rareacutefaction

data(BCI)SAC lt- specaccum(BCI random)plot(SAC citype = poly lwd = 2 cilty = 0 cicol = lightgray)

Pour une surface donneacutee le nombre drsquoindividus est unevariable aleacuteatoire Dans ce cas la SAC (deacutependant de lasurface) est diffeacuterente de la courbe de rareacutefaction (fonctiondu nombre drsquoindividus) de Gotelli et Colwell que Coleman4

nomme laquo courbe du collecteur raquoLa SAC theacuteorique en fonction de la surface contient une

incertitude concernant le nombre drsquoindividus Si la densiteacute 120582119904(nombre drsquoindividus par uniteacute de surface) des espegraveces peutecirctre connue (estimeacutee en comptant les individus) ou si les pro-babiliteacutes 119901119904 sont issues drsquoun modegravele (log-seacuteries log-normalhellip)le nombre drsquoindividus observeacutes de lrsquoespegravece 119904 suit une loi dePoisson drsquoespeacuterance 119860119904 ou de faccedilon eacutequivalente5 119899119901119904 (dansce deuxiegraveme cas 119899 est lrsquoestimateur de 119873 la variable aleacuteatoirecorrespondant agrave la taille de lrsquoeacutechantillon)

La SAC theacuteorique en fonction du nombre drsquoindividus necontient pas cet aleacutea Le nombre drsquoindividus de lrsquoespegravece 119904 suit

211 Courbes drsquoaccumulation 245

6G D Steel laquo Relation betweenPoisson and Multinomial Distribu-tions raquo In Biometrics Unit Techni-cal Reports Cornell University Bio-metrics Unit 1953 p 1-2

7R K Colwell et al laquo Modelsand Estimators Linking Individual-Based and Sample-Based RarefactionExtrapolation and Comparison of As-semblages raquo In Journal of PlantEcology 51 (2012) p 3-21 doi 101093jpertr044

10L Cao et M Grabchak laquo En-tropyEstimation Estimation of En-tropy and Related Quantities raquo In (2014)

alors une loi binomiale drsquoespeacuterance 119899119901119904 et la distribution drsquouneacutechantillon de taille 119899 suit la loi multinomiale correspondanteLes deux approches se reacuteconcilient en fixant arbitrairement lenombre drsquoindividus eacutechantillonneacutes dans la courbe aire-espegravece conditionnellement au nombre total drsquoindividus la distribu-tion des abondances des espegraveces issues de lois de Poisson deparamegravetres 120582119904 suit une loi multinomiale6 dont les probabiliteacutessont proportionnelles agrave 120582119904

La SAC deacutefinie en fonction du nombre drsquoindividus est ausens strict une succession de points (agrave chaque valeur de 119899)pas une courbe continue Elle est toutefois toujours preacutesen-teacutee comme une courbe lisseacutee passant par les points pour ecirctrecontinue et deacuterivable

0 5000 10000 15000 20000Nombre dindividus

pegravece

Fig 213 Courbe drsquoaccumulationdes espegraveces drsquoarbres de BarroColorado Island Somme desentropies de Simpson geacuteneacuteraliseacutees

Une difficulteacute suppleacutementaire consiste agrave prendre en compteles espegraveces non eacutechantillonneacutees en appliquant des techniquesstatistiques pour reacuteduire le biais qursquoelles induisent7 Dans cebut la SAC theacuteorique peut ecirctre construite8 comme la sommedes entropies de Simpson geacuteneacuteraliseacutees9 preacutesenteacutees en section47

La courbe obtenue (figure 213) est la mecircme que par ra-reacutefaction sans les problegravemes drsquoestimation Son intervalle deconfiance nrsquoest pas repreacutesenteacute lrsquoestimation est sans biais et aune variance tregraves petite drsquoautre part la variabiliteacute de lrsquoeacutechan-tillonnage prise en compte dans la figure 212 est ignoreacutee iciLa fonction GenSimpz est fournie par le package EntropyEs-timation10

Code pour la figure library(EntropyEstimation)data(BCI)Ns lt- colSums(BCI)gsValues lt- sapply(1(sum(Ns)-1) function(r) GenSimpz(Ns r))SAC lt- cumsum(gsValues)ggplot(dataframe(x = 0(sum(Ns)-1)

y = c(0 SAC))aes(x = x y = y)) +

11J Beacuteguinot laquo When Reasona-bly Stop Sampling How to Estimatethe Gain in Newly Recorded SpeciesAccording to the Degree of Supple-mentary Sampling Effort raquo In An-nual Research amp Review in Biology75 (2015) p 300-308 doi 109734ARRB201518809

12Beacuteguinot laquo An Algebraic De-rivation of Chaorsquos Estimator of theNumber of Species in a Commu-nity Highlights the Condition Allo-wing Chao to Deliver Centered Esti-mates raquo cf note 14 p 28

13Beacuteguinot cf note 11

14T-J Shen et al laquo Predictingthe Number of New Species in aFurther Taxonomic Sampling raquo cfnote 39 p 38

geom_line() +labs(x = Nombre dindividus y = Nombre despegraveces)

212 ExtrapolationLrsquoextrapolation de la SAC est un cas particulier de celle

de la diversiteacute deacutejagrave vue en section 46Beacuteguinot11 a une approche diffeacuterente Il considegravere la SAC

comme une fonction continue et infiniment deacuterivable de lataille de lrsquoeacutechantillon Le nombre drsquoespegraveces non observeacutees dansun eacutechantillon de taille 119899 est noteacute 119904119899

0 Le nombre drsquoespegraveces ob-serveacutees dans la SAC est 119904119899

gt0 = 119878 minus 1199041198990 Quand 119899 est assez

grand la pente de la SAC varie peu entre 119899 minus 1 et 119899 + 1 in-dividus Beacuteguinot12 approxime la deacuteriveacutee de 119904119899

0 par 1199041198990 minus 119904119899minus1

0 La deacuteriveacutee est en reacutealiteacute plus grande la pente de la SACqui est lrsquoopposeacutee de la pente de 119904119899

0 deacutecroicirct avec 119899 mais lrsquoap-proximation est acceptable quand 119899 est assez grand De mecircmeles deacuteriveacutees successives par exemple seconde sont approcheacuteespar la variation de la deacuteriveacutee drsquoordre infeacuterieur par exemplepremiegravere entre 119899 minus 1 et 119899 En combinant ces approximationsavec lrsquoespeacuterance du nombre drsquoespegraveces observeacutees 120584 fois dans uneacutechantillon de taille 119899 eacutequation (32) on obtient

120124 (119904119899120584 ) = (minus1)120584minus1 (119899

120584)120597120584119904119899gt0

120597119899120584 120584 = 1 2 hellip (211)

Lrsquoespeacuterance du nombre drsquoespegraveces observeacutees 120584 fois deacutependdirectement de la deacuteriveacutee 120584e de la SAC

Beacuteguinot13 eacutecrit lrsquoaccroissement du nombre drsquoespegraveces ob-serveacutees quand lrsquoeacutechantillon augmente de 119899 agrave 119899 + 120575119899 sous laforme drsquoune seacuterie entiegravere qursquoil combine avec lrsquoeacutequation preacuteceacute-dente pour en obtenir une approximation

119904119899+120575119899 asymp 119904119899 + sum120584

(minus1)120584minus1 119904119899120584 (120575119899

119899 )120584 (212)

La somme est infinie mais ses termes deacutecroissent rapide-ment Le nombre de termes agrave prendre en compte est drsquoautantplus grand que 120575119899

119899 le niveau drsquoextrapolation est grand Lrsquoau-teur conseille de ne pas pousser lrsquoextrapolation au delagrave dudouble de 119899

Cette meacutethode est compareacutee agrave lrsquoextrapolation de la diver-siteacute drsquoordre 0 (section 46) et agrave lrsquoestimateur de T-J Shen etal14 (section 31) dans lrsquoillustration suivante

Une communauteacute theacuteorique log-normale de 300 espegraveces estcreacuteeacutee Des inventaires de 1000 individus sont simuleacutes et lestrois meacutethodes drsquoextrapolation de la richesse speacutecifique sont

212 Extrapolation 247

appliqueacutees pour estimer la richesse drsquoun eacutechantillon de 1800 in-dividus Les reacutesultats obtenus sont compareacutes agrave des inventairesdirects de 1800 individus

160 180 200Nombre despegraveces

siteacute

teacute

Fig 214 Distribution de larichesse obtenue par extrapolationagrave 1800 individus de 500 inventairesde 1000 individus selon lesmeacutethodes de Shen et al (pointilleacutesalterneacutes vert) Beacuteguinot (tiretsrouges) ou avec le package iNEXT(pointilleacutes bleu) La distributionde la richesse de 500 inventaires demecircme taille est repreacutesenteacutee par lacourbe noire

La figure 214 montre que les extrapolations sont bonneset tregraves similaires avec les trois meacutethodes La distribution des500 simulations drsquoextrapolation est proche de celle des 500inventaires avec une plus grande variabiliteacute due agrave la quantiiteacuteplus faible de donneacutees disponibles

Ecart-type de la communauteacute log-normalesdlog lt- 2 Nombre despegravecesS lt- 300 Tirage des probabiliteacutes log-normales (lespeacuterance est sans importance)Ps lt- asProbaVector(rlnorm(S 0 sdlog)) Taille de linventairen lt- 1000 Niveau dextrapolationextra lt- 08 Nombre de simulationsnSim lt- 500 Creacuteation de nSim inventaires de n individusSamples lt- rmultinom(nSim n Ps) Richesse observeacuteeS0 lt- colSums(Samples gt 0) Fonction dextrapolation selon BeacuteguinotExtrapolateB lt- function(Ns)

Creacuteation dun tableau contenant le nombre despegraveces par abondancef lt- AbdFreqCount(Ns) Calcul des termes de la sommes lt- sapply(1nrow(f) function(i)

(-1)^(f[i 1]-1) f[i2] extra^f[i 1])return(sum(s))

Extrapolation des inventaireseB lt- apply(Samples 2 ExtrapolateB) + S0 Extrapolation par iNextlibrary(iNEXT)ei lt- iNEXT(asdataframe(Samples) q = 0 endpoint = n(1+extra)

knots = 4 se = FALSE)$iNextEst Extraction des reacutesultats de lobjet obtenuei lt- sapply(ei function(x) x[[4]][4]) Fonction dextrapolation selon Shen et al

15Beacuteguinot laquo Extrapolation ofthe Species Accumulation Curve forIncomplete Species Samplings ANew Nonparametric Approach to Es-timate the Degree of Sample Comple-teness and Decide When to Stop Sam-pling raquo cf note 37 p 37

library(SPECIES)ExtrapolateS lt- function(Ns)

Nombre despegraveces non observeacuteessink(tempfile()) Suppression des messages de jacknife()S0 lt- jackknife(AbdFreqCount(Ns))$Nhat -sum(Ns gt 0)sink() restauration de laffichage normal Taux de couvertureC lt- Coverage(Ns) Espegraveces nouvellesreturn(S0(1 -(1 -(1 -C)S0)^(nextra)))

Extrapolation des inventaireseS lt- apply(Samples 2 ExtrapolateS) + S0 Tirage de nSim communauteacutes de taille n(1+extra)Communities lt- rmultinom(nSim n(1 + extra) Ps)richCommunities lt- colSums(Communities gt 0) Distribution des reacutesultatsdeCommunities lt- density(richCommunities)deB lt- density(eB)dei lt- density(ei)deS lt- density(eS) FigureXlab lt- Nombre despegravecesYlab lt- Densiteacute de probabiliteacuteggplot(dataframe(richCommunities eB ei eS)) +

geom_density(aes(richCommunities)) +geom_density(aes(eB) lty = 2 col = red) +geom_density(aes(ei) lty = 3 col = blue) +geom_density(aes(eS) lty = 4 col = darkgreen) +labs(x = Xlab y = Ylab)

Beacuteguinot15 propose eacutegalement une forme analytique de laSAC extrapoleacutee en combinant lrsquoeacutequation (211) agrave lrsquoestimateurjackknife drsquoordre 2 Alors dans le domaine de validiteacute de lrsquoesti-mateur jackknife 2 crsquoest-agrave-dire quand le nombre de singletonsest supeacuterieur agrave 06 fois le nombre de doubletons la richessepour 119899 individus est

119904119899 = 1199041198990 +211990411989901 minus1199041198990

2 minus(311990411989901 minus 21199041198990

2 )lowast1198990119899 minus(1199041198990

2 minus 11990411989901 )lowast(1198990

119899 )2

ougrave 1198990 est la taille de lrsquoinventaire de deacutepartLa meacutethode est testeacutee ici sur la mecircme communauteacute log-

normale 500 inventaires de 5000 individus sont reacutealiseacutes etchacun est extrapoleacute jusqursquoagrave 25000 individus

Extrapolation jusquagraveNmax lt- 25000 SAC reacuteelle obtenue par la somme des entropies de Simpson geacuteneacuteraliseacutees Calcul de p(1-p)^r pour toutes les espegraveces (en lignes) et tous les r (en colonnes)GSsr lt- Ps sapply(1Nmax function(r) (1 - Ps)^r) Simpson geacuteneacuteraliseacute pour tous les rGSr lt- colSums(GSsr) SAC somme cumuleacutee des entropies de Simpson geacuteneacuteraliseacuteesSAC lt- cumsum(GSr) Fonction dextrapolation de la SACExtraSAC lt- function(Ns N)

Ns est le vecteur des abondances de leacutechantillon N est le vecteur des tailles agrave extrapolern0 lt- sum(Ns)Sn0 lt- sum(Ns gt 0)f1 lt- sum(Ns == 1)

f2 lt- sum(Ns == 2) Extrapolation agrave chaque taillevapply(N function(n) Sn0 + 2 f1 - f2 - (3 f1 - 2 f2)

n0n - (f2 - f1) (n0n)^2 0) Taille de leacutechantillonn lt- 5000 Tirage de nSim inventaires dans la communauteacute log-normaleSamples lt- rmultinom(nSim n Ps) Extrapolation des inventairesExtraSACs lt- apply(Samples 2 ExtraSAC nNmax) Moyenne et intervalle de confiance agrave 95Moyenne lt- apply(ExtraSACs 1 mean)Max lt- apply(ExtraSACs 1 quantile probs = 0975)Min lt- apply(ExtraSACs 1 quantile probs = 0025) Taille deacutechantillon reacuteduitenReduit lt- 1000 Tirage de nSim inventaires dans la communauteacute log-normaleSamples lt- rmultinom(nSim nReduit Ps) Extrapolation des inventairesExtraSACs lt- apply(Samples 2 ExtraSAC nReduitNmax) MoyenneMoyenneReduit lt- apply(ExtraSACs 1 mean)

Agrave titre de comparaison lrsquoextrapolation drsquoun seul inven-taire de 1000 individus est eacutegalement tenteacutee

0 5000 10000 15000 20000 25000Nombre dindividus

pegravece

Fig 215 Extrapolation de 500inventaires de 5000 individus(valeurs moyenne en tireteacute rougeet enveloppe de confiance agrave 95en gris) superposeacutee agrave la SAC reacuteelledrsquoune communauteacute log-normale de300 espegraveces Lrsquoextrapolation (enpointlleacutes bleu) drsquoun inventairelimiteacute agrave 1000 individus estseacutevegraverement sous-estimeacutee

Lrsquoextrapolation fonctionne assez bien (figure 215) tant quelrsquoeacutechantillonnage nrsquoest pas trop faible Avec un inventaire de5000 individus dans cet exemple lrsquoestimation de la richesseasymptotique par lrsquoestimateur jackknife 2 est correcte lrsquoextra-polation de la SAC lrsquoest aussi En limitant lrsquoinventaire agrave 1000individus lrsquoinformation disponible est trop limiteacutee

ggplot() +geom_ribbon(aes(x ymin = Min ymax = Max)

dataframe(x = nNmax Min Max) alpha = 03) +geom_line(aes(x y) dataframe(x = 0Nmax y = c(0 SAC))) +geom_line(aes(x y) dataframe(x = nNmax y = Moyenne)

col = red lty = 2) +geom_line(aes(x y) dataframe(x = nReduitNmax y = MoyenneReduit)

col = blue lty = 3) +labs(x = Nombre dindividus y = Nombre despegraveces)

16J A Veech laquo Analyzing Pat-terns of Species Diversity as Depar-tures from Random Expectations raquoIn Oikos 1081 (2005) p 149-155doi 101111j0030-1299200513506x

17J B Plotkin et al laquo Species-Area Curves Spatial Aggregationand Habitat Specialization in Tropi-cal Forests raquo In Journal of Theore-tical Biology 2071 (2000) p 81-99doi 101006jtbi20002158

18J Neyman et E L Scott laquo Sta-tistical Approach to Problems of Cos-mology raquo In Journal of the RoyalStatistical Society Series B (Statis-tical Methodology) 201 (1958) p 1-43 doi 101111j2517- 61611958tb00272x JSTOR 2983905

19N Picard et al laquo Species-AreaCurve and Spatial Pattern raquo In Ecoscience 111 (2004) p 45-54 doi 10108011956860200411682808

213 Influence de la structure spatiale

Les modegraveles classiques de courbes aire-espegraveces supposentun tirage indeacutependant des individus Sur le terrain parexemple en forecirct lrsquoeacutechantillonnage est continu srsquoil existeune structure spatiale comme des agreacutegats la probabiliteacuteque lrsquoarbre suivant soit drsquoune espegravece donneacutee deacutepend deses voisins donc de lrsquoarbre preacuteceacutedent Intuitivement oncomprend bien que le nouvel arbre de la mecircme espegravece apportemoins drsquoinformation ce qui revient agrave surestimer la taillede lrsquoeacutechantillon ou sous-estimer la richesse pour une tailledrsquoeacutechantillon fixeacutee16

Plotkin et al17 traitent un problegraveme un peu diffeacuterent connaissant le nombre total drsquoespegraveces dans les dispositifs dela figure 222 ils tracent la courbe de rareacutefaction theacuteorique quiconsidegravere simplement que la probabiliteacute de ne pas rencontrerune espegravece suit une loi binomiale les tirages eacutetant indeacutepen-dants Ce modegravele surestime largement la diversiteacute pour les pe-tites surfaces la probabiliteacute de ne pas rencontrer une espegraveceagreacutegative est sous-estimeacutee Le biais diminue quand la surfacedrsquoeacutechantillonnage augmente parce que la taille relative desagreacutegats diminue

Les effets de lrsquoagreacutegation peuvent donc ecirctre opposeacutes selonla question poseacutee Dans tous les cas il suffit de consideacutererqursquoun agreacutegat surestime le nombre drsquoarbres de son espegravece quidevrait ecirctre pris en compte dans le cadre drsquoun modegravele agrave tiragesindeacutependants

Plotkin et al proposent une meacutethode permettant deprendre en compte la structure spatiale pour fournir des mo-degraveles de courbes aire-espegraveces fiables dans un cadre particulierougrave le nombre total drsquoespegraveces et leur structure spatiale sontconnus La meacutethode neacutecessite une carte des individus Lesemis de point est consideacutereacute comme le reacutesultat drsquoun processusde Neyman-Scott 18 des centres drsquoagreacutegats sont tireacutes de faccediloncomplegravetement aleacuteatoire et les individus sont reacutepartis autourdes centres selon une loi normale en deux dimensions Lesparamegravetres du processus sont estimeacutes agrave partir du semis depoints puis la courbe aire-espegraveces est obtenue par simulationdu processus

Le problegraveme est traiteacute de faccedilon plus approfondie par Pi-card et al19 qui srsquoappuient sur la theacuteorie des processus ponc-tuels En supposant que la distribution spatiale des espegravecesest homogegravene (crsquoest-agrave-dire stationnaire et isotrope) la formedu domaine eacutechantillonneacute nrsquoa pas drsquoimportance lrsquoaire 119860 peutecirctre repreacutesenteacutee par un cercle de rayon 119903 = radic119860120587 La probabi-liteacute drsquoobserver lrsquoespegravece 119904 dans 119860 est identique agrave la probabiliteacuteque la distance entre un individu de lrsquoespegravece 119904 et un pointarbitrairement choisi soit infeacuterieure agrave 119903 Cette probabiliteacute a

213 Influence de la structure spatiale 251

20P J Diggle Statistical Analy-sis of Spatial Point Patterns Lon-don Academic Press 1983

21N A Cressie Statistics forSpatial Data New York John Wileyamp Sons 1993 D Stoyan et H StoyanFractals Random Shapes and PointFields Methods of Geometrical Sta-tistics Chichester John Wiley ampSons 1994 doi 978-0-471-93757-9

22B Mateacutern laquo Spatial Varia-tion raquo In Meddelanden fraringn StatensSkogsforskningsinstitut 495 (1960)p 1-144

eacuteteacute largement eacutetudieacutee et est connue sous le nom de fonction119865 de Diggle20 ou empty space function 119865119904(119903) est la fonctiondrsquoespace vide de lrsquoespegravece 119904 dont lrsquoargument est la distance119903 Le nombre drsquoespegraveces peut ecirctre eacutecrit comme la somme desfonctions 119865119904

120124 (119878119860) = sum119904

119865119904 (119903) (214)

La fonction 119865119904(119903) est connue pour les processus ponctuelscourants21 Le processus de Poisson place les individus indeacute-pendamment les uns des autres avec la mecircme probabiliteacute par-tout Son seul paramegravetre est lrsquointensiteacute 120582119904 qui donne lrsquoespeacute-rance du nombre drsquoindividus de lrsquoespegravece 119904 par uniteacute de sur-face Si toutes les espegraveces sont distribueacutees selon un processusde Poisson la courbe aire-espegravece est deacutecrite par

120124 (119878119860) = 119878 minus sum119904

119890minus120582119904119860 (215)

Lrsquoeacutequation (215) est identique au modegravele de distributionaleacuteatoire de Coleman en remplaccedilant la distribution observeacuteedes effectifs par espegravece par lrsquointensiteacute du processus de PoissonLes formes de 119865119904 sont connues aussi pour des processus agreacute-gatifs notamment le processus de Mateacutern22 ou des distribu-tions reacuteguliegraveres La courbe aire-espegravece peut donc ecirctre eacutevalueacuteeagrave partir drsquoinventaires fournissant la position des individus Leprocessus ponctuel correspondant agrave chaque espegravece peut ecirctreinfeacutereacute pour fournir une forme analytique de la courbe commedans lrsquoeacutequation (215) ou bien la fonction drsquoespace vide dechaque espegravece peut ecirctre estimeacutee agrave partir des donneacutees par lafonction Fest du package spatstat et sommeacutee pour toutes lesespegraveces selon lrsquoeacutequation (214)

La relation aire-espegravece contient au moins autant de para-megravetres que drsquoespegraveces lrsquointensiteacute 120582119904 si lrsquoespegravece 119904 est distri-bueacutee spatialement selon un processus de Poisson deux para-megravetres suppleacutementaires pour le processus de Mateacutern Cettecomplexiteacute peut ecirctre reacuteduite si la distribution des freacutequencesdes espegraveces (la SAD) est connue Picard et al fournissent lesrelations pour une SAD en log-seacuteries et une SAD geacuteomeacutetriqueavec une distribution spatiale suivant un processus de Poisson elles ne contiennent que deux paramegravetres un lieacute au nombretotal drsquoindividus et un propre agrave chaque SAD Les formules secompliquent quand la distribution spatiale nrsquoest pas poisson-nienne et ne sont pas disponibles quand la SAD (log-normalepar exemple) ne preacutevoit pas le nombre exact drsquoindividus parespegravece

Enfin il est possible de prendre en compte les espegraveces nonobserveacutees La relation aire-espegravece (214) srsquoentend pour toutes

24Picard et al laquo Species-AreaCurve and Spatial Pattern raquo cfnote 19 p 250

les espegraveces Elle peut ecirctre reacuteeacutecrite sous la forme

120124 (119878119860) =119878ne0

sum119904=1

119865119904 (119903) +119878

sum119904=119878ne0+1

119865119904 (119903) (216)

Le premier terme de la somme correspond aux espegraveces ob-serveacutees le deuxiegraveme aux espegraveces non observeacutees La distribu-tion des espegraveces non observeacutees peut maintenant ecirctre estimeacuteedans certains cas23 et leur distribution spatiale ecirctre supposeacuteepoissonnienne puisque ce sont des espegraveces rares24 ce qui ouvrela voie agrave une meilleure estimation de la courbe

1J Braun-Blanquet laquo Pflanzen-soziologie Grundzuumlge Der Vegeta-tionskunde raquo In Biologische Stu-dienbuumlcher Berlin Springer 1928

2P Greig-Smith QuantitativePlant Ecology 3rd edition Berkeleyand Los Angeles University of Cali-fornia Press 1983

3K A McGuinness laquo Equationsand Explanations in the Study ofSpecies-Area Curves raquo In BiologicalReviews 593 (1984) p 423-440 doi 101111j1469-185X1984tb00711x

4M Chytryacute et Z Otyacutepkovaacutelaquo Plot Sizes Used for Phytosociolo-gical Sampling of European Vegeta-tion raquo In Journal of VegetationScience 144 (2003) p 563-570 doi 101111j1654-11032003tb02183x

6Williamson et al laquo TheSpeciesndashArea Relationship Does NotHave an Asymptote raquo cf note 5p 25

Chapitre 22

Diversiteacute reacutegionale

La relation drsquoArrhenius preacutevoit que logarithme du nombre drsquoespegraveces soitproportionnel au logarithme de la surface (de faccedilon eacutequivalente quele nombre drsquoespegraveces soit proportionnel agrave la surface agrave une puissance 119911constante) Elle est plus robuste agrave lrsquoeacutechelle reacutegionale que le modegravele deGleason qui preacutedit que le nombre drsquoespegraveces plutocirct que son logarithmesoit en relation lineacuteaire avec le logarithme de la surface (tregraves proche dumodegravele de Fisher dans lequel le nombre drsquoespegraveces est proportionnel aulogarithme du nombre drsquoindividus eacutechantillonneacutes agrave partir drsquoune certainesurface)

Lrsquoessentiel

En forecirct tempeacutereacutee toutes les espegraveces drsquoun habitat sont ren-contreacutees sur une surface infeacuterieure agrave lrsquohectare Lrsquoaire minimaleest la surface neacutecessaire agrave eacutechantillonner pour caracteacuteriser uneassociation veacutegeacutetale dans lrsquoapproche de la phytosociologie fon-deacutee par Braun-Blanquet1 et plus largement2 mecircme si son in-teacuterecirct est discuteacute 3 elle ne contient pas toutes les espegraveces maisun sous-ensemble caracteacuteristique Elle est de lrsquoordre de 200 msup2en Europe4 Lrsquoaugmentation de la surface integravegre de nouveauxhabitats et ajoute donc la diversiteacute 120573 par sauts successifs dansla situation ideacuteale

En forecirct tropicale il existe de nombreuses espegraveces raresau sens ougrave la probabiliteacute de ne pas les rencontrer agrave lrsquoocca-sion drsquoun eacutechantillonnage drsquoune certaine taille nrsquoest pas neacute-gligeable Lrsquoexpeacuterience montre que lrsquoaugmentation de lrsquoairedrsquoeacutechantillonnage nrsquoest pas la solution adapteacutee puisqursquoon ren-contre toujours de nouvelles espegraveces5 mecircme en eacutechantillon-nant des surfaces consideacuterables (50 ha pour la figure 223 au-delagrave du million de kmsup2 pour la figure 221) Lrsquointeacutegration de ladiversiteacute 120573 due aux nouveaux habitats inventorieacutes se confondavec la progression de lrsquoaccumulation de la diversiteacute localeDans le cas geacuteneacuteral la SAR ne tend alors pas vers une asymp-tote et nombre drsquoespegraveces augmente tant que la surface eacutechan-tillonneacutee croicirct6 Il ne srsquoagit donc pas drsquoestimer un nombre drsquoes-pegraveces asymptotique pour une communauteacute mais un nombredeacutependant de la surface drsquoeacutechantillonnage

254 Diversiteacute reacutegionale

7McGuinness laquo Equations andExplanations in the Study of Species-Area Curves raquo cf note 3 p 253

8O Arrhenius laquo Species andArea raquo In Journal of Ecology 91(1921) p 95-99 doi 10 2307 2255763

9F W Preston laquo The Canoni-cal Distribution of Commonness andRarity Part I raquo In Ecology 432(1962) p 185-215 doi 10 2307 1931976

12May laquo Patterns of Spe-cies Abundance and Diversity raquo cfnote 29 p 17 R M May et M P HStumpf laquo Species-Area Relationsin Tropical Forests raquo In Science2905499 (2000) p 2084-2086 doi 101126science29054992084

13S Drakare et al laquo The Imprintof the Geographical Evolutionaryand Ecological Context on SpeciesndashArea Relationships raquo In EcologyLetters 92 (2006) p 215-227 doi 101111j1461-0248200500848x

Une revue historique des theacuteories sur la forme de la SARest fournie par McGuinness7

221 La relation drsquoArrhenius

Fig 221 Logarithme du nombredrsquoespegraveces en fonction dulogarithme de la surface

eacutechantillonneacutee Les donneacutees sontdes releveacutes drsquoespegraveces natives de

plantes vasculaires sur 104 sites detaille variable agrave travers le monde

Les symboles correspondent agravedivers types drsquohabitats (icircles ou

continent reacuteserves ou non) sansinteacuterecirct ici La valeur de 119911 est 027

plots regt the standard Arrhenius relationship It can be seenat a glance that all three are essentially linear throughoutThe areas covered are for vascular plants (Fig 1) fromjust under 1 km2 to just over 107 km2 The upper end isalmost at the continental scale the major continents beingroughly 1075 km2 the ice free land area of the world beingabout 13 acute 108 and the whole world 5 acute 108 km2 Forland birds the islands in Fig 2 cover a slightly smallerrange from 5 to 106 km2 The largest island is NewGuinea the largest isolated one is Madagascar Both plotsgive regressions with slopes around 03 (027 and 033 forall points similar values for subsets) There is of course ascatter round the regression lines caused by other factorsand stochasticity

Figure 3 for a smaller group of organisms in all senseslumbricid earthworms goes to a much smaller size

10)4 km2 (10)2 ha 102 m2) and the upper end islt106 km2 (France) It is also much macratter with a regressionslope of only 009 for reasons that remain obscure Usingstandardized residuals the top right hand point and all thepoints with S 1 are deviant Two points with S 0 havebeen omitted As a logarithmic plot can only cope with S 0by some fudge it is not surprising that results with S 1 area bit odd None of the three plots shows evidence oflimitation by the pool of species that Lomolino assumesexists

Plots covering such a wide range of orders of magnitudeand going to almost continental scales are unusual All threeclearly show that there is no asymptote at the right handend nor have we ever seen such an asymptote in otherpublished data at these large scales The speciesplusmnarearelationship does not have an asymptote

THE RIGHT HAND END

Species numbers for an even wider span of areas are givenby Williams (1964 reproduced in Heywood (1995) asFigs 32plusmn4) for macrowering plants from 10 cm2 (10)9 km2)to a number of points near 107 km2 and a point for thewhole land surface The speciesplusmnarea plot is remarkablylinear over 16 orders of magnitude considering howheterogeneous the data are from a wide variety ofclimates (which accounts for much of the varianceWoodward 2001) but there is a sharp turn up to thewhole land surface Rosenzweig (1995) on the basis of asingle nested set of points (his Fig 215) and a dubiouswider set (his Fig 216) says that such a turn up isnormal

Looking at the three reggures and remembering that extantglobally there may be c 250000 species of angiospermc 9500 species of birds (or double that if some cladists havetheir way) and c 500 species of lumbricid it is easy to seethat all would need a steep increase at some point to reachthe world total This is the very opposite of Lomolinosasymptote But these increases may be spurious World

Figure 1 The relationship between the number of native species andsite area for 104 sites around the world broken down into islandreserves (s) island non-reserves (n) mainland reserves (d)and mainland non-reserves (m) The regtted line islog S 196+027(log A) From Lonsdale (1999)

Figure 2 Speciesplusmnarea plot for the land birds on individual island inthe warmer seas (m) Islands more than 300 km from the nextlargest land mass or in the Hawaiian or Galapagos archipelagosFrom Williamson (1981) and (1988) from data in Slud (1976)

Figure 3 Speciesplusmnarea relationships for Lumbricidae (AnnelidaOligochaeta) in Europe From Gaston amp Spicer (1998) and Gaston(2000) from data in Judas (1988)

Oacute Blackwell Science Ltd 2001 Journal of Biogeography 28 827plusmn830

828 M Williamson K J Gaston and W M Lonsdale

Loi de puissanceArrhenius8 a eacutetabli le modegravele de base dit loi de puissance

119878119860 = 119888119860119911 (221)

119860 est la surface 119878119860 est le nombre drsquoespegraveces dans 119860 119888 et119911 des paramegravetres

Preston9 a montreacute que si la distribution des espegraveces est log-normale (sur un ensemble drsquoicircles) la SAR (le nombre drsquoespegravecesen fonction de la surface de chaque icircle mais en aucun cas laSAC de chaque icircle) suit une loi de puissance et a eacutetabli quela puissance 119911 valait environ 026 (agrave partir de donneacutees empi-riques pas par neacutecessiteacute theacuteorique) On notera que le nombredrsquoespegraveces est clairement fini dans ce cadre mais que la SARnrsquoa pas drsquoasymptote les deux notions ne sont pas eacutequivalentesLa loi de puissance peut donc ecirctre borneacutee Le glissement drsquounmodegravele de biogeacuteographie des icircles agrave un cadre plus geacuteneacuteral estfaisable simplement agrave la maniegravere de Hubbell10 pour la theacuteorieneutre chaque icircle peut ecirctre consideacutereacutee comme une commu-nauteacute locale issue drsquoune meacuteta-communauteacute reacutegionale

La distribution log-normale de Preston dite laquo canonique raquoassumait une relation particuliegravere entre le nombre drsquoespegraveceset le nombre drsquoindividus pour laquelle May11 a montreacute quela valeur exacte de 119911 est 025 Les reacutesultats empiriques ulteacute-rieurs12 pour des lois quelconques non canoniques ont four-ni des valeurs geacuteneacuteralement comprises entre 02 et 03 Unelarge meacuteta-analyse13 agrave partir de 794 SAR drsquoorigine tregraves diffeacute-

221 La relation drsquoArrhenius 255

15W M Lonsdale laquo Global Pat-terns of Plant Invasions and theConcept of Invasibility raquo In Ecolo-gy 805 (1999) p 1522-1536 doi 102307176544

16S J Gould laquo An Allometric In-terpretation of Species-Area Curves The Meaning of the Coefficient raquoIn The American Naturalist 1143(1979) p 335-343 doi 10 1086 283482

17J B Plotkin et al laquo Predic-ting Species Diversity in Tropical Fo-rests raquo In Proceedings of the Natio-nal Academy of Sciences of the Uni-ted States of America 9720 (2000)p 10850-10854 doi 101073pnas972010850

18J Harte et al laquo Self-Similarityin the Distribution and Abundanceof Species raquo In Science 2845412(1999) p 334-336 doi 10 1126 science2845412334

rentes fournit une moyenne de 027 comme la meacuteta-analysede la figure 221 extraite de Williamson et al14 agrave partir dedonneacutees de Lonsdale15 mais avec une certaine variabiliteacute queles auteurs relient agrave lrsquoeacutechelle spatiale au type drsquoorganismes etaux habitats eacutechantillonneacutes mais aussi agrave la technique drsquoeacutechan-tillonnage

Le paramegravetre le plus variable de la loi de puissance restedonc 119888 un facteur drsquoeacutechelle deacutependant de la richesse de lrsquoha-bitat

Repreacutesenteacutee en logarithmes la relation est une droite (fi-gure 221)

ln 119878119860 = ln 119888 + 119911 ln 119860 (222)

La constante 119888 est ignoreacutee par la majoriteacute de la litteacuterature16

mais preacutesente un inteacuterecirct pour la comparaison de courbes demecircme pente La remarquable constance de la valeur de 119911 estdonc utile ici Le rapport des valeurs de la constante pourdeux reacutegions par exemple permet de comparer leur richesse agrave taille identique les icircles Philippines ont 6 fois plus drsquoespegravecesdrsquooiseaux que lrsquoarchipel de Hawaiuml (119911 = 0 31 119888 vaut respecti-vement 12 et 2) Sur un mecircme territoire le rapport entre lenombre drsquoespegraveces de deux taxons est le rapport des constantessi 119911 est identique par exemple 15 espegraveces drsquooiseaux par es-pegravece de plante dans une partie de lrsquoarchipel drsquoHawaiuml

Le modegravele de PlotkinPlotkin et al17 ont eu accegraves agrave de grands eacutechantillons (5

placettes de 50 hectares de forecirct dans lrsquoensemble du mondetropical figure 222 toutes deacutetermineacutees correctement sur leplan botanique et dans lesquels chaque arbre est positionneacute)Ils montrent que le modegravele drsquoArrhenius comme les SAD clas-siques rendent mal compte de la reacutealiteacute (figure 223a) quandon les compare aux courbes drsquoaccumulation agrave lrsquoeacutechelle locale

shows however ai is not constant for any range of areas between1 m2 and 50 ha Hence tropical forests are conclusively notself-similar at these scales The empirical form of the spatialpersistence curve and its departure from self-similarity mayresult in part from aggregation of conspecificsmdasha possibility thatwe explore in detail elsewhere (29)

A Differential Equation ApproachInstead of self-similarity we find a consistent functional rela-tionship between ai and the area A in all five forests (Fig 2b)This observation is striking in light of the forestsrsquo disparategeographic locations climates and overall species diversitiesWe now introduce the spatial persistence function a(A) as acontinuous extension of ai In the appendix we use the persis-tence values of our data to derive a canonical two-parametermodel of a(A) Once this function has been derived we obtainthe SAR by solving the differential equation

2log2a~A 5AS

Using the diversity measured in a small area as the initialcondition in Eq 2 we may predict the diversity of a much largerarea if we know a(A)

In the appendix we derive Eq 2 and find a general solutionof the form S 5 cAzexp[P(A)] where P(A) is an infinitepolynomial in A We can truncate after the first n terms to obtainan approximate solution Truncating after the first term leads tothe expression

S cAze2kA [3]

Here c z and k are constants determined by a(A) Thisapproximate solution is less accurate than the complete solutionto Eq 2 and it is only valid for a limited range of areasNevertheless the approximation has the obvious advantage ofsimplicity If we let n 3 ` then we recover the full solution to

Eq 2 if we let n 3 0 then we reduce to the power law Hencethe power law is a zeroth-order special case of our general modelfor the SAR

Eq 2 accurately predicts diversity given only a small amountof data Because the persistence curves are similar across the fiveplots (Fig 2b) we may use the canonical form of a(A) fit at oneplot to predict diversity for another plot For example usingBCIrsquos persistence curve to determine a(A) and using the diver-sity in a single ha of Pasoh as the initial condition we can predictthe 50-ha diversity of Pasoh within 3 on average (Fig 3)Conversely Pasohrsquos persistence function predicts BCIrsquos totaldiversity with 4 average error and Lambirrsquos diversity with 9error from a single ha of data

Fig 3 illustrates the extrapolative ability of Eq 2 as comparedwith the classical models of the SAR The precision of ourmethodmdashnamely the ability to predict 50-ha diversity within 5at Pasoh and BCI and 10 at Lambirmdashis an improvement overother previous methods It is 1- to 7-fold more precise thanFisherrsquos alpha (23) and 5- to 10-fold more precise than the powerlaw On the one hand the increased precision of our method isnot surprising we have used two parameters to describe a(A) asopposed to the classical models which generally require oneparameter On the other hand given the interplot similarity ofpersistence curves in practice we need only measure one pa-rametermdashthe diversity of a single hamdashto extrapolate diversityvia Eq 2

Implications and ConclusionsWe have analyzed the largest existing data set of location-mapped trees in tropical forests We find that the SAR showsconsistent deviations from the power law on all spatial scales thatwere studied ranging from 1 m2 to 50 ha Hence self-similaritydoes not hold over this range of areas (There is the possibilitythat tropical forests are self-similar over scales greater than 50ha but in the absence of further data this remains speculative)

Fig 1 The locations of five tropical forest plots across the globe Each census encompasses 50 ha of forest within which every woody stem greater than 1 cmin diameter has been identified to species measured for girth and spatially mapped to 1-m accuracy The name country number of trees and number ofspecies is indicated for each plot The forests vary widely in species diversity and environment Pasoh and Lambir (Malaysia) are evergreen dipterocarp rainforestsBCI (Panama) is a lowland moist forest with a 4-month dry season HKK (Thailand) and Mudumalai (India) are the only forests that are regularly subject to firesFor a complete list of references consult the Center for Tropical Forest Science web site at httpyywwwstriorg

Plotkin et al PNAS u September 26 2000 u vol 97 u no 20 u 10851

Fig 222 Les cinq dispositifs dePlotkin et al Chaque dispositifmesure 50 ha et toutes les tiges dediamegravetre supeacuterieur agrave 1 cm sontcartographieacutees et deacutetermineacutees

Harte et al18 ont montreacute que la loi de puissance eacutetait eacutequi-valente au modegravele drsquoautosimilariteacute deacuteriveacute de la theacuteorie desfractales On considegravere un rectangle 119860119894 dont le rapport lon-gueur sur largeur vaut

radic2 On obtient le rectangle 119860119894+1 en

19Plotkin et al laquo Predicting Spe-cies Diversity in Tropical Forests raquocf note 17 p 255

20Ibid

placcedilant deux rectangles 119860119894 cocircte agrave cocircte (et donc le rectangle119860119894minus1 en coupant 119860119894 en deux) 119878119860119894 est le nombre drsquoespegraveces ren-contreacutees dans 119860119894 On deacutefinit enfin 119886119894 = 119878119860119894minus1 119878119860119894 le facteurde diminution du nombre drsquoespegraveces (dit paramegravetre de persis-tance) lieacute agrave la division par 2 de la taille du rectangle

Fig 223 Courbes aire-espegraveces(a) et paramegravetre de persistance en

fonction de la surface (b) dans 5forecircts tropicales Le modegravele

drsquoArrhenius est repreacutesenteacutee par leparalleacutelogramme sur la figure a

pour une gamme de valeurs de laconstante Elle implique que la

relation aire-espegraveces repreacutesenteacutee enlogarithmes soit une droite dont

la position deacutepend de la constantece qui nrsquoest visiblement pas le cas

These results might have some bearing on the longstandingcontroversy surrounding SARs Previous research has focusedon why the SAR has different slopes in different ecosystems (11)but in our extensive data the SAR does not possess a constantslope whatsoever

Instead of self-similarity we propose a model of the SARbased on the spatial persistence function which generalizes thepower law This framework allows us to predict 50-ha diversityfrom small-scale samples with greater accuracy than ever beforeCandidate logging protocols often are assayed at the 50- to100-ha scale and they are evaluated on the proportion ofdiversity that regenerates as estimated from a small census (24)Hence an accurate method to extrapolate 50-ha diversity froma small census will greatly benefit in the formulation of protocolsfor sustainable forestry and for biodiversity surveys (25) Fur-thermore our methods may be extended to estimate landscape-scale diversity (see Appendix) These advances may induceecologists to focus on the persistence curve itself as a unifyingconcept The search for a biological mechanism that explains theobserved persistence patterns offers an important challenge toecology In the meantime our theory provides a valuable tool forconservation planning and a practical method for estimatingdiversity in the field

AppendixIn this appendix we provide the details behind the derivation ofEq 2 its solution and its application to extrapolating diversity

Derivation of Eq 2 Given the definition of the spatial persistenceparameter ai 5 SiySi21 we start by deriving its relationship tothe slope of the SAR All logarithms are henceforth taken basetwo

2log~ai 5 2 logS Si

Si 2 1D

5log~Si 2 12 log~Si

log~Ai 2 12 log~Ai [4]

The last equality follows because Ai21yAi 5 2 The final quantityin Eq 4 measures the slope of a small chord on the log-log SARto the right of log(Ai) We conclude that

2 log~ai d log Sd log A

U log~Ai [5]

where i is now a continuous variable To be more precise thechord to the right of log(Ai) is an estimate of the derivative atlog(A(i1(i21))2) Note that Eq 5 clearly illustrates the equiva-lence between self-similarity (constant a) and the power law(constant dlogSydlogA)

Eq 2 follows easily from Eq 5 using the fact that dlogSydlogA 5 AyS z dSydA Note that Eq 2 is a strict generalizationof self-similarity if a(A) is constant then Eq 2 reduces to thepower law If a(A) 5 exp(21ylogA) then Eq 2 reduces toS(A)logA Hence Eq 2 also generalizes the logarithmic lawsuggested by Gleason (26)

Diversity Extrapolation Eq 2 together with the interplot simi-larity of the persistence curves provide a method for extrap-olating diversity over many spatial scales For example toextrapolate diversity from a subsample of Pasoh we use BCIdata to fit a(A) and then we solve Eq 2 according to the smallinitial condition measured at Pasoh In effect this processtranslates BCIrsquos log-log SAR so that it coincides with Pasohrsquosinitial condition nevertheless the universality between theforests is described more simply in terms of the persistenceparameter ai

We choose to model the persistence values ai with thesimple two-parameter family of curves 1frasl4F[(a 2 i)yb] 1 3frasl4(Other choices such as a cubic model are also possible andproduce accurate predictions at these scales and beyond Seebelow) Here F(x) is the lsquolsquoerror functionrsquorsquo given by the cumu-lative distribution of the Gaussian F(x) 5 (2y=p)z0

xe2t2dtThe parameter a moves the inf lection point of the persistencecurve horizontally and b determines the slope at the inf lectionpoint Hence b measures the maximal lsquolsquoaccelerationrsquorsquo ofdiversity with area and a measures the spatial scale at whichacceleration is maximized The best-fit at BCI is given by a 5856 b 5 808 For Pasoh a 5 773 b 5 741 for Mudumalaia 5 706 and b 5 776

We may express all solutions to Eq 2 in the form S 5cAzexp[P(A)] where P(A) is a polynomial in A of arbitrarydegree n with no constant term Once we specify a and b weexpand 2log(a(A)) in a Taylor series of order n around the pointA 5 25 ha The resulting separable equation can always be solvedin closed form yielding P For example using Pasohrsquos a and bto determine a(A) the approximate solution of order n 51 is

Fig 2 Graphs of the SAR and the spatial persistence parameter for each offive tropical forests (a) Log-log graph of the observed species-area data Eachplot encompasses a total area A0 5 50 ha We measure the mean speciesdiversity Si found in disjoint patches obtained by repeated bisections of A0The log-log species-area data are concave down for all five plots The SAR isapproximated loosely by the power law z 5 025 whose slope is indicated bythe trapezoid (red) (b) The persistence parameter ai 5 SiySi21 provides asensitive tool for analyzing SARs and testing self-similarity Self-similaritywould predict constant a 22025 084 shown in red All five persistencecurves are seen to depart from the power-law model over the entire range ofareas

10852 u wwwpnasorg Plotkin et al

Srsquoil srsquoagit drsquoune constante 119886 indeacutependante de la taille durectangle lrsquohabitat est dit auto-similaire lrsquoaugmentation dunombre drsquoespegraveces ne deacutepend pas de lrsquoeacutechelle drsquoobservation Sicette condition est respecteacutee le nombre drsquoespegraveces suit la loide puissance et 119886 = 2minus119911 Pour la valeur classique de 119911 = 0 25119886 = 0 84 La figure 223b19 preacutesente la valeur de 119886119894 en fonctionde la surface eacutechantillonneacutee Elle augmente avec la surface cequi infirme le modegravele drsquoautosimilariteacute

Plotkin et al20 ne supposent pas 119886119894 constant et lui im-posent simplement drsquoecirctre une fonction de la surface choisiearbitrairement pour permettre les calculs ulteacuterieurs et dontla forme correspond aux observations de la figure 223b Apregravescalculs la relation aire-espegraveces est 119878119860 asymp 119888119860119911119890minus119901(119860) 119901(119860) estun polynocircme de degreacute 119899 de 119860 sans constante Les monocircmessont drsquoautant moins importants que leur degreacute est eacuteleveacute Lrsquoap-proximation de degreacute 0 est la loi de puissance Celle de degreacute1 est retenue par les auteurs pour estimer le nombre drsquoespegravecesrencontreacutees sur la surface 119860

222 Le modegravele de Gleason 257

21Gleason laquo On the Relation bet-ween Species and Area raquo cf note 3p 233

22Arrhenius laquo Species and Area raquocf note 8 p 254

24C B Williams laquo Patterns inthe Balance of Nature raquo In Theore-tical and Experimental Biology Aca-demic Press 1964

119878119860 = 119888119860119911119890minus119896119860 (223)

given by S(A) 5 S(1ha)zAzekA where z 5 0125 and k 52566z1024 For Mudumalai z 5 0161 and k 5 2541z1024 Thisapproximation is only valid for A 50 ha but its accuracycompares well with the complete numerical solution it predicts50-ha diversity with average error 4 at Pasoh 9 at BCI and16 at Lambir

In practice a numerical solution of Eq 2 yields the mostaccurate SAR We used the Fehlberg-Runge-Kutta method togenerate the prediction shown in Fig 3 The initial conditionS(1ha) for Fig 3 was determined by the diversity of a singlerandom 1-ha subplot of Pasoh The confidence interval wasconstructed from 1000 independently sampled 1-ha initialconditions

We have divided our five plots into two categories those thatsuffer regular disturbance and those that do not The twotropical forests subject to regular fires HKK and Mudumalaigenerally should not be modeled via the persistence curve froma more stable moist tropical forest The values of a1 to a6 aregenerally smaller at HKK and Mudumalai than the other threeforests This reflects the fact that HKK and Mudumalai aresubject to more disturbances causing greater patchiness Thepersistence curve at Mudumalai can predict HKK and converselywithin 17 given 1 ha of data Compared with BCI Pasoh andLambir the accuracy of Eq 2 has been decreased by thedisturbances at Mudumalai and HKK Nevertheless 17 erroris still preferable to the 28 error-rate or worse given by Fisherrsquos

alpha or a power law on these disturbed forests In practice whenestimating diversity in a new forest the ecologist should firstdetermine the frequency of disturbances (eg fires hurricanesor roaming elephants) and choose a model forest where a andb are known accordingly

Extrapolation Beyond 50 ha For 50-ha predictions such as wouldbe useful to assess logging protocols F provides a simpletwo-parameter model of the persistence curve For largerareas however a cubic model (which works as well as F at 50ha) is often more effective For example we can use a cubicpersistence curve calibrated at Pasoh to extrapolate the di-versity of the entire BCI which occupies 1500 ha from a 1-hasample Using Eq 2 the predicted diversity for all of BCI is436 6 32 species (1 SD) This estimate compares favorably withCroatrsquos f loral count of 450 tree and shrub species on the island(27) For even larger areas the persistence curve should beparameterized by using multiple small censuses spread acrossthe landscape (as in ref 28) although such techniques requirefurther development

We sincerely thank Alice Chen Jay Rosenheim Stuart Davies EgbertLeigh Bill Bossert Burt Singer Steve Pacala Jerome Chave and SimonLevin for many helpful discussions We are especially grateful to HeleneMuller-Landau Bob Holt and Robert May for their conceptual andeditorial input JBP is supported by a National Science Foundationgraduate fellowship

1 May R (1999) Philos Trans R Soc London B 354 1951ndash19592 Reid W amp Miller K (1989) Keeping Options Alive The Scientific Basis for

Conservation Biology (World Resources Institute Washington DC)3 Reid W (1992) in Tropical Deforestation and Species Extinction eds Whit-

more T amp Sayer J (Chapman amp Hall London) pp 55ndash734 Simberloff D (1986) in Dynamics of Extinction ed Elliot D (Wiley New

York) pp 165ndash180

5 Raven P (1988) in Biodiversity eds Wilson E O amp Peter F (Natl AcadPress Washington DC) pp 119ndash122

6 Wilson E O (1988) in Biodiversity eds Wilson E O amp Peter F (Natl AcadPress Washington DC) pp 3ndash18

7 May R Lawton J amp Stork N (1995) in Extinction Rates eds Lawton J ampMay R (Oxford Univ Press Oxford) pp 1ndash24

8 Pimm S amp Raven P (2000) Nature (London) 403 843ndash845

Fig 3 The actual SAR at Pasoh (black) compared with the SAR predicted by our model and three classical models Assuming that individuals scale linearly witharea MacArthurrsquos lsquolsquobroken stickrsquorsquo distribution of relative abundances the canonical lognormal distribution and Fisherrsquos log series each yields a one-parametermodel of the SAR (green red and blue respectively) The first two of these models were parameterized by using 25 ha of Pasoh data 1 ha was used toparameterize the log series The log series provides a fairly accurate model but it overestimates 50-ha diversity by 21 The canonical log normal accounts forsteeper slopes at small areas and gentler slopes at large areas and hence it is more accurate than the broken stick (17) Our persistence method (yellow) requirestwo parameters fit by using any other forest and an initial condition obtained from 1 ha of Pasoh data The persistence method extrapolates 50-ha diversitywith 3 average error The figure indicates a 1-SD confidence interval around the extrapolation

Fig 224 Performance du modegravelede Plotkin face agrave des distributionstheacuteoriques SAD log-normalesmodegraveles de Fisher et Broken Stickde MacArthur La courberepreacutesente le nombre drsquoespegravecesrencontreacutees agrave Pasoh sur dessurfaces de 0 agrave 50 ha Les donneacuteesobserveacutees sont des tiragesaleacuteatoires drsquoeacutechantillons de lasurface souhaiteacutee Lrsquoeacutecart-type estrepreacutesenteacute (lrsquointervalle defluctuation agrave 95 est de lrsquoordre de2 eacutecart-types) Les valeurs issuesdu modegravele ont eacuteteacute obtenues par unparameacutetrage de 119896 et 119911 sur 25 hasupposeacute valide eacutegalement sur lesautres forecircts Le parameacutetrage de 119888est obtenu par un eacutechantillon drsquounhectare reacutepeacuteteacute 1000 fois pourobtenir un intervalle de confianceLrsquointervalle de fluctuation agrave 95est ici encore de lrsquoordre de deuxeacutecart-types

Ce modegravele contient un paramegravetre 119896 en plus de la loi de puis-sance Les auteurs ont eacutetabli que les paramegravetres 119896 et 119911 eacutetaienttregraves proches pour les cinq forecircts (119911 = 0 125 et 119896 = 0 0541agrave Pasoh) et que leur estimation sur une forecirct permettait depreacutedire avec une tregraves bonne preacutecision la richesse des autres agravepartir drsquoun eacutechantillon drsquoun hectare neacutecessaire pour obtenir leparamegravetre 119888 La figure 224 compare les performances de cettemeacutethode (persistence method) de la loi de puissance 025 (loilog-normale) et du modegravele de Fisher

222 Le modegravele de GleasonGleason21 reacutefute le travail drsquoArrhenius22 agrave partir de lrsquoargu-

ment selon lequel le nombre drsquoespegraveces doit se stabiliser quandla surface augmente au risque de preacutevoir une richesse beau-coup trop eacuteleveacutee pour de grandes surfaces Les travaux ulteacute-rieurs lui donneront tort23

Gleason propose une relation dans laquelle le nombre drsquoes-pegraveces (et non son logarithme) croicirct avec le logarithme de lasurface

119878119860 = ln 119888 + 119911 ln 119860 (224)

C B Williams24 reprend ce modegravele et affirme sa validiteacute agravepartir drsquoarguments sur la variabiliteacute de lrsquohabitat quand la sur-face drsquoeacutechantillonnage augmente (par opposition agrave la relationdrsquoArrhenius applicable dans un habitat homogegravene et due agrave la

25E F Connor et E D McCoylaquo The Statistics and Biology of theSpecies-Area Relationship raquo In TheAmerican Naturalist 1136 (1979)p 791-833 doi 101086283438

26Preston laquo The Canonical Dis-tribution of Commonness and Rarity Part I raquo cf note 9 p 254

27Coleman laquo On Random Place-ment and Species-Area Relations raquocf note 4 p 244 B D Coleman etal laquo Randomness Area and SpeciesRichness raquo In Ecology 634 (1982)p 1121-1133 doi 1023071937249

distribution log-normale des espegraveces selon Preston) Connor etMcCoy25 discutent de la faccedilon de tester les deux hypothegravesesmais ne disposent pas des donneacutees pour le faire

223 Le modegravele de placement aleacuteatoire

Fig 225 Relation aire-espegravece deColeman Les axes sont en eacutechelle

logarithmique Les pointsrepreacutesentent des releveacutes de nombre

drsquoespegraveces drsquooiseaux (en 1979) enfonction de la taille des icircles ougraveelles se trouvaient La ligne en

pointilleacutes courts est lrsquoajustementdrsquoune loi de puissance (modegravele

drsquoArrhenius) Les pointilleacutes longcorrespondent du modegravele de

Gleason La courbe continue estlrsquoajustement du modegravele de

placement aleacuteatoire Un test dequaliteacute drsquoajustement montre que lemodegravele de placement aleacuteatoire est

le plus proche des donneacutees

BERNARD D COLEMAN ET AL Ecology Vol 63 No 4

FIG4 Species-area data for two years The observed values of IS are plotted against log ( 1 8 1978 0 1979 The two nearly coincident curves show SIS calculated from Eq I0 using the values of n for each year - - - 1978 - 1979

1979 separately to determine the parameter pairs (c z ) and (G K ) by least-squares linear regression analyses based on Eq 3 (the logarithmic form of Eq 1 ) and Eq 2 (with log = log) The results are given in Table 3 and Fig 5 As log s (appearing in Eq 3) is not finite a t s = 0 for these calculations we set aside the data points with s = 0 and took the total number of islands to be K = I5 in 1978 and ti = 27 in 1979 instead of the actual values (ti = 17 for 1978 and ti =

30 for 1979) In Table 3 we list the values that these constants give to the root mean-square deviations A A and A associated with Eqs 1 2 and 10

TABU 3 Values of the Parameters in Eqs 2 and 3 derived from the data in Table 1 by linear regression analysis

Parameters 1978 1979

K 15 27

Power function 4298 0600 58

4993 0543 41

Exponential function G K

A Random placement

6549 14453 39

8333 12743 34

FIG5 Comparison of observed values of s with those calculated from the power function of Eq I the exponential relation of Eq 2 and the expected species-area function S derived from the hypothesis of random placement (Eq 10) The parameter pairs ( c z ) and (G K ) are as in Table 3

A = 7 [ s ~- CN~]) (15)K =

A2 1 h I = x [s) - G - K log ai12 ( 16)

1 h AZ = 7x [sii - ~(CY))] (17)K I=

It is interesting that the standardized measures of de- viation A A and A while differing greatly among themselves are approximately reproducible from year to year Our calculations show clearly that

En concurrence au modegravele de Preston26 preacutedisant une SARen forme de loi de puissance Coleman27 propose le modegravele deplacement aleacuteatoire (random placement) Lrsquoideacutee sous-jacenteest que certaines communauteacutes ont une composition laquo aleacutea-toire raquo crsquoest-agrave-dire issues drsquoun simple eacutechantillonnage de lameacuteta-communauteacute Coleman ne preacutetend pas que la SAR desarbres de forecirct tropicale suive son modegravele mais que ce soit lecas par exemple pour les oiseaux agrave une eacutechelle spatiale limiteacutee

Plusieurs icircles (communauteacutes locales) de taille relative 119901119894appartiennent agrave un ensemble (meacuteta-communauteacutes) dans le-quel la distribution des espegraveces n est consideacutereacute comme connueChaque individu drsquoune espegravece donneacutee peut se placer sur unequelconque des icircles avec une probabiliteacute eacutegale agrave 119901119894 La pro-babiliteacute qursquoun individu au moins de lrsquoespegravece 119904 se trouve surlrsquoicircle 119894 est 1 minus (1 minus 119901119894)119899119904 (1 moins la probabiliteacute que tous lesindividus de lrsquoespegravece se trouve sur une autre icircle elle-mecircmeeacutegale agrave 1minus119901119894 pour tous les individus) Lrsquoespeacuterance du nombredrsquoespegraveces repreacutesenteacutees sur lrsquoicircle 119894 est donc

120124 (119878119894ne0) = 119878 minus sum

119904(1 minus 119901119894)

119899119904 (225)

Ce modegravele ne fait aucune hypothegravese sur la distributionde la probabiliteacute des espegraveces et nrsquoassume que lrsquoindeacutependancedes individus et la proportionnaliteacute entre la probabiliteacute depreacutesence et la surface Formellement il srsquoagit donc drsquoune

28Coleman et al cf note 27fig 3

29Coleman laquo On Random Place-ment and Species-Area Relations raquocf note 4 p 244

30H Gaacutercia Martiacuten et N Golden-feld laquo On the Origin and Robustnessof Power-Law Species-Area Relation-ships in Ecology raquo In Proceedings ofthe National Academy of Sciences ofthe United States of America 10327(2006) p 10310-10315 doi 101073pnas0510605103

31P Wuumlrtz et A Annila laquo Rootsof Diversity Relations raquo In Journalof Biophysics 2008 (2008) Article ID654672 doi 1011552008654672

32S Engen laquo On Species Frequen-cy Models raquo In Biometrika 612(1974) p 263-270 doi 10 2307 2334353

33Engen laquo Exponential and Lo-garithmic Species-Area Curves raquo cfnote 20 p 92

34Connor et McCoy cf note 25

35K A Triantis et al laquo The Is-land SpeciesndashArea Relationship Bio-logy and Statistics raquo In Journal ofBiogeography 392 (2012) p 215-231doi 101111j1365-2699201102652x

36Dengler laquo Which Function Des-cribes the Species-Area RelationshipBest A Review and Empirical Eva-luation raquo cf note 2 p 10

37Preston laquo Time and Space andthe Variation of Species raquo cf note 8p 234

courbe drsquoaccumulation drsquoespegraveces Sur des donneacutees de richesseen nombre drsquoespegraveces drsquooiseaux reproducteurs dans les icirclesdrsquoun lac nord-ameacutericain le modegravele srsquoajuste mieux que ceuxdrsquoArrhenius et de Gleason (figure 225)28

Le modegravele de Coleman est parfois utiliseacute agrave lrsquoeacutechelle localepour construire une courbe drsquoaccumulation par rareacutefaction29

119878 est alors la richesse de la communauteacute et 119901119894 la proportion dela surface de la communauteacute inventorieacutee La courbe est traceacuteepour les valeurs de 119901 minus 119894 entre 0 et 1 La fonction specaccumde vegan permet de calculer une SAC selon ce modegravele

224 SynthegraveseLa relation drsquoArrhenius est plus robuste que celle de Glea-

son selon les reacutesultats empiriques et des consideacuterations theacuteo-riques30 y compris de thermodynamique31

Engen32 geacuteneacuteralise le modegravele de Fisher en autorisant desvaleurs neacutegatives du paramegravetre 119896 de la loi binomiale neacutegativeDans le modegravele de Fisher ce paramegravetre est lrsquoinverse de lavariabiliteacute de lrsquoespeacuterance du nombre drsquoindividus observeacutes parespegravece qui tend vers 0 car la variabiliteacute est tregraves grande Ilperd son sens quand il devient neacutegatif mais lrsquoespeacuterance dunombre drsquoespegraveces en fonction de la surface a une forme plusgeacuteneacuterale 33

120124 (119878119899) = 120572119896 [1 minus ( 120572

120572 + 119899)119896] (226)

Lrsquoeacutequation (204) en est la limite pour 119896 rarr 0 Pour minus1 lt119896 lt 0 avec 119860 suffisamment grand lrsquoeacutequation (226) revient agravela relation drsquoArrhenius ougrave 119911 = minus119896 Les deux relations peuventdonc ecirctre obtenues agrave partir du mecircme modegravele matheacutematiquedont seul le paramegravetre 119896 diffegravere mais aucune interpreacutetationbiologique sur le choix du paramegravetre nrsquoest possible

Empiriquement il est difficile drsquoestimer lequel des modegravelesest le plus adapteacute aux donneacutees sur 35 jeux de donneacuteesConnor et McCoy34 montrent que les reacutegressions de 119878 ou ln 119878en fonction de 119860 ou ln 119860 ont des performances similaires entermes de qualiteacute drsquoajustement (1198772) mais Triantis et al35

valident largement le modegravele drsquoArrhenius pour des SARinsulaires Ce reacutesultat est conforme agrave celui de Dengler36 qui atesteacute 23 types de SAR et conclu que la loi de puissance est lemodegravele le plus universel

Preston37 argumente en faveur du modegravele drsquoArrhenius (eten deacutefaveur de celui de Gleason) aux eacutechelles intermeacutediaireset montre que la courbe aire-espegraveces est triphasique (figure226) Ce reacutesultat fait maintenant consensus mais pas la deacute-limitation des trois eacutechelles ni la forme de la relation aux

39B J McGill laquo A Test ofthe Unified Neutral Theory of Bio-diversity raquo In Nature 4226934(2003) p 881-885 doi 10 1038 nature01583

40Volkov et al laquo Neutral Theo-ry and Relative Species Abundance inEcology raquo cf note 33 p 17

42Volkov et al laquo Neutral Theo-ry and Relative Species Abundance inEcology raquo cf note 33 p 17 figure 1

43J Grilli et al laquo Spatial Aggre-gation and the SpeciesndashArea Rela-tionship across Scales raquo In Journalof Theoretical Biology 3130 (2012)p 87-97 doi 101016jjtbi201207030

eacutechelles extrecircmes On notera que la partie locale de la courbeest en geacuteneacuteral une courbe drsquoaccumulation alors que les zonesB et C sont traiteacutees comme des SAR au sens strict

Hubbell38 chapitre 6 eacutetablit que le modegravele de Fisher estpertinent agrave lrsquoeacutechelle de la meacuteta-communauteacute et donc de lacommunauteacute locale en absence de limitation de la dispersion(si le taux de migration m vaut 1 la communauteacute locale est uneacutechantillon de la meacuteta-communauteacute) Dans ce cas la SAR ala forme de la courbe de la figure 226 zone A et lrsquoindice 120572 deFisher est le bon outil de mesure Mais la dispersion est limiteacuteeet la distribution de la communauteacute locale est plus compliqueacuteeMcGill39 montre qursquoune SAD log-normale srsquoajuste mieux auxdonneacutees que le modegravele neutre selon les reacutesultats de HubbellVolkov et al40 eacutetablissent la SAD neutre de faccedilon analytiquequi srsquoajuste mieux aux donneacutees que le modegravele log-normal maisla traduction en SAR nrsquoest pas faite

Fig 226 Relation aire-espegravecetriphasique [Grilli2012] Zone B

relation drsquoArrhenius

suggested later on have dealt with spatial features only implicitly orthe predictions are obtained via scaling relations (Zillio et al 2008)Within such approaches the dispersal abilities of species are capturedonly approximately although in an analytical tractable way Spatiallyexplicit models represent a substantial step towards a more realisticstudy of ecosystems but present much greater theoretical challengeswith respect to their implicit counterparts In fact spatial ecologicalmeasures such as the speciesndasharea relationship crucially dependon the behavior of multiple points correlation functions and anytruncation would inevitably impair the predictions As a consequenceone needs to solve the model in full generality a task that is highlynon-trivial because stochastic theories defined on space often havestationary states for which detailed balance does not hold Thiscondition ensures that at stationarity the probability to go from oneconfiguration to another one is the same as the reversed transition(Van Kampen 1981 Zia and Schmittmann 2007) Recently OrsquoDwyerand Green (2010) have derived the SAR from a fully spatially explicitmodel by using field theoretical techniques However their findingswere implicitly obtained under the assumption that the detailedbalance is satisfied a condition that is not correct for their model

Within a neutral setting we introduce a simple mechanismwhich is able to produce a tri-phasic SAR and can be explained insimple geometrical terms The model is based on the Poissoncluster processes (Cressie 1993 Illian et al 2009) and allows usto derive the SAR the endemic area relationship and also thespatial scaling of the RSA

2 Emergent geometry of Poisson cluster processes

Poisson cluster processes and NeymanndashScott processes (Cressie1993 Illian et al 2009 Thomas 1949 Neyman and Scott 1958Diggle 1984) (PCP in the following) are a very general frameworkuseful to analyze spatial ecological data and characterize populationaggregation (Plotkin et al 2000 Morlon et al 2008 Azaele et al2012) These processes are quite simple and based on the assump-tion that individuals are spatially clumped into clusters Specificallythe centers of clusters are distributed in space with a constantdensity independent of each other Each cluster is populated by arandom number of individuals (drawn from a given distribution)and the distance of each individual from the center of the cluster isdrawn from a given distribution (typically a Gaussian distributionwith a certain variance x2)

We consider a simplified version of the PCP in a homogeneouslandscape of area A0 assuming that

1 Species are independent of each other2 The individuals of any species are distributed around a single

center whose location is uniformly drawn within the landscape3 The position of individuals with respect to the center is drawn

from a given distribution fethrTHORN where r is the position withrespect to the center The distribution has a characteristic scalex above which it decreases exponentially

4 The number of individuals per species are drawn from a givenrelative species abundance (RSA) distribution SkethA0THORN

The assumption in item 3 takes into account that individualsbelonging to the same species are usually spatially aggregated(Plotkin 2000)mdashwe use a single cluster center (item 2) for the sakeof simplicity Here we do not focus on the biological mechanismsunderlying conspecific spatial aggregation but we account for it in aphenomenological fashion Because we assume that species areindependent (item 1) and every species is characterized by thesame model parameters the model is non-interacting and neutralas well

The model is formulated as neutral ie every species behaves inthe same way If neutrality holds and under the assumption ofspecies independence we can consider simply one species at a timeto calculate every quantity Within this model we can explicitlycalculate the SAR for a homogeneous and large landscape Underthese hypotheses we obtain the speciesndasharea relationship simplyfrom the probability of finding at least one individual in a given sub-region of area A by (OrsquoDwyer and Green 2010)

SethA9A0THORN frac14 StotethA0THORNX1k frac14 1

PkethA9A0THORN frac14 StotethA0THORNfrac121P0ethA9A0THORN eth1THORN

where StotethA0THORN is the total number of available species in the wholesystem with area A0 (ie

P1k frac14 0 SkethA0THORN) while PkethA9A0THORN is the

probability of finding exactly k individuals of a given species inthe sub-region of area A and has the following expression (seeAppendix A)

PkethA9A0THORN frac14

dlpethlTHORN1

d2rfrac12lR

Aethr THORNd2r 0 fethr 0THORNk

Aethr THORNd2r 0 fethr 0 THORN

eth2THORN

where AethrTHORN is a region of area A centered at the point r Thedistribution pethlTHORN is strictly related to the RSA SkethA0THORN implicitlydefined by the following equation

SkethA0THORN frac14 StotethA0THORN

dl pethlTHORNlkel

k eth3THORN

Interestingly the Eq (2) reduces to the random placement model(Coleman 1981) in its mean field version ie by considering fethrTHORN tobe constant On the other hand it is possible to relate the quantityfethrTHORN to the two point correlation function (see Appendix B) Thecorrelation function is proportional to the b-diversity (which is awell known measurable quantity in real systems (Condit et al2002) Specifically we obtain the following relation

G2ethrTHORN frac14l2SZ

d2y fethyTHORNfethyrTHORN eth4THORN

where l2Sfrac14R1

0 dl l2pethlTHORN Thus we can directly obtain an expres-sion for fethrTHORN when the correlation function By applying the Fouriertransform it is possible to invert Eq (4) obtaining bfethpTHORNp ffiffiffiffiffiffiffiffiffiffiffiffibG2ethpTHORN

q(where bfethpTHORN is the Fourier transform of fethrTHORN see Appendix B) Theformula in Eq (4) with an appropriate choice of fethrTHORN has the samestructure obtained with different models (Condit et al 2002 Zillioet al 2005)

Log Area

regional scales cont

Fig 1 Qualitative shape of the speciesndasharea relationship (Hubbell 2001) On local

spatial scales (region A) the trend is steep On intermediate spatial scales (region B)

the slope decreases and the curve is well approximated by a power law with

exponent z Finally on very large spatial scales (region C) the linear size of sampled

areas is much greater than the correlation length of biogeographic processes so that

the majority of species are completely independent of each other

J Grilli et al Journal of Theoretical Biology 313 (2012) 87ndash9788

Le meilleur modegravele agrave lrsquoeacutechelle locale est donc celui de Plot-kin et al41 qui reacutefute agrave la fois Gleason et Arrhenius La SACest concave sur une eacutechelle log-log (figure 223)

Lrsquoutilisation de lrsquoindice 120572 de Fisher est sujette agrave cautionpuisque la SAC locale ne correspond pas au modegravele (figure224) Sa valeur calculeacutee plus haut pour BCI est 35 tregraves dif-feacuterente de la valeur de 120579 du modegravele neutre pour les mecircmesdonneacutees42 entre 47 et 50

Lrsquoeacutechelle plus grande (zone B de la figure 226) est pourHubbell un assemblage drsquoun certain nombre de communauteacutescomposant la meacuteta-communauteacute (page 186) La SAR obte-nue par simulation suit la loi de puissance drsquoArrhenius Grilliet al43 deacuteveloppent un modegravele de SAR valable agrave toutes leseacutechelles Ses hypothegraveses sont peu reacutealistes dans la zone Amais il valide la loi de puissance analytiquement agrave lrsquoeacutechelleintermeacutediaire

La relation drsquoArrhenius est donc systeacutematiquementvalideacutee agrave lrsquoeacutechelle reacutegionale (figure 221) On remarquera

225 Estimation de la richesse agrave partir de placettes distantes 261

45Slik et al laquo An Estimate of theNumber of Tropical Tree Species raquo cfnote 63 p 47

47R Krishnamani et al laquo Estima-ting Species Richness at Large Spa-tial Scales Using Data from SmallDiscrete Plots raquo In Ecography 275(2004) p 637-642 doi 101111j0906-7590200403790x

48Harte et al laquo Self-Similarity inthe Distribution and Abundance ofSpecies raquo cf note 18 p 255

que la distribution de Fisher valideacutee par Hubbell pour lameacuteta-communauteacute nrsquoest jamais observeacutee dans la SAR agravecause de lrsquoagreacutegation spatiale en augmentant la surfacedrsquoeacutechantillonnage de nouvelles communauteacutes sont ajouteacuteesprogressivement mais lrsquoeacutechantillonnage de toute la meacuteta-communauteacute nrsquoest jamais reacutealiseacute (sauf au point marquant lepassage de la zone B agrave la zone C) Les seuls exemples empi-riques sont des inventaires drsquoarbres agrave lrsquoeacutechelle de lrsquoAmazonieentiegravere44 ou de la totaliteacute des forecircts tropicales45 qui corres-pondent agrave la distribution de Fisher Dans ces deux exempleslrsquoajustement est obtenu en extrapolant lineacuteairement la SADce qui est leacutegitime46 si la distribution est effectivement cellede Fisher la forme de la distribution est donc assumeacutee pasprouveacutee Les valeurs de 120572 agrave ces eacutechelles sont bien supeacuterieuresaux valeurs locales (35 pour BCI voir chapitre 20) 754 pourlrsquoAmazonie de lrsquoordre de 1000 pour les neacuteotropiques maisseulement de 250 pour lrsquoAfrique et de lrsquoordre de 2000 pourlrsquoensemble des tropiques

Enfin quand lrsquoeacutechelle est encore plus grande le nombredrsquoespegraveces augmente agrave nouveau plus vite parce que drsquoautresmeacuteta-communauteacutes sont inteacutegreacutees

225 Estimation de la richesse agrave partirde placettes distantes

Krishnamani et al47 drsquoapregraves Harte et al48 deacuteveloppentune meacutethode permettant lrsquoextrapolation de la richesse me-sureacutee sur de petites surfaces (48 placettes de 025 ha) agrave detregraves grandes zones (60000 kmsup2 la taille des Western Ghats enInde)

Partant de la relation drsquoArrhenius vue preacuteceacutedemment lenombre drsquoespegraveces dans une surface 1198601 est

1198781198601 = (11986011198600)119911 1198781198600 (227)

crsquoest-agrave-dire le nombre drsquoespegraveces dans la surface 1198600 pluspetite multiplieacutee par le rapport des surfaces agrave la puissance 119911La valeur de 119911 est constante pour des variations de surfacelimiteacutees Lrsquoideacutee est donc de proceacuteder par eacutetapes en partantdu nombre drsquoespegraveces mesureacute sur les petites placettes et extra-polant vers une surface plus grande Cette surface est ensuiteprise pour reacutefeacuterence pour une nouvelle extrapolation avec unenouvelle valeur de 119911 En indiccedilant les surfaces de 0 agrave 119899 onobtient

119878119860119899 = (119860119899119860119899minus1)119911119899minus1(119860119899minus1119860119899minus2)119911119899minus2 hellip (11986011198600)11991101198781198600 (228)

Il reste agrave eacutevaluer les diffeacuterentes valeurs de 119911 Agrave lrsquointeacuterieur dechaque placette lrsquoeacutequation (227) est suffisante Agrave plus grandedistance les auteurs utilisent lrsquoindice de Soslashrensen crsquoest-agrave-diredeux fois la fraction drsquoespegraveces communes entre deux placettes 120594 = 2(1198781 cap 1198782)(1198781 + 1198782) Lrsquoindice deacutepend principalementde la surface des placettes 119860 et de leur eacuteloignement 119889 Pourchaque plage de distances agrave conditions que les placettes soienteacuteloigneacutees (119889 eacutetant la distance entre deux placettes 119860 ≪ 1198892)120594 est proportionnel agrave (1198601198892)119911 La valeur de 119911 peut donc ecirctrecalculeacutee en comptant le nombre drsquoespegraveces communes entrechaque paire de placettes et ajustant ln 120594 agrave ln(1198601198892) sur desplages de distances convenables pour que 119911 reste constant etdonc que la relation soit lineacuteaire

Cette meacutethode permet lrsquoextrapolation agrave de tregraves grandessurfaces de mesures de richesse faites sur de petites placettesagrave condition qursquoelles soient assez nombreuses et eacuteloigneacutees lesunes des autres

1J Chave et E G Leigh laquo ASpatially Explicit Neutral Model of-Diversity in Tropical Forests raquo In Theoretical Population Biology 622(2002) p 153-168 doi 101006tpbi20021597

2R Condit et al laquo Beta-Diversity in Tropical Forest Trees raquoIn Science 2955555 (2002) p 666-669 doi 101126science1066854

3G Shen et al laquo QuantifyingSpatial Phylogenetic Structures ofFully Stem-Mapped Plant Communi-ties raquo In Methods in Ecology andEvolution 412 (2013) p 1132-1141doi 1011112041-210X12119

4Jurasinski et al laquo InventoryDifferentiation and Proportional Di-versity A Consistent Terminology forQuantifying Species Diversity raquo cfnote 12 p 163

Chapitre 23

Diversiteacute 120573 spatialement explicite

Lrsquoindice de Simpson spatialement explicite ou le variogramme de com-pleacutementariteacute relient la diversiteacute 120573 agrave la distance entre communauteacutes

Lrsquoessentiel

La diversiteacute 120573 de diffeacuterentiation mesure agrave quel point deuxcommunauteacutes sont diffeacuterentes entre elles Elle peut ecirctre relieacuteeagrave la distance entre les communauteacutes pour deacutefinir une diversiteacute120573 spatialement explicite

231 Lrsquoindice de Simpson spatialementexplicite

Chave et Leigh1 eacutecrivent un modegravele neutre de dispersiondes espegraveces forestiegraveres appliqueacute agrave lrsquoeacutechelle de lrsquoAmazonie oc-cidentale2 Ils deacutefinissent dans ce cadre la fonction 119865(119903) eacutegaleagrave la probabiliteacute que deux individus situeacutes agrave distance 119903 lrsquounde lrsquoautre soient de la mecircme espegravece crsquoest-a-dire lrsquoindice deconcentration de Simpson (328) appliqueacute agrave des paires drsquoindi-vidus distants 120573119904(119903) = 1minus119865(119903) est appeleacute laquo indice de Simpsonspatialement explicite raquo par G Shen et al3 En pratique il estestimeacute agrave partir drsquoindividus situeacutes dans des parcelles distantesde 119903 lrsquoordre de grandeur de 119903 eacutetant nettement plus grand quela taille des parcelles

De la mecircme faccedilon que lrsquoindice de Simpson est geacuteneacuteralisableagrave lrsquoindice de Rao 120573119904(119903) est geacuteneacuteralisable agrave 120573119901ℎ119910(119903) lrsquoindice deRao spatialement explicite eacutegal agrave la divergence moyenne entredeux individus situeacutes agrave distance 119903

Les deux mesures sont des entropies 120573 au sens ougrave ce sontdes diversiteacutes de diffeacuterenciation4 voir section 103 qui me-surent agrave quel point des uniteacutes spatiales distantes de 119903 sontdiffeacuterentes Ce ne sont pas des mesures de diversiteacute proportion-nelle parce que ce ne sont pas les diffeacuterences entre les entropies120574 (de la meacuteta-communauteacute composeacutee de toutes les parcelles) et

264 Diversiteacute 120573 spatialement explicite

5Nei laquo Analysis of Gene Diver-sity in Subdivided Populations raquo cfnote 27 p 195

7H H Wagner laquo Spatial Cova-riance in Plant Communities In-tegrating Ordination Geostatisticsand Variance Testing raquo In Ecolo-gy 844 (2003) p 1045-1057 doi 10 1890 0012 - 9658(2003 ) 084[1045 SCIPCI]20CO2

120572 (la moyenne des entropies des parcelles) Lrsquoavantage de cesmesures est drsquoecirctre facilement interpreacutetables estimables sansbiais (en tant qursquoentropies de Simpson ou de Rao) et indeacute-pendantes de la diversiteacute 120572

Une deacutecomposition due agrave Nei5 reprise par Chave et al6montre que 120573119904(119903) est en reacutealiteacute un meacutelange drsquoentropie 120572 et 120573Notons 119864119894119895 la probabiliteacute que deux individus tireacutes respective-ment dans les parcelles 119894 et 119895 soient drsquoespegraveces diffeacuterentes

119864119894119895 = 1 minus sum119904

119901119904|119894119901119904|119895 (231)

119864119894119894 est lrsquoentropie de Simpson calculeacutee dans la parcelle 119894Lrsquoentropie 120573 de Simpson (eacutequation (1212) dans le cadre dela deacutecomposition de la variance) pour des parcelles de poidseacutegal vaut

119864120573 = 11198682 sum

119894sum119895ne119894

(119864119894119895 minus 119864119894119894 + 1198641198951198952 ) (232)

En se limitant agrave deux parcelles 119894 et 119895 situeacutees agrave distance119903 le premier terme de la somme 119864119894119895 est lrsquoindice de Simpsonspatialement explicite qui doit ecirctre corrigeacute du deuxiegraveme termede la somme lrsquoentropie 120572 de la paire de parcelle pour obtenirlrsquoentropie 120573 apregraves la normalisation neacutecessaire (119864119894119895 = 119864119895119894 estcompteacute deux fois dans la somme mais diviseacute par 1198682 = 4)Lrsquoextension agrave 120573119901ℎ119910(119903) est immeacutediate en remplaccedilant lrsquoentropiede Simpson par celle de Rao

Il est donc preacutefeacuterable de calculer la diversiteacute 120573 de Simpsonou de Rao plutocirct que 120573119904(119903) ou 120573119901ℎ119910(119903)

232 Le variogramme decompleacutementariteacute

Wagner7 deacutefinit le variogramme de compleacutementariteacuteagrave partir des techniques de geacuteostatistique Les espegraveces sontinventorieacutees dans des parcelles de taille identique en preacutesence-absence Les distances entre parcelles sont regroupeacutees parclasses Lrsquoindicatrice 1119904|119894 vaut 1 si lrsquoespegravece 119904 est preacutesentedans la parcelle 119894 0 sinon 119899119903 est le nombre de paires deparcelles 119894 et 119895 situeacutees dans la classe de distances dont lavaleur centrale est 119903 (leur distance exacte est 119889(119894 119895)) Lasemi-variance empirique agrave distance 119903 de la variable indicatricede la preacutesence de lrsquoespegravece 119904 est

120574119904(119903) = 12119899119903

sum119894119895119889(119894119895)asymp119903

(1119904|119894 minus 1119904|119895)2 (233)

232 Le variogramme de compleacutementariteacute 265

8G Bacaro et C Ricotta laquo ASpatially Explicit Measure of BetaDiversity raquo In Community Ecology81 (2007) p 41-46 doi 101556ComEc8200716

Chaque terme de la somme vaut 1 si lrsquoespegravece est preacutesentesur une seule des deux parcelles 120574119904(119903) estime donc la probabi-liteacute que lrsquoespegravece ne soit preacutesente que sur une seule parcelle Levariogramme de la variable indicatrice est obtenue en traccedilantla valeur de 120574119904(119903) en fonction de 119903 Ce variogramme univarieacuteclassique en geacuteostatistique est geacuteneacuteraliseacute aux donneacutees multi-varieacutees le vecteur de preacutesence des espegraveces si dont chaqueterme est 1119904|119894 La semi-variance de ce vecteur de compositionspeacutecifique est

120574(119903) = 12119899119903

sum119894119895119889(119894119895)asymp119903

si minus sj2 = sum119904

120574119904(119903) (234)

si minus sj est la distance euclidienne entre les deux vecteursPuisque 120574(119903) est la somme des semi-variances speacutecifiques crsquoestun estimateur de lrsquoespeacuterance du nombre drsquoespegraveces preacutesentessur une seule parcelle de chaque paire Le variogramme de lacomposition speacutecifique est appeleacute laquo variogramme de compleacute-mentariteacute raquo pour cette raison

Bacaro et Ricotta8 lrsquoutilisent en tant que mesure de diver-siteacute 120573

120124(1119904) est la probabiliteacute qursquoune parcelle quelconquecontienne lrsquoespegravece 119904 Ce nrsquoest pas la probabiliteacute 119901119904 qursquounindividu appartienne agrave lrsquoespegravece 119904 comme toutes les parcellessont de taille identique 119901119904 est eacutegal agrave 120124(1119904)sum119904 120124(1119904)

En absence de structuration spatiale ou agrave partir de lavaleur de 119903 appeleacutee porteacutee au-delagrave de laquelle la variance sestabilise agrave son palier 120574(119903) est eacutegal agrave sum119904 120124(1119904)[1 minus 120124(1119904)] 120574(119903)nrsquoest pas une forme de lrsquoindice de Simpson parce que la sommedes 120124(1119904) ne vaut pas 1

Le variogramme peut ecirctre standardiseacute en divisanttoutes les valeurs par la valeur attendue du paliersum119904 120124(1119904)[1 minus 120124(1119904)] pour eacuteliminer lrsquoeffet de la diversiteacuteet se concentrer sur la structuration spatiale

Le variogramme peut ecirctre compleacuteteacute par un covariogrammeLa covariance entre les indicatrices de preacutesence des espegraveces 119904et 119905 est

120574119904119905(119903) = 12119899119903

sum119894119895119889(119894119895)asymp119903

(1119904|119894 minus 1119904|119895)(1119905|119894 minus 1119905|119895) (235)

Wagner montre que lrsquoestimateur de la variance de la ri-chesse speacutecifique par parcelle est

Var(119878) = sum119903

119899119903sum119903 119899119903

sum119904119905

120574119904119905(119903) (236)

Si les espegraveces sont distribueacutees indeacutependamment les unesdes autres la covariance est nulle pour toutes les paires drsquoes-pegraveces agrave toutes les distances Le test drsquoeacutegaliteacute entre Var(119878) et

120574119904119905(119903) agrave chaque valeur de 119903 (obtenu par la meacutethode de Monte-Carlo en redistribuant aleacuteatoirement la preacutesence de chaqueespegravece sur le mecircme nombre de parcelles que dans les donneacuteesreacuteelles) permet de rejeter lrsquoindeacutependance entre les espegraveces

Septiegraveme partie

Conclusion

Chapitre 24

Synthegravese

La biodiversiteacute peut ecirctre mesureacutee de nombreuses faccedilonsLa dualiteacute entropie-diversiteacute fournit un cadre clair et rigoureuxpour le faire Drsquoautres mesures de diversiteacute ont eacuteteacute preacutesenteacuteesici drsquoautres encore peuvent ecirctre trouveacutees dans la litteacuteratureElles ont en geacuteneacuteral un moins bon support matheacutematique sur-tout les mesures de diversiteacute 120573 elles ne peuvent pas ecirctre deacute-composeacutees corrigeacutees ou interpreacuteteacutees La diversiteacute de Hurlbertpossegravede toutes ses proprieacuteteacutes et une correction tregraves efficace dubiais drsquoestimation mais elle nrsquoest pas geacuteneacuteraliseacutee agrave la diversiteacutephylogeacuteneacutetique

241 Entropie et diversiteacute

Entropie de Tsallis

Richesse Shannon Simpson

Diversiteacute neutre

Diversiteacute phylogeacuteneacutetique

q quelconque q =0 1 ou 2 Fig 241 Geacuteneacuteralisation desmesures classiques de diversiteacute Lafigure preacutesente les mesuresdrsquoentropie qui peuvent toutes ecirctretransformeacutees en mesures dediversiteacute au sens strict Toutes cesentropies sont des cas particuliersde lrsquoentropie de Ricotta et Szeidlqui peut ecirctre transformeacutee endiversiteacute de Leinster et Cobbold

Lrsquoentropie est la surprise moyenne fournie par les individusdrsquoune communauteacute Le choix de la fonction drsquoinformation quimesure cette surprise agrave partir des probabiliteacutes drsquooccurrencedes espegraveces (ou drsquoautres cateacutegories) permet de deacutefinir les me-sures de diversiteacutes neutres fonctionnelles ou phylogeacuteneacutetiquepreacutesenteacutees ici

270 Synthegravese

1A Chao et al laquo Unifying Spe-cies Diversity Phylogenetic Diversi-ty Functional Diversity and Rela-ted Similarity Differentiation Mea-sures through Hill Numbers raquo In An-nual Review of Ecology Evolutionand Systematics 45 (2014) p 297-324 doi 101146annurev- ecolsys-120213-091540

7Marcon et Heacuterault laquo Entropartan r Package to Measure and Parti-tion Diversity raquo cf note 16 p xi

Lrsquoentropie est transformeacutee en diversiteacute au sens strict parune fonction croissante (lrsquoexponentielle deacuteformeacutee) ce qui sim-plifie son interpreacutetation en tant que nombre eacutequivalent drsquoes-pegraveces dans une distribution ideacuteale dans laquelle toutes lesespegraveces seraient eacutequifreacutequentes

Chao et al1 proposent un cadre fondeacute exclusivement surles nombres de Hill sans reacutefeacuterence agrave lrsquoentropie Les principalesdiffeacuterences avec celui preacutesenteacute ici concernent la deacutefinition dela diversiteacute 120572 et donc celle de la diversiteacute 120573

Lrsquoentropie phylogeacuteneacutetique geacuteneacuteralise les indices de diver-siteacute classique (figure 241) integravegre si neacutecessaire la distanceentre espegraveces peut ecirctre deacutecomposeacutee et corrigeacutee des biais drsquoes-timation Sa transformation en diversiteacute au sens strict permetdrsquointerpreacuteter les valeurs sous une forme unique un nombreeacutequivalent drsquoespegraveces et un nombre eacutequivalent de communau-teacutes La diversiteacute de Leinster et Cobbold geacuteneacuteralise agrave son tourla diversiteacute phylogeacuteneacutetique et permet drsquoautres deacutefinitions dela distance entre espegraveces Le parameacutetrage des mesures (lrsquoordrede la diversiteacute) permet de donner plus ou moins drsquoimportanceaux espegraveces rares et de tracer des profils de diversiteacute

Les communauteacutes et assemblages ideacuteals deacutefinissant lesnombres eacutequivalents drsquoespegraveces et de communauteacutes sont

bull des communauteacutes drsquoespegraveces eacutequiprobables2 dont lrsquoan-cecirctre commun est la racine de lrsquoarbre phylogeacuteneacutetique(diversiteacute phylogeacuteneacutetique)3 ou dont la distance fonction-nelle est maximale (diversiteacute fonctionnelle) 4

bull une meacuteta-communauteacute contenant des communauteacutes depoids eacutegal et totalement distinctes5 crsquoest-agrave-dire nrsquoayantaucune espegravece en commun De plus la distance fonc-tionnelle ou phylogeacuteneacutetique est maximale entre deux es-pegraveces quelconques appartenant agrave des communauteacutes dif-feacuterentes6

Le package entropart7 permet de calculer avec R la diversi-teacute drsquoune meacuteta-communauteacute agrave partir de donneacutees drsquoabondanceset drsquoun arbre (diversiteacute phylogeacuteneacutetique) ou drsquoune matrice dedistances (diversiteacute fonctionnelle)

242 Ordres particuliers de diversiteacuteLa diversiteacute drsquoordre 2 preacutesente de nombreuses particulari-

teacutes et avantages qui font qursquoelle est tregraves employeacutee

EstimationTous les estimateurs de 119902119867 sont biaiseacutes drsquoautant plus que

119902 est petit Seul lrsquoestimateur de lrsquoindice de Simpson 2 =

243 Limites 271

8M A Zacharias et J C Rofflaquo Use of Focal Species in MarineConservation and Management AReview and Critique raquo In AquaticConservation Marine and Freshwa-ter Ecosystems 111 (2001) p 59-76doi 101002aqc429

9R T Paine laquo A Note on Tro-phic Complexity and Community Sta-bility raquo In American naturalist103929 (1969) p 91-93 doi 10 1086282586 JSTOR 2459472

10J-M Roberge et P Angelstamlaquo Usefulness of the Umbrella SpeciesConcept as a Conservation Tool raquo In Conservation Biology 181 (2004)p 76-85 doi 101111j1523-1739200400450x

11C G Jones et al laquo Organismsas Ecosystem Engineers raquo In Oikos693 (1994) p 373-386 doi 101007978-1-4612-4018-1_14

[119899(119899 minus 1)](1 minus sum119904 1199012119904) est non biaiseacute Comme lrsquoentropie de

Rao est la somme sur les peacuteriodes de lrsquoarbre des entropies deSimpson 2(119879 ) = [119899(119899 minus 1)] 2(119879 ) est donc sans biais

PartitionLrsquoentropie de Simpson peut ecirctre deacutecomposeacutee comme une

variance La contribution de chaque communauteacute agrave la varianceinter nrsquoest pas la mecircme que dans la deacutecomposition geacuteneacuteralede lrsquoentropie HCDT mais la variance inter est bien eacutegale agravelrsquoentropie 120573 La deacutecomposition de la diversiteacute de Peacutelissier etCouteron est identique Dans le cas particulier de lrsquoentropiede Rao lrsquoentropie phylogeacuteneacutetique sans normalisation par lahauteur de lrsquoarbre est eacutegale agrave la somme pondeacutereacutee des dissi-milariteacutes (divergences de Jensen-Shannon) entre les paires decommunauteacutes Cette proprieacuteteacute permet de repreacutesenter dans unmecircme espace les espegraveces et les communauteacutes par une doubleanalyse en composantes principales

Eacutegaliteacute des diversiteacutesPour 119902 = 2 seulement toutes les mesures de diversiteacute sont

identiques

bull Le nombre eacutequivalent drsquoespegraveces de Hurlbert est eacutegal agrave2119863 le nombre de Hill

bull La diversiteacute de Leinster et Cobbold est eacutegale agrave la diver-siteacute phylogeacuteneacutetique

La diversiteacute drsquoordre 1 a en revanche des proprieacuteteacutes avanta-geuses pour la deacutecomposition toutes les deacutefinitions de diver-siteacute 120572 sont dans ce cas identiques et lrsquoinformation mutuellese confond avec la diversiteacute 120573

243 LimitesLes principales limites des mesures de diversiteacute sont

drsquoordre conceptuel et pratique Lrsquoaxiome de symeacutetrie interditde donner un rocircle particulier agrave une espegravece Il nrsquoest doncpas possible conceptuellement de prendre en compte lesespegraveces focales8 dans la quantification de la diversiteacute espegravecesembleacutematiques espegraveces cleacute de voucircte9 espegraveces parapluie10

espegraveces ingeacutenieures11hellip Leur preacutesence peut ecirctre deacutecisivepour la conservation mais il srsquoagit clairement drsquoune questiondistincte de celle de la diversiteacute

Sur le plan pratique la mesure de la diversiteacute se reacuteduit sou-vent agrave un groupe biologique (dans ce document les arbres)Estimer la biodiversiteacute totale est un objectif hors drsquoatteinteLrsquoeacutetendue spatiale agrave laquelle des donneacutees drsquoabondance sont

272 Synthegravese

12A Chiarucci et al laquo Old andNew Challenges in Using Species Di-versity for Assessing Biodiversity raquoIn Philosophical Transactions ofthe Royal Society of London Se-ries B Biological Sciences 3661576(2011) p 2426-2437 doi 101098rstb20110065

13Balmford et al laquo Measuringthe Changing State of Nature raquo cfnote 4 p 25

14F E Clements Plant Succes-sion an Analysis of the Deve-lopment of Vegetation WashingtonDC Carnegie Institution of Wa-shington 1916

15H M Pereira et al laquo EssentialBiodiversity Variables raquo In Science339 (2013) p 277-278 doi 101126science1229931

16Biodiversity Intactness IndexR J Scholes et R Biggs laquo A Bio-diversity Intactness Index raquo In Na-ture 4347029 (2005) p 45-49 doi 101038nature03289

18S T Buckland et al laquo The Geo-metric Mean of Relative AbundanceIndices A Biodiversity Measure witha Difference raquo In Ecosphere 29(2011) art100 doi 101890ES11-001861

19J Loh et al laquo The Living Pla-net Index Using Species PopulationTime Series to Track Trends in Biodi-versity raquo In Philosophical Transac-tions of the Royal Society of Lon-don Series B Biological Sciences3601454 (2005) p 289-295 doi 101098rstb20041584

20Ceballos et al laquo Biological An-nihilation via the Ongoing Sixth MassExtinction Signaled by VertebratePopulation Losses and Declines raquo cfnote 12 p x

accessibles est souvent trop reacuteduite12 Si la diversiteacute agrave prendreen compte est au-delagrave des donneacutees disponibles il est neacuteces-saire drsquoutiliser des indicateurs13 qui peuvent ecirctre la diversiteacutedrsquoun ou quelques groupes repreacutesentatifs voire la preacutesence drsquoes-pegraveces indicatrices14 Des indicateurs indirects sont la diversiteacutedes habitats ou mecircme lrsquoeacutetendue de certains habitats reconnuscomme les plus favorables agrave un haut niveau de diversiteacute Unereacuteflexion en cours15 consiste agrave eacutetablir une liste de variables per-tinentes (Essential biodiversity variables) qui puissent consti-tuer des indicateurs standardiseacutes agrave lrsquoeacutechelle globale pour per-mettre la comparaison des donneacutees Les indicateurs deacutevientsouvent de la notion stricte de diversiteacute et peuvent mesurertout autre chose comme lrsquoindice BII16 qui est la moyennepondeacutereacutee par la surface des habitats et le nombre drsquoespegravecesconcerneacutees de la variation des effectifs des populations induitepar lrsquoanthropisation Les effectifs ne sont pas pris en comptedans la mesure de la diversiteacute (sauf dans le calcul des biaisdrsquoestimation) seules les proportions importent lrsquoindice BIImesure donc la deacutegradation des habitats plus que la varia-tion de la biodiversiteacute Lrsquoargument deacuteveloppeacute par Balmfordet al17 est que la diminution des effectifs des espegraveces suiviesest correacuteleacute agrave la disparition des espegraveces plus vulneacuterables lrsquoeffec-tif drsquoune population est aussi un indicateur de sa diversiteacute geacute-neacutetique La moyenne geacuteomeacutetrique des abondances relatives18

compare les abondances des espegraveces au cours du temps agrave leurvaleur initiale Lrsquoindice LPI (Living Planet Index)19 srsquoappuiesur ce mecircme principe il mesure lrsquoeacutevolution dans le tempsdes effectifs drsquoun grand nombre de populations de verteacutebreacutesUne approche similaire mais plus exhaustive20 montre une tregravesforte probabiliteacute drsquoextinction massive agrave venir

La recherche sur la mesure de la diversiteacute est tregraves active cedocument eacutevolue donc reacuteguliegraverement pour prendre en compteles avanceacutees reacutecentes

Bibliographie

Aczeacutel J et Z Daroacuteczy On Measures of Informa-tion and Their Characterizations New York Academic Press 1975 p 234 (cf p 222)

Adelman M A laquo Comment on the rdquoHrdquo Concentra-tion Measure as a Numbers-Equivalent raquo In TheReview of Economics and Statistics 511 (1969)p 99-101 doi 1023071926955 (cf p 66)

Agapow P M O R P Binindal-Emonds K ACrandall J L Gittleman G M Mace J CMarshall et A Purvis laquo The Impact of Spe-cies Concept on Biodiversity Studies raquo In TheQuarterly Review of Biology 792 (2004) p 161-179 doi 101086383542 (cf p 7)

Alatalo R V laquo Problems in the Measurement ofEvenness in Ecology raquo In Oikos 372 (1981)p 199-204 doi 1023073544465 (cf p 91 94)

Allan J D laquo Components of Diversity raquo In Oe-cologia 184 (1975) p 359-367 doi 101007BF00345855 JSTOR 4215087 (cf p 223)

Allen B M Kon et Y Bar-Yam laquo A New Phyloge-netic Diversity Measure Generalizing the Shan-non Index and Its Application to PhyllostomidBats raquo In American Naturalist 1742 (2009)p 236-243 doi 101086600101 (cf p 132 136204)

Alonso D et A J McKane laquo Sampling HubbellrsquosNeutral Theory of Biodiversity raquo In EcologyLetters 710 (2004) p 901-910 doi 101111j1461-0248200400640x (cf p 238)

Anderson M J T O Crist J M Chase MVellend B D Inouye A L Freestone N J Sanders H V Cornell L S Comita K F Davies S P Harrison N J B Kraft J C Stegen et N G Swenson laquo Navigatingthe Multiple Meanings of Diversity ARoadmap for the Practicing Ecologist raquo In Ecology Letters 141 (2011) p 19-28 doi 101111j1461- 0248201001552x (cf p 159160)

Anderson M J K E Ellingsen et B HMcArdle laquo Multivariate Dispersion as aMeasure of Beta Diversity raquo In Ecology letters96 (2006) p 683-93 doi 10 1111 j 1461 -0248200600926x PMID 16706913 (cf p 175185)

Arrhenius O laquo Species and Area raquo In Journal ofEcology 91 (1921) p 95-99 doi 10 2307 2255763 (cf p 254 257)

Ashbridge J et I B J Goudie laquo Coverage-Adjusted Estimators for Mark-Recapturein Heterogeneous Populations raquo In Com-munications in Statistics - Simulation andComputation 294 (2000) p 1215-1237 doi 10108003610910008813661 (cf p 52)

Bacaro G M Gioria et C Ricotta laquo Testingfor Differences in Beta Diversity from Plot-to-Plot Dissimilarities raquo In Ecological Research272 (2012) p 285-292 doi 101007s11284-011-0899-z (cf p 185)

mdash laquo Beta Diversity Reconsidered raquo In EcologicalResearch 283 (2013) p 537-540 doi 101007s11284-013-1043-z (cf p 186)

Bacaro G et C Ricotta laquo A Spatially ExplicitMeasure of Beta Diversity raquo In Commu-nity Ecology 81 (2007) p 41-46 doi 101556ComEc8200716 (cf p 265)

Bacaro G C Ricotta M Marignani D Torri et A Chiarucci laquo Using Shannonrsquos Recursivityto Summarize Forest Structural Diversity raquo In Forests Trees and Livelihoods 233 (2014) p 211-216 doi 10 108014728028 2013 844933 (cfp 219 221)

Baez J C T Fritz et T Leinster laquo A Characteri-zation of Entropy in Terms of Information Loss raquoIn Entropy 1311 (2011) p 1945-1957 doi 103390e13111945 (cf p 221 222)

Balmford A M J B Green et M G Murray laquo Using Higher-Taxon Richness as a Surrogatefor Species Richness I Regional Tests raquo In Proceedings of the Royal Society of London Se-ries B Biological Sciences 263 (1996) p 1267-1274 doi 101098rspb19960186 (cf p 46)

Balmford A R E Green et M Jenkins laquo Measu-ring the Changing State of Nature raquo In Trendsin Ecology amp Evolution 187 (2003) p 326-330doi 101016S0169-5347(03)00067-3 (cf p 25272)

Balmford A A H M Jayasuriya et M J BGreen laquo Using Higher-Taxon Richness as a Sur-rogate for Species Richness II Local Applica-tions raquo In Proceedings of the Royal Societyof London Series B Biological Sciences 263(1996) p 1571-1575 doi 101098rspb19960230 (cf p 46)

Baraloto C C E T Paine S Patintildeo DBonal B Heacuterault et J Chave laquo FunctionalTrait Variation and Sampling Strategies inSpecies Rich Plant Communities raquo In Func-tional Ecology 241 (2010) p 208-216 doi 101111j1365-2435200901600x (cf p 104)

Barberousse A et S Samadi laquo La Taxonomie etLes Collections drsquohistoire Naturelle agrave lrsquoheure deLa Sixiegraveme Extinction raquo In La BiodiversiteacuteEn Question Enjeux Philosophiques Eacutethiqueset Scientifiques Sous la dir drsquoE Casetta etJ Delord Paris Editions Mateacuteriologiques2014 p 155-182 (cf p 7)

Baselga A laquo Multiplicative Partition of True Diver-sity Yields Independent Alpha and Beta Compo-

274 Bibliographie

nents Additive Partition Does Not raquo In Ecolo-gy 917 (2010) p 1974-1981 doi doi10189009-03201 (cf p 165 187)

Baselga A laquo Partitioning the Turnover and Nested-ness Components of Beta Diversity raquo In GlobalEcology and Biogeography 191 (2010) p 134-143 doi 10 1111j 1466- 8238200900490x(cf p 175 176)

mdash laquo The Relationship between Species Replace-ment Dissimilarity Derived from Nestednessand Nestedness raquo In Global Ecology andBiogeography 2112 (2012) p 1223-1232 doi 101111j1466-8238201100756x (cf p 176)

Basharin G P laquo On a Statistical Estimate for theEntropy of a Sequence of Independent RandomVariables raquo In Theory of Probability and its Ap-plications 43 (1959) p 333-336 doi 1011371104033 (cf p 51)

Basset Y L Cizek P Cueacutenoud R K Didham F Guilhaumon O Missa V Novotny F Oslashdegaard T Roslin J Schmidl A KTishechkin N N Winchester D W Roubik H-P Aberlenc J Bail H Barrios J RBridle G Castantildeo-Meneses B Corbara G Curletti W Duarte da Rocha DDe Bakker J H C Delabie A Dejean L L Fagan A Floren R L Kitching E Medianero S E Miller E Gama deOliveira J Orivel M Pollet M Rapp S PRibeiro Y Roisin J B Schmidt L Soslashrensen et M Leponce laquo Arthropod Diversity in aTropical Forest raquo In Science 3386113 (2012)p 1481-1484 doi 10 1126 science 1226727(cf p 26)

Bazzaz F A laquo Plant Species Diversity in Old-FieldSuccessional Ecosystems in Southern Illinois raquoIn Ecology 562 (mars 1975) p 485-488 doi 1023071934981 (cf p 18)

Beck C laquo Generalised Information and EntropyMeasures in Physics raquo In Contempora-ry Physics 504 (2009) p 495-510 doi 10108000107510902823517 (cf p 82)

Beck J J D Holloway et W Schwanghart laquo Undersampling and the Measurement ofBeta Diversity raquo In Methods in Ecologyand Evolution 44 (2013) p 370-382 doi 1011112041-210x12023 (cf p 199)

Beck J et W Schwanghart laquo Comparing Mea-sures of Species Diversity from Incomplete In-ventories An Update raquo In Methods in Eco-logy and Evolution 11 (2010) p 38-44 doi 101111j2041- 210X200900003x (cf p 3652)

Beacuteguinot J laquo An Algebraic Derivation of ChaorsquosEstimator of the Number of Species in a Com-munity Highlights the Condition Allowing Chaoto Deliver Centered Estimates raquo In Internatio-nal Scholarly Research Notices 2014 (Article ID847328 2014) doi 10 11552014847328 (cfp 28 246)

mdash laquo Extrapolation of the Species AccumulationCurve for Incomplete Species Samplings ANew Nonparametric Approach to Estimate theDegree of Sample Completeness and DecideWhen to Stop Sampling raquo In Annual Researchamp Review in Biology 85 (2015) p 1-9 doi 109734ARRB201522351 (cf p 37 248)

mdash laquo When Reasonably Stop Sampling How to Es-timate the Gain in Newly Recorded Species Ac-

cording to the Degree of Supplementary Sam-pling Effort raquo In Annual Research amp Review inBiology 75 (2015) p 300-308 doi 10 9734ARRB201518809 (cf p 246)

mdash laquo Basic Theoretical Arguments AdvocatingJackknife-2 as Usually Being the Most Ap-propriate Nonparametric Estimator of TotalSpecies Richness raquo In Annual Research ampReview in Biology 101 (2016) p 1-12 doi 109734ARRB201625104 (cf p 33 37)

Bellman R K L Cooke et J A Lockett Al-gorithms Graphs and Computers New York Academic Press Inc 1970 (cf p 215)

Berger W H et F L Parker laquo Diversity of Plank-tonic Foraminifera in Deep-Sea Sediments raquo In Science 1683937 (1970) p 1345-1347 doi 101126science16839371345 (cf p 70)

Blandin P laquo La Diversiteacute Du Vivant Avant (etApregraves) La Biodiversiteacute Repegraveres Historiqueset Eacutepisteacutemologiques raquo In La Biodiversiteacute EnQuestion Enjeux Philosophiques Eacutethiques etScientifiques Sous la dir drsquoE Casetta etJ Delord Paris Editions Mateacuteriologiques2014 p 31-68 (cf p ix)

Blonder B C Lamanna C Violle et B JEnquist laquo The N-Dimensional Hypervolume raquoIn Global Ecology and Biogeography 23 (2014)p 595-609 doi 101111geb12146 (cf p 111)

Bonachela J A H Hinrichsen et M A Muntildeoz laquo Entropy Estimates of Small Data Sets raquo In Journal of Physics A Mathematical and Theo-retical 41202001 (2008) p 1-9 doi 1010881751-81134120202001 (cf p 53)

Bordenave B G et J-J De Granville laquo Les Me-sures de La Biodiversiteacute Un Outil de Conser-vation En Forecirct Guyanaise raquo In JATBA Re-vue drsquoEthnobiologie 401-2 (1998) p 433-446 (cfp 239)

Bordenave B G J-J De Granville et KSteyn laquo Quantitative Botanical DiversityDescriptors to Set Conservation Priorities inBakhuis Mountains Rainforest Suriname raquoIn Botanical Journal of the Linnean Society1671 (2011) p 94-130 doi 101111j1095-8339201101163x (cf p 239)

Borland L A R Plastino et C Tsallis laquo Infor-mation Gain within Nonextensive Thermostatis-tics raquo In Journal of Mathematical Physics 3912(1998) p 6490-6501 doi 1010631532660 (cfp 192)

Botta-Dukaacutet Z laquo Raorsquos Quadratic Entropy as aMeasure of Functional Diversity Based on Mul-tiple Traits raquo In Journal of Vegetation Science165 (2005) p 533-540 doi 101111j1654-11032005tb02393x (cf p 125)

mdash laquo The Generalized Replication Principle and thePartitioning of Functional Diversity into Inde-pendent Alpha and Beta Components raquo In Eco-graphy 411 (jan 2018) p 40-50 doi 101111ecog02009 (cf p 132)

Bourguignon F laquo Decomposable Income Inequali-ty Measures raquo In Econometrica 474 (1979)p 901-920 doi 10 2307 1914138 JSTOR 1914138 (cf p 191 222)

Box G E P et D R Cox laquo An Analysis of Trans-formations raquo In Journal of the Royal StatisticalSociety Series B (Statistical Methodology) 262(1964) p 211-252 doi 101111j2517- 61611964tb00553x JSTOR 2984418 (cf p 67)

Bibliographie 275

Braun-Blanquet J laquo Pflanzensoziologie Grundzuumlge Der Vegetationskunde raquo In Bio-logische Studienbuumlcher Berlin Springer 1928(cf p 253)

Bray J R et J T Curtis laquo An Ordination of theUpland Forest Communities of Southern Wis-consin raquo In Ecological Monographs 274 (1957)p 325-349 doi 1023071942268 (cf p 174)

Brillouin L Science and Information Theory 2nded Oxford Academic Press 1962 (cf p 50)

Broms K M M B Hooten et R M Fitzpatrick laquo Accounting for Imperfect Detection in HillNumbers for Biodiversity Studies raquo In Methodsin Ecology and Evolution 61 (2014) p 99-108doi 1011112041-210X12296 (cf p 81)

Brose U N D Martinez et R J Williams laquo Es-timating Species Richness Sensitivity to SampleCoverage and Insensitivity to Spatial Patterns raquoIn Ecology 849 (2003) p 2364-2377 doi 10189002-0558 (cf p 36 38 77)

Bruumllhart M et R Traeger laquo An Accountof Geographic Concentration Patterns inEurope raquo In Regional Science and UrbanEconomics 356 (2005) p 597-624 doi 101016jregsciurbeco200409002 (cf p 82)

Buckland S T A C Studeny A E Magurran J B Illian et S E Newson laquo The GeometricMean of Relative Abundance Indices A Biodi-versity Measure with a Difference raquo In Ecos-phere 29 (2011) art100 doi 101890ES11-001861 (cf p 272)

Bulla L laquo An Index of Evenness and Its Associa-ted Diversity Measure raquo In Oikos 701 (1994)p 167-172 doi 10 2307 3545713 JSTOR 3545713 (cf p 91)

Bulmer M G laquo On Fitting the Poisson Lognor-mal Distribution to Species-Abundance Data raquoIn Biometrics 301 (1974) p 101-110 doi 1023071939021 (cf p 17 51)

Burnham K P et W S Overton laquo Estimation ofthe Size of a Closed Population When CaptureProbabilities Vary among Animals raquo In Bio-metrika 653 (1978) p 625-633 doi 1023072335915 (cf p 30)

mdash laquo Robust Estimation of Population Size WhenCapture Probabilities Vary among Animals raquoIn Ecology 605 (1979) p 927-936 doi 1023071936861 (cf p 26 30 77)

Cadotte M W T J Davies J Regetz S WKembel E Cleland et T H Oakley laquo Phylo-genetic Diversity Metrics for Ecological Commu-nities Integrating Species Richness Abundanceand Evolutionary History raquo In Ecology Letters131 (2010) p 96-105 doi 10 1111 j 1461 -0248200901405x (cf p 117)

Cailliez F laquo The Analytical Solution of the Addi-tive Constant Problem raquo In Psychometrika 48(1983) p 305-310 doi 101007BF02294026(cf p 102)

Caldarelli G A Capocci P De Los Rios etM A Muntildeoz laquo Scale-Free Networks from Va-rying Vertex Intrinsic Fitness raquo In Physical Re-view Letters 8925 (2002) p 258702 doi 101103PhysRevLett89258702 (cf p 46)

Campos D et J F Isaza laquo A Geometrical Indexfor Measuring Species Diversity raquo In EcologicalIndicators 94 (2009) p 651-658 doi 101016jecolind200807007 (cf p 151)

Cao L et M Grabchak laquo EntropyEstimation Es-timation of Entropy and Related Quantities raquoIn (2014) (cf p 245)

Cardinale B J J E Duffy A Gonzalez D UHooper C Perrings P Venail A Narwani G M Mace D Tilman D A Wardle A PKinzig G C Daily M Loreau J B Grace A Larigauderie D S Srivastava et S Naeem laquo Biodiversity Loss and Its Impact on Humani-ty raquo In Nature 4867401 (2012) p 59-67 doi 101038nature11148 (cf p x)

Cartozo C C D Garlaschelli C Ricotta MBartheacutelemy et G Caldarelli laquo Quantifyingthe Taxonomic Diversity in Real Species Com-munities raquo In Journal of Physics A Mathema-tical and Theoretical 41 (2008) p 224012 doi 1010881751-81134122224012 (cf p 46)

Casetta E laquo Eacutevaluer et Conserver La BiodiversiteacuteFace Au Problegraveme Des Espegraveces raquo In LaBiodiversiteacute En Question Enjeux Philoso-phiques Eacutethiques et Scientifiques Sous la dirdrsquoE Casetta et J Delord Paris EditionsMateacuteriologiques 2014 p 139-154 (cf p 7)

Castellani B et R Rajaram laquo Past the PowerLaw Complex Systems and the Limiting Lawof Restricted Diversity raquo In Complexity 21S2(nov 2016) p 99-112 doi 101002cplx21786(cf p 86)

Cavender-Bares J K H Kozak P V A Fine et S W Kembel laquo The Merging of CommunityEcology and Phylogenetic Biology raquo In EcologyLetters 127 (2009) p 693-715 doi 101111j1461-0248200901314x (cf p 106)

Ceballos G P R Ehrlich et R Dirzo laquo Biolo-gical Annihilation via the Ongoing Sixth MassExtinction Signaled by Vertebrate PopulationLosses and Declines raquo In Proceedings ofthe National Academy of Sciences (2017)p 201704949 doi 10 1073pnas 1704949114(cf p x 272)

Ceriani L et P Verme laquo The Origins of the Gi-ni Index Extracts from Variabilitagrave e Mutabilitagrave(1912) by Corrado Gini raquo In Journal of Eco-nomic Inequality 103 (2012) p 421-443 doi 101007s10888-011-9188-x (cf p 90)

Champely S et D Chessel laquo Measuring BiologicalDiversity Using Euclidean Metrics raquo In Envi-ronmental and Ecological Statistics 92 (2002)p 167-177 doi 101023A1015170104476 (cfp 126 198)

Chao A laquo Nonparametric Estimation of the Num-ber of Classes in a Population raquo In Scandina-vian Journal of Statistics 114 (1984) p 265-270JSTOR 4615964 (cf p 26 27 30)

mdash laquo Estimating the Population Size for Capture-Recapture Data with Unequal Catchability raquo In Biometrics 434 (1987) p 783-791 doi 10 23072531532 (cf p 28 29)

mdash laquo Species Richness Estimation raquo In Encyclope-dia of Statistical Sciences Sous la dir de NBalakrishnan C B Read et B Vidakovic 2nd ed New York Wiley 2004 (cf p 28)

Chao A R L Chazdon R K Colwell et T-JShen laquo A New Statistical Approach for Asses-sing Similarity of Species Composition with In-cidence and Abundance Data raquo In Ecology Let-ters 82 (2004) p 148-159 doi 101111j1461-0248200400707x (cf p 171)

276 Bibliographie

Chao A C-H Chiu et T C Hsieh laquo Proposinga Resolution to Debates on Diversity Partitio-ning raquo In Ecology 939 (2012) p 2037-2051doi 10189011- 18171 (cf p 165 166 187194 202)

Chao A C-H Chiu T C Hsieh T Davis D ANipperess et D P Faith laquo Rarefaction andExtrapolation of Phylogenetic Diversity raquo In Methods in Ecology and Evolution 64 (2015)p 380-388 doi 10 1111 2041 - 210X 12247(cf p 124)

Chao A C-H Chiu et L Jost laquo PhylogeneticDiversity Measures Based on Hill Numbers raquoIn Philosophical Transactions of the RoyalSociety of London Series B BiologicalSciences 3651558 (2010) p 3599-3609 doi 101098rstb20100272Supplementary (cf p 70133 136 137)

mdash laquo Unifying Species Diversity Phylogenetic Diver-sity Functional Diversity and Related Similari-ty Differentiation Measures through Hill Num-bers raquo In Annual Review of Ecology Evolu-tion and Systematics 45 (2014) p 297-324 doi 10 1146 annurev - ecolsys - 120213 - 091540 (cfp 270)

Chao A R K Colwell C-H Chiu et DTownsend laquo Seen Once or More than Once Applying Good-Turing Theory to Estimate Spe-cies Richness Using Only Unique Observationsand a Species List raquo In Methods in Ecologyand Evolution 810 (2017) p 1221-1232 doi 1011112041-210X12768 (cf p 29)

Chao A N J Gotelli T C Hsieh E L Sander K H Ma R K Colwell et A M Ellison laquo Rarefaction and Extrapolation with Hill Num-bers A Framework for Sampling and Estimationin Species Diversity Studies raquo In Ecological Mo-nographs 841 (2014) p 45-67 doi 10189013-01331 (cf p 58 81)

Chao A T C Hsieh R L Chazdon R KColwell et N J Gotelli laquo Unveiling theSpecies-Rank Abundance Distribution byGeneralizing Good-Turing Sample CoverageTheory raquo In Ecology 965 (2015) p 1189-1201doi 10189014-05501 (cf p 76 77 79 252)

Chao A et L Jost laquo Coverage-Based Rarefactionand Extrapolation Standardizing Samples byCompleteness Rather than Size raquo In Ecology9312 (2012) p 2533-2547 doi 10 189011-19521 (cf p 12 13 53 75)

mdash laquo Estimating Diversity and Entropy Profiles viaDiscovery Rates of New Species raquo In Methodsin Ecology and Evolution 68 (2015) p 873-882doi 1011112041-210X12349 (cf p 74 76 78211)

Chao A L Jost S C Chiang Y H Jiang et R LChazdon laquo A Two-Stage Probabilistic Approachto Multiple-Community Similarity Indices raquo In Biometrics 644 (2008) p 1178-1186 doi 101111j1541-0420200801010x (cf p 202)

Chao A et S-M Lee laquo Estimating the Numberof Classes via Sample Coverage raquo In Journalof the American Statistical Association 87417(1992) p 210-217 doi 10108001621459199210475194 (cf p 29)

Chao A S-M Lee et T-C Chen laquo A Genera-lized Goodrsquos Nonparametric Coverage Estima-tor raquo In Chinese Journal of Mathematics 16(1988) p 189-199 JSTOR 43836340 (cf p 12)

Chao A et C-W Lin laquo Nonparametric LowerBounds for Species Richness and Shared SpeciesRichness under Sampling without Replace-ment raquo In Biometrics 683 (2012) p 912-921doi 10 1111 j 1541 - 0420 2011 01739 x(cf p 14)

Chao A K H Ma T C Hsieh et C-H Chiu laquo SpadeR Species Prediction and Diversity Es-timation with R raquo In (2016) (cf p 13 34)

Chao A et T-J Shen laquo Nonparametric Estimationof Shannonrsquos Index of Diversity When There AreUnseen Species in Sample raquo In Environmentaland Ecological Statistics 104 (2003) p 429-443doi 101023A1026096204727 (cf p 52 76145)

mdash laquo Program SPADE Species Prediction and Di-versity Estimation Program and Userrsquos Guide raquoIn (2010) (cf p 13 30)

Chao A Y-T Wang et L Jost laquo Entropy and theSpecies Accumulation Curve A Novel Entro-py Estimator via Discovery Rates of New Spe-cies raquo In Methods in Ecology and Evolution411 (2013) p 1091-1100 doi 1011112041-210x12108 (cf p 53 74 75 77 78 83 189 245)

Chapin F S I E S Zavaleta V T Eviner R LNaylor P M Vitousek H L Reynolds D U Hooper S Lavorel O E Sala S EHobbie M C Mack et S Diacuteaz laquo Consequencesof Changing Biodiversity raquo In Nature 4056783(2000) p 234-242 doi 10 1038 35012241(cf p x)

Chase J M N J B Kraft K G Smith MVellend et B D Inouye laquo Using Null Modelsto Disentangle Variation in Community Dissimi-larity from Variation in -Diversity raquo In Ecos-phere 22 (2011) art 24 doi 101890ES10-001171 (cf p 184)

Chase J M et J A Myers laquo Disentangling theImportance of Ecological Niches from StochasticProcesses across Scales raquo In Philosophical Tran-sactions of the Royal Society of London SeriesB Biological Sciences 3661576 (2011) p 2351-2363 doi 101098rstb20110063 (cf p 185)

Chave J G Chust et C Theacutebaud laquo The Impor-tance of Phylogenetic Structure in BiodiversityStudies raquo In Scaling Biodiversity Sous la dirde D Storch P Marquet et J Brown San-ta Fe Institute Editions 2007 p 150-167 (cfp 101 103 264)

Chave J et E G Leigh laquo A Spatially Explicit Neu-tral Model of -Diversity in Tropical Forests raquoIn Theoretical Population Biology 622 (2002)p 153-168 doi 10 1006tpbi 2002 1597 (cfp 263)

Chiarucci A G Bacaro et S M Scheiner laquo Oldand New Challenges in Using Species Diversi-ty for Assessing Biodiversity raquo In Philosophi-cal Transactions of the Royal Society of LondonSeries B Biological Sciences 3661576 (2011)p 2426-2437 doi 101098rstb20110065 (cfp 272)

Chiu C-H et A Chao laquo Distance-Based FunctionalDiversity Measures and Their Decomposition AFramework Based on Hill Numbers raquo In PloSone 97 (2014) e100014 doi 101371journalpone0100014 (cf p 131 143 149)

Chiu C-H L Jost et A Chao laquo Phylogenetic Be-ta Diversity Similarity and Differentiation Mea-sures Based on Hill Numbers raquo In Ecological

Bibliographie 277

Monographs 841 (2014) p 21-44 doi 10189012-09601 (cf p 166 219 229)

Chiu C-H Y-T Wang B A Walther et AChao laquo An Improved Nonparametric LowerBound of Species Richness via a Modified Good-Turing Frequency Formula raquo In Biometrics 703(2014) p 671-682 doi 101111biom12200PMID 24945937 (cf p 11 29 37)

Chytryacute M et Z Otyacutepkovaacute laquo Plot Sizes Used forPhytosociological Sampling of European Vegeta-tion raquo In Journal of Vegetation Science 144(2003) p 563-570 doi 101111j1654- 11032003tb02183x (cf p 253)

Clarke K R et R M Warwick laquo QuantifyingStructural Redundancy in Ecological Communi-ties raquo In Oecologia 1132 (1998) p 278-289doi 101007s004420050379 (cf p 178)

mdash laquo A Further Biodiversity Index Applicable toSpecies Lists Variation in Taxonomic Distinct-ness raquo In Marine Ecology-Progress Series 216(2001) p 265-278 doi 10 3354meps216265(cf p 25 103 112)

Clements F E Plant Succession an Analysis ofthe Development of Vegetation WashingtonDC Carnegie Institution of Washington 1916(cf p 272)

Clench H K laquo How to Make Regional Lists of But-terflies Some Thoughts raquo In Journal of theLepidopteristsrsquo Society 334 (1979) p 216-231(cf p 41)

Coleman B D laquo On Random Placement andSpecies-Area Relations raquo In MathematicalBiosciences 543-4 (1981) p 191-215 doi 1010160025-5564(81)90086-9 (cf p 244 258259)

Coleman B D M A Mares M R Willig et Y-H Hsieh laquo Randomness Area andSpecies Richness raquo In Ecology 634 (1982)p 1121-1133 doi 1023071937249 (cf p 258259)

Colwell R K A Chao N J Gotelli S-YLin C X Mao R L Chazdon et J TLongino laquo Models and Estimators LinkingIndividual-Based and Sample-Based Rare-faction Extrapolation and Comparison ofAssemblages raquo In Journal of Plant Ecology51 (2012) p 3-21 doi 10 1093 jpe rtr044(cf p 245)

Colwell R K et J A Coddington laquo EstimatingTerrestrial Biodiversity through Extrapolation raquoIn Philosophical Transactions of the Royal So-ciety of London Series B Biological Sciences3451311 (1994) p 101-118 doi 101098rstb19940091 (cf p 34 42)

Colwell R K et D J Futuyma laquo On the Mea-surement of Niche Breadth and Overlap raquo In Ecology 524 (1971) p 567-576 doi 1023071934144 JSTOR 1934144 (cf p 223 224)

Conceiccedilatildeo P et P Ferreira The Young PersonrsquosGuide to the Theil Index Suggesting IntuitiveInterpretations and Exploring Analytical Appli-cations Austin Texas 2000 p 54 (cf p 50 64)

Condit R R A Chisholm et S P Hubbell laquo Thirty Years of Forest Census at Barro Colora-do and the Importance of Immigration in Main-taining Diversity raquo In PLoS ONE 711 (2012)e49826 doi 10 1371 journal pone 0049826(cf p xi)

Condit R N Pitman E G J Leigh J Chave J Terborgh R B Foster P Nuacutentildeez S Aguilar R Valencia G Villa H CMuller-Landau E Losos et S P Hubbell laquo Beta-Diversity in Tropical Forest Trees raquoIn Science 2955555 (2002) p 666-669 doi 101126science1066854 (cf p 263)

Connell J H laquo Diversity in Tropical Rain Forestsand Coral Reefs raquo In Science 1994335 (1978)p 1302-1310 doi 101126science19943351302 (cf p 47)

Connor E F et E D McCoy laquo The Statistics andBiology of the Species-Area Relationship raquo In The American Naturalist 1136 (1979) p 791-833 doi 101086283438 (cf p 258 259)

Cormack R M laquo Log-Linear Models for Capture-Recapture raquo In Biometrics 452 (1989) p 395-413 doi 1023072531485 (cf p 31)

Cornelissen J H C S Lavorel E Garnier S Diacuteaz N Buchmann D E Gurvich P BReich H ter Steege H D Morgan M G Avan der Heijden J G Pausas et H Poorter laquo A Handbook of Protocols for Standardised andEasy Measurement of Plant Functional TraitsWorldwide raquo In Australian Journal of Botany514 (2003) p 335-380 doi 101071BT02124(cf p 104)

Cousins S H laquo Species Diversity Measurement Choosing the Right Index raquo In Trends inEcology amp Evolution 66 (1991) p 190-192 doi 1010160169-5347(91)90212-G (cf p 101)

Couteron P et R Peacutelissier laquo Additive Apportio-ning of Species Diversity Towards More Sophis-ticated Models and Analyses raquo In Oikos 1071(2004) p 215-221 doi 101111j0030- 1299200412766x (cf p 213)

Cowell F laquo Measurement of Inequality raquo In Hand-book of Income Distribution Sous la dir drsquoA BAtkison et F Bourguignon T 1 6 North Hol-land 2000 p 87-166 doi 10 1016 S0014 -2921(81)80003-7 (cf p 82)

Cracraft J laquo Species Concepts and SpeciationAnalysis raquo In Current Ornithology Volume 1Sous la dir de R F Johnston T 1 CurrentOrnithology Springer US 1983 p 159-187doi 101007978-1-4615-6781-3_6 (cf p 7)

Cressie N et T R C Read laquo MultinomialGoodness-of-Fit Tests raquo In Journal of theRoyal Statistical Society Series B (StatisticalMethodology) 463 (1984) p 440-464 JSTOR 2345686 (cf p 82 192)

Cressie N A Statistics for Spatial Data New York John Wiley amp Sons 1993 (cf p 251)

Crist T O J A Veech J C Gering et K SSummerville laquo Partitioning Species Diversityacross Landscapes and Regions A HierarchicalAnalysis of Alpha Beta and Gamma Diversi-ty raquo In The American Naturalist 1626 (2003)p 734-743 doi 10 1086 378901 (cf p 199209)

Crozier R H laquo Preserving the Information Contentof Species Genetic Diversity Phylogeny andConservation Worth Interaction with ReasonsJustifying the Preservation raquo In Annual Reviewof Ecology and Systematics 28 (1997) p 243-268 doi 10 1146 annurev ecolsys 28 1 243(cf p 103)

Cutrini E laquo Specialization and Concentration froma Twofold Geographical Perspective Evidence

278 Bibliographie

from Europe raquo In Regional Studies 443 (2010)p 315-336 doi 10108000343400802378743 (cfp 219)

Czekanowski J Zarys Metod Statystycznych w Zas-tosowaniu Do Antropologii Warsaw Towarzyst-wo Naukowe Warszawskie 1913 (cf p 169)

Dalton H laquo The Measurement of the Inequality ofIncomes raquo In The Economic Journal 30119(1920) p 348-361 doi 1023072223525 (cfp 65 89)

Daroacuteczy Z laquo Generalized Information Functions raquoIn Information and Control 161 (1970) p 36-51 doi 10 1016s0019- 9958(70)80040- 7 (cfp 67)

Das J K et J Nautiyal laquo Forest Variability In-dex A Vector Quantifying Forest Stand Diver-sity and Forest Compactness raquo In Forest Poli-cy and Economics 63-4 (2004) p 271-288 doi 101016jforpol200403003 (cf p 219)

Dauby G et O J Hardy laquo Sampled-Based Esti-mation of Diversity Sensu Stricto by Transfor-ming Hurlbert Diversities into Effective Numberof Species raquo In Ecography 357 (2012) p 661-672 doi 10 1111j 1600- 0587201106860x(cf p 12 57 58 70)

Davis H T The Theory of Econometrics Bloo-mington Indiana The Principia Press 1941(cf p 61)

De Bello F S Lavergne C N Meynard J Lepš et W Thuiller laquo The Partitioning of Diversity Showing Theseus a Way out of the Labyrinth raquoIn Journal of Vegetation Science 215 (2010)p 992-1000 doi 10 1111j 1654- 1103201001195x (cf p 198)

DeBenedictis P A laquo On the Correlations betweenCertain Diversity Indices raquo In The AmericanNaturalist 107954 (1973) p 295-302 doi 1023072459799 (cf p 95)

DeLong D C J laquo Defining Biodiversity raquo In Wild-life Society Bulletin 244 (1996) p 738-749 JS-TOR 3783168 (cf p ix)

Delord J laquo La Biodiversiteacute Imposture ScientifiqueOu Ruse Eacutepisteacutemologique raquo In La BiodiversiteacuteEn Question Enjeux Philosophiques Eacutethiqueset Scientifiques Sous la dir drsquoE Casetta et JDelord Paris Editions Mateacuteriologiques 2014p 83-118 doi 103917edmatdelor2014010083 (cf p ix)

Dengler J laquo Which Function Describes the Species-Area Relationship Best A Review and Empiri-cal Evaluation raquo In Journal of Biogeography364 (2009) p 728-744 doi 101111j1365-2699200802038x (cf p 10 259)

Devictor V D Mouillot C Meynard F Jiguet W Thuiller et N Mouquet laquo Spatial Mismatch and Congruence betweenTaxonomic Phylogenetic and FunctionalDiversity The Need for Integrative Conser-vation Strategies in a Changing World raquo In Ecology letters 138 (2010) p 1030-40 doi 10 1111 j 1461 - 0248 2010 01493 x PMID 20545736 (cf p 25 106)

Dice L R laquo Measures of the Amount of EcologicAssociation between Species raquo In Ecology 263(1945) p 297-302 doi 1023071932409 (cfp 169)

Diggle P J Statistical Analysis of Spatial PointPatterns London Academic Press 1983 (cfp 251)

Dobzhansky T Genetics and the Origin of SpeciesNew York Columbia University Press 1937 (cfp 7)

Drakare S J J Lennon et H Hillebrand laquo TheImprint of the Geographical Evolutionary andEcological Context on SpeciesndashArea Relation-ships raquo In Ecology Letters 92 (2006) p 215-227 doi 10 1111j 1461- 0248200500848x(cf p 254)

Ellerman D laquo An Introduction to LogicalEntropy and Its Relation to Shannon Entro-py raquo In International Journal of SemanticComputing 702 (2013) p 121-145 doi 101142S1793351X13400059 (cf p 48)

Ellison A M laquo Partitioning Diversity raquo In Ecology917 (2010) p 1962-1963 doi doi10189009-16921 (cf p 187)

Engen S laquo On Species Frequency Models raquo In Bio-metrika 612 (1974) p 263-270 doi 1023072334353 (cf p 259)

mdash laquo Exponential and Logarithmic Species-AreaCurves raquo In The American Naturalist 111979(1977) p 591-594 JSTOR 2460244 (cf p 92239 259)

Engen S et R Lande laquo Population DynamicModels Generating the Lognormal SpeciesAbundance Distribution raquo In MathematicalBiosciences 1322 (1996) p 169-183 doi 1010160025-5564(95)00054-2 (cf p 17)

Eren M I A Chao W-H Hwang et R KColwell laquo Estimating the Richness of aPopulation When the Maximum Number ofClasses Is Fixed A Nonparametric Solutionto an Archaeological Problem raquo In Plos One75 (2012) doi 101371journalpone0034179(cf p 29)

Escalas A T Bouvier M A Mouchet FLeprieur C Bouvier M Troussellier et D Mouillot laquo A Unifying QuantitativeFramework for Exploring the Multiple Facets ofMicrobial Biodiversity across Diverse Scales raquoIn Environmental Microbiology 1510 (2013)p 2642-2657 doi 10 11111462 - 2920 12156(cf p 125)

Esty W W laquo A Normal Limit Law for a Nonpa-rametric Estimator of the Coverage of a Ran-dom Sample raquo In The Annals of Statistics 113(1983) p 905-912 doi 1023072240652 JS-TOR 2240652 (cf p 12)

Faddeev D K laquo On the Concept of Entropy of a Fi-nite Probabilistic Scheme raquo In Rossiiskaya Aka-demiya Nauk Moskovskoe Matematicheskoe Ob-shchestvo Uspekhi Matematicheskikh Nauk 167(1956) p 227-231 (cf p 221 222)

Faith D P laquo Conservation Evaluation and Phylo-genetic Diversity raquo In Biological Conservation611 (1992) p 1-10 doi 1010160006-3207(92)91201-3 (cf p 123)

mdash laquo Threatened Species and the Potential Loss ofPhylogenetic Diversity Conservation ScenariosBased on Estimated Extinction Probabilities andPhylogenetic Risk Analysis raquo In ConservationBiology 226 (2008) p 1461-70 doi 101111j1523-1739200801068x PMID 18798854 (cfp 114)

Fattorini L et M Marcheselli laquo Inference on In-trinsic Diversity Profiles of Biological Popula-tions raquo In Environmetrics 105 (1999) p 589-

Bibliographie 279

599 doi 101002(SICI)1099-095X(19990910)105lt589AID-ENV374gt30CO2-0 (cf p 73)

Felsenstein J laquo Phylogenies and the ComparativeMethod raquo In The American Naturalist 251(1985) p 1-15 doi 101086284325 (cf p 105116)

mdash Inferring Phylogenies 2nd Ed SinauerAssociates 2004 (cf p 104)

Fisher R A A S Corbet et C B Williams laquo The Relation between the Number of Speciesand the Number of Individuals in a RandomSample of an Animal Population raquo In Journalof Animal Ecology 12 (1943) p 42-58 doi 1023071411 (cf p 16 25 163 233 235)

Gadagkar R laquo An Undesirable Property of HillrsquosDiversity Index N2 raquo In Oecologia 80 (1989)p 140-141 doi 101007BF00789944 (cf p 71)

Gaacutercia Martiacuten H et N Goldenfeld laquo On the Ori-gin and Robustness of Power-Law Species-AreaRelationships in Ecology raquo In Proceedings ofthe National Academy of Sciences of the UnitedStates of America 10327 (2006) p 10310-10315doi 101073pnas0510605103 (cf p 259)

Garnier E J Cortez G Billegraves M-L Navas C Roumet M Debussche G Laurent A Blanchard D Aubry A Bellmann C Neill et J-P Toussaint laquo Plant FunctionalMarkers Capture Ecosystem Properties duringSecondary Succession raquo In Ecology 859 (2004)p 2630-2637 doi 10189003-0799 (cf p 130)

Gaston K J laquo Global Patterns in Biodiversity raquoIn Nature 4056783 (2000) p 220-227 doi 10103835012228 (cf p 5)

Gini C Variabilitagrave e Mutabilitagrave Bologna C Cup-pini 1912 (cf p 48 90)

Gleason H A laquo On the Relation between Speciesand Area raquo In Ecology 32 (1922) p 158-162doi 1023071929150 (cf p 233 257)

Good I J laquo The Population Frequency of Speciesand the Estimation of Population Parameters raquoIn Biometrika 4034 (1953) p 237-264 doi 101093biomet403- 4237 (cf p 11 12 4975)

Gosselin F laquo Lorenz Partial Order The BestKnown Logical Framework to Define EvennessIndices raquo In Community Ecology 22 (2001)p 197-207 doi 10 1556ComEc2 2001 2 7(cf p 89)

Gotelli N J et R K Colwell laquo Quantifying Bio-diversity Procedures and Pitfalls in the Mea-surement and Comparison of Species Richness raquoIn Ecology Letters 44 (2001) p 379-391 doi 101046j1461-0248200100230x (cf p 81 243253)

Gould S J laquo An Allometric Interpretation ofSpecies-Area Curves The Meaning of theCoefficient raquo In The American Naturalist1143 (1979) p 335-343 doi 101086283482(cf p 255)

Gourlet-Fleury S J M Guehl et OLaroussinie Ecology amp Management of aNeotropical Rainforest Lessons Drawn fromParacou a Long-Term Experimental ResearchSite in French Guiana Paris Elsevier 2004(cf p xi)

Gower J C laquo Some Distance Properties of LatentRoot and Vector Methods Used in MultivariateAnalysis raquo In Biometrika 533 (1966) p 325-

338 doi 101093biomet533-4325 (cf p 173198)

mdash laquo A General Coefficient of Similarity and Someof Its Properties raquo In Biometrics 274 (1971)p 857-871 doi 1023072528823 (cf p 104174)

Gower J C et P Legendre laquo Metric and Eu-clidean Properties of Dissimilarity Coefficients raquoIn Journal of classification 48 (1986) p 5-48doi 101007BF01896809 (cf p 170 174)

Grabchak M E Marcon G Lang et Z Zhang laquo The Generalized Simpsonrsquos Entropy Is a Mea-sure of Biodiversity raquo In Plos One 123 (2017)e0173305 doi 101371journal pone0173305(cf p 83)

Grassberger P laquo Finite Sample Corrections to En-tropy and Dimension Estimates raquo In PhysicsLetters A 1286-7 (1988) p 369-373 doi 1010160375-9601(88)90193-4 (cf p 55 76 79)

mdash laquo Entropy Estimates from Insufficient Sam-plings raquo In arXiv Physics e-prints 0307138v2(2003) (cf p 55)

Greenwood M et G U Yule laquo An Inquiry into theNature of Frequency Distributions Representa-tive of Multiple Happenings with Particular Re-ference to the Occurrence of Multiple Attacks ofDisease or of Repeated Accidents raquo In Jour-nal of the Royal Statistical Society 832 (1920)p 255-279 doi 1023072341080 (cf p 236)

Gregorius H-R laquo On the Concept of EffectiveNumber raquo In Theoretical population biology402 (1991) p 269-83 doi 10 1016 0040 -5809(91)90056-L PMID 1788824 (cf p 66)

mdash laquo Distribution of Variation over Populations raquoIn Theory in Biosciences 1283 (2009)p 179-89 doi 10 1007 s12064 - 009 - 0064 - 1(cf p 225)

mdash laquo Linking Diversity and Differentiation raquo In Di-versity 23 (2010) p 370-394 doi 10 3390 d2030370 (cf p 70 165 219 225)

mdash laquo Partitioning of Diversity The rdquowithin Commu-nitiesrdquo Component raquo In Web Ecology 14 (2014)p 51-60 doi 105194we-14-51-2014 (cf p 66195 219 225)

mdash laquo Effective Numbers in the Partitioning of Biolo-gical Diversity raquo In Journal of Theoretical Bio-logy 409 (2016) p 133-147 doi 101016jjtbi201608037 (cf p 163)

Greig-Smith P Quantitative Plant Ecology 3rd edi-tion Berkeley and Los Angeles University ofCalifornia Press 1983 (cf p 253)

Grilli J S Azaele J R Banavar et A Maritan laquo Spatial Aggregation and the SpeciesndashArea Re-lationship across Scales raquo In Journal of Theo-retical Biology 3130 (2012) p 87-97 doi 101016jjtbi201207030 (cf p 260)

Guiasu R C et S Guiasu laquo The Weighted Qua-dratic Index of Biodiversity for Pairs of Species A Generalization of Raorsquos Index raquo In NaturalScience 39 (2011) p 795-801 doi 104236ns201139104 (cf p 130 198)

mdash laquo The Weighted Gini-Simpson Index Revitali-zing an Old Index of Biodiversity raquo In Inter-national Journal of Ecology 2012478728 (2012)p 1-10 doi 1011552012478728 (cf p 130)

Haegeman B J Hamelin J Moriarty P Neal J Dushoff et J S Weitz laquo Robust Estimationof Microbial Diversity in Theory and in Prac-

280 Bibliographie

tice raquo In The ISME journal 76 (2013) p 1092-101 doi 101038ismej201310 (cf p 18 77)

Hankin R K S laquo Introducing Untb an r Packagefor Simulating Ecological Drift under the UnifiedNeutral Theory of Biodiversity raquo In Journal ofStatistical Software 2212 (2007) p 1-15 doi 1018637jssv022i12 (cf p 238)

Hardy G H J E Littlewood et G Poacutelya In-equalities Cambridge University Press 1952 (cfp 139)

Hardy O J et L Jost laquo Interpreting and Esti-mating Measures of Community PhylogeneticStructuring raquo In Journal of Ecology 965(2008) p 849-852 doi 10 1111 j 1365 -2745200801423x (cf p 198)

Hardy O J et B Senterre laquo Characterizingthe Phylogenetic Structure of Communitiesby an Additive Partitioning of PhylogeneticDiversity raquo In Journal of Ecology 953(2007) p 493-506 doi 10 1111 j 1365 -2745200701222x (cf p 198)

Harte J A Kinzig et J Green laquo Self-Similarityin the Distribution and Abundance of Species raquoIn Science 2845412 (1999) p 334-336 doi 101126science2845412334 (cf p 255 261)

Hausser J et K Strimmer laquo Entropy Inferenceand the James-Stein Estimator with Applica-tion to Nonlinear Gene Association Networks raquoIn Journal of Machine Learning Research 10(2009) p 1469-1484 (cf p 56)

Havrda J et F Charvaacutet laquo Quantification Methodof Classification Processes Concept of Structu-ral Alpha-Entropy raquo In Kybernetika 31 (1967)p 30-35 (cf p 67)

Heller R et H R Siegismund laquo Relationship bet-ween Three Measures of Genetic DifferentiationG(ST) D-EST and Grsquo(ST) How Wrong HaveWe Been raquo In Molecular Ecology 1810 (2009)p 2080-2083 doi 101111j1365-294X200904185x (cf p 195)

Helmus M R T J Bland C K Williams et A RIves laquo Phylogenetic Measures of Biodiversity raquoIn The American naturalist 1693 (2007) E68-83 doi 101086511334 (cf p 116)

Heltshe J F et N E Forrester laquo EstimatingSpecies Richness Using the Jackknife Proce-dure raquo In Biometrics 391 (1983) p 1-11 doi 1023072530802 JSTOR 2530802 (cf p 30)

Hey J laquo The Mind of the Species Problem raquo In Trends in Ecology amp Evolution 167 (2001)p 326-329 doi 101016S0169-5347(01)02145-0(cf p x 7)

Hill M O laquo Diversity and Evenness A UnifyingNotation and Its Consequences raquo In Ecology542 (1973) p 427-432 doi 1023071934352(cf p 65 70 71 82 91 270)

Hoffmann S et A Hoffmann laquo Is Therea rdquoTruerdquo Diversity raquo In EcologicalEconomics 652 (2008) p 213-215 doi 101016jecolecon200801009 (cf p 69)

Holdridge L R W C Grenke W H Hatheway T Liang et J A Tosi Forest Environments inTropical Life Zones Oxford Pergamon Press1971 (cf p 44)

Horvitz D G et D J Thompson laquo A Generali-zation of Sampling without Replacement froma Finite Universe raquo In Journal of the Ameri-can Statistical Association 47260 (1952) p 663-

685 doi 10108001621459195210483446 (cfp 52)

Hsieh T C K H Ma et A Chao laquo iNEXT AnR Package for Interpolation and Extrapolationin Measuring Species Diversity raquo In Methods inEcology and Evolution 7 (2016) p 1451-1456doi 1011112041-210X12613 (cf p 81)

Hubbell S P laquo Estimating the Global Number ofTropical Tree Species and Fisherrsquos Paradox raquoIn Proceedings of the National Academy ofSciences 11224 (2015) p 7343-7344 doi 101073pnas1507730112 (cf p 47)

mdash The Unified Neutral Theory of Biodiversity andBiogeography Princeton University Press 2001(cf p 16 17 233-235 238 239 254 260)

Hurlbert S H laquo The Nonconcept of Species Diver-sity A Critique and Alternative Parameters raquoIn Ecology 524 (1971) p 577-586 doi 10 23071934145 (cf p 48 57 65 93 115)

Hutcheson K laquo A Test for Comparing DiversitiesBased on the Shannon Formula raquo In Journal ofTheoretical Biology 29 (1970) p 151-154 doi 1010160022-5193(70)90124-4 (cf p 51)

Hutchinson G E laquo Concluding Remarks raquo In Coldspring harbor symposia on quantitative biology22 (1957) p 415-427 doi 101101SQB195702201039 (cf p 110)

Hwang W-H C-W Lin et T-J Shen laquo Good-Turing Frequency Estimation in a Finite Popu-lation raquo In Biometrical journal 572 (2014)p 321-339 doi 10 1002 bimj 201300168(cf p 14)

Iknayan K J M W Tingley B J Furnas etS R Beissinger laquo Detecting Diversity Emer-ging Methods to Estimate Species Diversity raquoIn Trends in Ecology amp Evolution 292 (2014)p 97-106 doi 101016jtree201310012 (cfp 81)

Ilić V M M Stanković et E H Mulalić laquo Com-ments on rdquoGeneralization of Shannon-KhinchinAxioms to Nonextensive Systems and the Uni-queness Theorem for the Nonextensive Entro-pyrdquo raquo In IEEE Transactions on InformationTheory 5910 (2013) p 6950-6952 doi 101109TIT20132259958 (cf p 222)

Isaac N J S T Turvey B Collen CWaterman et J E Baillie laquo Mammals onthe EDGE Conservation Priorities Based onThreat and Phylogeny raquo In PLoS ONE 23(2007) e296 doi 101371journalpone0000296(cf p 114)

Izsak C et A R G Price laquo Measuring -DiversityUsing a Taxonomic Similarity Index and ItsRelation to Spatial Scale raquo In Marine Ecolo-gy Progress Series 215 (2001) p 69-77 doi 103354meps215069 (cf p 178)

Izsaacutek J et L Papp laquo A Link between EcologicalDiversity Indices and Measures of Biodiversity raquoIn Ecological Modelling 130 (2000) p 151-156 doi 10 1016 S0304 - 3800(00 ) 00203 - 9(cf p 125)

Izsaacutek J et S Pavoine laquo New Concentration Mea-sures as Kinds of the Quadratic Entropy raquo In Ecological Indicators 112 (2011) p 540-544doi httpdxdoiorg101016jecolind201007010 (cf p 130)

mdash laquo Links between the Species Abundance Distri-bution and the Shape of the Corresponding RankAbundance Curve raquo In Ecological Indicators

Bibliographie 281

141 (2012) p 1-6 doi 101016jecolind201106030 (cf p 15 237 261)

Jaccard P laquo Eacutetude Comparative de La Distribu-tion Florale Dans Une Portion Des Alpes et DuJura raquo In Bulletin de la Socieacuteteacute Vaudoise desSciences Naturelles 37 (1901) p 547-579 doi http dx doi org10 5169seals - 266450 (cfp 169)

James W et C Stein laquo Estimation with QuadraticLoss raquo In Proceedings of the Fourth BerkeleySymposium on Mathematical Statistics and Pro-bability Sous la dir de J Neyman T 1 Ber-keley California University of California Press1961 p 361-379 (cf p 56)

Jensen J L W V laquo Sur les fonctions convexes etles ineacutegaliteacutes entre les valeurs moyennes raquo In Acta Mathematica 301 (1906) p 175-193 doi 101007bf02418571 (cf p 53)

Jizhong Z M Shijun et C Changming laquo An Indexof Ecosystem Diversity raquo In Ecological Model-ling 59 (1991) p 151-163 doi 1010160304-3800(91)90176-2 (cf p x)

Jones C G J H Lawton et M Shachak laquo Orga-nisms as Ecosystem Engineers raquo In Oikos 693(1994) p 373-386 doi 101007978- 1- 4612-4018-1_14 (cf p 271)

Jones D et N Matloff laquo Statistical HypothesisTesting in Biology A Contradiction in Terms raquoIn Journal of Economic Entomology 795(1986) p 1156-1160 doi 101093jee7951156(cf p 209 210)

Jost L laquo Entropy and Diversity raquo In Oikos 1132(2006) p 363-375 doi 101111j20060030-129914714x (cf p 67 69 164)

mdash laquo Partitioning Diversity into Independent Alphaand Beta Components raquo In Ecology 8810(2007) p 2427-2439 doi 10189006- 17361(cf p 67 69 164-166 183 191 195 200 240270)

mdash laquo GST and Its Relatives Do Not Measure Diffe-rentiation raquo In Molecular Ecology 1718 (2008)p 4015-4026 doi 101111j1365-294X200803887x (cf p 195)

mdash laquo D vs GST Response to Heller and Siegismund(2009) and Ryman and Leimar (2009) raquo In Mo-lecular Ecology 1810 (2009) p 2088-2091 doi 101111j1365-294X200904186x (cf p 195)

mdash laquo Mismeasuring Biological Diversity Responseto Hoffmann and Hoffmann (2008) raquo In Eco-logical Economics 68 (2009) p 925-928 doi 101016jecolecon200810015 (cf p 69 70)

mdash laquo Independence of Alpha and Beta Diversities raquoIn Ecology 917 (2010) p 1969-1994 doi 10189009-03681 (cf p 187)

mdash laquo The Relation between Evenness and Diversi-ty raquo In Diversity 22 (2010) p 207-232 doi 103390d2020207 (cf p 5 89 94 95 109)

Jurasinski G V Retzer et C Beierkuhnlein laquo Inventory Differentiation and ProportionalDiversity A Consistent Terminology forQuantifying Species Diversity raquo In Oecologia1591 (2009) p 15-26 doi 10 1007s00442 -008-1190-z (cf p 163 263)

Kader G D et M Perry laquo Variability for Catego-rical Variables raquo In Journal of Statistics Edu-cation 152 (2007) doi 10108010691898200711889465 (cf p 113)

Kempton R A et L R Taylor laquo Modelsand Statistics for Species Diversity raquo In

Nature 2625571 (1976) p 818-820 doi 101038262818a0 (cf p 240)

Kempton R A et R W M Wedderburn laquo AComparison of Three Measures of Species Diver-sity raquo In Biometrics 341 (1978) p 25-37 doi 1023072529585 JSTOR 2529585 (cf p 240)

Keylock C J laquo Simpson Diversity and theShannon-Wiener Index as Special Cases ofa Generalized Entropy raquo In Oikos 1091(2005) p 203-207 doi 10 1111 j 0030 -1299200513735x (cf p 67)

Kindt R P Van Damme et A J Simons laquo Tree Di-versity in Western Kenya Using Profiles to Cha-racterise Richness and Evenness raquo In Biodiver-sity and Conservation 154 (2006) p 1253-1270doi 101007s10531-005-0772-x (cf p 71)

Kosman E laquo Difference and Diversity of PlantPathogen Populations A New Approach forMeasuring raquo In Phytopathology 8611 (1996)p 1152-1155 (cf p 215)

mdash laquo Measuring Diversity From Individuals to Po-pulations raquo In European Journal of Plant Pa-thology 1383 (2013) p 467-486 doi 101007s10658-013-0323-3 (cf p 215)

Kosman E et K J Leonard laquo Similarity Coef-ficients for Molecular Markers in Studies ofGenetic Relationships between Individuals forHaploid Diploid and Polyploid Species raquo In Molecular ecology 142 (2005) p 415-24 doi 10 1111 j 1365 - 294X 2005 02416 x PMID 15660934 (cf p 215)

mdash laquo Conceptual Analysis of Methods Appliedto Assessment of Diversity within and Dis-tance between Populations with Asexual orMixed Mode of Reproduction raquo In TheNew phytologist 1743 (2007) p 683-96 doi 10 1111 j 1469 - 8137 2007 02031 x PMID 17447922 (cf p 215)

Krishnamani R A Kumar et J Harte laquo Esti-mating Species Richness at Large Spatial ScalesUsing Data from Small Discrete Plots raquo In Eco-graphy 275 (2004) p 637-642 doi 101111j0906-7590200403790x (cf p 261)

Kullback S et R A Leibler laquo On Information andSufficiency raquo In The Annals of MathematicalStatistics 221 (1951) p 79-86 JSTOR 2236703(cf p 63 82)

Laliberteacute E et P Legendre laquo A Distance-BasedFramework for Measuring Functional Diversityfrom Multiple Traits raquo In Ecology 911 (2010)p 299-305 doi 10189008-22441 (cf p 114)

Lamberti P W et A P Majtey laquo Non-Logarithmic JensenndashShannon Divergence raquoIn Physica A-statistical Mechanics and ItsApplications 3291ndash2 (2003) p 81-90 doi httpdxdoiorg101016S0378-4371(03)00566-1(cf p 192)

Lande R laquo Statistics and Partitioning of Species Di-versity and Similarity among Multiple Commu-nities raquo In Oikos 761 (1996) p 5-13 doi 1023073545743 (cf p 49 164 191)

Lande R P J DeVries et T R Walla laquo WhenSpecies Accumulation Curves Intersect Im-plications for Ranking Diversity Using SmallSamples raquo In Oikos 893 (2000) p 601-605doi 10 1034 j 1600 - 0706 2000 890320 x(cf p 71 72)

Lavorel S K Grigulis S McIntyre N S GWilliams D Garden J Dorrough S

282 Bibliographie

Berman F Queacutetier A Theacutebault et ABonis laquo Assessing Functional Diversity in theField - Methodology Matters raquo In Func-tional Ecology 22 (2008) p 134-147 doi 101111j1365-2435200701339x (cf p 130)

Legendre P laquo Interpreting the Replacement andRichness Difference Components of Beta Diversi-ty raquo In Global Ecology and Biogeography 2311(2014) p 1324-1334 doi 101111geb12207(cf p 177)

Legendre P et M J Anderson laquo Distance-BasedRedundancy Analysis Testing MultispeciesResponses in Multifactorial Ecological Experi-ments raquo In Ecological Monographs 691 (1999)p 1-24 doi 1018900012-9615(1999)069[0001DBRATM]20CO2 (cf p 161 182)

Legendre P D Borcard et P R Peres-Neto laquo Analyzing Beta Diversity Partitioning theSpatial Variation of Community CompositionData raquo In Ecological Monographs 754 (2005)p 435-450 doi 10189005- 0549 (cf p 161182)

Legendre P et M De Caacuteceres laquo Beta Diversity asthe Variance of Community Data DissimilarityCoefficients and Partitioning raquo In Ecology Let-ters 168 (2013) p 951-963 doi 101111ele12141 (cf p 183)

Legendre P et E Gallagher laquo Ecologically Mea-ningful Transformations for Ordination of Spe-cies Data raquo In Oecologia 1292 (2001) p 271-280 doi 10 1007s004420100716 (cf p 161182)

Legendre P et L Legendre Numerical Ecology3rd Ed Elsevier 2012 (cf p 104 174)

Leinster T laquo The Magnitude of Metric Spaces raquo In Documenta Mathematica 18 (2013) p 857-905(cf p 139 144)

Leinster T et C Cobbold laquo Measuring Diversity The Importance of Species Similarity raquo In Eco-logy 933 (2012) p 477-489 doi 10189010-24021 (cf p 58 71 138 139 147 270)

Levins R Evolution in Changing Environments Some Theoretical Explorations Princeton Uni-versity Press 1968 (cf p 223 224)

Lewontin R laquo The Apportionment of Human Diver-sity raquo In Evolutionary Biology Sous la dir deT Dobzhansky M K Hecht et W C Steere T 6 Springer US 1972 p 381-398 doi 10 1007978-1-4684-9063-3_14 (cf p 188)

Lin J laquo Divergence Measures Based on the Shan-non Entropy raquo In IEEE Transactions on In-formation Theory 371 (1991) p 145-151 doi 1011091861115 (cf p 188)

Lineweaver H et D Burk laquo The Determination ofEnzyme Dissociation Constants raquo In Journalof the American Chemical Society 563 (1934)p 658-666 doi 101021ja01318a036 (cf p 43)

Lingoes J C laquo Some Boundary Conditions for aMonotone Analysis of Symmetric Matrices raquo In Psychometrika 362 (1971) p 195-203 doi 101007BF02291398 (cf p 102)

Liu C R J Whittaker K Ma et J R Malcolm laquo Unifying and Distinguishing Diversity Orde-ring Methods for Comparing Communities raquoIn Population Ecology 492 (2006) p 89-100doi 101007s10144-006-0026-0 (cf p 72)

Liu D D Wang Y Wang J Wu V P Singh XZeng L Wang Y Chen X Chen L Zhang etS Gu laquo Entropy of Hydrological Systems under

Small Samples Uncertainty and Variability raquoIn Journal of Hydrology 532 (2016) p 163-176doi 101016jjhydrol201511019 (cf p 57)

Lloyd M et R J Ghelardi laquo A Table for Cal-culating the rsquoequitabilityrsquo Component of SpeciesDiversity raquo In Journal of Animal Ecology 332(1964) p 217-225 doi 1023072628 JSTOR 2628 (cf p 89 92)

Loh J R E Green T Ricketts J Lamoreux MJenkins V Kapos et J Randers laquo The LivingPlanet Index Using Species Population TimeSeries to Track Trends in Biodiversity raquo In Phi-losophical Transactions of the Royal Society ofLondon Series B Biological Sciences 3601454(2005) p 289-295 doi 101098rstb20041584(cf p 272)

Lonsdale W M laquo Global Patterns of Plant Inva-sions and the Concept of Invasibility raquo In Eco-logy 805 (1999) p 1522-1536 doi 10 2307176544 (cf p 255)

Loreau M laquo Discours de Clocircture raquo In Actes de LaConfeacuterence Internationale Biodiversiteacute Scienceet Gouvernance Sous la dir de R Barbault et J-P Le Duc Paris France IRD Editions2005 p 254-256 (cf p ix)

Lorenz M O laquo Methods of Measuring theConcentration of Wealth raquo In QuarterlyPublications of the American StatisticalAssociation 9 (1905) p 209-219 doi 10108015225437190510503443 (cf p 89)

Ludovisi A et M I Taticchi laquo Investigating BetaDiversity by Kullback-Leibler Information Mea-sures raquo In Ecological Modelling 1921-2 (2006)p 299-313 doi 101016jecolmodel200505022(cf p 188)

Maasoumi E laquo A Compendium to InformationTheory in Economics and Econometrics raquo In Econometric Reviews 122 (1993) p 137-181doi 10108007474939308800260 (cf p 61 82)

MacArthur R H laquo Fluctuations of Animal Popu-lations and a Measure of Community Stability raquoIn Ecology 363 (1955) p 533-536 doi doi1023071929601 (cf p 64)

mdash laquo On the Relative Abundance of Bird Species raquoIn Proceedings of the National Academy ofSciences of the United States of America 433(1957) p 293-295 doi 101073pnas433293JSTOR 89566 (cf p 16)

mdash laquo Patterns of Species Diversity raquo In BiologicalReviews 404 (1965) p 510-533 doi 101111j1469-185X1965tb00815x (cf p 66)

MacDonald Z G S E Nielsen et J H Acorn laquo Negative Relationships between Species Rich-ness and Evenness Render Common DiversityIndices Inadequate for Assessing Long-TermTrends in Butterfly Diversity raquo In Biodiversityand Conservation 263 (2017) p 617-629 doi 101007s10531-016-1261-0 (cf p 95)

Magurran A E Ecological Diversity and Its Mea-surement Princeton NJ Princeton UniversityPress 1988 (cf p 16 18)

mdash Measuring Biological Diversity Oxford Black-well Publishing 2004 (cf p 233)

Maire E G Grenouillet S Brosse et SVilleacuteger laquo How Many Dimensions Are Neededto Accurately Assess Functional Diversity APragmatic Approach for Assessing the Qualityof Functional Spaces raquo In Global Ecology and

Bibliographie 283

Biogeography 246 (2015) p 728-740 doi 101111geb12299 (cf p 105)

Mao C X laquo Estimating Species AccumulationCurves and Diversity Indices raquo In StatisticaSinica 17 (2007) p 761-774 (cf p 58 74)

Mao C X et R K Colwell laquo Estimation of Spe-cies Richness Mixture Models the Role of RareSpecies and Inferential Challenges raquo In Ecology865 (2005) p 1143-1153 doi 10189004-1078(cf p 27)

Marcon E laquo Practical Estimation of Diversity fromAbundance Data raquo In HAL 01212435 (version2 2015) (cf p 37 76-79 86)

Marcon E et B Heacuterault laquo Decomposing Phylo-diversity raquo In Methods in Ecology and Evolu-tion 63 (2015) p 333-339 doi 1011112041-210X12323 (cf p 130 203 270)

mdash laquo Entropart an r Package to Measure and Parti-tion Diversity raquo In Journal of Statistical Soft-ware 678 (2015) p 1-26 doi 10 18637 jss v067i08 (cf p xi 270)

Marcon E B Heacuterault C Baraloto et G Lang laquo The Decomposition of Shannonrsquos Entropy anda Confidence Interval for Beta Diversity raquo In Oikos 1214 (2012) p 516-522 doi 101111j1600-0706201119267x (cf p 64 78 165 187199 211)

Marcon E I Scotti B Heacuterault V Rossi etG Lang laquo Generalization of the Partitioning ofShannon Diversity raquo In Plos One 93 (2014)e90289 doi 101371journalpone0090289 (cfp 69 76 78 126 136 163 165 167 191 192194 199 209 210)

Marcon E Z Zhang et B Heacuterault laquo TheDecomposition of Similarity-Based Diversityand Its Bias Correction raquo In HAL 00989454(version 3 2014) (cf p 145 199 205)

Margalef R laquo Temporal Succession and Spatial He-terogeneity in Phytoplankton raquo In Perspectivesin Marine Biology Sous la dir drsquoA Buzzati-Traverso Berkeley California University ofCalifornia Press 1958 p 323-349 (cf p 233)

Mason N W H K MacGillivray J B Steel et J B Wilson laquo An Index of Functional Di-versity raquo In Journal of Vegetation Science 144(2003) p 571-578 doi 101111j1654- 11032003tb02184x (cf p 112)

Mason N W H D Mouillot W G Lee etJ B Wilson laquo Functional Richness FunctionalEvenness and Functional Divergence ThePrimary Components of Functional Diversity raquoIn Oikos 1111 (2005) p 112-118 doi 101111j0030- 1299200513886x (cf p 109110)

Mateacutern B laquo Spatial Variation raquo In Meddelandenfraringn Statens Skogsforskningsinstitut 495 (1960)p 1-144 (cf p 251)

May R M laquo Patterns of Species Abundance and Di-versity raquo In Ecology and Evolution of Com-munities Sous la dir de M L Cody et J MDiamond Harvard University Press 1975 p 81-120 (cf p 17 18 96 254)

mdash laquo Taxonomy as Destiny raquo In Nature 347 (1990)p 129-130 doi 101038347129a0 (cf p 101)

mdash laquo Why Worry about How Many Species andTheir Loss raquo In PLoS Biology 98 (2011)e1001130 doi 1013712Fjournalpbio1001130(cf p 46)

May R M et M P H Stumpf laquo Species-Area Rela-tions in Tropical Forests raquo In Science 2905499(2000) p 2084-2086 doi 101126science29054992084 (cf p 254)

Mayden R L laquo A Hierarchy of Species Concepts The Denouement in the Saga of the Species Pro-blem raquo In Species The Units of BiodiversitySous la dir de M F Claridge H A Dawah et M R Wilson London Chapman and Hall1997 p 381-424 (cf p 7)

Mayr E Systematics and the Origin of Species fromthe Viewpoint of a Zoologist New York Colum-bia University Press 1942 (cf p 7)

McGill B J laquo A Test of the Unified NeutralTheory of Biodiversity raquo In Nature 4226934(2003) p 881-885 doi 10 1038nature01583(cf p 260)

McGill B J R S Etienne J S Gray DAlonso M J Anderson H K Benecha M Dornelas B J Enquist J L Green F He A H Hurlbert A E Magurran P A Marquet B A Maurer A Ostling C U Soykan K I Ugland et E P White laquo Species Abundance Distributions Movingbeyond Single Prediction Theories to Integra-tion within an Ecological Framework raquo In Ecology Letters 1010 (2007) p 995-1015 doi 101111j1461-0248200701094x (cf p 16)

McGuinness K A laquo Equations and Explanations inthe Study of Species-Area Curves raquo In Biolo-gical Reviews 593 (1984) p 423-440 doi 101111j1469- 185X1984tb00711x (cf p 253254)

Mcintosh R P laquo An Index of Diversity and theRelation of Certain Concepts to Diversity raquo In Ecology 483 (1967) p 392-404 doi 1023071932674 (cf p 3)

Meine C M Souleacute et R F Noss laquo rdquoA Mission-Driven Disciplinerdquo The Growth of ConservationBiology raquo In Conservation Biology 203 (2006)p 631-651 doi 10 1111 j 1523 - 1739 2006 00449x (cf p ix)

Mendes R S L R Evangelista S M Thomaz A A Agostinho et L C Gomes laquo A Unified In-dex to Measure Ecological Diversity and SpeciesRarity raquo In Ecography 314 (2008) p 450-456doi 101111j0906-7590200805469x (cf p 4867 93)

Menhinick E F laquo A Comparison of Some Species-Individuals Diversity Indices Applied to Samplesof Field Insects raquo In Ecology 454 (1964) p 859-861 doi 1023071934933 (cf p 233)

Meacuterigot B et J-C Gaertner laquo Incorporation ofPhylogeny in Biological Diversity Measurement Drawbacks of Extensively Used Indices and Ad-vantages of Quadratic Entropy raquo In BioEssays3311 (2011) p 819-822 doi 10 1002 bies 201100103 (cf p 112)

Michaelis L et M L Menten laquo Die Kinetik Der In-vertinwirkung raquo In Biochemische Zeitschrift 49(1913) p 333-369 PMID 21888353 (cf p 41)

Miller G A laquo Note on the Bias of Information Es-timates raquo In Information Theory in Psycho-logy Problems and Methods Sous la dir de HQuastler Free Press 1955 p 95-100 (cf p 51)

Miraldo A S Li M K Borregaard AFlorez-Rodriguez S Gopalakrishnan M Rizvanovic Z Wang C Rahbek K AMarske et D Nogues-Bravo laquo An An-

284 Bibliographie

thropocene Map of Genetic Diversity raquo In Science 3536307 (2016) p 1532-1535 doi 101126scienceaaf4381 (cf p 5)

Mooers A Oslash et S B Heard laquo Inferring Evolu-tionary Process from Phylogenetic Tree Shape raquoIn The Quarterly Review of Biology 721 (1997)p 31-54 doi 101086419657 (cf p 106)

Mora C D P Tittensor S Adl A G BSimpson et B Worm laquo How Many SpeciesAre There on Earth and in the Ocean raquoIn PLoS Biology 98 (2011) e1001127 doi 101371journalpbio1001127 (cf p 46)

Moreno C E et P Rodriacuteguez laquo A ConsistentTerminology for Quantifying Species Diversi-ty raquo In Oecologia 1632 (2010) p 279-82doi 101007s00442-010-1591-7 (cf p 6)

Motomura I laquo On the statistical treatment of com-munities raquo In Zoological Magazine 44 (1932)p 379-383 (cf p 16 18)

Motyka J O Celach i Metodach Badan Geobota-nicznych Sur Les Buts et Les Meacutethodes Des Re-cherches Geacuteobotaniques Lublin Poland Nakla-dem universytftu Marii Curie-Sklodowskiej 1947(cf p 174)

Mouchet M A F Guilhaumon S Villeacuteger N W H Mason J-A Tomasini et DMouillot laquo Towards a Consensus for Calcu-lating Dendrogram-Based Functional DiversityIndices raquo In Oikos 117 (2008) p 794-800 doi 101111j0030- 1299200816594x (cf p 104111)

Mouchet M A et D Mouillot laquo DecomposingPhylogenetic Entropy into and Com-ponents raquo In Biology Letters 72 (2011)p 205-209 doi 10 1098 rsbl 2010 0769(cf p 204)

Mouillot D et A Leprecirctre laquo A Comparison ofSpecies Diversity Estimators raquo In Researcheson Population Ecology 412 (1999) p 203-215doi 101007s101440050024 (cf p 26)

Mouillot D W H N Mason O Dumay et J BWilson laquo Functional Regularity A NeglectedAspect of Functional Diversity raquo In Oecologia1423 (2005) p 353-359 doi 101007s00442-004-1744-7 (cf p 111)

Mouillot D W Stubbs M Faure O Dumay J-A Tomasini J B Wilson et T DChi laquo Niche Overlap Estimates Based onQuantitative Functional Traits A NewFamily of Non-Parametric Indices raquo In Oecologia 1453 (2005) p 345-353 doi 101007s00442-005-0151-z (cf p 4)

Nei M laquo Genetic Distance between Populations raquoIn The American Naturalist 106949 (1972)p 283-292 doi 10 2307 2459777 JSTOR 2459777 (cf p 143)

mdash laquo Analysis of Gene Diversity in Subdivided Popu-lations raquo In Proceedings of the National Acade-my of Sciences of the United States of America7012 (1973) p 3321-3323 doi 101073pnas70123321 (cf p 195 264)

Nekola J C et P S White laquo The Distance Decayof Similarity in Biogeography and Ecology raquo In Journal of Biogeography 264 (1999) p 867-878doi 10 1046 j 1365 - 2699 1999 00305 x (cfp 161)

Neyman J et E L Scott laquo Statistical Approachto Problems of Cosmology raquo In Journal of theRoyal Statistical Society Series B (Statistical

Methodology) 201 (1958) p 1-43 doi 101111j2517-61611958tb00272x JSTOR 2983905(cf p 250)

Norris J L et K H Pollock laquo Non-ParametricMLE for Poisson Species Abundance Mo-dels Allowing for Heterogeneity betweenSpecies raquo In Environmental and Ecologi-cal Statistics 54 (1998) p 391-402 doi 101023A1009659922745 (cf p 40)

OrsquoHara R B laquo Species Richness Estimators HowMany Species Can Dance on the Head of a Pin raquoIn Journal of Animal Ecology 74 (2005) p 375-386 doi 101111j1365-2656200500940x (cfp 26)

Ochiai A laquo Zoogeographic Studies on the SoleoidFishes Found in Japan and Its Neighbouring Re-gions raquo In Bulletin of the Japanese Society ofScientific Fisheries 229 (1957) p 526-530 doi 102331suisan22526 (cf p 170)

Odum E P laquo Bird Populations of the Highlands(North Carolina) Plateau in Relation to PlantSuccession and Avian Invasion raquo In Ecology314 (1950) p 587-605 doi 1023071931577(cf p 174)

Oksanen J F G Blanchet R Kindt PLegendre P R Minchin R B OrsquoHara G L Simpson P Solymos M H H Stevens et H Wagner laquo Vegan Community EcologyPackage raquo In (2012) (cf p xi 244)

Olszewski T D laquo A Unified Mathematical Frame-work for the Measurement of Richness and Even-ness within and among Multiple Communities raquoIn Oikos 1042 (2004) p 377-387 doi 101111j0030-1299200412519x (cf p 48)

Paine R T laquo A Note on Trophic Complexity andCommunity Stability raquo In American naturalist103929 (1969) p 91-93 doi 101086282586JSTOR 2459472 (cf p 271)

Pallmann P F Schaarschmidt L A Hothorn C Fischer H Nacke K U Priesnitz etN J Schork laquo Assessing Group Differencesin Biodiversity by Simultaneously Testing aUser-Defined Selection of Diversity Indices raquoIn Molecular Ecology Resources 126 (2012)p 1068-1078 doi 10 11111755 - 0998 12004(cf p 72)

Patil G P et C Taillie laquo Diversity as a Conceptand Its Measurement raquo In Journal of theAmerican Statistical Association 77379 (1982)p 548-561 doi 10 2307 2287709 JSTOR 2287709 (cf p 62 65 67 71 72)

Pavoine S et M B Bonsall laquo Biological Diversity Distinct Distributions Can Lead to the Maximi-zation of Raorsquos Quadratic Entropy raquo In Theo-retical Population Biology 752-3 (2009) p 153-163 doi 101016jtpb200901008 (cf p 130133 138)

mdash laquo Measuring Biodiversity to Explain CommunityAssembly A Unified Approach raquo In BiologicalReviews 864 (2011) p 792-812 doi 101111j1469-185X201000171x (cf p 4 106 109 111)

Pavoine S A-B Dufour et D Chessel laquo FromDissimilarities among Species to Dissimilaritiesamong Communities A Double Principal Co-ordinate Analysis raquo In Journal of TheoreticalBiology 2284 (2004) p 523-537 doi 101016jjtbi200402014 (cf p 126 161 196 198)

Pavoine S et J Izsaacutek laquo New Biodiversity MeasureThat Includes Consistent Interspecific and In-

Bibliographie 285

traspecific Components raquo In Methods in Eco-logy and Evolution 52 (2014) p 165-172 doi 1011112041-210X12142 (cf p 151)

Pavoine S M S Love et M B Bonsall laquo Hierarchical Partitioning of Evolutionaryand Ecological Patterns in the Organizationof Phylogenetically-Structured Species As-semblages Application to Rockfish (Genus Sebastes) in the Southern California Bight raquo In Ecology Letters 129 (2009) p 898-908 doi 101111j1461-0248200901344x (cf p 132)

Pavoine S E Marcon et C Ricotta laquo lsquoEquivalentNumbersrsquo for Species Phylogenetic or Functio-nal Diversity in a Nested Hierarchy of MultipleScales raquo In Methods in Ecology and Evolution710 (2016) p 1152-1163 doi 1011112041-210X12591 (cf p 165 204 270)

Pavoine S S Ollier et A-B Dufour laquo Is the Ori-ginality of a Species Measurable raquo In EcologyLetters 8 (2005) p 579-586 doi 10 1111 j 1461- 0248 2005 00752 x (cf p 105 126 127129 155)

Pavoine S S Ollier et D Pontier laquo Mea-suring Diversity from Dissimilarities withRaorsquos Quadratic Entropy Are Any Dis-similarities Suitable raquo In TheoreticalPopulation Biology 674 (2005) p 231-239doi 101016jtpb200501004 (cf p 125)

Pavoine S et C Ricotta laquo Functional and Phy-logenetic Similarity among Communities raquo In Methods in Ecology and Evolution 57 (2014)p 666-675 doi 1011112041-210X12193 (cfp 149 178)

Pavoine S J Vallet A-B Dufour S Gachet etH Daniel laquo On the Challenge of Treating Va-rious Types of Variables Application for Im-proving the Measurement of Functional Diversi-ty raquo In Oikos 1183 (2009) p 391-402 doi 101111j1600-0706200916668x (cf p 104)

Pearson K laquo On the Criterion That a given Systemof Deviations from the Probable in the Case ofa Correlated System of Variables Is Such ThatIt Can Be Reasonably Supposed to Have Arisenfrom Random Sampling raquo In Philosophical Ma-gazine Series 5 50302 (1900) p 157-175 doi 10108014786440009463897 (cf p 82)

mdash laquo On Lines and Planes of Closest Fit to Systemsof Points in Space raquo In Philosophical Magazine2 (1901) p 559-572 (cf p 180)

Peet R K laquo The Measurement of Species Diversi-ty raquo In Annual review of ecology and systema-tics 5 (1974) p 285-307 doi 101146annureves05110174001441 (cf p 25 91)

Peacutelissier R et P Couteron laquo An Operational Ad-ditive Framework for Species Diversity Partitio-ning and Beta-Diversity Analysis raquo In Journalof Ecology 952 (2007) p 294-300 doi 101111j1365-2745200701211x (cf p 213)

Peacutelissier R P Couteron S Dray et DSabatier laquo Consistency between OrdinationTechniques and Diversity Measurements Two Strategies for Species Occurrence Da-ta raquo In Ecology 841 (2003) p 242-251doi 10 1890 0012 - 9658(2003 ) 084[0242 CBOTAD]20CO2 (cf p 213)

Pereira H M S Ferrier M Walters G NGeller R H G Jongman R J Scholes M W Bruford N Brummitt S H MButchart A C Cardoso N C Coops

E Dulloo D P Faith J Freyhof R DGregory C Heip R Houmlft G Hurtt W Jetz D S Karp M A McGeoch D Obura Y Onoda N Pettorelli BReyers R Sayre J P W Scharlemann S N Stuart E Turak M Walpole et MWegmann laquo Essential Biodiversity Variables raquoIn Science 339 (2013) p 277-278 doi 101126science1229931 (cf p 272)

Pernegraves J eacuted Gestion Des Ressources GeacuteneacutetiquesDes Plantes Tome 2 Manuel Paris Agencede Coopeacuteration culturelle et technique 1984 (cfp 7)

Petchey O L et K J Gaston laquo Functional Di-versity (FD) Species Richness and Communi-ty Composition raquo In Ecology Letters 5 (2002)p 402-411 doi 10 1046 j 1461 - 0248 2002 00339x (cf p 111 123)

Picard N M Karembe et P Birnbaum laquo Species-Area Curve and Spatial Pattern raquo In Ecoscience111 (2004) p 45-54 doi 10108011956860200411682808 (cf p 250 252)

Pielou E C laquo Species-Diversity and Pattern-Diversity in the Study of Ecological Succession raquoIn Journal of Theoretical Biology 102 (1966)p 370-383 doi 1010160022-5193(66)90133-0(cf p 53)

mdash laquo The Measurement of Diversity in DifferentTypes of Biological Collections raquo In Journalof Theoretical Biology 13C (1966) p 131-144doi 1010160022-5193(66)90013-0 (cf p 5092)

mdash An Introduction to Mathematical Ecology NewYork Wiley 1969 (cf p 244)

mdash laquo Niche Width and Niche Overlap A Methodfor Measuring Them raquo In Ecology 534 (1972)p 687-692 doi 1023071934784 (cf p 223224)

mdash Ecological Diversity New York Wiley 1975 (cfp 61 92 101)

Plotkin J B et H C Muller-Landau laquo Sam-pling the Species Composition of a Landscape raquoIn Ecology 8312 (2002) p 3344-3356 doi 1018900012-9658(2002)083[3344STSCOA]20CO2 (cf p 173)

Plotkin J B M D Potts N Leslie NManokaran J V LaFrankie et P S Ashton laquo Species-Area Curves Spatial Aggregationand Habitat Specialization in Tropical Forests raquoIn Journal of Theoretical Biology 2071(2000) p 81-99 doi 101006jtbi20002158(cf p 250)

Plotkin J B M D Potts D W Yu SBunyavejchewin R Condit R B Foster S P Hubbell J LaFrankie N Manokaran H-S Lee R Sukumar M A Nowak etP S Ashton laquo Predicting Species Diversityin Tropical Forests raquo In Proceedings of theNational Academy of Sciences of the UnitedStates of America 9720 (2000) p 10850-10854doi 101073pnas972010850 (cf p 255 256260)

Podani J laquo Extending Gowerrsquos General Coefficientof Similarity to Ordinal Characters raquo In Taxon482 (1999) p 331-340 doi 1023071224438JSTOR 1224438 (cf p 104)

Podani J C Ricotta et D Schmera laquo A GeneralFramework for Analyzing Beta Diversity Nes-tedness and Related Community-Level Pheno-

286 Bibliographie

mena Based on Abundance Data raquo In Ecolo-gical Complexity 15 (2013) p 52-61 doi 101016jecocom201303002 (cf p 177)

Podani J et D Schmera laquo On Dendrogram-BasedMeasures of Functional Diversity raquo In Oikos1151 (2006) p 179-185 doi 101111j20060030-129915048x (cf p 104 155)

mdash laquo How Should a Dendrogram-Based Measure ofFunctional Diversity Function A Rejoinder toPetchey and Gaston raquo In Oikos 1168 (2007)p 1427-1430 doi 101111j20070030- 129916160x (cf p 105 155)

mdash laquo A New Conceptual and Methodological Fra-mework for Exploring and Explaining Patternin Presence - Absence Data raquo In Oikos 12011(2011) p 1625-1638 doi 101111j1600-0706201119451x (cf p 176 177)

mdash laquo Once Again on the Components of PairwiseBeta Diversity raquo In Ecological Informatics 32(2016) p 63-68 doi 101016jecoinf201601002 (cf p 177)

Presley S J S M Scheiner et M R Willig laquo Evaluation of an Integrated Framework for Bio-diversity with a New Metric for Functional Dis-persion raquo In PloS one 98 (2014) e105818 doi 101371journalpone0105818 (cf p 119)

Preston F W laquo The Commonness and Rarity ofSpecies raquo In Ecology 293 (1948) p 254-283doi 1023071930989 (cf p 15 16 39)

mdash laquo Time and Space and the Variation of Species raquoIn Ecology 414 (1960) p 611-627 doi 10 23071931793 (cf p 234 259)

mdash laquo The Canonical Distribution of Commonnessand Rarity Part I raquo In Ecology 432 (1962)p 185-215 doi 1023071931976 (cf p 254258)

Pueyo S F He et T Zillio laquo The Maximum En-tropy Formalism and the Idiosyncratic Theory ofBiodiversity raquo In Ecology letters 1011 (2007)p 1017-28 doi 10 1111 j 1461 - 0248 2007 01096x (cf p 18)

Purvis A et A Hector laquo Getting the Measureof Biodiversity raquo In Nature 4056783 (2000)p 212-9 doi 10103835012221 (cf p x)

R Core Team R A Language and Environmentfor Statistical Computing Vienna Austria RFoundation for Statistical Computing 2021 (cfp xi)

Raaijmakers J G W laquo Statistical Analysis of theMichaelis-Menten Equation raquo In Biometrics434 (1987) p 793-803 doi 1023072531533(cf p 42 43)

Rajaram R et B Castellani laquo An Entropy BasedMeasure for Comparing Distributions of Com-plexity raquo In Physica A Statistical Mechanicsand its Applications 453 (2016) p 35-43 doi 101016jphysa201602007 (cf p 86)

Rao C R laquo The Use and Interpretation of Princi-pal Component Analysis in Applied Research raquoIn Sankhyā The Indian Journal of Statistics264 (1964) p 329-358 JSTOR 25049339 (cfp 183)

mdash laquo Diversity and Dissimilarity Coefficients A Unified Approach raquo In Theoretical Po-pulation Biology 21 (1982) p 24-43 doi 1010160040-5809(82)90004-1 (cf p 101 125180 198)

Rao C R et T K Nayak laquo Cross Entropy Dissimi-larity Measures and Characterizations of Qua-

dratic Entropy raquo In IEEE Transactions on In-formation Theory 315 (1985) p 589-593 doi 101109tit19851057082 (cf p 187)

Reacutejou-Meacutechain M O Flores N Bourland J-LDoucet R F Feacuteteacutekeacute A Pasquier et O JHardy laquo Spatial Aggregation of Tropical Treesat Multiple Spatial Scales raquo In Journal of Eco-logy 996 (2011) p 1373-1381 doi 101111j1365-2745201101873x (cf p 163)

Renkonen O laquo Statisch-Oumlkologische Untersuchun-gen Uumlber Die Terrestrische Kaumlferwelt Der Fin-nischen Bruchmoore raquo In Annales botanici So-cietatis Zoologicaelig Botanicaelig Fennicaelig Vanamo 6(1938) p 1-231 (cf p 174)

Reacutenyi A laquo On Measures of Entropy and Informa-tion raquo In 4th Berkeley Symposium on Mathe-matical Statistics and Probability Sous la dir deJ Neyman T 1 Berkeley USA University ofCalifornia Press 1961 p 547-561 (cf p 65 81222)

Richard-Hansen C G Jaouen T Denis O Brunaux E Marcon et S Guitet laquo Landscape Patterns Influence Communities ofMedium- to Large-Bodied Vertebrate in Undis-turbed Terra Firme Forests of French Guiana raquoIn Journal of Tropical Ecology 315 (2015)p 423-436 doi 10 1017 S0266467415000255(cf p 211)

Richards R A The Species Problem A Philosophi-cal Analysis Cambridge Cambridge UniversityPress 2010 (cf p 7)

Ricotta C laquo On Parametric Evenness Measures raquoIn Journal of Theoretical Biology 2222 (2003)p 189-197 doi 101016S0022-5193(03)00026-2(cf p 92)

mdash laquo A Parametric Diversity Measure Combiningthe Relative Abundances and TaxonomicDistinctiveness of Species raquo In Diversity andDistributions 102 (2004) p 143-146 doi 101111j1366-9516200400069x (cf p 115)

mdash laquo A Recipe for Unconventional Evenness Mea-sures raquo In Acta Biotheoretica 522 (2004) p 95-104 doi 101023BACBI000004343841888ac(cf p 90 92)

mdash laquo A Note on Functional Diversity Measures raquo In Basic and Applied Ecology 65 (2005) p 479-486doi 101016jbaae200502008 (cf p 107)

mdash laquo Additive Partitioning of Raorsquos Quadratic Di-versity A Hierarchical Approach raquo In Ecolo-gical Modelling 1834 (2005) p 365-371 doi 101016jecolmodel200408020 (cf p 134)

mdash laquo On Parametric Diversity Indices in Ecology A Historical Note raquo In Community Ecology 62(2005) p 241-244 doi 101556ComEc62005212 (cf p 67)

mdash laquo Through the Jungle of Biological Diversity raquoIn Acta Biotheoretica 531 (2005) p 29-38 doi 101007s10441-005-7001-6 (cf p x)

mdash laquo Strong Requirements for Weak Diversi-ties raquo In Diversity and Distributions 122(2006) p 218-219 doi 10 1111 j 1366 -9516200500233x (cf p 115)

mdash laquo A Semantic Taxonomy for Diversity Mea-sures raquo In Acta Biotheoretica 551 (2007)p 23-33 doi 10 1007 s10441 - 007 - 9008 - 7(cf p 4 101 106)

mdash laquo Computing Parametric Beta Diversity withUnequal Plot Weights A Solution Based onResampling Methods raquo In Theoretical Ecology

Bibliographie 287

21 (2009) p 13-17 doi 101007s12080-008-0028-y (cf p 166)

mdash laquo On Hierarchical Diversity Decomposition raquoIn Journal of Vegetation Science 162(2009) p 223-226 doi 10 1111 j 1654 -11032005tb02359x (cf p 165)

Ricotta C et A T Acosta laquo On the FunctionalDiversity of Partially Distinct Species SomeTheory and a Practical Example raquo In Com-munity Ecology 152 (2014) p 205-211 doi 101556ComEc15201429 (cf p 135)

Ricotta C et G C Avena laquo An Information-Theoretical Measure of Beta-Diversity raquo In Plant Biosystems 1371 (2003) p 57-61 doi 10108011263500312331351331 (cf p 188)

mdash laquo An Information-Theoretical Measure of Taxo-nomic Diversity raquo In Acta biotheoretica 2551(2003) p 35-41 doi 101023A1023000322071(cf p 25 66)

mdash laquo A rsquofast-Food Approachrsquo to the Standardi-zation of Quadratic Diversity raquo In PlantBiosystems 1393 (2005) p 411-413 doi 10108011263500500158736 (cf p 130)

Ricotta C et G Bacaro laquo On Plot-to-Plot Dissi-milarity Measures Based on Species FunctionalTraits raquo In Community Ecology 111 (2010)p 113-119 doi 101556ComEc112010116(cf p 177)

Ricotta C G Bacaro M Caccianiga B E LCerabolini et M Moretti laquo A Classical Mea-sure of Phylogenetic Dissimilarity and Its Rela-tionship with Beta Diversity raquo In Basic andApplied Ecology 161 (2015) p 10-18 doi 101016jbaae201410003 (cf p 198)

Ricotta C G Bacaro M Marignani SGodefroid et S Mazzoleni laquo Computing Di-versity from Dated Phylogenies and TaxonomicHierarchies Does It Make a Difference to theConclusions raquo In Oecologia 1702 (2012)p 501-506 doi 10 1007s00442- 012- 2318- 8(cf p 103)

Ricotta C G Bacaro et S Pavoine laquo A Cau-tionary Note on Some Phylogenetic Dissimilari-ty Measures raquo In Journal of Plant Ecology 81(2014) p 12-16 doi 101093jpertu008 (cfp 180)

Ricotta C et S Burrascano laquo Beta Diversity forFunctional Ecology raquo In Preslia 801 (2008)p 61-72 (cf p 178)

mdash laquo Testing for Differences in Beta Diversity withAsymmetric Dissimilarities raquo In Ecological In-dicators 94 (2009) p 719-724 doi 101016jecolind200809003 (cf p 185 199)

Ricotta C E De Zuliani A Pacini et G CAvena laquo On the Mutual Relatedness of Even-ness Measures raquo In Community Ecology 21(2001) p 51-56 doi 101556ComEc2200116(cf p 91)

Ricotta C et M Marignani laquo Computing-Diversity with Raorsquos Quadratic Entropy AChange of Perspective raquo In Diversity andDistributions 132 (2007) p 237-241 doi 101111j1472-4642200700316x (cf p 165)

Ricotta C et M Moretti laquo CWM and RaorsquosQuadratic Diversity A Unified Framework forFunctional Ecology raquo In Oecologia 167 (2011)p 181-188 doi 10 1007s00442- 011- 1965- 5(cf p 130)

Ricotta C et L Szeidl laquo Towards a Unifying Ap-proach to Diversity Measures Bridging the Gapbetween the Shannon Entropy and Raorsquos Qua-dratic Index raquo In Theoretical Population Bio-logy 703 (2006) p 237-243 doi 101016jtpb200606003 (cf p 67 142 205)

mdash laquo Diversity Partitioning of Raorsquos Quadratic En-tropy raquo In Theoretical Population Biology 764(2009) p 299-302 doi 101016jtpb200910001 (cf p 136 199)

Roberge J-M et P Angelstam laquo Usefulness ofthe Umbrella Species Concept as a ConservationTool raquo In Conservation Biology 181 (2004)p 76-85 doi 101111j1523-1739200400450x(cf p 271)

Routledge R D laquo Diversity Indices Which OnesAre Admissible raquo In Journal of TheoreticalBiology 764 (1979) p 503-515 doi 1010160022-5193(79)90015-8 (cf p 166)

mdash laquo Evenness Indices Are Any Admissible raquo In Oikos 401 (1983) p 149-151 doi 10 2307 3544211 JSTOR 3544211 (cf p 90)

Runnegar B laquo Rates and Modes of Evolution in theMollusca raquo In Rates of Evolution Sous la dirde M Campbell et M F Day London Allenamp Unwin 1987 p 39-60 (cf p 5)

Ružička M laquo Anwendung Mathematisch-Statisticher Methoden in Der Geobotanik(Synthetische Bearbeitung von Aufnahmen) raquoIn Biologia Bratislava 13 (1958) p 647-661(cf p 175)

Ryman N et O Leimar laquo G(ST) Is Still a Use-ful Measure of Genetic Differentiation - a Com-ment on Jostrsquos D raquo In Molecular Ecology 1810(2009) p 2084-2087 doi 101111j1365-294X200904187x (cf p 195)

Scheiner S M laquo Six Types of Species-AreaCurves raquo In Global Ecology and Biogeography126 (2003) p 441-447 doi 101046j1466-822X200300061x (cf p 10)

mdash laquo A Metric of Biodiversity That IntegratesAbundance Phylogeny and Function raquo In Oikos 1218 (2012) p 1191-1202 doi 101111j1600-0706201220607x (cf p 119)

Schleuter D M Daufresne F Massol etC Argillier laquo A Userrsquos Guide to FunctionalDiversity Indices raquo In Ecological Monographs803 (2010) p 469-484 doi 10189008-22251(cf p 109 111)

Schmera D T Erős et J Podani laquo A Measurefor Assessing Functional Diversity in EcologicalCommunities raquo In Aquatic Ecology 431 (2009)p 157-167 doi 101007s10452-007-9152-9 (cfp 113)

Scholes R J et R Biggs laquo A Biodiversity Intact-ness Index raquo In Nature 4347029 (2005) p 45-49 doi 101038nature03289 (cf p 272)

Schulte R P O E A Lantinga et M JHawkins laquo A New Family of Fisher-CurvesEstimates Fisherrsquos Alpha More Accurately raquoIn Journal of Theoretical Biology 2323 (2005)p 305-313 doi 10 1016 j jtbi 2004 08 014(cf p 239)

Schuumlrmann T laquo Bias Analysis in Entropy Estima-tion raquo In Journal of Physics A Mathematicaland General 3727 (2004) p L295-L301 doi 1010880305-44703727L02 (cf p 55)

Shannon C E laquo A Mathematical Theory of Commu-nication raquo In The Bell System Technical Jour-

288 Bibliographie

nal 273 (1948) p 379-423 623-656 doi 10 1002j1538-73051948tb01338x (cf p 49 61)

Shannon C E et W Weaver The MathematicalTheory of Communication University of IllinoisPress 1963 (cf p 49 61)

Sheldon A L laquo Equitability Indices Dependenceon the Species Count raquo In Ecology 503 (1969)p 466-467 doi 1023071933900 (cf p 91 9294)

Shen G T Wiegand X Mi et F He laquo QuantifyingSpatial Phylogenetic Structures of Fully Stem-Mapped Plant Communities raquo In Methods inEcology and Evolution 412 (2013) p 1132-1141doi 1011112041-210X12119 (cf p 263)

Shen T-J A Chao et C-F Lin laquo Predicting theNumber of New Species in a Further Taxono-mic Sampling raquo In Ecology 843 (2003) p 798-804 doi 10 18900012 - 9658(2003)084[0798 PTNONS]20CO2 (cf p 38 246)

Shimatani K laquo Multivariate Point Processes andSpatial Variation of Species Diversity raquo In Forest Ecology and Management 1421-3 (2001)p 215-229 doi 101016s0378-1127(00)00352-2(cf p 134)

mdash laquo On the Measurement of Species Diversity In-corporating Species Differences raquo In Oikos 931(2001) p 135-147 doi 101034j1600- 07062001930115x (cf p 125)

Simpson E H laquo Measurement of Diversity raquo In Nature 1634148 (1949) p 688 doi 101038163688a0 (cf p 47)

Simpson G G laquo Mammals and the Nature of Conti-nents raquo In American Journal of Science 241(1943) p 1-31 doi 102475ajs24111 (cfp 176)

Slik J W F et al laquo An Estimate of the Numberof Tropical Tree Species raquo In Proceedings ofthe National Academy of Sciences of the UnitedStates of America 11224 (2015) p 7472-7477doi 101073pnas1423147112 (cf p 47 261)

Smith B et J B Wilson laquo A Consumerrsquos Guide toEvenness Indices raquo In Oikos 761 (1996) p 70-82 doi 1023073545749 JSTOR 3545749 (cfp 89 93 94)

Smith E P et G V Belle laquo Nonparametric Esti-mation of Species Richness raquo In Biometrics 401(1984) p 119-129 doi 1010029780470015902a0026329 (cf p 34)

Smith W et J F Grassle laquo Sampling Properties ofa Family of Diversity Measures raquo In Biometrics332 (1977) p 283-292 doi 1023072529778JSTOR 2529778 (cf p 58)

Soberoacuten M J et J Llorente B laquo The Use of Spe-cies Accumulation Functions for the Predictionof Species Richness raquo In Conservation Biolo-gy 73 (1993) p 480-488 doi 101046j1523-1739199307030480x (cf p 43 44)

Sobral F L A C Lees et M V Cianciaruso laquo Introductions Do Not Compensate for Functio-nal and Phylogenetic Losses Following Extinc-tions in Insular Bird Assemblages raquo In EcologyLetters 199 (2016) p 1091-1100 doi 101111ele12646 (cf p 105)

Sokal R R et C D Michener laquo A Statistical Me-thod for Evaluating Systematic Relationships raquoIn The University of Kansas Science Bulletin3822 (1958) p 1409-1438 doi citeulike-article-id1327877 (cf p 104)

Sokal R R et F J Rohlf laquo The Comparison ofDendrograms by Objective Methods raquo In Taxon112 (1962) p 33-40 doi 10 2307 1217208JSTOR 1217208 (cf p 104)

Sokal R R et P H A Sneath Principles of Nume-rical Taxonomy San Francisco W H Freemanamp Co 1963 (cf p 170)

Sol D I Bartomeus C Gonzaacutelez-Lagos et SPavoine laquo Urbanisation and the Loss of Phylo-genetic Diversity in Birds raquo In Ecology Letters20 (2017) p 721-729 doi 101111ele12769(cf p 123)

Solow A S Polasky et J Broadus laquo On the Mea-surement of Biological Diversity raquo In Archivesof biochemistry and biophysics 24 (1993) p 60-68 doi 101016S0003- 9861(71)80064- 4 (cfp 132)

Solow A R et S Polasky laquo Measuring Biologi-cal Diversity raquo In Environmental and Ecologi-cal Statistics 12 (1994) p 95-103 doi 101007BF02426650 (cf p 107 122)

Soslashrensen T laquo A Method of Establishing Groups ofEqual Amplitude in Plant Sociology Based on Si-milarity of Species Content and Its Applicationto Analyses of the Vegetation on Danish Com-mons raquo In Biologiske Skrifter Biologiske Skrif-ter 54 (1948) p 1-34 (cf p 169)

Spellerberg I F et P J Feder laquo A Tributeto Claude Shannon (1916ndash2001) and a Pleafor More Rigorous Use of Species RichnessSpecies Diversity and the lsquoShannonndashWienerrsquoIndex raquo In Global Ecology and Biogeography123 (2003) p 177-179 doi 101046j1466-822X200300015x (cf p 49)

Speth J G M W Holdgate et M K Tolba laquo Foreword raquo In Global Biodiversity StrategySous la dir de K Courrier Washington DC WRI IUCN UNEP 1992 p v-vi (cf p ix)

Steel G D laquo Relation between Poisson andMultinomial Distributions raquo In BiometricsUnit Technical Reports Cornell UniversityBiometrics Unit 1953 p 1-2 (cf p 245)

Stegen J C et A H Hurlbert laquo Inferring Eco-logical Processes from Taxonomic Phylogeneticand Functional Trait -Diversity raquo In PloS one66 (2011) e20906 doi 101371journalpone0020906 (cf p 25)

Stirling A laquo A General Framework for AnalysingDiversity in Science Technology and Society raquoIn Journal of the Royal Society Interface 415(2007) p 707-719 doi 101098rsif20070213(cf p 5)

Stirling G et B J Wilsey laquo Empirical Relation-ships between Species Richness Evenness andProportional Diversity raquo In The American na-turalist 1583 (2001) p 286-299 doi 101086321317 (cf p 96)

Stoddart J A laquo A Genotypic Diversity Measure raquoIn Journal of Heredity 74 (1983) p 489-490doi 101093oxfordjournalsjhereda109852 (cfp 66)

Stoyan D et H Stoyan Fractals Random Shapesand Point Fields Methods of Geometrical Sta-tistics Chichester John Wiley amp Sons 1994doi 978-0-471-93757-9 (cf p 251)

Studeny A C S T Buckland J B Illian AJohnston et A E Magurran laquo Goodness-of-Fit Measures of Evenness A New Tool for Ex-ploring Changes in Community Structure raquo In

Bibliographie 289

Ecosphere 22 (2011) art15 doi 101890ES10-000741 (cf p 82)

Sukumaran J et L L Knowles laquo MultispeciesCoalescent Delimits Structure Not Species raquoIn Proceedings of the National Academy ofSciences of the United States of America inpress (2017) doi 101073PNAS1607921114(cf p 7)

Suyari H laquo Generalization of Shannon ndash Khin-chin Axioms to the Nonextensive Entropy raquoIn IEEE Transactions on InformationTheory 508 (2004) p 1783-1787 doi 101109TIT2004831749 (cf p 222)

Swenson N G P Anglada-Cordero et J ABarone laquo Deterministic Tropical Tree Com-munity Turnover Evidence from Patterns ofFunctional Beta Diversity along an ElevationalGradient raquo In Proceedings of the RoyalSociety of London Series B BiologicalSciences 2781707 (2011) p 877-884 doi 101098rspb20101369 (cf p 180)

Swenson N G et B J Enquist laquo OpposingAssembly Mechanisms in a Neotropical DryForest Implications for Phylogenetic and Func-tional Community Ecology raquo In Ecology 908(2009) p 2161-2170 doi 10189008- 10251(cf p 106)

Taillie C laquo Species Equitability A ComparativeApproach raquo In Ecological Diversity in Theo-ry and Practice Sous la dir de J F Grassle G P Patil W K Smith et C Taillie Fair-land MD International Cooperative PublishingHouse 1979 p 51-62 (cf p 91)

Ter Braak C J F laquo Principal Components Biplotsand Alpha and Beta Diversity raquo In Ecology 643(1983) p 454-462 doi 1023071939964 JS-TOR 1939964 (cf p 180 183)

mdash laquo Canonical Correspondence Analysis A NewEigenvector Technique for Multivariate DirectGradient Analysis raquo In Ecology 675 (1986)p 1167-1179 doi 1023071938672 (cf p 183)

Ter Steege H N C A Pitman D Sabatier C Baraloto R P Salomatildeo J E Guevara O L Phillips C V Castilho W EMagnusson J-F Molino A Monteagudo P Nuacutentildeez Vargas J C Montero T RFeldpausch E N H Coronado T JKilleen B Mostacedo R Vasquez R LAssis J Terborgh F Wittmann A C SAndrade W F Laurance S G WLaurance B S Marimon B-H Marimon I C Guimaratildees Vieira I L Amaral R Brienen H Castellanos D CaacuterdenasLoacutepez J F Duivenvoorden H F Mogolloacuten F D d A Matos N Daacutevila R Garciacutea-Villacorta P R Stevenson Diaz F Costa T Emilio C Levis J Schietti P Souza A Alonso F Dallmeier A J D Montoya M T Fernandez Piedade A Araujo-Murakami L Arroyo R Gribel P V AFine C A Peres M Toledo G A Aymard T Baker C Ceroacuten J Engel T W Henkel P Maas P Petronelli J Stropp C EZartman D Daly D Neill M Silveira M R Paredes J Chave D d A Lima Filho P M Joslashrgensen A Fuentes J Schoumlngart F Cornejo Valverde A Di Fiore E MJimenez M C Pentildeuela-Mora J F Phillips G Rivas T R van Andel P von Hildebrand

B Hoffman E L Zent Y Malhi A Prieto A Rudas A R Ruschell N Silva V Vos S Zent A A Oliveira A C Schutz T Gonzales M Trindade Nascimento H Ramirez-Angulo R Sierra M Tirado M N Umantildea Medina G van der Heijden C I A Vela E Vilanova Torre CVriesendorp O Wang K R Young CBaider H Balslev C Ferreira I Mesones A Torres-Lezama L E Urrego Giraldo R Zagt M N Alexiades L Hernandez I Huamantupa-Chuquimaco W Milliken W Palacios Cuenca D Pauletto EValderrama Sandoval L ValenzuelaGamarra K G Dexter K J Feeley G Lopez-Gonzalez et M R Silman laquo Hy-perdominance in the Amazonian Tree Flora raquoIn Science 3426156 (2013) p 1243092 doi 101126science1243092 (cf p 47 234 261)

Theil H Economics and Information Theory Chi-cago Rand McNally amp Company 1967 (cf p 5061 63 83)

Tilman D J Knops D Wedin P Reich MRitchie et E Siemann laquo The Influence of Func-tional Diversity and Composition on EcosystemProcesses raquo In Science 2775330 (1997) p 1300-1302 doi 10 1126 science 277 5330 1300(cf p 101)

Tothmeresz B laquo Comparison of Different Methodsfor Diversity Ordering raquo In Journal of Vege-tation Science 62 (1995) p 283-290 doi 1023073236223 (cf p 71)

Triantis K A F Guilhaumon et R JWhittaker laquo The Island SpeciesndashArea Rela-tionship Biology and Statistics raquo In Journalof Biogeography 392 (2012) p 215-231 doi 101111j1365-2699201102652x (cf p 259)

Tsallis C laquo Possible Generalization of Boltzmann-Gibbs Statistics raquo In Journal of StatisticalPhysics 521 (1988) p 479-487 doi 101007BF01016429 (cf p 67)

mdash laquo What Are the Numbers That Experiments Pro-vide raquo In Quiacutemica Nova 176 (1994) p 468-471 (cf p 67)

Tsallis C R S Mendes et A R Plastino laquo TheRole of Constraints within Generalized Nonex-tensive Statistics raquo In Physica A-statistical Me-chanics and Its Applications 2613 (1998) p 534-554 doi 101016S0378-4371(98)00437-3 (cfp 192)

Tucker C M L G Shoemaker K F Davies D Nemergut et B A Melbourne laquo Differen-tiating between Niche and Neutral Assemblyin Metacommunities Using Null Models of-Diversity raquo In Oikos 1256 (2016) p 778-789doi 101111oik02803 (cf p 184)

Tuomisto H laquo A Diversity of Beta Diversi-ties Straightening up a Concept GoneAwry Part 1 Defining Beta Diversity as aFunction of Alpha and Gamma Diversity raquoIn Ecography 331 (2010) p 2-22 doi 101111j1600- 0587200905880x (cf p 163187)

mdash laquo A Diversity of Beta Diversities Straighteningup a Concept Gone Awry Part 2 QuantifyingBeta Diversity and Related Phenomena raquo In Ecography 331 (2010) p 23-45 doi 101111j1600-0587200906148x (cf p 187)

290 Bibliographie

Tuomisto H laquo Commentary Do We Have aConsistent Terminology for Species Diver-sity Yes If We Choose to Use It raquo In Oecologia 1674 (2011) p 903-911 doi 101007s00442-011-2128-4 (cf p 164)

mdash laquo An Updated Consumerrsquos Guide to Even-ness and Related Indices raquo In Oikos 1218(2012) p 1203-1218 doi 10 1111 j 1600 -0706201119897x (cf p 89 94)

Ugland K I J S Gray et K E Ellingsen laquo TheSpecies-Accumulation Curve and Estimation ofSpecies Richness raquo In Journal of Animal Ecolo-gy 725 (2003) p 888-897 doi 101046j1365-2656200300748x (cf p 244)

Ulanowicz R E laquo Information Theory in Ecology raquoIn Computers amp Chemistry 254 (2001) p 393-399 doi 101016S0097-8485(01)00073-0 (cfp 64)

Van Valen L laquo Ecological Species Multispecies andOaks raquo In Taxon 2523 (1976) p 233-239doi 1023071219444 (cf p 7)

Van Buuren S J P L Brand C G MGroothuis-Oudshoorn et D B Rubin laquo FullyConditional Specification in Multivariate Impu-tation raquo In Journal of Statistical Computationand Simulation 7612 (2006) p 1049-1064 doi 10108010629360600810434 (cf p 104)

Van Buuren S et K Groothuis-Oudshoorn laquo Mice Multivariate Imputation by ChainedEquations in R raquo In Journal of Statis-tical Software 453 (2011) p 1-67 doi 1018637jssv045i03 (cf p 104)

Vane-Wright R I C J Humphries et P HWilliams laquo What to Protect mdashSystematicsand the Agony of Choice raquo In BiologicalConservation 553 (1991) p 235-254 doi 1010160006-3207(91)90030-D (cf p 101 114)

Veech J A laquo Analyzing Patterns of Species Diver-sity as Departures from Random Expectations raquoIn Oikos 1081 (2005) p 149-155 doi 101111j0030-1299200513506x (cf p 250)

Veech J A et T O Crist laquo Diversity Partitioningwithout Statistical Independence of Alpha andBeta raquo In Ecology 917 (2010) p 1964-1969doi doi10189008-17271 (cf p 165 187)

Veech J A K S Summerville T O Crist etJ C Gering laquo The Additive Partitioning ofSpecies Diversity Recent Revival of an OldIdea raquo In Oikos 991 (2002) p 3-9 doi 101034j1600-07062002990101x (cf p 165)

Vellend M laquo Do Commonly Used Indices of-Diversity Measure Species Turnover raquo In Journal of Vegetation Science 12 (2001)p 545-552 doi 1023073237006 (cf p 160)

Vellend M W K Cornwell K Magnuson-Ford et A Oslash Mooers laquo Measuring Phyloge-netic Biodiversity raquo In Biological Diversity Frontiers in Measurement and Assessment Sousla dir drsquoA E Magurran et B J McGill Ox-ford Oxford University Press 2010 p 194-207(cf p 101)

Villeacuteger S E Maire et F Leprieur laquo On theRisks of Using Dendrograms to Measure Func-tional Diversity and Multidimensional Spaces toMeasure Phylogenetic Diversity A Comment onSobral et al (2016) raquo In Ecology Letters 204(avr 2017) Sous la dir de M Vila p 554-557doi 101111ele12750 (cf p 105)

Villeacuteger S N W H Mason et D Mouillot laquo New Multidimensional Functional Diversity In-dices for a Multifaceted Framework in FunctionalEcology raquo In Ecology 898 (2008) p 2290-2301doi 10189007-12061 (cf p 112-114)

Villeacuteger S et D Mouillot laquo Additive Partitio-ning of Diversity Including Species Differences A Comment on Hardy amp Senterre (2007) raquo In Journal of Ecology 965 (2008) p 845-848 doi 101111j1365-2745200701351x (cf p 198)

Vinck M F P Battaglia V B Balakirsky A J H Vinck et C M A Pennartz laquo Esti-mation of the Entropy Based on Its PolynomialRepresentation raquo In Physical Review E 855(2012) doi 10 1103 PhysRevE 85 051139(cf p 52 74)

Volkov I J R Banavar S P Hubbell et AMaritan laquo Neutral Theory and Relative SpeciesAbundance in Ecology raquo In Nature 4246952(2003) p 1035-1037 doi 101038nature01883(cf p 17 260)

Vu V Q B Yu et R E Kass laquo Coverage-AdjustedEntropy Estimation raquo In Statistics in Medicine2621 (2007) p 4039-4060 doi 101002sim2942 (cf p 52)

Wagner H H laquo Spatial Covariance in Plant Com-munities Integrating Ordination Geostatisticsand Variance Testing raquo In Ecology 844 (2003)p 1045-1057 doi 10 1890 0012 - 9658(2003 )084[1045SCIPCI]20CO2 (cf p 264)

Walker B A Kinzig et J Langridge laquo PlantAttribute Diversity Resilience and EcosystemFunction The Nature and Significance of Do-minant and Minor Species raquo In Ecosystems 22(1999) p 95-113 doi 101007s100219900062(cf p 112)

Walker B H laquo Biodiversity and Ecological Redun-dancy raquo In Conservation biology 61 (1992)p 18-23 doi 101046j1523-17391992610018x (cf p 101)

Wang J-P laquo Estimating Species Richness bya Poisson-Compound Gamma Model raquo In Biometrika 973 (2010) p 727-740 doi 101093biometasq026 (cf p 41)

mdash laquo SPECIES An R Package for Species RichnessEstimation raquo In Journal of Statistical Software409 (2011) p 1-15 doi 1018637jssv040i09(cf p 35)

Wang J-P B Lindsay L Cui P K Wall JMarion J Zhang et C DePamphilis laquo GeneCapture Prediction and Overlap Estimationin EST Sequencing from One or MultipleLibraries raquo In BMC Bioinformatics 61 (2005)p 300 doi 1011861471-2105-6-300 (cf p 41)

Warwick R M et K R Clarke laquo New rsquobiodiver-sityrsquo Measures Reveal a Decrease in TaxonomicDistinctness with Increasing Stress raquo In MarineEcology Progress Series 129 (1995) p 301-305JSTOR 24855596 (cf p 101 116)

Webb C O laquo Exploring the Phylogenetic Structureof Ecological Communities An Example forRain Forest Trees raquo In American Naturalist1562 (2000) p 145-155 doi 101086303378(cf p 105)

Webb C O D D Ackerly et S W Kembel laquo Phylocom Software for the Analysis of Phylo-genetic Community Structure and Trait Evolu-tion raquo In Bioinformatics 2418 (2008) p 2098-

Bibliographie 291

2100 doi 10 1093 bioinformatics btn358(cf p 178)

Webb C O J B Losos et A A Agrawal laquo Integrating Phylogenies into Community Eco-logy raquo In Ecology 87 (sp7 2006) S1-S2 doi 1018900012-9658(2006)87[1IPICE]20CO2(cf p 101)

Weikard H-P M Punt et J Wesseler laquo Di-versity Measurement Combining RelativeAbundances and Taxonomic Distinctivenessof Species raquo In Diversity and Distributions122 (2006) p 215-217 doi 101111j1366-9516200600234x (cf p 115)

Weitzman M L laquo On Diversity raquo In The QuarterlyJournal of Economics 1072 (1992) p 363-405doi 1023072118476 (cf p 107 124)

mdash laquo What to Preserve An Application of DiversityTheory to Crane Conservation raquo In The Quar-terly Journal of Economics 1081 (1993) p 157-183 doi 1023072118499 JSTOR 2118499(cf p 124)

Westoby M D S Falster A T Moles P AVesk et I J Wright laquo PLANT ECOLOGICALSTRATEGIES Some Leading Dimensions ofVariation between Species raquo In Annual Reviewof Ecology and Systematics 331 (2002) p 125-159 doi 101146annurevecolsys33010802150452 (cf p 103)

Whitlock M C laquo GrsquoST and d Do Not Re-place FST raquo In Molecular Ecology 206(2011) p 1083-1091 doi 10 1111 j 1365 -294X201004996x (cf p 195)

Whittaker R H laquo Vegetation of the SiskiyouMountains Oregon and California raquo In Ecological Monographs 303 (1960) p 279-338doi 10 2307 1943563 JSTOR 1943563(cf p 5 159 163 164 194)

mdash laquo Dominance and Diversity in Land Plant Com-munities raquo In Science 1473655 (1965) p 250-260 doi 101126science1473655250 (cf p 315)

mdash laquo Evolution and Measurement of Species Diver-sity raquo In Taxon 2123 (1972) p 213-251 doi 1023071218190 (cf p 16 18 164)

mdash laquo Evolution of Species Diversity in Land Com-munities raquo In Evolutionary Biology 10 (1977)Sous la dir de M K Hecht W C Steere etB Wallace p 1-67 (cf p 6)

Wilkins J S laquo Philosophically Speaking How Ma-ny Species Concepts Are There raquo In Zootaxa27651 (15 feacutev 2011) p 58-60 doi 1011646zootaxa276515 (cf p 7)

Williams C B laquo Patterns in the Balance of Na-ture raquo In Theoretical and Experimental BiologyAcademic Press 1964 (cf p 257)

Williams P H et K J Gaston laquo Measuring Moreof Biodiversity Can Higher-Taxon Richness Pre-dict Wholesale Species Richness raquo In Biolo-gical Conservation 67 (1994) p 211-217 doi 1010160006-3207(94)90612-2 (cf p 46)

Williamson M et K J Gaston laquo The LognormalDistribution Is Not an Appropriate Null Hypo-thesis for the Species-Abundance Distribution raquoIn Journal of Animal Ecology 742001 (2005)p 409-422 doi 10 1111 j 1365 - 2656 2005 00936x (cf p 39)

Williamson M K J Gaston et W M Lonsdale laquo The SpeciesndashArea Relationship Does Not Havean Asymptote raquo In Journal of Biogeography

287 (2001) p 827-830 doi 101046j1365-2699200100603x (cf p 25 253 255 257)

Wilsey B J D R Chalcraft C M Bowles etM R Willig laquo Relationships among IndiciesSuggest That Richness Is an Imcomplete Surro-gate for Grassland Diversity raquo In Ecology 865(2005) p 1178-1184 doi 10189004-0394 (cfp 95)

Wilson E O et F M Peter eacuted Biodiversity Wa-shington DC The National Academies Press1988 (cf p ix)

Wilson J B R K Peet J Dengler et M Paumlrtel laquo Plant Species Richness The World Records raquoIn Journal of Vegetation Science 234 (2012)p 796-802 doi 10 1111 j 1654 - 1103 2012 01400x (cf p 47)

Wilson M V et A Shmida laquo Measuring Beta Di-versity with Presence-Absence Data raquo In TheJournal of Ecology 723 (1984) p 1055 doi 1023072259551 JSTOR 2259551 (cf p 165)

Witting L et V Loeschcke laquo The Optimizationof Biodiversity Conservation raquo In BiologicalConservation 712 (1995) p 205-207 doi 1010160006-3207(94)00041-N (cf p 124)

Wolda H laquo Similarity Indices Sample Size and Di-versity raquo In Oecologia 503 (1981) p 296-302doi 101007BF00344966 (cf p 169)

Wright I J P B Reich M Westoby D D Ackerly Z Baruch F Bongers J Cavender-Bares T Chapin J H CCornelissen M Diemer J Flexas EGarnier P K Groom J Gulias KHikosaka B B Lamont T Lee W Lee C Lusk J J Midgley M-L Navas Uuml Niinemets J Oleksyn N Osada HPoorter P Poot L Prior V I Pyankov C Roumet S C Thomas M G Tjoelker E J Veneklaas et R Villar laquo The WorldwideLeaf Economics Spectrum raquo In Nature 428(2004) p 821-827 doi 10 1038nature02403(cf p 104)

Wright S laquo Evolution in Mendelian Populations raquoIn Genetics 162 (1931) p 97-159 (cf p 66)

Wuumlrtz P et A Annila laquo Roots of Diversity Rela-tions raquo In Journal of Biophysics 2008 (2008)Article ID 654672 doi 1011552008654672(cf p 259)

Yager R R laquo On the Specificity of a Possibility Dis-tribution raquo In Fuzzy Sets and Systems An In-ternational Journal in Information Science andEngineering 503 (1992) p 279-292 doi 10 10160165-0114(92)90226-T (cf p 92)

Zacharias M A et J C Roff laquo Use of Focal Spe-cies in Marine Conservation and Management A Review and Critique raquo In Aquatic Conserva-tion Marine and Freshwater Ecosystems 111(2001) p 59-76 doi 10 1002 aqc 429 (cfp 271)

Zadeh L laquo Fuzzy Sets raquo In Informationand Control 83 (1965) p 338-353 doi 101016S0019-9958(65)90241-X (cf p 111)

Zanne A E D C Tank W K Cornwell J M Eastman S A Smith R G FitzJohn D J McGlinn B C OrsquoMeara A T Moles P B Reich D L Royer D E Soltis P F Stevens M Westoby I J Wright L W Aarssen R I Bertin A Calaminus R Govaerts F Hemmings M R Leishman J Oleksyn P S Soltis N G Swenson

292 Bibliographie

L Warman et J M Beaulieu laquo Three Keysto the Radiation of Angiosperms into FreezingEnvironments raquo In Nature 5067486 (2014)p 89-92 doi 101038nature12872 (cf p 103)

Zhang C-H et Z Zhang laquo Asymptotic Normalityof a Nonparametric Estimator of Sample Cove-rage raquo In Annals of Statistics 37 (5A 2009)p 2582-2595 doi 10121408-aos658 (cf p 12)

Zhang J T O Crist et P Hou laquo Partitioning of and Diversity Using Hierarchical Bayesian Mo-deling of Species Distribution and Abundance raquoIn Environmental and Ecological Statistics 214(2014) p 611-625 doi 101007s10651- 013-0271-2 (cf p 81)

Zhang Z laquo Entropy Estimation in Turingrsquos Pers-pective raquo In Neural Computation 245 (2012)p 1368-1389 doi 101162NECO_a_00266(cf p 52 74)

mdash laquo Asymptotic Normality of an EntropyEstimator with Exponentially DecayingBias raquo In IEEE Transactions on Informa-tion Theory 591 (2013) p 504-508 doi 101109TIT20122217393 (cf p 52)

Zhang Z et M Grabchak laquo Bias Adjustment fora Nonparametric Entropy Estimator raquo In En-tropy 156 (2013) p 1999-2011 doi 103390e15061999 (cf p 52)

mdash laquo Nonparametric Estimation of Kullback-Leibler Divergence raquo In Neural compu-tation 2611 (2014) p 2570-2593 doi 10 1162 NECO _ a _ 00646 PMID 25058703(cf p 190)

mdash laquo Entropic Representation and Estimation of Di-versity Indices raquo In Journal of NonparametricStatistics 283 (2016) p 563-575 doi 1010801048525220161190357 (cf p 73 83 146)

Zhang Z et H Huang laquo Turingrsquos FormulaRevisited raquo In Journal of QuantitativeLinguistics 142-3 (2007) p 222-241 doi 10108009296170701514189 (cf p 12)

Zhang Z et J Zhou laquo Re-Parameterizationof Multinomial Distributions and DiversityIndices raquo In Journal of Statistical Planningand Inference 1407 (2010) p 1731-1738 doi 101016jjspi200912023 (cf p 73 83 245)

La biodiversiteacute peut ecirctre mesureacutee de nombreuses faccedilonsLa dualiteacute entropie-diversiteacute fournit un cadre clair et rigoureux pour le faireLrsquoentropie est la surprise moyenne fournie par les individus drsquoune communauteacuteLe choix de la fonction drsquoinformation qui mesure cette surprise agrave partir desprobabiliteacutes drsquooccurence des espegraveces (ou drsquoautres cateacutegories) permet de deacutefinirles mesures de diversiteacutes neutres fonctionnelles ou phylogeacuteneacutetique preacutesenteacuteesici Lrsquoentropie est transformeacutee en diversiteacute au sens strict par une fonction crois-sante (lrsquoexponentielle deacuteformeacutee) ce qui simplifie son interpreacutetation en tant quenombre eacutequivalent drsquoespegravecesLrsquoentropie phylogeacuteneacutetique geacuteneacuteralise les indices de diversiteacute classique integravegre sineacutecessaire la distance entre espegraveces peut ecirctre eacutecomposeacutee et corrigeacutee des biaisdrsquoestimation Sa transformation en diversiteacute au sens strict permet drsquointerpreacuteterles valeurs sous une forme unique un nombre eacutequivalent drsquoespegraveces et un nombreeacutequivalent de communauteacutes La diversiteacute de Leinster et Cobbold geacuteneacuteralise agraveson tour la diversiteacute phylogeacuteneacutetique et permet drsquoautres deacutefinitions de la distanceentre espegraveces Le parameacutetrage des mesures (lrsquoordre de la diversiteacute) permet dedonner plus ou moins drsquoimportance aux espegraveces rares et de tracer des profilsde diversiteacuteLa construction de ce cadre meacutethodologique est preacutesenteacutee en deacutetail ainsi queplusieurs approches diffeacuterentes qui constituent lrsquoeacutetat de lrsquoart de la mesure dela biodiversiteacute

ECOlogie

FOrecircts

Guyane

Motivation

Notations

Notions


Composantes

Richesse


Dispariteacute

Agreacutegation

Niveaux de leacutetude

Diversiteacute alpha beta et gamma

Deacutecomposition

Le problegraveme de lespegravece

Outils

Courbes daccumulation

Diversiteacute asymptotique

Taux de couverture

Formule des freacutequences de Good-Turing


Compleacutetude

Distribution de labondance des espegraveces (SAD)

La distribution en log-seacuteries

La distribution Broken Stick


La distribution geacuteomeacutetrique

Synthegravese

Diversiteacute neutre dune communauteacute

Mesures neutres de la diversiteacute alpha ou gamma

Richesse speacutecifique

Techniques destimation non parameacutetrique

Infeacuterence du nombre despegraveces agrave partir de la SAD

Infeacuterence du nombre despegraveces agrave partir de courbes daccumulation

Diversiteacute geacuteneacuterique

Combien y a-t-il despegraveces diffeacuterentes sur Terre

Indice de Simpson

Deacutefinition

Estimation

Indice de Shannon

Deacutefinition

Estimation

Indice de Hurlbert

Deacutefinition

Estimation

Entropie

Deacutefinition de lentropie

Entropie relative

Lappropriation de lentropie par la biodiversiteacute

Entropie HCDT

Logarithmes deacuteformeacutes

Entropie et diversiteacute

Synthegravese

Profils de diversiteacute

Estimation de lentropie

Zhang et Grabchak

Chao et Jost

Autres meacutethodes



Pratique de lestimation

MSOM et MSAM


Autres approches

Lentropie de Reacutenyi

Lentropie geacuteneacuteraliseacutee des mesures dineacutegaliteacute

Lentropie de Simpson geacuteneacuteraliseacutee

Lentropie par cas


Approche axiomatique

Indice classiques

Indice de Bulla

Indice de Gini

Rapports de moyennes

Ratios de Hill

Synthegravese

Indice alternatifs



Indice de Pielou

Geacuteneacuteralisation de lindice de Pielou

Mendes et al

Tuomisto

Jost

Synthegravese

Relations empiriques entre richesse et eacutequitabiliteacute

Diversiteacute fonctionnelle et phylogeacuteneacutetique

Cadre

Dissimilariteacute et distance

Distance phylogeacuteneacutetique

Distance fonctionnelle

Eacutequivalence des deux diversiteacutes

Typologie des mesures


Richesse eacutequitabiliteacute et divergence fonctionnelle

Richesse fonctionnelle

Equitabiliteacute fonctionnelle


Originaliteacute richesse et eacutequitabiliteacute phylogeacuteneacutetique

Mesures speacutecifiques doriginaliteacute


Richesse phylogeacuteneacutetique

Indices de Cadotte

Diversiteacute de Scheiner

Diversiteacute de Solow et Polasky

FD et PD

Indice de Rao

Principe

Formalisation

Proprieacuteteacutes

Calcul sous R

Maximum theacuteorique

Diversiteacute et moyenne

Variations sur lentropie quadratique

Diversiteacute fonctionnelle de Chiu et Chao

H_p et I_1


Geacuteneacuteralisation de lentropie HCDT

Estimation


Diversiteacute individuelle

Arbres non ultrameacutetriques


Deacutefinitions


Diversiteacute non neutre

Entropie de Ricotta et Szeidl

Deacutefinition de la similariteacute

Estimation



Diversiteacute des valeurs propres

Synthegravese

Diversiteacute beta et deacutecomposition

Cadre

Deacutefinition de la diversiteacute beta par objectifs


Deacutecomposition de la diversiteacute

Deacutefinitions de la diversiteacute beta mesure deacuteriveacutee

Le deacutebat sur la deacutecomposition

Deacutecomposition multiplicative de la diversiteacute

Deacutefinitions de la diversiteacute alpha


Donneacutees de preacutesence-absence


Biais destimation

Repreacutesentation graphique

Donneacutees dabondance

Emboicirctement et substitution

Donneacutees dabondance et similariteacute des espegraveces

Dissimilariteacute minimale moyenne

Similariteacute moyenne entre individus

Distance entre paires de communauteacutes et diversiteacute beta proportionnelle

Diversiteacute de Simpson

Geacuteneacuteralisation



Analyse de la variabiliteacute

Deacutecomposition de lentropie HCDT

Deacutecomposition de lindice de Shannon

Deacutefinition

Biais destimation

Deacutecomposition de lentropie geacuteneacuteraliseacutee

Deacutecomposition du nombre despegraveces

Deacutecomposition de lindice de Gini-Simpson

Deacutecomposition de lindice de Rao

Synthegravese

Normalisation

Neacutecessiteacute de normaliser la diversiteacute beta

Lindice de chevauchement C_qN

Deacutecomposition de la diversiteacute phylogeacuteneacutetique et fonctionnelle

Deacutecomposition de la diversiteacute phylogeacuteneacutetique

Partitionnement de la diversiteacute de Leinster et Cobbold



Intervalle de confiance

Correction des biais


Autres approches

Le partitionnement de la diversiteacute selon Peacutelissier et Couteron

Cadre

Deacutecomposition

Diversiteacute de Kosman

Diversiteacute jointe diversiteacute structurelle

Cadre


Reacutecursiviteacute de lentropie

Entropie de Shannon

Entropie HCDT

Inteacuterecirct de linformation mutuelle

Taille de niche


Deacutefinitions

Relations avec dautres mesures de diversiteacute

Diversiteacute spatialement explicite

Cadre

Indice alpha de Fisher

Construction

Variantes



Extrapolation

Influence de la structure spatiale


La relation dArrhenius

Loi de puissance

Le modegravele de Plotkin

Le modegravele de Gleason

Le modegravele de placement aleacuteatoire

Synthegravese

Estimation de la richesse agrave partir de placettes distantes

Diversiteacute beta spatialement explicite

Lindice de Simpson spatialement explicite

Le variogramme de compleacutementariteacute

Conclusion

Synthegravese


Ordres particuliers de diversiteacute

Estimation

Partition

Eacutegaliteacute des diversiteacutes

Limites

Bibliographie