Rapport la maladie d’Alzheimer. technologique II. Examen ...

126
Pharmacothérapie de la maladie d’Alzheimer. II. Examen des instruments de mesure utilisés dans les essais cliniques Rapport technologique numéro 9 mai 2000

Transcript of Rapport la maladie d’Alzheimer. technologique II. Examen ...

Page 1: Rapport la maladie d’Alzheimer. technologique II. Examen ...

Pharmacothérapie de la maladie d’Alzheimer. II. Examen des instruments de mesure utilisés dans les essais cliniques

Rapport technologiquenuméro 9 mai 2000

Page 2: Rapport la maladie d’Alzheimer. technologique II. Examen ...

Citer le présent document comme suit : Wolfson C, Moride Y, Perrault A, Momoli F, Demers L, Oremus M. Pharmacothérapie de la maladie d’Alzheimer. II. Examen des instruments de mesure utilisés dans les essais cliniques. Ottawa : Office canadien de coordination de l’évaluation des technologies de la santé (OCCETS); 2000.

La reproduction du document à des fins non commerciales est autorisée sous réserve que l’OCCETS soit dûment mentionné.

Dépôt légal – 2000 Bibliothèque nationale du Canada ISBN 1-895561-80-9 (l’ensemble) ISBN 1-895561-90-6 (seconde partie)

Numéro de la convention de poste-publications : 1633171

Transmettre les demandes de publications à :

OCCETS 110-955, croissant Green Valley

Ottawa (Ontario) Canada K2C 3V4 Tél. : (613) 226-2553

Téléc. : (613) 226-5392 Courriel : [email protected]

ou télécharger les publications du site Web de l’OCCETS à :

http://www.ccohta.ca

Page 3: Rapport la maladie d’Alzheimer. technologique II. Examen ...

Office canadien de coordination de l’évaluation des technologies de la santé

Pharmacothérapie de la maladie d’Alzheimer. II. Examen des instruments de mesure utilisés dans

les essais cliniques

Christina Wolfson, Ph. D.1,2 Yola Moride, Ph. D.1,3 Anne Perrault, M. Sc.1

Franco Momoli, M. Sc.1,2 Louise Demers, Ph. D.1 Mark Oremus, M.A.1,2

mai 2000

Soutien technique assuré par : Carole Bohbot, Irina Lazariciu et Alexander Tsertsvadze

1. Centre d’épidémiologie clinique et d’études communautaires, Hôpital général juif, Sir Mortimer B. Davis, Montréal (Québec)

2. Départements associés d’épidémiologie et de biostatistique et de santé professionnelle, Université McGill, Montréal (Québec)

3. Faculté de pharmacie, Université de Montréal, Montréal (Québec)

Page 4: Rapport la maladie d’Alzheimer. technologique II. Examen ...
Page 5: Rapport la maladie d’Alzheimer. technologique II. Examen ...

i

EXAMINATEURS

Les personnes mentionnées ci-dessous ont eu l’amabilité d’offrir leurs observations sur le présent rapport. Toutefois, l’OCCETS assume l’entière responsabilité de sa forme et de son contenu définitifs. Conseil consultatif scientifique de l’OCCETS Dre Gina Bravo Institut de gériatrie Université de Sherbrooke Sherbrooke (Québec) Dr David Persaud Université Dalhousie Halifax (Nouvelle-Écosse) Examinateurs externes Dr Richard Gladstone Université de Toronto Toronto (Ontario) Dr Willie Malloy Groupe de recherche en gériatrie Université McMaster Hamilton (Ontario) REMERCIEMENTS L’Office canadien de coordination de l’évaluation des technologies de la santé (OCCETS) a financé la présente étude, tandis que le Fonds de la recherche en santé du Québec (FRSQ), par l’entremise de l’Équipe prioritaire de l'épidémiologie de la démence chez les personnes âgées, a assuré en partie la rémunération de Carole Bohbot et d’Alexander Tsertsvadze.

Page 6: Rapport la maladie d’Alzheimer. technologique II. Examen ...

ii

SOMMAIRE

La maladie d’Alzheimer, affection invalidante touchant principalement les personnes âgées, représentera de toute évidence un important problème de santé publique au Canada au cours des deux prochaines décennies. En effet, selon des prévisions récentes, le nombre de cas de maladie d’Alzheimer au Canada passera de 160 000 à plus de 380 000 d’ici 2020. Ces prévisions sont fondées sur l’hypothèse voulant que l’incidence de la maladie demeure inchangée.

De vastes initiatives de recherche au Canada et dans le monde entier sont axées sur l’étiologie

de la maladie et sur la découverte d’un traitement curatif. D'ici à ce que ces recherches soient fructueuses, des milliers de personnes âgées au Canada continuent néanmoins de souffrir de la maladie d’Alzheimer. C’est pourquoi la recherche actuelle est également centrée sur la mise au point de traitements médicamenteux susceptibles de ralentir la progression de la maladie chez ces personnes.

Dans le rapport complémentaire (Pharmacothérapie de la maladie d’Alzheimer. I. Analyse

comparative d’essais cliniques), nous examinons des essais cliniques publiés caractérisés, à notre avis, par une rigueur méthodologique telle qu’ils offrent les meilleures données probantes qui soient sur l’efficacité du donépézil, du métrifonate, de la rivastigmine, de la sélégiline, de la vitamine E, de la lécithine, de la linopirdine, de la propentofylline et du Gingko Biloba dans le traitement de la maladie d’Alzheimer.

Par la recherche documentaire, nous avons relevé 27 essais cliniques randomisés qui répondent

aux critères méthodologiques appropriés. Nous concluons, d’une part, que les données publiées ne permettent pas d’établir l’efficacité de

la sélégiline, de la vitamine E, de la lécithine, de la linopirdine et de la propentofylline. D’autre part, d’après les données objectives examinées, le donépézil, le métrifonate et la

rivastigmine procurent tous trois une amélioration modeste, statistiquement significative, du rendement cognitif et du fonctionnement global de personnes âgées atteintes de la maladie d’Alzheimer probable, qui satisfont aux critères d'admissibilité des essais cliniques. Dans tous ces cas, l’ampleur de l’effet est du même ordre. Quant au Gingko Biloba, les résultats des essais sont prometteurs, mais l'effet de cet extrait n’est pas aussi marqué que celui des médicaments mentionnés ci-dessus.

Quoique tous ces médicaments soient bien tolérés, quant à la fréquence d’effets indésirables, le

taux d’abandon est élevé dans certains cas, d’où une surestimation possible de l'efficacité thérapeutique apparente.

Il importe de souligner que le présent rapport n’est fondé que sur les résultats d’essais publiés

et que, de ce fait, il peut être entaché d’un biais de publication. Plus précisément, s’il est vrai qu’il est moins probable que les essais ne démontrant pas d'effet thérapeutique soient publiés, nos constatations surestimeraient alors l’efficacité en raison de l’inclusion sélective d’essais positifs. Par contre, le rejet d’essais non publiés pour cause de faiblesse méthodologique n’entraîne vraisemblablement pas de biais, puisqu’il est fort peu probable que ces essais auraient répondu à nos critères de rigueur méthodologique.

Page 7: Rapport la maladie d’Alzheimer. technologique II. Examen ...

iii

Dans le présent rapport (Pharmacothérapie de la maladie d’Alzheimer. II. Examen des instruments de mesure utilisés dans les essais cliniques), nous étudions les qualités psychométriques des instruments de mesure principaux et secondaires de ces essais, et nous ne pouvons que constater à regret l’utilisation d’une vaste gamme d’échelles qui n’ont pas fait l’objet d’une évaluation psychométrique appropriée. Bien que la fiabilité et la validité d’un grand nombre de ces échelles ne fassent aucun doute, leur sensibilité au changement n’a pas été évaluée de façon appropriée. C’est pourquoi la portée clinique des écarts médicament : placebo demeure imprécise.

L’aptitude à effectuer une analyse comparative de médicaments employés dans le traitement de

la maladie d’Alzheimer ne repose pas uniquement sur la comparabilité de la structure, de la durée et des instruments de mesure des essais, mais dépend également des modes de présentation des résultats. À cet égard, la présentation des résultats des essais sur la maladie d’Alzheimer, même des essais effectués par le même groupe de chercheurs, n’est pas uniforme. Tout en sachant que les revues spécialisées préconisent leurs propres lignes directrices en matière de rédaction, nous proposons que les rapports d’essai clinique sur des médicaments employés dans la maladie d’Alzheimer se conforment à un mode de présentation des résultats normalisé, afin d’accroître la possibilité de comparer les résultats de diverses études.

Page 8: Rapport la maladie d’Alzheimer. technologique II. Examen ...

iv

Page 9: Rapport la maladie d’Alzheimer. technologique II. Examen ...

v

TABLE DES MATIÈRES

1 INTRODUCTION.......................................................................................................................1

1.1 Sélection des échelles à examiner.......................................................................................................................................2

1.2 Qualités psychométriques des échelles.............................................................................................................................2 1.2.1 Fiabilité .............................................................................................................................................................................4 1.2.2 Validité..............................................................................................................................................................................4

1.3 Portée et mode de présentation ..........................................................................................................................................6

2 ÉCHELLES D'ÉVALUATION GLOBALE ............................................................................7

2.1 Introduction : les échelles d’évaluation globale .............................................................................................................7

2.2 Échelles d’impression clinique de changement global (CGIC) .................................................................................7 2.2.1 Introduction......................................................................................................................................................................7 2.2.2 Description .......................................................................................................................................................................8 2.2.3 Évaluation.........................................................................................................................................................................8 2.2.4 Examen critique.............................................................................................................................................................10

2.3 Évaluation clinique de la démence (CDR).....................................................................................................................12 2.3.1 Introduction....................................................................................................................................................................12 2.3.2 Description .....................................................................................................................................................................12 2.3.3 Évaluation.......................................................................................................................................................................13 2.3.4 Examen critique.............................................................................................................................................................15

2.4 Échelle d’évaluation de la détérioration globale (GDS) ............................................................................................15 2.4.1 Introduction....................................................................................................................................................................15 2.4.2 Description .....................................................................................................................................................................15 2.4.3 Évaluation.......................................................................................................................................................................16 2.4.4 Examen critique.............................................................................................................................................................17

2.5 Échelle Gottfries-Bråne -Steen (GBS).............................................................................................................................18 2.5.1 Introduction....................................................................................................................................................................18 2.5.2 Description .....................................................................................................................................................................18 2.5.3 Évaluation.......................................................................................................................................................................19 2.5.4 Examen critique.............................................................................................................................................................20

2.6 Mini-examen de l’état mental (MMSE) .........................................................................................................................21

2.7 Échelles d'évaluation globale : atouts et limites...........................................................................................................21

3 ÉCHELLES D'ÉVALUATION DE LA FONCTION COGNITIVE...................................22

3.1 Introduction...........................................................................................................................................................................22

3.2 Échelle d’évaluation de la maladie d’Alzheimer – cognitive (ADAS-cog)............................................................22 3.2.1 Introduction....................................................................................................................................................................22 3.2.2 Description .....................................................................................................................................................................22 3.2.3 Évaluation.......................................................................................................................................................................23 3.2.4 Examen critique.............................................................................................................................................................25

3.3 Test du syndrome de Kurtz (SKT) ..................................................................................................................................27 3.3.1 Introduction....................................................................................................................................................................27 3.3.2 Description .....................................................................................................................................................................27 3.3.3 Évaluation.......................................................................................................................................................................28 3.3.4 Examen critique.............................................................................................................................................................30

Page 10: Rapport la maladie d’Alzheimer. technologique II. Examen ...

vi

3.4 Mini-examen de l’état mental (MMSE) .........................................................................................................................31 3.4.1 Introduction....................................................................................................................................................................31 3.4.2 Description .....................................................................................................................................................................31 3.4.3 Évaluation.......................................................................................................................................................................31 3.4.4 Examen critique.............................................................................................................................................................33

3.5 MMSE en tant qu’instrument de stadification............................................................................................................33

3.6 Échelle Blessed d’évaluation de la démence (BDS).....................................................................................................34 3.6.1 Introduction....................................................................................................................................................................34 3.6.2 Description .....................................................................................................................................................................34 3.6.3 Évaluation.......................................................................................................................................................................35 3.6.4 Examen critique.............................................................................................................................................................36

3.7 Tests neuropsychologiques particuliers .........................................................................................................................37

3.8 Psychomotricité ....................................................................................................................................................................37 3.8.1 Test d’oscillation du doigt ...........................................................................................................................................37 3.8.2 Temps de réaction au choix.........................................................................................................................................37 3.8.3 Évaluation.......................................................................................................................................................................37

3.9 Mémoire .................................................................................................................................................................................38 3.9.1 Test Buschke de remémoration sélective (BSRT)...................................................................................................38 3.9.2 Échelle Wechsler d’évaluation de la mémoire (version révisée) (WMS-R) .......................................................38

3.10 Langage .................................................................................................................................................................................39 3.10.1 Test oral contrôlé d’association de mots (COWA) .................................................................................................40 3.10.2 Test d’appellation de Boston (BNT)..........................................................................................................................40

3.11 Fonction oculoperceptive ...................................................................................................................................................41 3.11.1 Test d’organisation visuelle de Hooper (VOT)........................................................................................................41 3.11.2 Test des formes complexes de Rey-Osterrieth (RF) ...............................................................................................42

3.12 Attention .................................................................................................................................................................................43 3.12.1 Test de marquage des pistes ........................................................................................................................................43 3.12.2 Test chiffres-symboles – sous-test du WAIS-R.......................................................................................................44 3.12.3 Test chiffres-symboles inversé (SDMT) ...................................................................................................................44 3.12.4 Sous-test de suites de nombres du WAIS-R.............................................................................................................45

3.13 Abstraction.............................................................................................................................................................................45 3.13.1 Test de repérage catégoriel..........................................................................................................................................45

3.14 Atouts et lacunes des tests neuropsychologiques particuliers..................................................................................45 3.14.1 Atouts ..............................................................................................................................................................................45 3.14.2 Lacunes ...........................................................................................................................................................................46 3.14.3 Sensibilité au changement ...........................................................................................................................................46

3.15 Échelles d’évaluation de la fonction cognitive : atouts et limites ............................................................................46

4 ÉCHELLES D’ÉVALUATION DE LA CAPACITÉ FONCTIONNELLE ET DE LA QUALITÉ DE VIE ...................................................................................................................48

4.1 Introduction : les échelles d’évaluation de la capacité fonctionnelle .....................................................................48

4.2 L’instrument de cotation de l’évaluation gériatrique par les proches (GERRI)................................................49 4.2.1 Description .....................................................................................................................................................................49 4.2.2 Évaluation.......................................................................................................................................................................49 4.2.3 Examen critique.............................................................................................................................................................50

Page 11: Rapport la maladie d’Alzheimer. technologique II. Examen ...

vii

4.3 Échelle d’évaluation de l’autonomie physique (PSMS).............................................................................................50 4.3.1 Description .....................................................................................................................................................................50 4.3.2 Évaluation.......................................................................................................................................................................51 4.3.3 Examen critique.............................................................................................................................................................52

4.4 Échelle d’évaluation des activités instrumentales de la vie quotidienne (IADL)................................................52 4.4.1 Description .....................................................................................................................................................................52 4.4.2 Évaluation.......................................................................................................................................................................52 4.4.3 Examen critique.............................................................................................................................................................53

4.5 Échelle Blessed d’évaluation de la démence, partie 1 (BDS partie 1)....................................................................53 4.5.1 Introduction....................................................................................................................................................................53 4.5.2 Description de la partie 1 de l’échelle BDS..............................................................................................................53 4.5.3 Description de la version mBDS................................................................................................................................54 4.5.4 Qualités psychométriques de la partie 1 de l’échelle BDS....................................................................................54 4.5.5 Examen critique.............................................................................................................................................................55

4.6 Échelle Nüremberg d’observation gériatrique (NAB)...............................................................................................55 4.6.1 Description .....................................................................................................................................................................55 4.6.2 Évaluation et examen critique.....................................................................................................................................55

4.7 Nüremberg-Alters-Alltags-Skala (NAA) .......................................................................................................................56

4.8 Liste de vérification des activités de la vie quotidienne (ADLC) ............................................................................56

4.9 Entrevue d’évaluation de la détérioration de l’exécution des activités de la vie quotidienne dans la démence (IDDD) ...................................................................................................................................................................56

4.9.1 Description .....................................................................................................................................................................56 4.9.2 Évaluation.......................................................................................................................................................................57 4.9.3 Examen critique.............................................................................................................................................................57

4.10 Questionnaire unifié sur les activités de la vie quotidienne (ADL unifié) ............................................................57

4.11 Échelle d’évaluation de l’autonomie (DS).....................................................................................................................58 4.11.1 Description .....................................................................................................................................................................58 4.11.2 Évaluation.......................................................................................................................................................................58 4.11.3 Examen critique.............................................................................................................................................................58

4.12 Conclusion globale sur les échelles d’évaluation de l’état fonctionnel ..................................................................59

4.13 Introduction : les échelles d’évaluation de la qualité de vie .....................................................................................59

4.14 L’échelle d'évaluation de la qualité de vie (QoL) ........................................................................................................59 4.14.1 Description .....................................................................................................................................................................59 4.14.2 Évaluation.......................................................................................................................................................................60 4.14.3 Examen critique.............................................................................................................................................................60

4.15 Échelle de détérioration progressive (PDS) ..................................................................................................................61 4.15.1 Description .....................................................................................................................................................................61 4.15.2 Évaluation.......................................................................................................................................................................61 4.15.3 Examen critique.............................................................................................................................................................62

4.16 Conclusion globale sur les échelles d’évaluation de la qualité de vie.....................................................................62

5 ÉCHELLES D’ÉVALUATION DU COMPORTEMENT ET DE L’HUMEUR ...............63

5.1 Introduction...........................................................................................................................................................................63

5.2 Sélection des instruments à examiner.............................................................................................................................63

Page 12: Rapport la maladie d’Alzheimer. technologique II. Examen ...

viii

5.3 Échelle abrégée d’appréciation psychiatrique (BPRS)..............................................................................................64 5.3.1 Introduction....................................................................................................................................................................64 5.3.2 Description .....................................................................................................................................................................64 5.3.3 Évaluation.......................................................................................................................................................................64 5.3.4 Examen critique.............................................................................................................................................................65

5.4 Échelle d’évaluation de la maladie d’Alzheimer-non cognitive (ADAS-noncog)...............................................65 5.4.1 Introduction....................................................................................................................................................................65 5.4.2 Évaluation.......................................................................................................................................................................66 5.4.3 Examen critique.............................................................................................................................................................67

5.5 Échelle d’évaluation comportementale CERAD (C-BRSD).....................................................................................67 5.5.1 Introduction....................................................................................................................................................................67 5.5.2 Description .....................................................................................................................................................................67 5.5.3 Évaluation.......................................................................................................................................................................68 5.5.4 Examen critique.............................................................................................................................................................69

5.6 Compilation des troubles neuropsychiatriques (NPI)................................................................................................70 5.6.1 Introduction....................................................................................................................................................................70 5.6.2 Évaluation.......................................................................................................................................................................70 5.6.3 Examen critique.............................................................................................................................................................71

5.7 Évaluation de la symptomatologie globale par un proche (RAGS).......................................................................72

5.8 Échelle d’évaluation de l’humeur dans la démence de l’Institut national de la santé mentale (DMAS).....72

5.9 Échelle des troubles de comportement dans la démence (DBD) .............................................................................73

5.10 Échelle Cornell d’évaluation de la dépression associée à la démence (CSDD) ...................................................74

5.11 Conclusion globale sur les échelles d’évaluation du comportement et de l’humeur .........................................74

6 OBSERVATIONS GÉNÉRALES ET CONCLUSION.........................................................76

7 RÉFÉRENCES..........................................................................................................................79

8 BIBLIOGRAPHIE PAR AUTEURS ......................................................................................94

9 BIBLIOGRAPHIE DES ESSAIS CLINIQUES SUR LA MALADIE D'ALZHEIMER EXAMINÉS DANS LE PREMIER RAPPORT I ................................................................107

ANNEXE A : NOTE DE LA TRADUCTION .............................................................................110

Page 13: Rapport la maladie d’Alzheimer. technologique II. Examen ...

ix

Page 14: Rapport la maladie d’Alzheimer. technologique II. Examen ...

x

Page 15: Rapport la maladie d’Alzheimer. technologique II. Examen ...

1

1 INTRODUCTION

La maladie d’Alzheimer (MA) est une affection dégénérative caractérisée par une détérioration touchant trois aspects principaux : la cognition, la capacité fonctionnelle et le comportement et l’humeur (1-4). Le déclin cognitif survient en trois grandes phases cliniques : une phase précoce de perte de mémoire, où le déficit est surtout de nature subjective et habituellement mesurable par des tests neuropsychologiques; une phase intermédiaire de confusion, où le déficit est décelable par un observateur objectif; une phase avancée de démence, lorsque le malade ne peut plus vivre sans aide. Au fur et à mesure que le déficit cognitif devient manifeste, la capacité d’effectuer des activités de la vie quotidienne (p. ex., accomplir des tâches courantes telles se promener à l’extérieur ou effectuer des transactions monétaires) s'estompe graduellement. Par la suite, lorsque le déclin cognitif se transpose en démence, la capacité d’effectuer des activités instrumentales de base s’émousse également de façon progressive. Pour pallier cette perte d’autonomie, les malades doivent s'en remettre de plus en plus à des prestataires de soins. La personnalité et l'émotivité sont également perturbées au fil de l’évolution de la MA, ce qui se traduit par des troubles de comportement et de l’humeur (p. ex., anxiété, agitation, comportement violent, hallucinations et signes obsessifs). Ces troubles peuvent se manifester à n’importe quel stade de la maladie, bien qu’ils soient plus fréquents au stade avancé.

Les instruments de mesure, dont l’utilisation s’est répandue dans les essais sur les

médicaments employés dans le traitement de la MA, visent dans bien des cas à quantifier l’état du malade dans au moins un des trois domaines mentionnés plus haut. Par ailleurs, d’autres échelles ont pour objet de quantifier l’état de santé d’ensemble (ou global) du malade atteint de la MA. Étant donné que cette maladie s’apparente plus à une « notion hypothético-déductive » (syndrome) qu’à une entité réelle, il n’existe pas de tests cliniques permettant de détecter avec certitude la maladie et sa gravité chez des personnes en vie. Par conséquent, les échelles de mesure sont devenues des instruments primordiaux dans le diagnostic et la détermination du stade de la MA dans les essais cliniques sur les médicaments. Ces instruments jouent également un rôle crucial dans la détermination de l’efficacité thérapeutique.

Le présent rapport complète la recherche effectuée par Wolfson et ses collègues sur la

pharmacothérapie de la MA (I. Analyse comparative d’essais cliniques). Dans l’ensemble, le projet de recherche comporte trois objectifs principaux :

1) Évaluer les données probantes sur l’efficacité clinique de divers médicaments dans le

traitement de la maladie d’Alzheimer. 2) Comparer l’efficacité clinique de ces médicaments dans le traitement de la MA, le cas

échéant. 3) Examiner les données sur la fiabilité et la validité de nombreux instruments de mesure

principaux et secondaires utilisés dans les essais sélectionnés à la partie I.

Ce troisième objectif, à savoir l’examen des qualités psychométriques des instruments de mesure utilisés dans les essais, constitue l’objet du présent rapport.

Page 16: Rapport la maladie d’Alzheimer. technologique II. Examen ...

2

1.1 Sélection des échelles à examiner

Les échelles utilisées dans les essais examinés dans le rapport I (Analyse comparative d’essais cliniques) figurent aux tableaux 1 et 2. Nous avons classifié les échelles selon les six catégories suivantes : état global, cognition, capacité fonctionnelle, qualité de vie, comportement et humeur, ou autre. Dans certains cas, la classification a été facilitée du fait que le nom de l’instrument ou la documentation d’appui indique le domaine d’intérêt (p. ex., échelle d’évaluation de la maladie d’Alzheimer – cognitive (ADAS-cog), activités de la vie quotidienne, etc.). Pour d’autres échelles, la classification repose sur leur description dans la documentation ou dans les essais examinés. Par exemple, un instrument mesurant la capacité du malade à s’habiller ou à monter un escalier a été rangé dans la catégorie de la capacité fonctionnelle. Quant aux échelles de stadification visant à déterminer la gravité globale de la maladie, nous les avons regroupées dans la catégorie de l’état global puisqu’elles portent sur plusieurs aspects de la démence.

Puis, nous avons examiné les échelles en passant en revue les renseignements et la

documentation disponibles, sauf en ce qui concerne les échelles d’évaluation du comportement et de l’humeur. En raison de la vaste diversité des échelles de cette catégorie, ces instruments de mesure secondaires n’ont fait l’objet que d’un examen limité. Par ailleurs, nous n’avons pas étudié les instruments décrits dans une langue autre que l’anglais ou le français.

Nous avons obtenu la documentation sur laquelle repose l’évaluation des échelles de

nombreuses sources. D’abord, nous avons consulté la bibliographie des essais afin de repérer des sources de référence portant sur les échelles en question. Puis, nous avons passé en revue la bibliographie des articles ainsi repérés afin de dépister d’autres sources de référence. En troisième lieu, nous avons effectué une recherche documentaire dans les bases de données Medline (1966-aujourd’hui) et PsycINFO (1967-aujourd’hui). Nous avons utilisé l’appellation complète des échelles et leur acronyme comme mots-clés. Lorsque les résultats de la recherche comptaient plus de 20 sources de référence, nous avons combiné et l’appellation et l'acronyme de l’instrument aux mots-clés « Alzheimer », « reliability » et « validity » afin de circonscrire davantage la recherche documentaire. Enfin, nous avons pris connaissance des résumés afin de sélectionner les articles en vue de l’examen des échelles.

1.2 Qualités psychométriques des échelles

La portée des échelles tient à leur conception et à leur validation, lesquelles doivent correspondre à celles des tests mesurant d’autres notions hypothétiques (c.-à-d., attributs psychologiques) (5). Il est incontestable que les échelles conçues pour mesurer ou quantifier la MA doivent être à la fois fiables et valides. Dans l’optique des essais cliniques, cela signifie qu’une échelle doit mesurer la MA, et non d’autres formes de démence ou d’autres affections. De plus, les applications répétées de l'échelle doivent produire les mêmes résultats d'un évaluateur à un autre. La conformité à ces deux exigences est d’autant plus difficile que la MA n’est pas un phénomène qui puisse être observé ou mesuré directement, et que sa nature multidimensionnelle impose l’utilisation de nombreux instruments. Enfin, les instruments de mesure doivent être sensibles au changement, c’est-à-dire qu’ils doivent être capables de détecter les changements marquant l’évolution de la maladie. Les sections qui suivent présentent une définition plus étendue des notions de fiabilité et de validité.

Page 17: Rapport la maladie d’Alzheimer. technologique II. Examen ...

3

Tableau 1 : Essais cliniques sur la pharmacothérapie de la maladie d’Alzheimer – Catégories de résultats d’efficacité et échelles correspondant es

Domaine de résultat

Médicament Auteur Évaluation globale

Cognition (échelles)

Cognition (tests) État fonctionnel/ Qualité de vie

Comportement et humeur

Donépézil Burns et collab., 1999 CIBIC-plus CDR-SB

ADAS-cog IDDD QoL modifiée (cotée par le malade)

Donépézil Rogers et collab.,1998 (Arch Internal Med)

CIBIC-plus CDR-SB

ADAS-cog MMSE

QoL

Donépézil Rogers et collab.,1998 (Neurology)

CIBIC-plus CDR-SB

ADAS-cog MMSE

QoL

Donépézil Rogers et collab.,1996 CIBIC CDR-SB

ADAS-cog MMSE

ADL unifié QoL

Gingko Biloba Le Bars et collab., 1997 CGIC ADAS-cog GERRI

Gingko Biloba Maurer et collab., 1997 CGI SKT

Test de vocabulaire à choix multiple Pistage

Gingko Biloba Kanowski et collab., 1996 * CGI SKT NAB

Lécithine Foster et collab., 1996 CGIC ADAS-cog MMSE

ADAS-noncog

Linopirdine Rockwood et collab., 1997 CGI ADAS-cog MMSE SKT

IADL PSMS

ADAS-noncog Échelle DBD

Métr ifonate Raskind et collab., 1999* CIBIC-plus ADAS-cog MMSE

DAD NPI ADAS-noncog

Métrifonate Jann et collab., 1999 CIBIC-plus CIBIS-plus

ADAS-cog MMSE

ADAS-noncog

Métrifonate Cummings et collab., 1998 CIBIC-plus CIBIS-plus GERRI

ADAS-cog MMSE

IADL PSMS GERRI

Métrifonate Becker et collab., 1998 GIS ADAS-cog MMSE

ADLC ADAS-noncog

Métrifonate Morris et collab., 1998 CIBIC-plus CIBIS-plus GDS

ADAS-cog MMSE

DAD ADAS-noncog NPI

Métrifonate Becker et collab., 1996 GIS ADAS-cog MMSE

ADLC ADAS-noncog

Propentofylline Mielke et collab., 1998 * MMSE BSRT COWA DSST

Propentofylline Marcusson et collab., 1997 CGI - changement CGI - gravité

SKT DSST NAB NAA

BfS

Rivastigmine Rösler et collab., 1999* CIBIC-plus GDS

ADAS-cog MMSE

PDS

Rivastigmine Corey -Bloom et collab., 1998* CIBIC-plus GDS

ADAS-cog MMSE

PDS

Sélégiline Tariot et collab., 1998 * CDR-SB Oscillation du doight Temps de réaction au choix BSRT Pistage Repérage catégoriel

IADL BDS partie I

BPRS RAGS DMAS

Sélégiline Freedman et collab., 1998 GDS MMSE BSRT RFT BNT COWA RF WAIS-R MCPT

BPRS CSDD ADAS-noncog RAGS

Sélégiline/Vit. E Sano et collab., 1997 CDR ADAS-cog MMSE

mBDS DS

C-BRSD

Sélégiline Lawlor et collab., 1997 * ADAS-cog BPRS DMAS

Sélégiline Schneider et collab., 1993 * ADAS-cog MMSE

Sélégiline Burke et collab., 1993 * CDR CDR-SB

MMSE Oscillation du doigt WMS-R COWA BNT WAIS-R Orientation visuelle de HooperPistage WMS-R SDMT

CSDD BPRS

Sélégiline Mangoni et collab., 1991 * BDS partie II (en fait le BIMC)

WMS-R COWA Dessin TP Attention

BDS partie I IPSC-E

Les instruments de mesure principaux sont inscrits en caractères gras. * Les échelles de mesure principales ne sont pas précisées. Se reporter au chapitr e 9 pour la bibliographie complète de ces essais.

Page 18: Rapport la maladie d’Alzheimer. technologique II. Examen ...

4

Tableau 2 : Essais cliniques sur la parmacothérapie de la maladie d’Alzheimer – Tests neuropsychologiques particuliers

Concept neuropsychologique

Médicament Auteur Rapidité motrice

Mémoire Langage Organisation oculospatiale

Attention Abstraction

Gingko Biloba Maurer et collab., 1997 Vocabulaire à choix multiple

Pistage

Propentofylline Mielke et collab., 1998 BSRT COWA DSST

Propentofylline Marcusson et collab., 1997 DSST

Sélégiline Tariot et collab., 1998 Tapotement du doigt / Temps de réaction au choix

BSRT Pistage Repérage catégoriel

Sélégiline Freedman et collab., 1998 BSRT RFT

BNT COWA

RF WAIS-R (chiffres-symboles) MCPT

Sélégiline Burke et collab., 1993 Oscillation du doigt

WMS-R COWA BNT

WAIS-R (dessin de cube) Organisation visuelle de Hooper

Pistage WAIS-R (suites de nombres) WMS-R (maîtrise mentale) SDMT

Sélégiline Mangoni et collab., 1991 WMS-R COWA Dessin TP attention

Se reporter au chapitre 9 pour la bibliographie complète de ces essais.

1.2.1 Fiabilité

Une échelle fiable est une échelle qui produit le même résultat chaque fois qu’elle est administrée, pourvu que les caractéristiques étudiées n’aient pas changé. Il y a trois principales démarches d’estimation de la fiabilité, selon les sources d’erreur prises en compte. La première, à savoir la fidélité test-retest, porte sur la stabilité de la mesure à deux moments différents. Pour établir cette constance, on évalue deux fois les mêmes personnes par la même échelle, puis on compare les deux ensembles de scores obtenus. La deuxième, soit la fidélité inter-juges, consiste en l’évaluation de la reproductibilité de la mesure lorsque les caractéristiques étudiées sont mesurées par deux évaluateurs ou plus au même moment. Il s’agit en fait de déterminer le coefficient de corrélation entre les ensembles de scores obtenus. La dernière démarche est axée sur la détermination de la cohérence interne, soit la mesure dans laquelle les items d’un score composite mesurent essentiellement le même concept. Il s’agit d’une qualité métrologique qui caractérise l’échelle ou les sous-échelles dans leur ensemble.

Il convient de souligner que tant la fiabilité que la validité sont établies en fonction d’une situation et d’une population particulières. Par conséquent, lorsqu’on prévoit utiliser un instrument dans un contexte ou pour une population qui diffèrent de ceux pour lesquels il a été mis à l’épreuve, il est nécessaire de réévaluer sa fiabilité et sa validité.

1.2.2 Validité

L’estimation de la validité d’un instrument d’évaluation consiste à déterminer sa capacité à mesurer le phénomène étudié. La validité renvoie à l’adéquation entre le concept théorique et sa concrétisation sur le plan des variables. Traditionnellement, les concepteurs de tests se préoccupent de trois types de validité : la validité de contenu, la validité empirique et la validité hypothético-déductive ou de structure. Pour notre part, nous tenons également compte de la capacité des

Page 19: Rapport la maladie d’Alzheimer. technologique II. Examen ...

5

instruments à préciser les stades de la MA et de leur sensibilité au changement – plus précisément aux changements liés à la cognition, au comportement et à l'état fonctionnel.

La validité de contenu désigne le degré auquel un instrument couvre l’étendue des

caractéristiques étudiées. La détermination de la validité de contenu englobe l’évaluation de la pertinence de certains composants (pertinence de contenu) et de leur capacité à représenter toutes les facettes du phénomène mesuré (couverture du concept) (6). Dans la MA par exemple, les échelles d’intérêt sont celles dont les items portent sur la fonction cognitive, la capacité fonctionnelle et le comportement. Si les items ne sont axés que sur l’une de ces dimensions, on ne peut obtenir une évaluation globale de la MA. Par contre, de telles échelles se révèlent utiles lorsqu’il s’agit de n’examiner qu’un aspect de la maladie (p. ex., l’effet d’un médicament sur la cognition).

La validité hypothético-déductive ou de structure désigne le rapport théorique entre une

échelle et l’entité conceptuelle plutôt abstraite à l’étude. Compte tenu que le processus pathologique sous-jacent de la MA ne peut être observé directement, seules les manifestations hypothétiques de la maladie (c.-à-d., déclin cognitif, troubles de comportement, perte d’autonomie) sont mesurables. La mise à l’épreuve et l'amélioration de la validité de structure d’un instrument s'inscrivent dans un processus continu de perfectionnement de la compréhension des éléments de l’état sous-jacent en formulant et en mettant à l’épreuve diverses hypothèses. Par exemple, on peut postuler que les malades dont l’évaluation clinique indique qu’ils sont atteints de la MA « grave » obtiendront un score exprimant un déficit plus prononcé que les personnes dont le diagnostic est la MA « légère ». Si les liens postulés au départ se confirment comme le veut la théorie, alors tant l’instrument que la théorie s’en trouvent renforcés. Toutefois, dans le cas contraire, le concepteur du test ne peut savoir qui du test ou des hypothèses théoriques ne sont pas fondés (7).

La validité empirique renvoie au degré de corrélation entre les résultats d’une échelle

d’évaluation et un critère de rendement qui ne peut être mesuré directement par un test. D’une part, la valeur prédictive désigne le degré auquel les scores d’un test prédisent la mesure du critère qui sera effectuée ultérieurement. D’autre part, la validité concomitante représente le rapport établi entre les scores du test et la mesure du critère lorsqu’ils sont effectués de façon simultanée. Dans le cas de la MA, le diagnostic anatomo-pathologique posé à l’autopsie constitue le seul étalon idéal, de sorte que la validité concomitante ne peut être déterminée. Par contre, la validité prédictive peut être évaluée.

Afin qu’elle puisse être utilisée pour évaluer l'ampleur de l'effet d’une intervention

thérapeutique, une échelle doit pouvoir déceler le changement. La sensibilité au changement consiste en la capacité d’un instrument de détecter avec exactitude les changements de portée clinique (8). Même si l’étude de la sensibilité au changement fait partie du processus de validation d’un instrument, il peut être nécessaire d’évaluer cette qualité de façon distincte (9). Idéalement, cette évaluation devrait reposer sur l’étude prospective des changements survenant chez une même personne dans le cadre d’un essai clinique (10). En réalité, toutefois, les données étayant la sensibilité au changement d’instruments de mesure proviennent d’études longitudinales et d’études transversales (9). Dans les études longitudinales, il est possible de suivre l’évolution de la maladie chez des personnes atteintes de démence (changements survenant chez une même personne), tandis que les études transversales permettent d’établir une comparaison entre des personnes atteintes de la maladie à divers degrés de gravité (changements parmi des personnes).

Page 20: Rapport la maladie d’Alzheimer. technologique II. Examen ...

6

1.3 Portée et mode de présentation

L’examen des échelles est présenté par domaine, un chapitre étant consacré à chacun des domaines. C’est ainsi que le chapitre 2 porte sur les échelles d’évaluation globale et que le chapitre 3 est consacré aux tests et échelles évaluant la fonction cognitive. Le chapitre 4 est centré sur les échelles d’évaluation de la capacité fonctionnelle et englobe des instruments qui leur sont étroitement apparentés, les instruments de mesure de la qualité de vie. Enfin, le chapitre 5 présente les échelles d’évaluation du comportement et de l’humeur, certaines n'étant abordées que brièvement. Dans chaque domaine, les échelles sont examinées de façon distincte selon une présentation uniforme commençant par un aperçu des caractéristiques mesurées, la procédure d’administration/d’application et le mécanisme de cotation. Suit l’examen des qualités psychométriques, notamment la fiabilité, la validité et la sensibilité au changement. Enfin, la présentation de l’échelle se termine par un examen critique. Cette section met en relief les atouts et les lacunes, et l’utilité de l’échelle du point de vue des essais cliniques sur des médicaments dans le traitement de la MA, et propose des améliorations. Pour conclure, nous présentons dans le chapitre 6 un sommaire de certaines des questions fréquemment soulevées dans cet examen, concernant l’incidence sur la détermination de l’efficacité thérapeutique.

Nos recherches documentaires ne nous ont pas permis de retracer de l’information sur tous

les aspects de la fiabilité ou de la validité. À cet égard, mentionnons particulièrement la rareté des renseignements sur la validité de contenu et la sensibilité au changement. Dans certains cas, le sujet de la validité de contenu est abordé indirectement dans le processus de mise au point de l’échelle. Quant aux échelles pour lesquelles nous n’avons pu obtenir toute l’information nécessaire, nous avons soit évité de traiter des aspects en question, soit mentionné l’absence d’information à ce propos.

Page 21: Rapport la maladie d’Alzheimer. technologique II. Examen ...

7

2 ÉCHELLES D'ÉVALUATION GLOBALE

2.1 Introduction : les échelles d’évaluation globale

L’évaluation globale repose sur des instruments de mesure qui visent à synthétiser l’état global d’une personne à un moment précis. Ce domaine revêt une importance pratique considérable depuis que la Food and Drug Administration (FDA) des États-Unis a décrété en 1991 que l’évaluation globale doit constituer une mesure principale des résultats dans les essais sur les médicaments employés dans le traitement de la démence (11). En règle générale, les instruments d’évaluation globale sont des tests semi-dirigés et les évaluateurs doivent estimer le degré d’amélioration de l'état du malade à l’aide d’une échelle ordinale. Le degré d’amélioration est établi d’après un moment de référence antérieur, habituellement le moment de la répartition au hasard des personnes. Dans leur évaluation globale, les évaluateurs tiennent compte de la fonction cognitive, de la capacité fonctionnelle, du comportement et de l’humeur des malades.

Par ailleurs, les méthodes de stadification de la démence sont conçues pour offrir aux

professionnels de la santé une mesure de la gravité de la maladie à un moment précis ainsi qu’un moyen d’évaluer la progression de la détérioration mentale au fil du temps. Ces méthodes se rangent dans la catégorie de l’évaluation globale du fait que les évaluateurs doivent prendre en considération plusieurs facteurs (p. ex., la cognition, l’humeur, etc.) au cours du processus d’évaluation. Deux hypothèses fondamentales sous-tendent la stadification de la démence. Selon la première, les capacités mentales se détériorent de façon uniforme. En vertu de la seconde, la nature progressive de la démence peut être représentée par une série de stades sans période de chevauchement (12). Burke et collab. (13) affirment que les instruments de stadification sont utiles dans un essai pour distinguer l’effet thérapeutique d’un médicament des manifestations propres à l'histoire naturelle de la démence. Qui plus est, les instruments de stadification permettraient d’établir un pronostic quant aux degrés futurs de perte d'autonomie et à l'éventualité de l’institutionnalisation d’une population de personnes âgées et, à ce titre, peuvent se révéler utiles dans la planification du soutien familial, des services à domicile et de la politique de la santé (14). Selon d’autres auteurs (15), les instruments de stadification permettraient de différencier la maladie d’Alzheimer d’autres formes de démence.

2.2 Échelles d’impression clinique de changement global (CGIC)

2.2.1 Introduction

Le premier instrument d’impression clinique de changement global (CGIC) a été mis au point par Guy (16) en 1978 afin d'étudier les affections psychiatriques. L’échelle, appelée alors « impressions cliniques globales » (CGI), se compose d'un indice de gravité de la maladie, d'un indice d’amélioration globale et d'un indice d’efficacité. L’indice de gravité rend compte du degré de maladie mentale; l’indice d’amélioration globale exprime la mesure dans laquelle l’amélioration globale de l’état du malade est attribuable au médicament; quant à l’indice d’efficacité, il s’agit du rapport entre les avantages et les effets indésirables des médicaments. Dans bien des cas, l’indice d’amélioration globale est le seul élément de l'échelle CGI utilisé dans les essais cliniques, car il refléterait le mieux les effets bénéfiques modestes que produisent la plupart des médicaments contre la démence (17). Lorsqu’il est employé seul comme instrument de mesure, l’indice d’amélioration globale porte la désignation d’impression clinique de changement relevée en entrevue (CIBIC).

Page 22: Rapport la maladie d’Alzheimer. technologique II. Examen ...

8

2.2.2 Description

Caractéristiques étudiées : Les échelles CGIC sont conçues pour mesurer l’état physique et mental général. Cela comprend la capacité fonctionnelle sur les plans des activités de la vie quotidienne, de la cognition, du comportement et de l’humeur.

Administration : La FDA (11) préconise que les évaluateurs soient des cliniciens qui n’assument pas la prise en charge des patients en question. Les observations du clinicien sont alors dénuées de biais que pourrait introduire la connaissance des résultats d'autres évaluations cliniques ou psychométriques, de même que cela préserve le mécanisme à l’insu des essais cliniques randomisés. Puisque les personnes souffrant de démence ne peuvent pas toujours fournir des renseignements appropriés concernant leur état de santé global (17), certains chercheurs (17;18) modifient l'instrument pour y incorporer les renseignements indiqués par le prestataire de soins. Meya et collab. (17) désignent leur instrument modifié comme étant le CIBIC-M (« M » pour « modifié »), alors que Boothby et collab. (18) lui confèrent l’appellation de CIBIC-plus.

Application : Les médecins chargés de l’administration de l’échelle effectuent une première entrevue à l’admission des malades à l’essai, puis répètent la procédure à une ou à des dates ultérieures (dates précisées dans le protocole de l’étude) pour effectuer les évaluations globales. L’entrevue initiale et les évaluations subséquentes sont semi-dirigées et sont régies par des lignes directrices souples. Par exemple, les cliniciens ne sont pas autorisés à consulter le dossier des malades ou les résultats d’autres tests psychométriques. Une échelle CGIC plus structurée a été mise au point par l’Alzheimer’s Disease Cooperative Study (ADCS) (19). Pour administrer l’échelle ADCS-CGIC, les médecins doivent utiliser un ensemble de questionnaires en tant que lignes directrices d’évaluation. Ils évaluent ainsi quinze dimensions couvrant la fonction cognitive, le comportement, les activités de la vie quotidienne et les activités sociales pour définir l’impression de changement global, cotée alors sur une échelle de sept points.

Cotation : L’indice de gravité de la maladie CGI s’exprime par une cotation à sept points (1=normal, 2=à la limite, 3=légèrement malade, 4=modérément malade, 5=très malade, 6=gravement malade, 7=parmi les patients les plus malades), comme c’est le cas de l’indice d’amélioration globale (1=considérablement amélioré, 2=grandement amélioré, 3=légèrement amélioré, 4=pas de changement, 5=légèrement aggravé, 6=sérieusement aggravé, 7=considérablement aggravé). En règle générale, les instruments CIBIC font appel à l’échelle d’amélioration globale. L’indice d’efficacité CGI s’établit par l’utilisation d’une grille où figure la description de quatre degrés d’efficacité thérapeutique possible et de quatre niveaux d’intensité d’effets indésirables causés par le médicament. Dans chaque catégorie, le clinicien sélectionne la description correspondant à son estimation. Ces deux descriptions sont alors rapportées sur la grille afin de déterminer le score, qui va de 1 à 16. 2.2.3 Évaluation

2.2.3.1 Fiabilité

Constance test-retest : Knopman et collab. (20) analysent les données concernant les 125 personnes (âge moyen=72,1 ans; gamme=51-89) du groupe sous placebo qui ont terminé une étude randomisée, à double insu et à contrôle parallèle d’une durée de 30 semaines. Dans cet essai, l'échelle CIBIC représente l’instrument de mesure de résultats, et les cliniciens chargés de l’administrer ont reçu une formation à ce propos. L’indice de constance test-retest en ce qui

Page 23: Rapport la maladie d’Alzheimer. technologique II. Examen ...

9

concerne les consultations des semaines 16 et 18 est de 0,35 (coefficient kappa pondéré), et de 0,51 en ce qui a trait aux consultations des semaines 22 et 24.

Dahlke et collab. (21) effectuent une étude de fiabilité à laquelle participent

37 psychogériatres. Les cliniciens sélectionnent d’abord un de leurs patients, puis ils sont interviewés par un psychologue chevronné. Le but de l’entrevue consiste à aider le médecin à estimer le degré de gravité de la démence du patient en question en déterminant l’indice de gravité CGI et l’indice d’amélioration globale. Les 37 cliniciens évaluent de nouveau leurs patients respectifs huit semaines après l’entrevue afin d’établir un nouvel indice de gravité CGI. Le coefficient de corrélation Pearson entre les résultats (rp) est de 0,65 (IC de 95 % : 0,41-0,81).

Fidélité inter-juges : Dahlke et collab. (21) évaluent également la fidélité inter-juges en demandant à un médecin et à une infirmière expérimentée d’évaluer les patients sélectionnés par les 37 cliniciens. Les coefficients de corrélation Pearson entre les résultats (rp) sont : gravité de la maladie : médecin --------- > 0,66 (IC de 95 % : 0,42-0,81) infirmière --------- > 0,41 (IC de 95 % : 0,10-0,65) amélioration globale : médecin ---------- > 0,51 (IC de 95 % : 0,22-0,69) infirmière -------- > 0,35 (IC de 95 % : 0,03-0,61) Boothby et collab. (18) enregistrent sur bande vidéo l’entrevue de huit personnes (âge >65) atteintes de la MA probable selon les critères NINCDS/ADRDA ainsi que l’entrevue des prestataires de soins de ces personnes. Dix-huit médecins répartis en deux groupes évaluent les personnes à l’aide de l'échelle CIBIC-plus. L’un des groupes visionne la bande de l’entrevue des prestataires de soins, tandis que l’autre visionne la bande des entrevues des malades probables. Puis, les deux groupes échangent les bandes afin de visionner celles qu’ils n'ont pas vues. Les coefficients de corrélation intraclasse (CCI) sont de 0,76 et de 0,82 lorsque la bande sur les entrevues des prestataires de soins est visionnée en premier; ils sont de 0,66 et de 0,69 lorsque la bande sur les entrevues des personnes est visionnée en premier. Les paires personne-prestataire de soins assorties des degrés de concordance le plus élevé et le plus faible ont été évaluées par sept nouveaux médecins, le CCI étant de 0,70.

2.2.3.2 Validité

Validité de contenu : Ce sujet n'est pas abordé dans la documentation.

Validité empirique/validité concomitante : Knopman et collab. (20) examinent également la validité concomitante d'après les données d’un essai de 30 semaines sur la tacrine. Ils constatent que la corrélation entre l’indice d’amélioration globale CGI et l’échelle ADAS-cog (r=0,33) et entre l’indice d’amélioration globale CGI et le MMSE (r=0,39) est faible. Ces coefficients de corrélation sont mesurés d’après les scores obtenus à la fin de la période de suivi. Les auteurs ne mentionnent pas s'il s'agit du coefficient de corrélation Pearson ou Spearman.

Claus et collab. (22) demandent à des cliniciens et à des dispensateurs de soins de coter le

niveau de « fonctionnement » de 140 patients externes d’une clinique sur la mémoire, dont le diagnostic est soit la MA probable, soit la MA possible selon les critères NINCDS/ADRDA. Le processus de cotation se déroule sur une semaine, et les scores sont comparés aux scores obtenus six

Page 24: Rapport la maladie d’Alzheimer. technologique II. Examen ...

10

mois plus tôt. Le niveau de fonctionnement est coté sur une échelle de trois points (aggravation/pas de changement/amélioration), et aucune ligne directrice n'est offerte pour définir le changement clinique. Tous les patients subissent l’examen Cambridge sur la fonction cognitive (CAMCOG), bref test neuropsychologique aidant à poser le diagnostic de démence chez les personnes âgées (23), administré par un médecin. Le taux de concordance entre le CAMCOG et l’évaluation globale du changement des cliniciens est de 35 %, alors que le taux de concordance entre le CAMCOG et l’évaluation des dispensateurs de soins est de 21 %.

Dans une étude effectuée par Korner et collab. (24), deux psychogériatres évaluent de façon

indépendante 20 patients externes manifestant des troubles de la mémoire, dont 16 souffrent de la MA probable selon les critères DSM-III-R. Les coefficients de corrélation Spearman entre l’indice d’amélioration globale CGI et d’autres instruments sont : MMSE (0,93), CAMCOG (0,94), ADAS-cog (0,93) et ADAS-noncog (0,78).

Validité de structure : Dans leur étude, Dahlke et collab. (21) demandent à 37 médecins de nommer six critères d’évaluation personnels de la démence. Les auteurs compilent ainsi 222 critères qu’ils regroupent en sept catégories (1 – déficit cognitif/intellectuel, 2 – symptômes psychiatriques concomitants, 3 – troubles de comportement, 4 – perte d’autonomie, 5 – troubles de langage et de communication, 6 – problèmes sociaux et 7 – désordres somatiques). S'ils sont mentionnés par le clinicien, les items des troubles de langage et de communication contribuent à la variance de l’indice de gravité CGI dans une proportion de 52 %; les items de la catégorie déficit cognitif/intellectuel y contribuent dans une proportion de 40 %. Les items de cette dernière catégorie contribuent également à la variance de l’indice CGI d’impression de changement global dans une proportion de 24 %; quant aux six autres catégories, elles ne contribuent que pour moins de 24 % à la variance de l’indice global, de sorte que la plus grande partie de la variance totale est d’origine incertaine.

Pour leur part, Dahlke et collab. (21) choisissent les cinq critères DSM-III-R (déclin de la mémoire, déclin de la pensée abstraite, déficit du jugement, perturbation de fonctions corticales supérieures et changement de personnalité), ainsi que « l’orientation » en tant que dimensions reconnues dans l’évaluation de la démence. Lorsque les médecins indiquent que les troubles de l’orientation représentent le critère d’évaluation le plus important, ce facteur contribue à la variance de l’indice de gravité dans une proportion de 47 % et à la variance de l’indice d’amélioration globale dans une proportion de 28 %. Tous les autres critères sont responsables d’une variance moindre dans les deux parties du CGI.

Sensibilité au changement : Cet aspect n’est pas abordé dans la documentation. 2.2.4 Examen critique

En règle générale, les échelles CGIC font preuve d’une constance test-retest et d’une fidélité inter-juges qui vont de médiocres à bonnes. Quant à la validité concomitante, elle est de médiocre à très bonne. Certains de ces résultats peuvent s’expliquer par le fait que l’estimation des groupes chargés des évaluations globales n’est pas nécessairement fondée sur les mêmes domaines. En effet, les médecins considèrent la psychopathologie clinique comme le fondement de la détermination de l’amélioration globale, alors que les infirmières sont d’avis que la quantité des soins requis par les malades constitue un critère important (21). Selon Claus et collab. (22), les cliniciens sont plutôt centrés sur les capacités cognitives, tandis que les dispensateurs de soins mettent l’accent sur le

Page 25: Rapport la maladie d’Alzheimer. technologique II. Examen ...

11

comportement et la capacité fonctionnelle. Dans l’ensemble, ces constatations laissent entrevoir que les scores des instruments CGIC ne reflètent pas le degré global d’amélioration de l’état de santé d’une personne, mais dénotent plutôt l’amélioration dans les domaines jugés importants par les évaluateurs.

En ce concerne la validité de structure, Dahlke et collab. (21) constatent qu’une grande

partie de la variance des scores CGI ne découle pas des critères « personnels » ou « reconnus » décrits dans leur étude. Les auteurs concluent que ce « bruit » (perturbation) peut réduire le degré de concordance entre l’estimation de l’amélioration globale CGI et les changements réels qui surviennent chez les malades souffrant de démence. Les changements des scores ne traduiraient que les effets thérapeutiques importants. De fait, le changement des scores pourrait n’être qu’un indicateur valide du déficit cognitif et de la détérioration fonctionnelle. Selon Quinn et collab. (25), la validité et la fidélité inter-juges des mesures globales diminuent lorsque l’état clinique des malades s’améliore.

Les résultats soulèvent un autre problème, soit celui des instruments CGIC qui tiennent

compte de l’opinion du dispensateur de soins (p. ex., CIBIC-plus). Les résultats peuvent varier selon que l’évaluateur effectue une entrevue initiale avec le malade ou avec le prestataire de soins. Schneider et collab. (26) signalent que lorsque les dispensateurs de soins ont été interrogés les premiers et que les patients ont été vus par la suite, l’état des malades mesuré par le ADCS-CGIC s’est aggravé par rapport au moment de référence. Boothby et collab. (18) en arrivent aux mêmes constatations dans leur étude.

L’échelle de cotation des instruments CGIC suscite des préoccupations. Knopman et collab.

(20) sont d’avis que le caractère flou des termes utilisés dans l’échelle CGI de sept points (p. ex., grande amélioration, légère amélioration, etc.) pourrait faire en sorte que des observateurs externes ne comprennent pas les motifs expliquant l'évaluation du médecin. Rockwood et Morris (15) indiquent que l’écart entre les sept points n’est pas uniforme si bien que la notation finale peut ne pas exprimer de façon appropriée l’intensité d’un changement individuel. Par exemple, le plus grand écart (selon Rockwood et Morris) entre deux changements de portée clinique sur l’échelle d’amélioration se situe entre le point quatre (pas de changement) et le point cinq (amélioration minime). Les cliniciens peuvent ne pas saisir l’importance relative de ces deux scores et juger que la différence entre les deux est négligeable. Il se peut donc que le malade obtenant un « cinq » sur l’échelle ne manifeste pas l’amélioration suffisante d’après la signification accordée à ces deux points (15).

L’utilisation des échelles CGIC comme instruments de mesure dans les essais sur les

médicaments employés dans le traitement de la MA est très répandue. Toutefois, ces échelles suscitent certains problèmes importants qui mettent en lumière la nécessité de les étudier davantage ou de les améliorer avant qu’elles ne soient reconnues comme instruments de mesure appropriés. Voici certaines améliorations proposées en vue de cette reconnaissance :

• Évaluer les malades à la dernière consultation précédant la fin de la période de suivi afin de

pouvoir comparer leur état de santé entre la fin de l’étude et le moment de référence et faire en sorte que des évaluations intermédiaires ne viennent pas provoquer d’interférence (27).

Page 26: Rapport la maladie d’Alzheimer. technologique II. Examen ...

12

• Élaborer des descripteurs qualitatifs explicites du changement de portée clinique pour à tout le moins les scores intermédiaire et final de l’échelle de sept points afin d’optimiser la signification et l’uniformité de la cotation (20).

• Faire en sorte que les cliniciens consultent le dispensateur de soins en l’absence du malade, car les prestataires de soins sont les mieux placés pour évaluer la « valeur des effets bénéfiques d’un médicament en fonction du milieu » (20).

• Effectuer l’entrevue avec le dispensateur de soins d’abord afin d’obtenir une opinion plus critique de l’état du malade (18;26).

• Adopter une démarche traditionnelle en matière d’analyse statistique (utiliser la fonction des rangs des observations), car les échelles CGIC sont ordinales et le changement est mesuré de façon individuelle plutôt qu’en rapport avec des normes externes (27).

2.3 Évaluation clinique de la démence (CDR)

2.3.1 Introduction

L’évaluation clinique de la démence (CDR) a été mise au point en 1977 sous l’égide du Washington University’s Memory and Aging Project parce que des chercheurs désiraient une échelle pour comparer les malades souffrant de la MA et des personnes saines témoins dans le cadre d’une étude longitudinale (28).

2.3.2 Description

Caractéristiques étudiées : La mesure du rendement cognitif porte sur six aspects : la mémoire, l’orientation, le jugement ou la résolution de problèmes, les activités communautaires, les activités à la maison/de passe-temps et les soins personnels.

Administration : L'échelle CDR est administrée par un médecin.

Application : Il s’agit d’une entrevue semi-dirigée avec le malade et une personne qui connaît sa situation (un parent ou un dispensateur de soins qui connaît l’état du malade).

Cotation : Le médecin attribue un score aux six catégories du rendement cognitif d’après une échelle du déficit de cinq points (0 = aucun, 0,5 = douteux, 1 = léger, 2 = modéré et 3 = grave), puis il utilise un algorithme pour obtenir le score global (stade) de la démence (28). Le score global ne peut pas être supérieur au degré de déficit le plus prononcé (CDR 3). À l’occasion, le mécanisme de cotation est modifié pour effectuer la sommation des scores des six catégories du rendement et obtenir un score global de démence qui ne peut être supérieur à 18 points. Cette méthode de cotation porte souvent l’appellation de CDR-Sum of Boxes ou CDR-SB. Certains médecins privilégient cette méthode car elle permet de tracer un portrait plus détaillé et quantitatif de l’état de démence (28;29). En 1996, on a ajouté deux autres points à la cotation (4 = déficit prononcé et 5 = déficit terminal) à l’échelle originale afin de tenir compte de l’état de démence de nombreux malades dans les centres d’accueil et d’hébergement (30). Cette version modifiée porte la désignation « CDR étendue ».

Page 27: Rapport la maladie d’Alzheimer. technologique II. Examen ...

13

2.3.3 Évaluation

2.3.3.1 Fiabilité

Constante test-retest : Nous n’avons pas relevé d'information sur cet aspect.

Fidélité inter-juges : En puisant dans le Alzheimer Disease Research Center Patient Registry (É.-U.), Morris et collab. (31) sélectionnent des malades dont les scores CDR couvrent toute l’échelle de cotation. Quatre-vingt-deux chercheurs visionnent les entrevues avec ces malades ou consultent le compte rendu écrit de ces entrevues. Les chercheurs doivent déterminer le score CDR de trois patients, ensuite certains d’entre eux, choisis au hasard, visionnent un second ensemble de trois entrevues. On compare le score des chercheurs au score CDR attribué par le chercheur principal. La « concordance » globale (pas de mention d’un coefficient statistique particulier) entre l’estimation des chercheurs et celle du chercheur principal est de 0,79. Le taux d’accord entre les évaluateurs inexpérimentés est de 0,74, alors qu’il est de 0,83 entre les chercheurs qui ont utilisé antérieurement l'échelle CDR. Le taux de concordance parmi les chercheurs ayant visionné le second ensemble d'entrevues est de 0,83.

Burke et collab. (13) enregistrent 25 entrevues avec des malades et des dispensateurs de

soins. Un clinicien cote les malades au moment de l’enregistrement. Un autre clinicien, ne connaissant pas ces résultats initiaux, visionne les bandes par la suite et attribue ses propres scores. La concordance, entre les deux médecins, des scores CDR, de la cotation des six catégories de rendement cognitif et des scores obtenus par la sommation s’exprime par des coefficients kappa pondérés qui vont de 0,75 à 0,94 (indiquant une concordance excellente).

2.3.3.2 Validité

Validité de contenu : Selon Morris et collab. (31), l’échelle CDR fait preuve de validité apparente, car elle évalue l’incidence du déclin cognitif sur la capacité d’une personne à effectuer des tâches de la vie quotidienne. De leur côté, Rubin et collab. (32) et Berg et collab. (28) affirment que les six catégories de rendement cognitif de l'instrument sont conformes aux critères diagnostiques NINCDS/ADRDA (33) de la MA.

Validité empirique/validité concomitante : Juva et collab. (14) sélectionnent 93 malades parmi les participants de la Helsinki Aging Study et leur administrent les échelles suivantes : CDR, mini-examen de l’état mental (MMSE), l’indice des activités de la vie quotidienne (indice ADL) et l’échelle d’évaluation des activités instrumentales de la vie quotidienne (IADL). Un omnipraticien effectue l’entrevue de CDR, une infirmière communautaire administre le MMSE et des « proches informés » administrent l’indice ADL et l’échelle IADL. Le coefficient kappa exprime la concordance qui s’établit comme suit : CDR-MMSE = 0,56; CDR-indice ADL = 0,46. Les auteurs ne mentionnent pas le coefficient kappa traduisant la concordance entre les échelles CDR et IADL.

Hughes et collab. (4) examinent l’échelle CDR, l’échelle BDS, le questionnaire SPMSQ et le

test FHT. Ils recrutent 138 personnes vivant dans la collectivité (fourchette d’âge = 65-80 ans) : 58 personnes saines comme témoins (CDR 0), 16 atteintes de démence douteuse (CDR 0,5) et 43 souffrant de démence légère (CDR 1). Les coefficients de corrélation Pearson sont : CDR-BDS = 0,74; CDR-SPMSQ = 0,84; CDR-FHT = 0,57.

Page 28: Rapport la maladie d’Alzheimer. technologique II. Examen ...

14

Berg et collab. (28) admettent 43 personnes souffrant de MA légère (CDR 1) et 58 personnes saines témoins (CDR 0) à un essai d’une durée de 19 mois. Ils évaluent la validité de l’échelle CDR par rapport aux échelles suivantes : BDS, DSC, SPMSQ, AP et le test FHT. Ils estiment la concordance entre les scores CDR et les scores des autres échelles 15 mois et 34 mois après l’admission en calculant le coefficient tau de Kendall. En tenant compte des abandons, 31 participants sur 38 subissent les épreuves au 15e mois, alors que 24 participants sur 33 sont évalués au 34e mois. Voici les résultats (15e mois/34e mois) : CDR-BDS = 0,53/0,59; CDR-DSC = 0,55/0,70; CDR-SPMSQ = 0,68/0,50; CDR-AP = 0,53/0,68; CDR-FHT = 0,47/0,64.

Dooneief et collab. (30), qui étudient l’échelle CDR étendue, suivent pendant six ans

956 personnes souffrant de démence, sélectionnées parmi les participants volontaires d'une étude communautaire prospective sur la démence. L’état de ces personnes est évalué au moment de référence à l'aide des échelles suivantes : CDR étendue, BDS, ADL et sBIMC. Les résultats exprimés par les coefficients de corrélation des rangs de Spearman sont : de r=0,67 entre l’échelle CDR et l’incapacité fonctionnelle croissante sur l’échelle BDS; de r=0,64 entre l’échelle CDR et la perte d’autonomie mesurée par l’échelle ADL; de r=0,57 entre l’échelle CDR et la détérioration du rendement mesurée par l’échelle sBIMC.

Validité empirique/validité prédictive : Dooneief et collab. (30) constatent que le pronostic de survie est moins bon pour les personnes dont le score CDR est de 4 ou de 5, quoique ces résultats ne soient pas statistiquement significatifs. La survie médiane relative au score CDR 5 est de un an, de près de deux ans quant au score CDR 4, d’environ deux ans et demi quant au score CDR 3, de trois ans pour le score CDR 2 et de trois ans et demi en ce qui concerne le score CDR 1.

Rubin et collab. (32) dirigent une petite étude longitudinale (1979-1981) pour savoir si l’état

de personnes souffrant de démence douteuse (CDR 0,5) évolue vers des stades plus graves. Ils sélectionnent 16 personnes dont le score CDR est de 0,5 parmi les participants du Washington University Memory and Aging Project. De ces 16 personnes, 11 obtiennent un score CDR de 1 ou plus durant la période de suivi. Comme les auteurs tirent un échantillon homogène pour définir la MA dans sa « forme la plus pure », ils proposent que leur étude soit reproduite sur un échantillon plus hétérogène afin d’accroître la généralisabilité des résultats.

Validité de structure : Juva et collab. (14) demandent à un neurologue d’examiner 93 personnes souffrant de démence afin de déterminer le degré de gravité de la maladie selon les critères DSM-III-R. Le coefficient kappa entre l’échelle CDR et les critères DSM-III-R est de 0,56.

Dans leur étude comprenant 956 personnes atteintes de démence, Dooneief et collab. (30)

constatent que la corrélation de l’échelle CDR étendue n’est que minimale plus l’âge s’accroît (rs = 0,21), mais ils concluent que les stades de démence prononcée (CDR 4) et terminale (CDR 5) ont « une utilité pronostique en ce qui a trait à la survie ». Toutefois, les résultats quant à la survie ne sont pas statistiquement significatifs, fort probablement en raison de la petite taille de l’échantillon (n = 14).

Sensibilité au changement : La documentation n’aborde pas cet aspect.

Page 29: Rapport la maladie d’Alzheimer. technologique II. Examen ...

15

2.3.4 Examen critique

L’échelle CDR est utile car : (i) elle offre aux médecins une cote globale qui englobe une vaste gamme des caractéristiques du malade; (ii) elle peut être utilisée par des neurologues, des psychiatres, des psychologues et d’autres personnes qui évaluent la cognition chez les personnes âgées; (iii) elle est axée sur la cognition plutôt que sur des aspects reliés à d’autres affections médicales, troubles émotionnels ou problèmes sociaux (4). En outre, l'échelle se prête aux modifications; elle a été ainsi remaniée pour clarifier les degrés de gravité dans les six catégories de rendement cognitif (29).

Cet instrument fait preuve d’une bonne fidélité inter-juges, et sa validité concomitante va de

passable à bonne. Certaines constatations laissent sous-entendre que l’instrument aurait une valeur prédictive en ce qui a trait à l’évolution de la maladie et à la survie. Bien que la constance test-retest n’ait pas été étudiée, rien n’indique que les chercheurs ne devraient pas avoir recours à cette échelle pour déterminer le stade de la MA. Cette échelle peut être utilisée comme critère d’admissibilité à un essai ou à titre d’instrument de mesure des résultats. Il convient de noter toutefois que l’instrument est conçu pour mesurer les aspects cognitifs de la démence plutôt que pour déterminer l’état de santé global d’un patient atteint de la MA.

Voici quelques suggestions afin d’optimiser l’utilisation de l’échelle CDR dans les essais sur

des médicaments employés dans le traitement de la démence : élaborer une entrevue normalisée de structure fixe afin de remplacer la présentation semi-dirigée actuelle, qui introduit une certaine subjectivité dans le processus de cotation de l’échelle CDR, ce qui entrave l’uniformisation de la cotation d'une personne à une autre et d'une étude à une autre (31); s’assurer que les évaluateurs cotent les six catégories de rendement cognitif avant de calculer le score global, afin d’améliorer la fiabilité et l’utilité de cet instrument (13).

2.4 Échelle d’évaluation de la détérioration globale (GDS)

2.4.1 Introduction

L’échelle de détérioration globale (GDS) a été mise au point en 1982 pour stadifier « l’ampleur du déficit cognitif dû au vieillissement et à la démence » (1). Son utilisation repose sur le principe que la démence dégénérative primaire se manifeste en diverses phases cliniques facilement repérables, que l’on peut représenter à l’aide d’une échelle ordinale.

2.4.2 Description

Caractéristiques étudiées : Les stades évolutifs du déficit cognitif. Administration : Les cliniciens sont chargés de l’administration de l’échelle GDS. Outre des directives simples, aucune formation précise n’est nécessaire. Application : Cet instrument est destiné à des adultes présentant des symptômes de déclin cognitif. Cotation : La version imprimée de l’échelle consiste en une grille circonscrivant sept stades : 1=pas de déficit cognitif, 2=déficit cognitif très léger, 3=déficit cognitif léger, 4=déficit cognitif modéré, 5=déficit cognitif modérément grave, 6=déficit cognitif grave, 7=déficit cognitif très grave (1). La

Page 30: Rapport la maladie d’Alzheimer. technologique II. Examen ...

16

grille renferme une ou des descriptions du déficit cognitif au regard de chaque stade. Les médecins doivent « déterminer le niveau de capacité cognitive de la personne » en choisissant l’un des stades (34). 2.4.3 Évaluation

2.4.3.1 Fiabilité

Constance test-retest : Reisberg et collab. (34) font état d’une étude antérieure comptant 38 personnes (âge moyen=69,3 ans; gamme=54-82), dont certaines souffrent de démence (avec ou sans antécédents de maladie cérébrovasculaire). Le coefficient de corrélation test-retest de l’échelle GDS à des intervalles allant de sept jours à quatre mois est de 0,92. Fidélité inter-juges : Gottlieb et collab. (35) évaluent 43 malades ambulatoires (âge moyen=72,8 ans; gamme=55-88), dont le diagnostic de MA probable est fondé sur les critères NINCDS/ADRDA. Deux des auteurs administrent l'instrument de façon indépendante, l’intervalle entre les administrations étant d’une semaine au maximum, et sont autorisés à consulter un membre de la famille des malades. Le coefficient de corrélation intraclasse est de 0,82. Les deux évaluateurs attribuent les mêmes scores, à un point près, à 41 personnes sur 43. En fait, les scores de 30 personnes sont identiques.

À un hôpital psychiatrique municipal, Foster et collab. (36) sélectionnent 40 malades ayant reçu un diagnostic de l’une ou l’autre de nombreuses maladies, dont un trouble mental organique, des troubles de la personnalité, des troubles d’adaptation, un trouble psychotique et affectif, ou éprouvant un deuil. Ils les répartissent en deux groupes de 20 personnes, dont le premier (âge moyen=63,0 ans; gamme=30-82) est évalué par cinq psychiatres traitants, alors que le second (âge moyen=52,6 ans, gamme=24-81) est évalué par trois adjoints à la recherche. Les participants sont interrogés par l’un des évaluateurs pendant 45 ou 60 minutes, tandis que les autres évaluateurs ne font qu'observer. À la fin des entrevues, les évaluateurs attribuent chacun de leur côté un score GDS au malade. Les coefficients de fidélité inter-juges sont de 0,97 (premier groupe) et de 0,92 (second groupe). 2.4.3.2 Validité

Validité de contenu : La mise au point de l’échelle GDS ne repose pas sur des fondements psychométriques ou statistiques. Selon la démarche plus conceptuelle qui a été adoptée, certaines hypothèses ont été formulées quant à l’apparition de la maladie, le taux d’aggravation, l’interrelation de diverses formes de déficit cognitif, du dysfonctionnement comportemental, de perte d’autonomie dans les activités de la vie quotidienne et de symptômes psychiatriques (37). Initialement, la validité de l’échelle a été établie par rapport à diverses évaluations du fonctionnement et des changements cérébraux (34). Il en ressort que l’échelle GDS est fondée sur l’hypothèse que la MA est un processus homogène, alors que, de plus en plus, les données probantes indiquent qu’il s’agit d’un syndrome hétérogène. En outre, la détermination de la gravité de la maladie à l’aide de cet instrument peut se révéler inexacte (37). Validité empirique/validité concomitante : Dans leur étude (24) (les lecteurs sont priés de consulter la section sur les échelles CGIC pour plus de renseignements), Korner et collab. font mention des coefficients de corrélation (rs) entre l’échelle GDS et plusieurs autres échelles de mesure. Ils ont

Page 31: Rapport la maladie d’Alzheimer. technologique II. Examen ...

17

choisi d’établir de multiples comparaisons étant donné qu’aucun étalon idéal n’existe pour quantifier la MA. Ces coefficients sont : GDS-CGI (0,88), GDS-MMSE (0,93), GDS-CAMCOG (0,94), GDS-ADAS-cog (0,92) et GDS-ADAS-noncog (0,66).

Pour leur part, Cohen-Mansfield et collab. (12) comparent l’échelle GDS et l’échelle de capacité fonctionnelle (FCS), échelle ordinale de sept points visant à déterminer le stade de la démence. Les points de l’échelle représentent un niveau d’incapacité croissant particulier. Les auteurs obtiennent un coefficient de corrélation élevé de 0,97, lorsque des neurologues évaluent 240 personnes âgées saines et 142 personnes souffrant de la MA. La nature du coefficient de corrélation n’est pas précisée.

Heun et collab. (38) procèdent à l’analyse de la courbe caractéristique d’efficacité dans leur examen de plusieurs instruments de mesure relatifs à la démence. Cet examen s’inscrit dans le cadre d’une vaste étude épidémiologique sur la population générale des personnes âgées. Ils font mention des données sur 287 personnes ayant rempli plus d’un questionnaire au cours d’une entrevue à domicile dont la durée varie de une à trois heures. Pour que la sensibilité de l’instrument soit de 95 % dans la distinction entre une personne atteinte de démence et une personne saine, les scores doivent être supérieurs à deux. Quant à la spécificité de 95 %, les scores doivent être supérieurs à trois. Validité de structure : Dans une étude rétrospective, Reisberg et collab. (1) examinent le lien entre les scores GDS et d’autres évaluations psychométriques telles l’IPSCE. Leur échantillon se compose de malades souffrant de démence dont l’intensité va de très légère à modérément grave. La corrélation entre l’échelle GDS et 13 éléments cognitifs sur 19 de l'instrument IPSCE, et 25 autres mesures psychométriques sur 26 (p. ex., temps de réaction simple, vitesse perceptuelle, etc.) est statistiquement significative. En réalité, les coefficients de corrélation se situent pour la plupart dans la gamme de –0,64 à 0,66 (on note des corrélations négatives car l'aggravation du déficit s’exprime par une diminution du score sur certaines échelles, alors que la progression de la MA se traduit par une élévation du score sur l’échelle GDS). Sensibilité au changement : La documentation n’aborde pas ce sujet. 2.4.4 Examen critique

L’échelle GDS est l’un des instruments les plus couramment utilisés dans la stadification de la démence (34). Les chercheurs doivent toutefois savoir que la détermination de la gravité de la maladie par cet instrument peut être inexacte. En effet, Eisdorfer et collab. (37) affirment que seuls les derniers stades de l’échelle GDS représentent à la fois l’incapacité fonctionnelle grave et les troubles psychiatriques prononcés. Pourtant, ces manifestations peuvent se produire à des stades moins avancés de la maladie. Selon Reisberg et collab. (34) et Eisdorfer et collab. (37), nombre des descripteurs du déficit cognitif des sept stades de l’échelle GDS ne reflètent pas de façon appropriée les manifestations cliniques réelles survenant pendant ces stades.

D’autre part, l’utilisation de l’échelle GDS en tant que critère d'admissibilité à un ECR soulève un autre problème. Souvent, les participants potentiels doivent obtenir un score GDS qui dépasse un certain niveau pour être admis à l’essai. En procédant de la sorte, les chercheurs s’assurent que l’état de démence des participants est suffisamment grave pour optimiser la possibilité de déceler un effet thérapeutique. Mais si l’on tient compte du fait que l’échelle GDS

Page 32: Rapport la maladie d’Alzheimer. technologique II. Examen ...

18

peut ne pas déterminer avec exactitude le stade de la démence, la sélection de participants ayant les caractéristiques désirées s’en trouve alors compromise. Un essai comptant des participants dont la démence n’est pas au stade voulu peut donner lieu à des résultats marqués par une variance importante. De même, le fait d'écarter des malades, qui auraient été admis si leur état avait été évalué avec précision, a des répercussions sur la généralisabilité; cela signifie donc qu’il faut évaluer un plus grand nombre de participants potentiels.

À la lumière de ces faits, l’échelle GDS ne devrait pas être comme instrument de stadification de la démence dans les essais cliniques sur les médicaments employés dans le traitement de la MA.

2.5 Échelle Gottfries-Bråne-Steen (GBS)

2.5.1 Introduction

Gottfries et collab. (39) mettent au point l’échelle Gottfries-Bråne-Steen (GBS) en 1982 afin de déterminer les divers types et degrés de démence. Cette échelle devait constituer une méthode, d'application facile, de détermination (i) de l’inactivité physique, (ii) des symptômes mentaux courants de la démence et (iii) de l’incapacité intellectuelle et émotionnelle. L’échelle GBS, qui peut être administrée à la même personne de façon répétée, convient à l’évaluation d’un médicament, sans toutefois être conçue en tant qu'outil diagnostique. Dans la mise au point de l’échelle GBS, les concepteurs se sont inspirés des instruments suivants : l’échelle d’évaluation psychopathologique générale (CPRS), l’évaluation gériatrique clinique Sandoz (SCAG) et l’échelle d’évaluation gériatrique de Gottfries et Gottfries (GRSGG).

2.5.2 Description

Caractéristiques étudiées : La capacité motrice, le fonctionnement intellectuel et émotionnel, et les symptômes courants de la démence (p. ex., la confusion, l’irritabilité, l’anxiété, la souffrance physique ou morale intolérable, l’humeur perturbée et la nervosité). Administration : Un professionnel de la santé connaissant bien l’état du malade devrait administrer l’échelle. Gottfries et collab. (39) font appel à un psychiatre, un psychologue et plusieurs infirmières autorisées dans leur évaluation originale des qualités psychométriques de l’échelle. Application : L’instrument est destiné aux malades dont le diagnostic de démence est confirmé. Cotation : Les quatre sections fonctionnelles de l’échelle renferment plusieurs items (p. ex., la section intellectuelle comporte un item appelé « mémoire récente déficiente »); en général, chaque item est suivi de trois énoncés (p. ex., un énoncé comme « la mémoire récente du malade est quelque peu déficiente, mais ce déficit n’est manifeste que dans une conversation suivie ou lorsque le patient subit une épreuve »). Lorsqu’un énoncé en particulier décrit précisément le malade, la cote attribuée par l’évaluateur correspond au nombre rattaché à l’énoncé. Ces nombres (scores) vont de 0 (fonctionnement normal ou absence de symptômes) à 6 (dysfonctionnement maximal ou présence de symptômes). Le score total s’obtient par la sommation des scores des items. Toutefois, Gottfries et collab. n’offrent pas d'interprétation qualitative des divers scores totaux. Les utilisateurs doivent déterminer ce qui constitue un « bon score » ou un « mauvais score ».

Page 33: Rapport la maladie d’Alzheimer. technologique II. Examen ...

19

2.5.3 Évaluation

2.5.3.1 Fiabilité

Constance test-retest : Villardita et collab. (40) administrent six instruments de mesure (sur une période de trois jours) à 41 malades vivant dans la collectivité et ayant un diagnostic de MA probable selon les critères NINCDS/ADRDA. Ils procèdent à une seconde administration des épreuves quatre semaines plus tard. Pendant cette période de quatre semaines, les malades ne sont pas soumis à un traitement des troubles de la mémoire. Un technicien qualifié ou un neurologue est chargé de l’évaluation des malades. Le coefficient de constance test-retest de l’échelle GBS est de 0,59 (p<0,001). Fidélité inter-juges : Gottfries et collab. (39) évaluent la fidélité inter-juges de l’instrument auprès de 70 patients d’un centre d’accueil et d’hébergement (âge moyen=81 ans; écart-type=9,0) et de 30 patients en psychogériatrie (âge moyen=78 ans; écart-type=6,2). Ces personnes présentent toutes des symptômes de démence. Dans le centre d’accueil et d’hébergement, deux infirmières administrent de façon indépendante l’échelle GBS, alors que dans le service de psychogériatrie, une infirmière, un psychologue et un médecin administrent l’instrument. Tous les patients sont évalués une seconde fois à un intervalle de trois jours. Les coefficients de corrélation (rs) vont de 0,57 à 0,97. 2.5.3.2 Validité

Validité de contenu : La documentation n’aborde pas l’aspect de la validité de contenu. Validité empirique/validité concomitante : Gottfries et collab. (39) comparent les échelles GBS et GRSGG d’après les données de l’évaluation de l'infirmière des 70 patients du centre d’accueil et d’hébergement mentionnés plus haut. L’échelle GRSGG mesure les déficits moteur et intellectuel ainsi que la perturbation émotionnelle. Les choix de réponse ne comprennent que « oui » et « non », et l’instrument ne peut être utilisé pour obtenir des mesures répétées. Les coefficients de corrélation (dont le type exact n’est pas indiqué) des diverses sections des deux échelles vont de 0,42 à 0,92. Les auteurs ne mentionnent pas l’intervalle d'administration des deux échelles.

De leur côté, Jensen et collab. (41) comparent l’échelle GBS au MMSE et à l’échelle d’évaluation du syndrome cérébral organique (OBS). Cet instrument, qui peut être administré à des personnes souffrant de démence, consiste en une entrevue avec le malade pour évaluer son état de santé à court terme et une entrevue avec le professionnel de la santé/dispensateur de soins pour déterminer son état de santé à long terme. L’étude compte 28 personnes souffrant de démence (âge moyen=76 ans; gamme=66-89) provenant soit d’un centre de jour, soit d’un établissement communautaire. Les participants ont un diagnostic de MA, de démence vasculaire, d’une combinaison de ces deux affections, de trouble bipolaire (une personne) ou de changement de personnalité post-traumatique (une personne). Les coefficients de corrélation (rs) sont : GBS-MMSE (-0,80; p<0,001), GBS-OBS (0,82; p<0,001). Outre la mention qu’un interrogateur qualifié administre les échelles, les auteurs n’indiquent pas d’autres renseignements sur la structure de l’étude (p. ex., intervalle d'administration des instruments).

Villardita et collab. (40) évaluent également la validité dans leur étude comprenant 41 participants. Les coefficients de corrélation redressés (dont le type exact n’est pas mentionné) sont (admission/semaine 4) : GBS-SCAG (0,98/0,98), GBS-MMSE (-0,77/-0,79), GBS – examen de dépistage du déficit cognitif (-0,76/-0,99), GBS-BIMC (0,76/0,78).

Page 34: Rapport la maladie d’Alzheimer. technologique II. Examen ...

20

Folnegovic-Smalc et collab. (42) administrent l’échelle GBS, le MMSE et l’échelle SCAG à

40 malades (âge moyen=69 ans; gamme=46-89) souffrant de démence vasculaire. Les auteurs ne décrivent pas la procédure d’administration des instruments, mais ils font état d’un coefficient de corrélation élevé (r=0,73; p<0,0001) entre les échelles GBS et SCAG. Par contre, ils ne constatent pas de lien entre l’échelle GBS et le MMSE (r=0,02; p=0,9138). Le type de coefficient de corrélation n’est pas précisé. Validité de structure : Parnetti et collab. (43) effectuent une analyse en composantes principales de l'échelle GBS à partir des données de 138 patients externes (âge>75 ans) dont le diagnostic de MA respecte les critères NINCDS/ADRDA et de 116 personnes saines (âge>75 ans) agissant comme témoins. Trois facteurs, « le fonctionnement général », « la dépression » et « la nervosité », contribuent à la variance des scores GBS dans une proportion de 74 %. En se fondant sur ce qui n'est décrit que comme une analyse « QROC », les auteurs concluent que les personnes obtenant un score GBS supérieur à 8 ont une probabilité de 88 % d'avoir un diagnostic de MA et que celles dont le score est inférieur à 8 ont une probabilité de 90 % de ne pas avoir ce diagnostic.

Nyth et Bråne (44) procèdent à une analyse en composantes principales auprès de 221 malades, ayant pour la plupart un diagnostic de MA, de démence vasculaire ou de démence de type indéterminé. Les auteurs relèvent quatre composantes, qu’ils ne nomment pas, contribuant à la variance des scores dans une proportion de 64,5 %. Les composantes englobent toutes une combinaison d’items de l’échelle GBS. Cohérence interne : Nyth et Bråne (44) utilisent les résultats de l’analyse en composantes principales pour produire de nouvelles sous-échelles GBS, qui mesurent les troubles de l’orientation et de la mémoire, les activités de la vie quotidienne, la dépression/l’anxiété, et les troubles d’attention et de motivation. Les auteurs évaluent la cohérence interne de ces sous-échelles auprès de deux échantillons. Le premier comprend 98 malades atteints de la MA modérée ou de démence vasculaire ayant participé à un essai multicentrique comparant le citalopram au placebo. Le second échantillon est formé de 87 malades souffrant de MA à un degré qui va de léger à grave, ou de démence vasculaire, ayant participé à une étude longitudinale sur la démence. Les coefficients alpha de Cronbach varient de 0,73 à 0,97 dans les analyses distinctes des sous-échelles et des échantillons. 2.5.4 Examen critique

Les qualités psychométriques de l’échelle GBS vont de passables à très bonnes. Cet instrument serait un moyen utile de quantifier la démence dans les essais sur les médicaments. Il est entendu, toutefois, qu’il ne devrait pas être utilisé en tant qu’outil diagnostique. D’ailleurs, Gottfries et collab. (39) précisent cette mise en garde à la mise au point de l’instrument. À cet égard, Olafsson et collab. (45) effectuent une analyse corrélationnelle dans leur étude comptant 39 personnes souffrant de démence vasculaire et 34 personnes atteintes de la MA. Ils concluent que l’échelle GBS n’a pas d’utilité diagnostique dans la distinction entre ces deux affections.

Cette échelle n’est utilisée que dans l’un des essais (46) examinés dans le présent rapport, fort probablement en raison du fait que les chercheurs nord-américains ne connaissent pas bien cet instrument. Même si ses concepteurs considèrent cet instrument comme une échelle d’évaluation fonctionnelle, ses sections couvrent un certain nombre d’aspects cognitifs, fonctionnels et comportementaux. On peut donc ranger cette échelle dans la catégorie de l’évaluation globale. Peut-

Page 35: Rapport la maladie d’Alzheimer. technologique II. Examen ...

21

être que l’avenir de cet instrument en Amérique du Nord sera de remplacer les multiples instruments portant l’étiquette d’impression clinique de changement global (CGIC). Avant cela toutefois, il faudra évaluer la validité concomitante de l’échelle GBS et par rapport aux diverses échelles CGIC.

2.6 Mini-examen de l’état mental (MMSE)

Le mini-examen de l’état mental (MMSE) peut être utilisé comme instrument de stadification de la maladie. Nous abordons ce propos dans la section portant sur la fonction cognitive.

2.7 Échelles d'évaluation globale : atouts et limites

Les échelles d’évaluation globale (à l’exception sans doute de l’échelle GBS) sont utilisées de façon répandue en tant qu’instruments de mesure principaux dans les essais sur les médicaments employés dans le traitement de la MA. De nombreuses études psychométriques démontrent que la fiabilité et la validité (la validité concomitante dans la plupart des cas) de ces échelles sont passables ou bonnes. Toutefois, le terme « globale » de l’appellation ne serait pas tout à fait approprié. En effet, l’utilisation de ces échelles aurait surtout pour objectif de mesurer des caractéristiques précises. Ainsi, les médecins administrent ces échelles en vue principalement de mesurer la fonction cognitive. Par contre, les prestataires de soins et les infirmières cotent les malades en tenant compte surtout du comportement, de l’humeur ou du fardeau des soins.

Si l’on continue de recourir aux instruments d’évaluation globale dans les essais sur la pharmacothérapie de la MA, les évaluateurs devraient être informés qu’il leur faut prendre en considération une vaste gamme d’aspects. Sinon, il risque d’y avoir chevauchement des mesures dans les essais où ces instruments d’évaluation globale sont utilisés de concert avec d’autres échelles comme l’échelle ADAS-cog. De plus, les chercheurs pourraient ainsi enfreindre les lignes directrices de la FDA concernant les mesures du changement global dans les ECR.

La sensibilité au changement des instruments de mesure n’a, pour ainsi dire, pas été étudiée. Aucune norme ne précise l’écart minimal entre les scores préthérapeutiques et les scores post-thérapeutiques qui démontrerait l’efficacité thérapeutique. Les chercheurs ne peuvent que s’en remettre à la pratique courante qui consiste à sélectionner leurs propres écarts significatifs du point de vue clinique. En ce qui concerne les essais sur la MA que nous avons examinés, de nombreux auteurs n'abordent pas de façon explicite la question de ces écarts; la plupart d’entre eux soit déterminent de façon arbitraire un écart comme étant un écart significatif du point de vue clinique ou établissent que les écarts statistiquement significatifs ont une portée clinique.

Il faut à l’évidence évaluer la sensibilité au changement des échelles d’évaluation globale si l’on veut que ces instruments puissent offrir des indications utiles de l’efficacité thérapeutique. Entre-temps, l’utilisation de ces échelles en tant qu’instruments de mesure principaux n’est pas judicieuse. Par ailleurs, l’utilisation de l’une de ces échelles, l’échelle CDR, serait appropriée dans les essais sur la pharmacothérapie de la MA comme instrument de mesure de référence ou de critère d'admissibilité.

Page 36: Rapport la maladie d’Alzheimer. technologique II. Examen ...

22

3 ÉCHELLES D'ÉVALUATION DE LA FONCTION COGNITIVE

3.1 Introduction

L’évaluation de la fonction cognitive dans la MA est un processus multidimensionnel. En règle générale, les épreuves touchent les aspects de la mémoire, du langage, de la praxie, de la perception visuelle, de l’attention et du raisonnement abstrait. Pour une vue d’ensemble sur ce sujet, les lecteurs sont priés de consulter les articles de Strub et Black (47) et d’Albert (48;49). Selon Zec (50), les évaluations de la fonction cognitive sont effectuées à trois fins : (i) le dépistage précoce, (ii) le diagnostic différentiel, (iii) la détermination du degré de gravité et du stade évolutif de la maladie. La combinaison des tests neuropsychologiques à administrer varie selon le but choisi.

Vu que l’efficacité thérapeutique dans la démence signifie habituellement l’amélioration des troubles cognitifs primaires (51), l’évaluation de la cognition est devenue une composante essentielle des essais cliniques sur la MA. Cette évaluation peut être effectuée à l’aide d’une vaste gamme d’instruments qui vont des échelles cognitives synthétiques à des tests cognitifs particuliers (52). Les échelles cognitives synthétiques permettent d’obtenir un indice global de la fonction cognitive, lequel ne fait ressortir aucun aspect particulier de la cognition. À l’opposé, les tests neuropsychologiques particuliers couvrent des aspects précis de la cognition (p. ex., la mémoire, le langage), quoique l’on ne puisse procéder à la sommation des scores pour obtenir un indice global de la cognition. En raison de leur importance en tant qu’instruments de mesure dans les essais sur la pharmacothérapie de la MA, nous examinons d’abord les échelles cognitives synthétiques.

3.2 Échelle d’évaluation de la maladie d’Alzheimer – cognitive (ADAS-cog)

3.2.1 Introduction

L’échelle d’évaluation de la maladie d’Alzheimer – cognitive (ADAS-cog) est la sous-échelle cognitive de l’échelle ADAS (53;54), qui comprend également une échelle non cognitive (c.-à-d., l’échelle ADAS-noncog) (voir la section sur les échelles d’évaluation du comportement et de l’humeur). Conçue à l’origine en tant que mesure globale du fonctionnement cognitif des personnes atteintes de MA, l’échelle ADAS vise à évaluer l’efficacité des médicaments. Toutefois, les chercheurs se sont rendu compte qu’il n’y a pas, à toutes fins utiles, de corrélation entre les scores des deux sous-échelles, et ils en concluent que la présentation distincte des résultats des sous-échelles est plus instructive (55). En pratique, le score total est rarement utilisé. L’échelle ADAS-cog, qui comporte 11 items, est souvent sélectionnée comme instrument de mesure principal de l’efficacité. Dans l’ensemble, il s’agit d’une des échelles les plus utilisées dans les essais sur la pharmacothérapie de la MA.

3.2.2 Description

Caractéristiques étudiées : L’échelle ADAS-cog comporte 11 items touchant l’orientation et la mémoire (immédiate et de reconnaissance), le langage et la praxie (56) (57-59). Les items sur la mémoire et l’orientation comptent pour 50 % de la cotation, alors que les items sur le langage et la praxie correspondent respectivement à 36 % et 14 % de la cotation.

Page 37: Rapport la maladie d’Alzheimer. technologique II. Examen ...

23

Administration : La plupart des items sont évalués par des tests, bien que quelques-uns (p. ex., l’évocation des consignes du test, la capacité verbale, la compréhension verbale et la difficulté à trouver ses mots) sont évalués par un clinicien qui cote le déficit sur une échelle de six points. Application : L’échelle est destinée à des personnes souffrant d’un déficit cognitif provoqué par la MA. Cotation : Les scores vont de 0 à 70; plus le score est élevé, plus le dysfonctionnement est prononcé. Un examinateur chevronné peut administrer l’échelle en 30 ou 45 minutes (58). 3.2.3 Évaluation

3.2.3.1 Fiabilité

Constance test-retest : Des études démontrent que la constance test-retest de l’échelle ADAS-cog est élevée lorsqu’elle est administrée à des personnes souffrant de déficit cognitif. En effet, dans une étude comptant 27 personnes âgées atteintes de la MA (âge moyen=65,1 ans; écart-type=7,4) et possédant un bon niveau d’instruction, le coefficient de corrélation des rangs de Spearman est de 0,92 (54). On constate des résultats semblables auprès de personnes souffrant de la MA du groupe sous placebo d’autres essais cliniques (58;59). La fidélité test-retest de l’échelle ADAS-cog est plus faible quand elle est appliquée à des personnes dont la fonction cognitive est intacte, quoique cela reflète probablement la diminution des coefficients de corrélation souvent provoquée par le rétrécissement de la gamme des scores (60). Par ailleurs, l'indice de constance test-retest, estimé d'après les données sur 440 personnes souffrant de la MA participant à un ECR allemand multicentrique, est de 0,93 (61). Fidélité inter-juges : La fidélité inter-juges de l’échelle ADAS-cog est élevée. Dans un groupe de 27 personnes âgées d’éducation supérieure souffrant de MA, Rosen et collab. (54) font état d’un coefficient de corrélation intraclasse (CCI) de 0,99. Toutefois, Ritchie (62) considère qu’il s’agit là d’une surestimation parce que la procédure ne comprend pas d’évaluation indépendante (il y avait un interrogateur et deux évaluateurs). Par conséquent, il est probable que le véritable taux de variabilité n’a pu être décelé. Pour leur part, Standish et collab. (63) font mention d’un CCI de 0,82 pour un groupe de 27 personnes âgées atteintes de la MA. Dans ce cas, les interrogateurs sont des étudiants en médecine ayant suivi une formation dans ce domaine. Dans le même groupe de personnes, le CCI de concordance chez le même évaluateur est de 0,86 (63). Scores fiables de changement individuel : À partir du CCI de l’essai allemand multicentrique (61), il a été possible de calculer l’erreur type de mesure (ETM). L’ETM représente la proportion de la variabilité globale des scores qui est attribuable à l’erreur de mesure et permet de calculer un intervalle de confiance s’appliquant aux changements individuels fiables. D’après les données de l’ECR, Weyer et collab. (61) estiment que le score de changement fiable est 7. En vertu de cette estimation, un écart de 7 ou plus refléterait probablement un véritable changement individuel, alors qu’un écart inférieur serait hors de propos du point de vue psychométrique. 3.2.3.2 Validité

Validité de contenu : Du point de vue de la validité de contenu, l’échelle ADAS-cog n’est pas sans faille. En effet, elle ne permet pas d’évaluer l’attention (concentration) de façon explicite. Cet

Page 38: Rapport la maladie d’Alzheimer. technologique II. Examen ...

24

aspect est plutôt couvert par l’échelle ADAS-noncog. En outre, l’échelle ADAS-cog n’évalue pas les tâches d’exécution, ni ne couvre tous les aspects de la mémoire (p. ex., la mémoire différée) (64). Validité de structure/validité concomitante : La corrélation entre l’échelle ADAS-cog et plusieurs échelles cognitives va de modérée à bonne. Les coefficients de corrélation sont : BIMC (-0,78), DRS (0,48) (54), BCRS (0,80), SKT (0,82) (55). La corrélation est également bonne entre l’échelle ADAS-cog et le MMSE (gamme de –0,81 à –0,90) (55;65). Doraiswamy et collab. (66) analysent de nouveau les données de 1 648 personnes atteintes de la MA (DSM-III-R) participant à un ECR, dont le score GDS est de 4 ou de 5. Les coefficients de corrélation sont : ADAS-cog et MMSE (r=0,76); ADAS-cog et GERRI (r=0,40). Validité empirique/validité discriminative : L’échelle ADAS-cog permet de bien établir la distinction entre des personnes saines et des personnes souffrant de la MA, lorsqu’un seuil correspondant à deux écarts moyens quadratiques au-dessus de la moyenne des personnes saines est utilisé (50;54). 3.2.3.3 Sensibilité au changement

Études longitudinales : Quatre études longitudinales renferment des données sur les changements des scores ADAS-cog. La détérioration moyenne sur une année chez des personnes atteintes de la MA est semblable (environ sept unités) dans trois des études, quoique dans l’une de ces études le déficit au moment de référence soit plus prononcé (67). À l’opposé, l’état des malades ne présentant pas de déficit cognitif ne se détériore pas. Par ailleurs, l’évolution de la maladie est suivie dans l’une des études (68), où 111 personnes souffrant de MA sont évaluées à intervalles de six mois; le score ADAS-cog moyen de référence des participants est de 35 (écart-type de 3); la variabilité des scores est étonnamment faible, compte tenu que ceux-ci couvrent une gamme étendue de 5 à 69. Le schéma des scores de changement moyen après un an par comparaison aux scores initiaux fait apparaître une distribution en U inversé, indiquant que les scores de changement varient en fonction des scores de base. Par exemple, selon cette distribution, le changement annuel moyen sur l’échelle ADAS-cog serait de 10,8 pour un niveau de base de 25, alors qu’il serait de 13,0 pour un niveau de base de 35. Gravité : Zec et collab. (69) étudient la sensibilité à la détérioration de l’échelle ADAS-cog dans des tests secondaires subis par des personnes ne souffrant pas de la MA et des personnes atteintes de MA légère, modérée ou grave. La gravité de la maladie est définie selon le MMSE : MMSE>=20, MA légère, n=23; MMSE 10-19, MA modérée, n=33, MMSE 0-9, MA grave, n=5. Selon cette analyse, les scores ADAS-cog comme tels et certains tests secondaires (p. ex., orientation et reconnaissance de mots) font preuve de sensibilité à tous les degrés de gravité, tandis que d’autres tests secondaires démontrent une sensibilité maximale à l’un ou l’autre des degrés de gravité (p. ex., MA précoce : évocation de mots; MA précoce et modérée : reconnaissance de mots, mémorisation des consignes du test, items de l’expression orale; MA intermédiaire et avancée : ordres; MA avancée : désignation des objets et des doigts, praxie structurale, praxie idéatoire. D’après Zec et collab. (69), le taux de déclin différentiel des tests secondaires de l’échelle ADAS-cog reflète, dans une certaine mesure, la véritable nature de la progression du déficit cognitif au cours des stades de la MA. Toutefois, ces auteurs mentionnent que certains tests secondaires ne démontreraient pas une sensibilité appropriée à la détérioration au stade précoce de la maladie (p. ex., appellation et praxie). Partant de là, ils affirment que l’échelle ADAS-cog ne pourrait déceler de façon appropriée

Page 39: Rapport la maladie d’Alzheimer. technologique II. Examen ...

25

l’amélioration de ces capacités à l’évaluation de personnes souffrant de démence légère ou modérée. Par contre, Ihl et collab. (55) ne constatent pas d'effet de plafonnement ni d'effet-seuil de l’échelle ADAS-cog, tandis que Mohs et Cohen (56) font état d’un effet-seuil. Dans leur analyse des résultats de l’échelle d’évaluation gériatrique de la détérioration (GDS) appliquée à 1 648 malades, Dowaiswamy et collab. (66) révèlent que les personnes dont le score GDS=5 ont un score ADAS-cog moyen de 50 % supérieur au score moyen des malades dont le score GDS=4. Âge et éducation en tant que variables confusionnelles : Peu de renseignements décrivent l’influence de l’âge et de l’éducation sur l’échelle ADAS-cog. Les auteurs d’une étude (50), à laquelle ne participent que quelques personnes âgées de plus de 79 ans, constatent que l’âge n’exerce pas d'influence. Ils rapportent également que l’éducation est sans effet, sans toutefois indiquer la valeur ADAS-cog moyenne. Par contre, dans une étude portant sur les participants souffrant de MA du groupe sous placebo d’un essai sur un médicament (70), on note que l’éducation exerce une influence. Ainsi, le groupe caractérisé par le plus faible niveau d’instruction (pas de diplôme d’études secondaires) obtient un score ADAS-cog moyen supérieur à celui du groupe marqué par le plus haut niveau d’éducation (diplôme d’études supérieures) (23,4 contre 18,3). Selon Stern et collab. (68), l’âge n’influence pas le taux de déclin sur l’échelle ADAS-cog. On ne sait toujours pas si l’éducation joue un rôle en matière du taux de déclin, mais cela n’en demeure pas moins un aspect important à prendre en considération lorsqu’on mesure le changement (70). 3.2.4 Examen critique

Changement de portée clinique : La FDA décrète que l’effet d’un médicament dans le traitement de la MA est considéré comme étant de portée clinique si le médicament est capable d’inverser le processus naturel du déficit cognitif d’une période d’au moins six mois (63). Pour les auteurs d’une éminente étude, ce changement de six mois s’exprime par une variation de quatre points sur l’échelle ADAS-cog (67). D'autre part, une étude plus récente sur le taux de détérioration cognitive mesuré par l’échelle ADAS-cog chez 111 personnes souffrant de la MA laisse entrevoir que le taux de détérioration n’est pas constant, mais qu’il varie plutôt selon le stade de la maladie. Selon les estimations de Stern (68), le déclin moyen chez des personnes atteintes de démence légère est de 8-9 points, alors qu'il est de 12-13 points chez des personnes souffrant de démence modérée. En moyenne, l’état des malades atteints de démence légère se détériore plus lentement que l’état des personnes souffrant de démence modérée (71).

Standish et collab. (63) remettent en question les lignes directrices concernant l’administration des échelles ADAS-cog et ADAS-noncog. Ils estiment que ces lignes directrices sont inappropriées, trop brèves et vagues, principalement en ce qui a trait aux indices, aux délais de réponse et à la formulation des questions concernant les tâches sur l’orientation. Des lignes directrices inappropriées peuvent entraîner la variabilité de l’administration et de la cotation de ces échelles. Ces auteurs (63) ont élaboré des lignes directrices rigoureuses quant à l’administration et à la cotation, afin d’améliorer l’uniformité de l’évaluation. Ils comparent la fiabilité de l’échelle ADAS « normalisée » à celle de la version habituelle dans un essai clinique randomisé et à double insu comptant 54 personnes souffrant de la MA de divers degrés de gravité. Alors que la fidélité inter-juges et chez le même évaluateur de l’échelle ADAS-noncog normalisée est de beaucoup supérieure à celles de l’échelle ADAS-noncog habituelle, la fiabilité de l’échelle ADAS-cog normalisée n’est pas meilleure que celle de la version habituelle.

Page 40: Rapport la maladie d’Alzheimer. technologique II. Examen ...

26

Malgré cette absence d’amélioration, il tombe sous le sens que les évaluateurs puissent disposer d’une version normalisée officielle qui pourrait être utilisée à l’échelon international. De la sorte, il serait possible d’établir des comparaisons valides entre les essais et entre les cultures, et les utilisateurs ne sentiraient pas le besoin de modifier l’échelle. Déjà, dans la version allemande de l’échelle ADAS-cog, des images se substituent aux listes de mots; cette modification de l’échelle initiale concerne l’évaluation d’un autre aspect cognitif (63).

La plupart des tests secondaires de l’échelle ADAS-cog ont une capacité limitée de déceler le changement survenant pendant la maladie, quel que soit son degré de gravité. La capacité de détecter l’amélioration de beaucoup de tests secondaires ne s’exerce qu’au regard d’une gamme restreinte de degrés de gravité de la maladie. Les réponses au traitement qui diffèrent selon le degré de gravité de base peuvent s’expliquer par les changements mesurés par les tests secondaires qui font preuve d’une sensibilité maximale à l’égard du degré de gravité en question. Cela vient limiter l’utilisation de ces tests dans le cadre des ECR. Jarvik et collab. (72) proposent d’améliorer la sensibilité de l’échelle ADAS-cog en ajoutant les aspects de la mémoire et de la reconnaissance différées, et en simplifiant le dessin du cube, qui ne permet pas de distinguer les personnes âgées saines des personnes âgées souffrant de démence.

Mattes (73) examine de façon approfondie les résultats sur l’échelle ADAS-cog de 48 personnes souffrant de la MA participant à un ECR visant à cerner les tâches marquées par un effet-seuil ou un effet de plafonnement. La tâche d’évocation de mots serait trop difficile : les participants ne se rappelant en moyenne que de 1,7; 2,3; et 2,9 mots dans trois tentatives d’affilée. Certains d’entre eux ne se rappellent aucun mot (effet-seuil). D’autre part, la tâche de reconnaissance de mots serait conçue de façon appropriée pour les participants, et elle n’est donc caractérisée ni par un effet-seuil, ni par un effet de plafonnement. Les auteurs proposent d’éliminer la troisième tentative d’évocation (qui n’amène aucune amélioration du rendement) et de modifier le nombre de mots de la tâche d’évocation afin de s’adapter au degré de gravité de la maladie. Ces recommandations, quoique logiques, ne sont fondées que sur les données concernant un faible nombre de personnes dont le degré de démence est indéterminé. En outre, les résultats de l’échelle ADAS-cog ne sont pas présentés en totalité. Enfin, il faudrait pouvoir reproduire ces résultats avant de modifier l’échelle ADAS-cog.

Il importe de tenir compte des limites de l’échelle ADAS-cog avant de l’utiliser en tant que mesure de l’efficacité d’un médicament. Mohs (71) préconise que la sélection des participants à un essai à long terme soit effectuée de telle sorte qu’ils forment un groupe homogène quant à la gravité de la démence – l’évolution naturelle escomptée d’un groupe de personnes (p. ex., le taux de détérioration) sera grandement influencée par la gravité de la démence au début de l’étude.

Le score fiable de changement individuel est estimé d'après les données d'un essai allemand. Bien que cette estimation vienne étoffer les données sur les qualités psychométriques de l’échelle, elle n’est pas applicable directement à la version anglaise de l’échelle. Par conséquent, il y aurait lieu d'effectuer de nouveau cette analyse en se fondant sur les données appropriées reliées à la version anglaise de l’échelle.

Page 41: Rapport la maladie d’Alzheimer. technologique II. Examen ...

27

3.3 Test du syndrome de Kurtz (SKT)

3.3.1 Introduction

Le test du syndrome de Kurtz (SKT) est une échelle d’évaluation de la fonction cognitive qui a été mise au point et normalisée dans les pays européens germanophones (74); la publication initiale de ce test date de 20 ans. La plus grande partie de la documentation sur les qualités psychométriques du SKT est tirée d’études portant sur des personnes de langue allemande, quoique le test ait été administré à des personnes de langue anglaise dans des essais américains sur des médicaments (74-76).

3.3.2 Description

Caractéristiques étudiées : L’appellation SKT recouvre une batterie de tests neuropsychologiques axés sur la concision, les modes de rendement et les degrés de difficulté, destinés aux cas de démence légère ou modérée (74). L’analyse factorielle fait constamment ressortir deux éléments principaux, soit « l’attention » (ou la vitesse de traitement de l’information) et la « mémoire ». Administration : Il s’agit d’un test à temps fixe dont les six sous-tests sur « l’attention » sont limités à 60 secondes (c.-à-d., l'appellation d’objets, l'appellation de nombres, le classement de cubes, la réorganisation de cubes, le dénombrement de symboles, l'appellation inversée). Les trois sous-tests sur la « mémoire » sont à temps libre (c.-à-d., la mémoire immédiate, la mémoire différée et la mémoire de reconnaissance). Au total, l’administration dure environ 15 minutes. Pour que le test dans l'ensemble se déroule de façon satisfaisante, un bon rapport doit s’établir entre l’évaluateur et le malade (77). Application : Conçu pour des personnes atteintes de démence légère ou modérée, le SKT peut être administré à des personnes souffrant de troubles psychiatriques ou d’autres affections entraînant un déficit cognitif. Même si les études d’observation post-thérapeutique et les ECR représentent les principaux cadres d’application du SKT, il est également utilisé en pratique clinique courante et en recherche fondamentale. Il a été administré à plusieurs milliers de personnes âgées, et son utilisation comme instrument de mesure est également fréquente dans les ECR européens. La disponibilité de cinq formes parallèles composées de sous-tests équivalents vient contrer tout effet d’assimilation dans les essais cliniques sur les médicaments. Cotation : Les tâches sur « l’attention » sont cotées en additionnant le nombre d’erreurs et le nombre de secondes du délai d’exécution (ou 60 secondes lorsque la tâche n’est pas terminée). Quant aux tâches sur la « mémoire », leur score se compose du nombre de stimulus dont on ne peut se rappeler ou que l’on ne peut reconnaître avec précision. Le score brut s’obtient par la sommation des scores des neuf sous-tests. Plus le score SKT global est élevé, plus le rendement est faible.

Dans les pays germanophones, les scores bruts sont normalisés conformément au manuel sur le SKT (76). Les normes SKT sont stratifiées en quatre groupes d’âge (17-44, 45-54, 55-64 et 65 ans et plus) et trois niveaux d’intelligence en l’absence de maladie (QI : moins de 90, de 90 à 110 et plus de 110). Les scores normalisés vont de 0 à 27 et indiquent cinq niveaux de gravité (76) :

Page 42: Rapport la maladie d’Alzheimer. technologique II. Examen ...

28

- 0-4 = pas de déficit cognitif - 5-8 = déficit très léger ou douteux - 9-13 = démence légère - 14-18 = démence modérée - 19-23 = démence prononcée - 24-27 = démence grave.

Dans les versions traduites du SKT, on a adapté la cotation de différentes façons : (i) scores normalisés conformément aux normes allemandes (75), (ii) scores transposés en scores T accompagnés d’une médiane de 50 et d’un écart-type de 15 (78), ou (iii) scores utilisés sous leur forme brute (74). Il convient de souligner qu’en utilisant les scores T moyens, on peut générer les scores factoriels de la « mémoire » et de « l’attention » qui peuvent être comparés directement (78).

3.3.3 Évaluation

3.3.3.1 Fiabilité

Constance test-retest : Overall et Schaltenbrand (78) analysent les données sur les tests SKT effectués dans trois essais allemands sur des médicaments contre la démence. Les essais comptent respectivement 165, 217 et 201 participants atteints de démence légère ou modérée (il ne s’agit pas seulement de MA ou de démence dégénérative primaire), dont la répartition selon l’âge n’est pas indiquée. Les participants sont évalués deux fois : à un intervalle de 14 jours dans les deux premiers essais et à un intervalle de 90 jours dans le troisième. Les coefficients de corrélation du moment mixte de Pearson vont de 0,76 à 0,84 quant au facteur de la « mémoire »; de 0,87 à 0,89 quant à l'élément de « l’attention »; de 0,83 à 0,89 s’agissant du score SKT global. Les coefficients de corrélation concernant les sous-tests sont pour la plupart supérieurs à 0,75. Dans les trois essais, le traitement par le médicament commence peu après la première évaluation, quoique la durée de cette période de traitement diffère d’une personne à une autre. Il se peut que les résultats de cette étude en aient été biaisés.

Pour leur part, Kim et collab. (74) présentent une analyse des données d’une étude américaine multicentrique sur la linopirdine. Les 265 participants de cette étude ont un diagnostic de MA établi conformément aux critères NINCDS/ADRDA, ont un score MMSE se situant entre 14 et 23, et sont évalués deux fois à un intervalle de 14 jours. Le coefficient de corrélation est de 0,75 quant à la « mémoire », de 0,93 s’agissant de « l’attention » et de 0,90 quant au score SKT global. Les coefficients de corrélation des sous-tests, à l’exception de la tâche sur la mémoire différée (0,52), vont de 0,62 à 0,86. La répartition selon l’âge et le type de coefficient de corrélation ne sont pas mentionnés. 3.3.3.2 Validité

Validité de contenu : Rapidité par rapport à qualité : L’administration et la cotation à temps fixe sont des caractéristiques distinctives du SKT. Cette méthode ne fait pas l’unanimité chez les psychométriciens et les neuropsychologues (74) en raison du fait qu’aux États-Unis, il est d’usage de mettre l’accent sur la qualité (ou la précision) de la performance plutôt que sur la rapidité. Kim et collab. (74) échafaudent ainsi une expérimentation afin d’examiner si la cotation sous l’aspect de la « qualité » peut améliorer l’information produite par la cotation SKT sous l’angle de la « rapidité ».

Page 43: Rapport la maladie d’Alzheimer. technologique II. Examen ...

29

Ils ont mis au point un score de qualité à cinq paliers qu’ils appliquent au sous-test de « l’attention » du SKT (mentionnons que les sous-tests sur la « mémoire » ne sont pas des tests à temps fixe); la cotation tient compte de la distinction entre l’erreur simple et l’erreur grossière. La sommation des scores qualitatifs des sous-tests sur « l’attention » produit le score global du sous-test qualitatif sur « l’attention ». Ces deux tests SKT, soit le test à temps fixe et le test qualitatif, sont administrés deux fois au moment de référence aux personnes atteintes de la MA (voir plus haut). La constance test-retest du sous-test sur « l’attention » est du même ordre, qu’il s’agisse du test à temps fixe (0,93) ou du test qualitatif (0,86). Les coefficients de corrélation entre les deux types de sous-tests sur « l’attention » sont également bons (0,72 et 0,75); les coefficients de corrélation entre les items des tâches, qui vont de 0,52 à 0,67 à la première évaluation et de 0,49 à 0,77 à la seconde, ne sont pas aussi remarquables. Les coefficients de corrélation entre le sous-test sur « l’attention » à temps fixe et le MMSE (-0,57) et l’échelle ADAS-cog (0,63) sont semblables aux coefficients de corrélation entre le sous-test qualitatif sur « l’attention » et les mêmes échelles – MMSE (-0,55) et ADAS-cog (0,67). La saturation de variables déterminée par l’analyse factorielle est de même nature pour les deux types de tests SKT. Selon les auteurs, la similarité frappante des résultats du test à temps fixe et du test qualitatif découlerait fort probablement du fait que des aspects cognitifs sous-jacents de même nature sont mesurés de façon différente. Cette expérimentation viendrait appuyer l’interprétation voulant que les instruments de mesure à temps fixe permettent d’évaluer d’autres facettes de la cognition que la seule rapidité de la performance. Validité de structure/validité concomitante : Weyer et collab. (61) comparent les scores SKT et ADAS-cog de référence de 440 personnes souffrant de MA (selon les critères NINCDS/ADRDA) participant à un essai multicentrique. L’âge moyen des participants est de 70 ans, et leurs scores MMSE vont de 10 à 24. La moyenne des scores SKT est de 18,6 (écart-type de 4,7; gamme 9-27) et la moyenne des scores ADAS-cog est de 34,3 (écart-type de 8,6; gamme 15-61). Le coefficient de corrélation du moment mixte de Pearson est de 0,75. Dans l’analyse décrite plus haut (74), le coefficient de corrélation entre le SKT et l’échelle ADAS-cog est de 0,69; entre le SKT et le MMSE de -0,60. Lorsque les auteurs tiennent compte des sous-tests sur la « mémoire » et « l’attention » plutôt que du score SKT total, ils constatent que les coefficients de corrélation sont un peu plus faibles (facteur de la « mémoire » : ADAS-cog 0,47; MMSE -0,38; facteur de « l’attention » : ADAS-cog 0,63; MMSE -0,57). Les auteurs présentent également les coefficients de corrélation redressés en fonction de l’erreur aléatoire, qui sont évidemment plus élevés que les coefficients non redressés. Les coefficients redressés n’ont qu’une utilité théorique et ne peuvent être comparés aux coefficients de corrélation (non redressés) que présentent habituellement les études. Nous n’avons pu déterminer si Kim et collab. (74) ont recours aux coefficients de corrélation de Pearson ou à ceux de Spearman.

Dans une autre analyse (55) des données concernant 49 patients d’une clinique souffrant de MA probable (âge moyen=70,4 ans; gamme=45-84), les coefficients de corrélation (rs) entre le SKT et diverses échelles cognitives sont : ADAS-cog (0,82); MMSE (0,81); BCRS (0,80). Validité de structure/structure factorielle : L’analyse factorielle du déficit cognitif chez les personnes âgées atteintes de démence démontre de façon constante l’existence d’une structure formée de deux facteurs désignés comme étant les déficits de la « mémoire » et de « l’attention » (ou vitesse de traitement de l’information) (75;76). Chez les personnes âgées dont la fonction cognitive est intacte, l’analyse factorielle met en évidence une structure composée de trois éléments, définis comme étant les déficits de la « mémoire », de « l’attention » et de la « fluidité verbale »

Page 44: Rapport la maladie d’Alzheimer. technologique II. Examen ...

30

(75). Lehfeld et collab. (75) et Kim et collab. (74) expliquent de façon plausible cette différence de structure factorielle entre les personnes âgées dont la fonction cognitive est intacte et les personnes âgées souffrant de déficit cognitif. Une étude comparant des données du Chili, de la Grèce, de la Russie, de l’Angleterre et de l’Allemagne révèle d’ailleurs la stabilité interculturelle de la structure factorielle (75). 3.3.3.3 Sensibilité au changement

En comparant la répartition des scores SKT de 49 personnes atteintes de démence aux scores-seuils de trois échelles cognitives (BCRS, MMSE et ADAS-cog), Ihl et collab. (55) évaluent la structure de cotation du SKT par rapport à la gravité de la démence, à l’effet-seuil et à l’effet de plafonnement. Ils constatent que le SKT est doté de sensibilité aux divers degrés de gravité de la maladie. Cet instrument peut toutefois surestimer la gravité par rapport à l’échelle ADAS-cog et au MMSE – l’instrument faisant preuve d’un effet-seuil à un degré de gravité inférieur. Par conséquent, le SKT ne devrait être appliqué qu’à des personnes atteintes de démence légère ou modérée (les scores-seuils précis des degrés de gravité sont indiqués au regard du BCRS, du MMSE et de l’échelle ADAS-cog). Cette constatation va dans le même sens que l’information contenue dans le manuel sur le SKT, qui ne prétend pas que l’instrument puisse mesurer toute la gamme des degrés de gravité de la maladie et qui mentionne l'effet-seuil.

3.3.4 Examen critique

Les analyses démontrent la fiabilité et la validité du SKT dans les études portant sur des personnes atteintes de la MA. Toutefois, à l’exception d’une étude, les résultats s’appliquent à des populations germanophones et ne sont valides que pour ces populations (76).

L’administration et la cotation à temps fixe du SKT posent problème pour certains

psychométriciens. Nous ne partageons pas ce point de vue. Des caractéristiques à temps fixe sont courantes dans plusieurs tests neuropsychologiques particuliers dont l’utilité dans la mesure de l’attention est démontrée. En outre, une étude du SKT indique que le rendement à temps fixe est tout aussi instructif que le rendement qualitatif (74).

Il n’y a, à toutes fins utiles, pas d’information sur le « changement de portée clinique » et les

« scores fiables de changement individuel », à tout le moins dans la documentation en anglais ou concernant des malades de langue anglaise. À notre avis, il importe de tenir compte du mode de présentation des résultats (p. ex., score brut, scores t ou scores normalisés) à l’interprétation de ces notions.

Par ailleurs, il faudra traiter de la question de la normalisation des versions traduites – il est

à penser que les normes allemandes ne s'appliquent pas à toutes les populations.

La structure factorielle de la cognition n’est pas la même chez les personnes atteintes de démence et chez les personnes dont la fonction cognitive est intacte; nous proposons que cet aspect soit étudié de façon plus approfondie.

En outre, le SKT comprend certaines tâches difficiles à accomplir par des personnes

atteintes de démence, tel le fait de se souvenir de 12 stimuli (objets). En fait, l’utilisation de cet

Page 45: Rapport la maladie d’Alzheimer. technologique II. Examen ...

31

instrument est limitée à l’évaluation de personnes atteintes de démence légère ou modérée. Les utilisateurs doivent d’ailleurs s’attendre à ce qu’un effet-seuil se produise.

De toute évidence, il faut poursuivre l’évaluation du SKT avant de l’adopter comme instrument de mesure principal dans les essais sur les médicaments. Comme le SKT est complémentaire de l’échelle ADAS-cog (qui ne comporte pas de tâches sur l’attention), il occuperait une place distinctive dans l’évaluation de la capacité cognitive chez les personnes atteintes de la MA (78).

3.4 Mini-examen de l’état mental (MMSE)

3.4.1 Introduction

À l’origine, le mini-examen de l’état mental (MMSE) (79) a été conçu pour (i) évaluer les aspects cognitifs de l’état mental de personnes subissant une évaluation psychiatrique et (ii) établir le diagnostic différentiel de troubles cérébraux organiques (p. ex., la démence) et fonctionnels (p. ex., la dépression). Outre qu’il est le test de dépistage du déficit cognitif le plus répandu, il est également utilisé dans les études longitudinales afin de documenter l’histoire naturelle du déficit cognitif et de surveiller l’amélioration en cours de traitement, même s’il n’a pas été conçu dans ce but (55;80). Tombaugh et McIntyre (81) ont examiné la documentation sur le MMSE s’étendant sur 26 ans; nous prions les lecteurs de consulter cet ouvrage précurseur pour obtenir plus de renseignements.

3.4.2 Description

Caractéristiques étudiées : Le MMSE comprend 11 questions sur l’orientation, la mémoire (récente et immédiate), la concentration, le langage et la praxie. Tous les items sont évalués par des tests. La formulation, le contenu de certaines questions, l’administration et la cotation de cet instrument ont été modifiés à l’occasion depuis sa conception initiale. Administration : Un intervieweur qualifié administre l’échelle en cinq ou dix minutes. Application : L’instrument est destiné à des personnes chez qui l’on soupçonne la présence d’un trouble cérébral organique ou fonctionnel. Cotation : Les scores vont de 0 à 30; plus le score est élevé, moins le déficit est prononcé. Le score-seuil du déficit cognitif est de 23 ou moins. Le score-seuil du déficit cognitif grave, un score de 17 ou moins, est parfois utilisé. 3.4.3 Évaluation

3.4.3.1 Fiabilité

Constance test-retest : Dans l’évaluation de personnes souffrant d'un déficit cognitif, le MMSE est doté d’une fidélité test-retest élevée (de 0,80 à 0,95) (81). Sur ce plan, les résultats obtenus chez des personnes souffrant de MA du groupe placebo de divers essais cliniques (58;59) sont semblables. La constance test-retest de l’instrument est moindre lorsque des personnes, dont la fonction cognitive est intacte, sont évaluées, mais cela reflète probablement la baisse du coefficient de corrélation découlant de la réduction de la gamme des scores (60;81).

Page 46: Rapport la maladie d’Alzheimer. technologique II. Examen ...

32

Fidélité inter-juges : La concordance inter-évaluateurs du MMSE est élevée (de 0,50 à 0,75). Toutefois, l’absence de critères de cotation au regard de certains items (p. ex., le dessin des pentagones) peut influer sur le degré de corrélation (81). 3.4.3.2 Validité

Validité de contenu : Le MMSE est un bref test de dépistage qui ne permet pas d’évaluer les fonctions cognitives supérieures, la fluidité verbale ou tous les aspects de la mémoire. Par conséquent, sa capacité d’évaluer tous les aspects cognitifs touchés par la MA est limitée. Validité empirique/validité concomitante : À cet égard, le MMSE a été comparé à un certain nombre d’échelles cognitives. En règle générale, les coefficients de corrélation sont élevés (de 0,70 à 0,90) (81). En effet, le degré de corrélation est élevé entre le MMSE et le DRS (0,87), le SPSMQ (r=0,83), le BIMC (r=-0,83 ou plus) et le CAMCOG (r=0,94) (82-84). Deux études comparant le MMSE et l’échelle ADAS-cog indiquent que le degré de corrélation est élevé (r=-0,81 et -0,90) (55;65). 3.4.3.3 Sensibilité au changement

Études longitudinales : Dans de nombreuses études longitudinales portant sur des personnes souffrant de la MA, on observe que les scores MMSE diminuent avec le temps (81). En général, ce taux de diminution varie de 2 à 5 points par an, quoique l’on constate une grande variabilité d'une personne à une autre et d'une étude à une autre (85). Cette variabilité s’explique en partie par l’évolution irrégulière caractéristique de la MA et par l’hétérogénéité des caractéristiques individuelles.

Cette variabilité est également attribuable en partie au contenu et aux qualités

psychométriques du MMSE. Clark et collab. (85) font d’ailleurs ressortir cet aspect. Dans leur analyse des données du Consortium to Establish a Registry for Alzheimer’s Disease (CERAD), les auteurs démontrent que, dans des conditions test-retest, le coefficient de fiabilité estimé d’après les résultats MMSE de personnes atteintes de démence est élevé (rp=0,87). Toutefois, les scores de changement individuel correspondants (scoreT1 – scoreT 2) sont considérablement étalés, allant de -8 points à +7 points (score de changement moyen=0,5; écart-type=2,8). Ces résultats mettent en relief l'utilité limitée du MMSE en tant qu’instrument de mesure du changement à court et à moyen terme chez une même personne. Bowie et collab. (86), qui démontrent que le MMSE n’est pas doté d’une fidélité inter-juges appropriée pour déceler les changements minimes de la cognition, tels qu’ils se produisent dans les essais actuels sur la pharmacothérapie de la MA, en arrivent à des conclusions semblables.

La capacité du MMSE de déceler la détérioration est également inconstante – dans une plus

grande mesure que d’autres échelles cognitives plus longues. Le MMSE est sensible au déclin prononcé de la mémoire causé par la démence légère ou modérée; toutefois, au fur et à mesure que la démence s'aggrave, la sensibilité au changement du MMSE s’estompe. Autrement dit, au fur et à mesure que le score MMSE diminue, la sensibilité de l’échelle à la détérioration de la fonction cognitive chez des personnes atteintes de la MA (87) diminue également – phénomène appelé l’effet-seuil.

Page 47: Rapport la maladie d’Alzheimer. technologique II. Examen ...

33

Gravité : En comparant la répartition des scores MMSE aux scores-seuils de trois échelles cognitives (BCRS, SKT et ADAS-cog), Ihl et collab. (55) évaluent la structure de notation du MMSE en rapport avec la gravité de la démence, l’effet-seuil et l’effet de plafonnement. Ils constatent que l’étalement des scores MMSE aux stades intermédiaires de la maladie, déterminés par les scores-seuils, est plus grand que prévu, ce qui laisse entrevoir que le MMSE est doté d’une faible sensibilité pour documenter l’évolution de la MA. Ils observent également un effet de plafonnement. 3.4.3.4 L’âge et l’éducation en tant que variables confusionnelles

Beaucoup d’études indiquent que les scores MMSE diminuent avec l’âge. Cette influence de l’âge se manifeste dans divers milieux. L'effet, qui commence vers l’âge de 55 ou 60 ans et s’accentue après l’âge de 75 ou 80 ans, ne constitue pas un effet de la cohorte car il persiste malgré la stratification de la population selon le niveau d’éducation. Par conséquent, l’application du score-seuil MMSE de 23/24 dans le dépistage peut se traduire par la sous-estimation du déficit cognitif chez des personnes jeunes et la surestimation de ce déficit chez les personnes âgées (88).

De nombreuses études démontrent également que les scores MMSE sont inversement

proportionnels au nombre d’années de scolarité (81). Le point de vue qui prévaut à l’heure actuelle veut que l’éducation introduise un biais psychométrique causant le classement erroné de personnes dont les antécédents éducatifs sont divers. Par ailleurs, d’autres hypothèses tentent d’expliquer ce rapport. Selon l’une d’elles, l’éducation constitue un marqueur d’autres facteurs de risque (p. ex., la malnutrition ou l’exposition à un produit nocif au cours de la vie) (89). Selon une autre hypothèse, les personnes très instruites (ou intelligentes) sont dotées d’une capacité élevée d’adaptation au déclin du fonctionnement cérébral; cette capacité d’adaptation élevée est désignée comme étant la « réserve cognitive » (89). L’interprétation fondamentale de l’influence de l’éducation reste à déterminer.

Fait curieux, l’éducation et l’âge n’influenceraient pas le taux de détérioration cognitive, tel qu’il est mesuré par le MMSE (90). Néanmoins, on peut penser que l’âge avancé et le faible niveau d’éducation représentent deux facteurs déterminants de l’effet-seuil qui caractérise le MMSE.

3.4.4 Examen critique

Même si la fiabilité et la validité du MMSE sont bonnes en ce qui concerne son usage prévu initialement, soit le dépistage de la démence, les échelles brèves de dépistage ne sont pas conçues pour mesurer les aspects fins de la cognition. Plus précisément, les échelles brèves telles le MMSE peuvent ne déceler qu’un changement minime, voire aucun changement, au fil du temps chez des personnes qui, si elles avaient été évaluées à l’aide d’une autre échelle, manifesteraient de fait une détérioration importante (49) (85). Le MMSE ne représente pas un instrument de mesure idéal dans le contexte d’essais cliniques sur la pharmacothérapie de la MA, surtout si les effets bénéfiques escomptés sont limités (86).

3.5 MMSE en tant qu’instrument de stadification

Selon Kraemer et collab. (91), le MMSE peut être utilisé comme instrument de stadification de la démence. Ils proposent cinq stades de la maladie correspondant aux scores MMSE suivants : 1 (24-30), 2 (15-23), 3 (8-14), 4 (4-7), 5 (0-3). En examinant les résultats MMSE et GDS de 206

Page 48: Rapport la maladie d’Alzheimer. technologique II. Examen ...

34

personnes souffrant de MA probable, les auteurs constatent que la concordance entre les deux instruments est bonne. Ils établissent cette concordance en appariant le stade MMSE (score) et le stade GDS des malades. Les stades inférieurs du MMSE (1, 2 et 3) sont ceux qui correspondent le mieux à la stadification de l’échelle GDS. Lorsque la démence est plus prononcée, la stadification des deux instruments diverge.

Kraemer et collab. (91) présentent les avantages du MMSE en tant qu’instrument de

stadification, à savoir que le processus est plus simple et de plus courte durée que l’utilisation de l’échelle GDS. En outre, les milieux cliniques connaissent bien le MMSE. L’utilisation du MMSE pour déterminer les stades de la démence est indiquée lorsque la recherche porte essentiellement sur les phases précoces de la maladie ou du déclin cognitif. L’échelle GDS convient mieux lorsque l’accent est mis sur les changements physiques, comportementaux, neurologiques ou socio-économiques liés aux divers degrés de gravité de la démence.

La version de « stadification » du MMSE (c.-à-d., degrés de gravité définis par des scores-

seuils MMSE) est utilisée comme critère de sélection dans de nombreux essais. Par contre, cette version du MMSE n’est pas utilisée en tant qu’instrument de mesure dans les essais sur la pharmacothérapie de la MA. La lacune du MMSE du point de vue de la sensibilité au changement expliquerait que sa version de « stadification » ne constitue pas un instrument de mesure approprié dans le cadre d’essais sur la pharmacothérapie de la MA.

3.6 Échelle Blessed d’évaluation de la démence (BDS)

3.6.1 Introduction

L’échelle Blessed d’évaluation de la démence (BDS) a été mise au point en 1968 pour examiner le rapport entre la formation de plaques séniles dans le cerveau et les troubles psychiatriques, principalement la démence (92). À l’origine, l’échelle a été conçue surtout pour les patients hospitalisés dans les services de psychiatrie et de gériatrie. Depuis ce temps, elle est devenue un outil d’évaluation de la gravité du déficit cognitif chez les personnes atteintes de la MA (38). Cet instrument est également utilisé pour déterminer l’admissibilité de personnes atteintes de la MA à des essais cliniques sur des médicaments.

3.6.2 Description

Caractéristiques étudiées : L’échelle BDS permet de mesurer : (i) les changements dans l’exécution d’activités de la vie quotidienne (p. ex., tâches ménagères, mémoire des faits récents, gestion de petits montants d’argent, etc.); (ii) les changements d’habitudes dans des activités instrumentales comme manger, se vêtir et aller à la toilette; (iii) les changements de personnalité, d’intérêts et de motivation (92). Administration : Un intervieweur administre l’échelle à un parent ou un ami « qui entretient des rapports étroits et continus avec [le] malade » (92). Aucune règle ne régit la durée ou la fréquence des administrations. Application : L’échelle BDS est destinée à des malades souffrant de troubles psychiatriques ou atteints de démence. L’instrument est conçu pour évaluer le rendement du malade dans la période de six mois précédant l’administration du test.

Page 49: Rapport la maladie d’Alzheimer. technologique II. Examen ...

35

Cotation : L’échelle BDS comporte trois sections. La section sur les « activités de la vie quotidienne » comprend huit questions qui sont notées de façon distincte selon les paliers suivants : 1=incapacité totale; 0,5=incapacité partielle, variable ou intermittente; 0=pleine capacité. La section sur les « habitudes » se compose de questions relatives à l’alimentation, à l’habillement et à la continence qui sont également notées de façon distincte. L’évaluateur sélectionne la description, parmi les quatre qui accompagnent les questions, qui correspond le mieux à l’état du malade. Les scores vont de 0 (s’habiller de façon appropriée/proprement, s’habiller sans aide, plein contrôle des sphincters) à 3 (doit être nourri, incapable de s’habiller, incontinence vésicale et anale). La section sur « la personnalité, les intérêts et la motivation » consiste en une série d’énoncés auxquels on attribue un score de 1 lorsque l’énoncé s’applique au malade en question. À la fin du test, on procède à la sommation des scores des trois sections pour obtenir le score global qui va de 0 (pleine capacité) à 28 (incapacité totale). 3.6.3 Évaluation

3.6.3.1 Fiabilité

Constance test-retest : La documentation n’aborde pas ce sujet. Fidélité inter-juges : Pour étudier la fidélité inter-juges, Cole (93) demande à deux psychologues cliniciens qualifiés d’évaluer 47 patients hospitalisés dont le diagnostic est la MA ou une démence vasculaire. Les psychologues interviewent de façon indépendante le dispensateur de soins du malade. Celui-ci doit être un parent ayant prodigué des soins au malade avant son hospitalisation. Le coefficient de corrélation Pearson entre les scores globaux des intervieweurs est de 0,59; le CCI est de 0,30. 3.6.3.2 Validité

Validité de contenu : Cet aspect n’est pas traité dans la documentation. Validité de structure/validité concomitante : Morris et collab. (94) analysent les données concernant 430 personnes souffrant de la MA selon les critères NINCDS/ADRDA pour étudier la validité. Des cliniciens chevronnés administrent l’échelle BDS et le test Blessed abrégé (SBT, qui porte sur l’orientation, la mémoire et la concentration) aux prestataires de soins et aux malades. De leur côté, des psychométriciens expérimentés administrent une batterie de tests neuropsychologiques (y compris le MMSE) aux malades, hors du contexte des évaluations cliniques. Ces deux processus d’évaluation ont lieu au moment de référence, puis chaque année pendant quatre ans. Les auteurs constatent qu’il existe une corrélation entre les scores BDS de changement annuel (année2-année1, etc.) et le SBT (rp=0,48), et le MMSE (rp=-0,56).

Davis et collab. (95) comparent le rendement de quatre instruments d’évaluation de la fonction cognitive, dont le BDS, au rendement de l’échelle CDR. En vertu de l’hypothèse formulée par ce groupe, la corrélation entre le BDS et l’échelle CDR serait positive, car les stades avancés de la démence se traduiraient par des scores élevés au test Blessed. Leur étude longitudinale comprend 25 personnes témoins, 25 personnes souffrant de MA douteuse, 24 atteintes de MA légère, 24 souffrant de MA modérée et 18 atteintes de MA grave. Le coefficient de corrélation tau B de

Page 50: Rapport la maladie d’Alzheimer. technologique II. Examen ...

36

Kendall entre les échelles BDS et CDR est de 0,80. En outre, le coefficient de corrélation entre les échelles BDS-cognitive (amputée de la section sur la personnalité, les intérêts et la motivation) et CDR est de 0,84. Validité empirique/validité discriminative : Blessed et collab. (92) examinent les résultats d’autopsie de 60 personnes dont l’hospitalisation avait pour cause des troubles psychiatriques, la démence ou d’autres affections générales. Les scores BDS avant décès font preuve d'une bonne corrélation (r=0,77; p<0,001) et d'une relation « globalement linéaire » avec le nombre moyen de plaques décelées à l’autopsie. Il existe une corrélation négative (r=-0,40; p<0,01) entre ces scores et le taux réel de survie de 40 personnes atteintes de démence assurée (dont 26 ont subi une autopsie). Blessed et collab. ont recours à des appréciations cliniques subjectives et non précisées pour établir ce qu’ils appellent un diagnostic « assuré ». 3.6.3.3 Sensibilité au changement

Aucune synthèse fondamentale sur ce sujet n’a été publiée, quoique Heun et collab. (38) aient examiné l’échelle BDS dans le cadre d’une analyse de la courbe d’efficacité du test. Ils constatent qu’un score supérieur à 1 permettrait d’établir la distinction, avec une sensibilité de 95 %, entre des malades atteints de démence et des malades dont la fonction cognitive est intacte. Pour atteindre une spécificité de 95 % et de 99 %, les scores sont respectivement supérieurs à 3 et à 4,5. Le seuil optimal de différentiation, défini par la courbe d’efficacité du test, est un score supérieur à 1.

Dans une étude sur le test de dépistage du déclin cognitif (CAST), Drachman et collab. (96) font mention de renseignements sur la sensibilité et la spécificité de l’échelle BDS. Cette étude compte deux groupes : (i) 19 personnes atteintes de démence légère ou modérée (âge moyen=72,8 ans) et 24 personnes saines témoins du même groupe d’âge (âge moyen=74,9 ans); (ii) 26 personnes âgées ne souffrant pas de démence. On administre diverses batteries de tests neuropsychologiques pour cerner les personnes atteintes d’un déficit cognitif. L’échelle BDS permet de distinguer les personnes souffrant de démence des personnes saines avec une sensibilité de 100 % et une spécificité de 96 % dans une expérimentation où seules les personnes témoins subissent les tests neuropsychologiques. Dans la seconde expérimentation, les personnes sont toutes soumises aux divers tests, peu importe leur état de santé, et la distinction établie par l’échelle BDS révèle une sensibilité de 50 % et une spécificité de 94 %.

3.6.4 Examen critique

Seule une étude (93) évalue la fiabilité de cet instrument de mesure, indiquant d’ailleurs que la fidélité inter-juges de l’échelle est faible. Quant à la validation, les résultats ne sont pas probants. Bien que Blessed et collab. (92) démontrent qu’il y a une bonne corrélation entre le nombre de plaques décelées à l’autopsie et les scores BDS, Drachman et collab. (96) et Heun et collab. (38) obtiennent des résultats douteux quant à la sensibilité du test sous l’angle de la distinction entre des personnes atteintes de démence et des personnes ne souffrant pas de cette affection. À la lumière de ces résultats médiocres ou contradictoires, l’utilisation de l’échelle BDS en tant qu’instrument de mesure ou critère d'admissibilité dans les essais sur la pharmacothérapie de la MA n’est pas préconisée. D’autres instruments de mesure, tels l’échelle ADAS-cog ou l’échelle CDR, représentent des choix plus judicieux.

Page 51: Rapport la maladie d’Alzheimer. technologique II. Examen ...

37

3.7 Tests neuropsychologiques particuliers

Outre les échelles déjà décrites, les essais examinés font état de divers tests neuropsychologiques particuliers. Nous avons regroupé ces tests en six catégories aux fins de la discussion : la psychomotricité, la mémoire, le langage, la capacité oculoperceptive, l’attention et l’abstraction (voir le tableau 2 au chapitre 1).

3.8 Psychomotricité

Les tests de rapidité psychomotrice sont considérés comme des instruments de mesure utiles dans l’évaluation des effets d’une intervention thérapeutique sur la capacité cognitive (97). Dans de nombreux tests psychologiques, particulièrement les tests à temps fixe, le rendement repose sur la rapidité psychomotrice. En outre, comme le vieillissement normal et les affections liées à l’âge, telles la démence, s’accompagnent d’un ralentissement du fonctionnement moteur, il importe d’évaluer de façon distincte la rapidité psychomotrice (97). Dans les essais examinés, on relève l’utilisation de deux tests psychomoteurs, le test d’oscillation du doigt (98) et le temps de réaction au choix (99). Ces tests sont des tests « témoins » sur lesquels se fonde l’interprétation des résultats cognitifs. Nous n’abordons ce sujet que brièvement; les lecteurs sont priés de consulter l’examen approfondi de Flicker (97) pour obtenir plus de renseignements.

3.8.1 Test d’oscillation du doigt

Dans ce test, la personne enfonce la touche d’un compteur-enregistreur à l’aide de l’index aussi souvent que possible pendant une période déterminée.

3.8.2 Temps de réaction au choix

Dans ce test, la personne relâche une touche ou un bouton lorsqu’elle capte un signal. Si la tâche comprend le déplacement d’une position de repos à une position cible, le temps de réaction global réel peut être fractionné en deux durées, le « temps de relâchement » et le « temps de déplacement ». Le temps de relâchement varie en partie selon la vitesse du traitement cognitif, alors que le temps de déplacement constitue une mesure relativement pure de la rapidité motrice. De même, le temps de réaction simple (un signal – une réaction) et le temps de réaction au choix (la personne choisit la réaction appropriée au signal en question) font preuve d’une sensibilité au vieillissement et à la démence qui n'est pas la même.

3.8.3 Évaluation

Selon Flicker (97), ces deux tests bruts de la rapidité motrice couvrent une vaste gamme de degrés de difficulté, sont dotés d’une fiabilité appropriée (qui peut être améliorée par des essais pratiques), et font preuve d’une validité de structure appropriée et d’une sensibilité au vieillissement et à la démence. Dans les deux cas, l’administration ne dure que cinq minutes ou moins. Il n’est pas judicieux d'utiliser des tâches plus complexes que celles de ces tests pour évaluer la rapidité motrice. En règle générale, plus la complexité s'accroît, plus la fonction cognitive doit intervenir, et il serait difficile d’interpréter les résultats d’un tel test sur le plan de la seule rapidité motrice.

Page 52: Rapport la maladie d’Alzheimer. technologique II. Examen ...

38

3.9 Mémoire

3.9.1 Test Buschke de remémoration sélective (BSRT)

3.9.1.1 Description

Le test d’appellation de Boston (BNT) du test Buschke de remémoration sélective (BSRT) (100) mesure l’apprentissage verbal et la mémoire. Caractéristiques étudiées : Le test est centré sur la mémoire immédiate, l'évocation avec indices, la mémoire de reconnaissance à choix multiple et la mémoire différée. Administration : Un examinateur administre le test en lisant ou en montrant une liste de 12 mots. Puis, il demande à la personne de se souvenir du plus grand nombre possible de mots de cette liste. À l’essai suivant, l’examinateur ne présente, de façon sélective, que des mots non évoqués à l’essai précédent. L’examinateur peut établir la distinction entre la mémoire à court terme et la mémoire à long terme en mesurant la remémoration de mots non présentés au cours d’une tentative en particulier. On cherche à obtenir le rendement maximal sur le plan de la mémoire immédiate en accordant 12 tentatives d’affilée, le cas échéant. Une version pour adultes et une version pour enfants sont disponibles. La version pour adultes s’administre en 30 minutes. Application : Le BSRT est dorénavant le test le plus répandu dans l’évaluation de la mémoire à la suite d’un traumatisme crânien. Cet instrument permet également d’établir la distinction entre des personnes âgées saines et des personnes âgées atteintes de démence légère. Cotation : Le mécanisme de cotation détaillé et complexe tient compte du nombre d’erreurs et de répétitions de la personne ainsi que du nombre de rappels de l’intervieweur. Les divers aspects de la mémoire sont cotés : la mémoire à court terme, la mémorisation à long terme, le repérage à long terme et le repérage fidèle à long terme. Plus le score est élevé, plus le rendement est bon. À cet égard, il existe des données normatives s’appliquant à divers groupes d’âge (jusqu’à 91 ans) ainsi qu’aux hommes et aux femmes. L’éducation n’exercerait pas d’influence sur les résultats du BSRT. 3.9.1.2 Évaluation

Selon Flicker (97), la fiabilité et la validité de structure du BSRT sont appropriées. L’instrument fait également preuve d’une capacité de déceler le changement, étant doté d’une sensibilité au vieillissement et à la démence. Toutefois, le BSRT, au même titre que d’autres tests axés sur des listes de mots, est enclin à l’effet-seuil (c.-à-d., le test peut solliciter de façon exagérée la capacité cognitive de la personne). Théoriquement, il est conçu pour mesurer la capacité de remémoration liée à la mémoire à court terme et à la mémoire à long terme, quoique la validité hypothético-déductive de ces items ne soit pas établie.

3.9.2 Échelle Wechsler d’évaluation de la mémoire (version révisée) (WMS-R)

3.9.2.1 Description

Le test d’appellation de Boston (BNT) de l’échelle Wechsler d’évaluation de la mémoire – version révisée (WMS-R) (100) constitue une refonte en profondeur de la batterie de tests de l’échelle Wechsler d’évaluation de la mémoire (WMS), l’instrument de mesure clinique de la

Page 53: Rapport la maladie d’Alzheimer. technologique II. Examen ...

39

mémoire le plus fréquemment utilisé aux États-Unis. L’usage consacré des deux batteries de tests consiste à évaluer divers aspects de la mémoire. Caractéristiques étudiées : Les concepteurs du test l’ont axé sur la maîtrise mentale, la mémoire figurale, la mémoire logique, les couples visuels, les couples verbaux, la reproduction visuelle, le spectre de mémoire visuelle et la remémoration différée relatifs à la mémoire logique, aux couples visuels, aux couples verbaux et à la reproduction visuelle. Administration : Un intervieweur administre les 13 sous-tests de l’échelle WMS-R. Le premier sous-test est un questionnaire informatif sur l’orientation, utilisé à des fins de sélection et qui ne fait pas l’objet d’une cotation, contrairement aux autres sous-tests. Les tâches différées sont entreprises après un délai de 30 minutes. La durée du test en entier (sans compter le délai) est d’environ 45 minutes. Application : Les études cliniques utilisant l’échelle WMS-R indiquent que le test est capable de déceler les perturbations de la mémoire et qu’il peut circonscrire les troubles d’apprentissage et de mémoire dans un certain nombre d’affections, dont la MA. Cotation : À la fin du test, on obtient cinq scores sommaires redressés en fonction de l’âge : un pour la mémoire immédiate générale, un pour la mémoire différée générale, un pour l’attention/la concentration et deux indices distincts, l’un pour la mémoire visuelle immédiate et l’autre pour la mémoire verbale immédiate. Le manuel d’utilisation du test renferme des lignes directrices explicites quant à la cotation et à la pondération. Il contient également des normes s’appliquant aux personnes selon leur âge (gamme d’âge : de 16 à 74 ans) et des renseignements sur les écarts significatifs entre les divers types de scores. 3.9.2.2 Évaluation

Nous considérons que les données des concepteurs quant à la constance test-retest sont justes. La validité concomitante, établie par comparaison à un test d’apprentissage verbal, est également appropriée. L’analyse factorielle de l’échelle WSM-R met en évidence deux éléments principaux : la « mémoire générale » (qui ne serait pas coreliée au QI) et « l’attention/la concentration » (dont la corrélation avec l’intelligence est élevée).

Bien que l’échelle WMS-R représente une amélioration par rapport à la version originale, elle comporte plusieurs limites : la durée d’administration est plus longue que celle de l’échelle WMS; il n’existe pas de formes parallèles; il n’y a pas de données normatives s’appliquant aux personnes très âgées (75+); elle est entachée d'un effet-seuil établi. Signalons également que la cotation accorde plus d’importance à la mémoire verbale qu’aux autres aspects de la mémoire, et que l’absence de tâches sur la reconnaissance réduit la capacité de l’échelle de différencier divers groupes de malades. Il y a une corrélation entre le niveau d’éducation et les cinq scores, et ce facteur devrait être pris en considération lors de l’interprétation des scores particuliers.

3.10 Langage

D’après Flicker (97), les tests sur le langage sont sous-utilisés dans la recherche sur le traitement de la démence. En règle générale, on considère que cette fonction n’est pas touchée par des affections qui entravent le fonctionnement cérébral, du moins au point que les scores des tests

Page 54: Rapport la maladie d’Alzheimer. technologique II. Examen ...

40

de vocabulaire sont parfois interprétés comme des indices d’intelligence prémorbide. Même si l’aspect de la syntaxe peut rester intact à un stade avancé de la maladie d’Alzheimer, la difficulté à trouver ses mots se manifeste souvent à des stades plus précoces.

3.10.1 Test oral contrôlé d’association de mots (COWA)

3.10.1.1 Description

Le test d’appellation de Boston (BNT) du test oral contrôlé d’association de mots (COWA) (100) est un test de langage nécessitant la production spontanée de mots commençant par une lettre en particulier ou se rangeant dans une classe en particulier (p. ex., les animaux) dans une période limitée. Ce test s’appelle également test de fluidité verbale et test FAS (F, A et S sont les lettres les plus souvent utilisées dans ce test). Le test COWA est le test de langage le plus fréquemment administré dans les essais cliniques sur l’efficacité thérapeutique chez les personnes âgées. Caractéristiques étudiées : La fluidité verbale dans l’association de mots constitue la caractéristique d’intérêt. Comme il s’agit d’un test à temps fixe, le rendement varie selon la rapidité de production orale, qui elle varie selon la rapidité du traitement cognitif. Administration : Le sujet doit produire le plus grand nombre possible de mots dans une période limitée. L’intervieweur décrit les mots qui ne comptent pas (p. ex., les variations, les répétitions, les noms propres, les mots inappropriés). La durée du test est de cinq minutes. Application : Le test est destiné à des adultes ou des enfants. Cotation : Le score est formé du nombre total de mots admissibles. Les mots inadmissibles ne comptent pas. 3.10.1.2 Évaluation

La fidélité inter-juges est très élevée. Quant à la constance test-retest, elle est également élevée chez des adultes après un délai de 19-42 jours. Le test est faiblement corelié à l’âge. Chez les adultes, l’analyse factorielle indique que la saturation se produit principalement pour le facteur de « connaissance verbale ». Les scores varient selon le type d’affection cérébrale.

Selon Spreen et Straus (100), la désignation « fluidité verbale » est trompeuse « car la

production verbale dans une conversation ou dans des phrases continues n’est pas mesurée. Le test mesure plutôt la production de mots particuliers dans certaines conditions de recherche restreintes » (p. 221). Plusieurs auteurs n’ont pu constater une réduction de la fluidité verbale chez des personnes atteintes de la MA, possiblement en raison des effets de plafonnement (97). Néanmoins, les personnes souffrant de MA sont réputées à faire plus d’erreurs d’empiétement, de répétition ou de variation (100).

3.10.2 Test d’appellation de Boston (BNT)

3.10.2.1 Description

Le test d’appellation de Boston (BNT) (100) évalue la capacité de nommer des objets présentés sous forme d'images.

Page 55: Rapport la maladie d’Alzheimer. technologique II. Examen ...

41

Caractéristiques étudiées : L’exactitude et la rapidité jouent un rôle dans ce test. Soixante dessins classés selon l'ordre des mots les plus simples et fréquents aux mots les plus rares sont présentés un à la fois. Lorsque la personne ne répond pas en 20 secondes, l’examinateur donne un indice verbal et, le cas échéant, un indice phonétique. Administration : Les adultes commencent le test par l’item 30. S’ils ne peuvent nommer l’un des huit items suivants, l’examinateur doit alors revenir à l’item 29 et continuer en ordre décroissant jusqu’à ce que huit objets d’affilée soient nommés. Puis, l’intervieweur procède selon l’ordre croissant jusqu’à ce que la personne ne puisse nommer un seul objet. Le mot compte lorsqu’il est indiqué en moins de 20 secondes. Le nombre de réponses exactes et inexactes est consigné. La durée d’administration n’est pas fixe. Application : Le test est utilisé de façon répandue pour déceler l’aphasie chez les adultes et les enfants. Cotation : Le score d’appellation total s’obtient en effectuant la sommation du nombre de réponses exactes entre l’item de référence et l’item plafond, tout en ajoutant le nombre d’items en deçà de l’item de référence. Plus le score est élevé, plus la performance est bonne. 3.10.2.2 Évaluation

Il n’y a pas de données sur la constance test-retest. La corrélation entre des formes parallèles est élevée chez des personnes saines témoins et chez des personnes atteintes de la MA (deux formes équivalentes ont été obtenues en scindant l’échelle originale). La validité de structure n’aurait été évaluée que chez les enfants. Les scores BNT sont reliés à un indice de gravité de l’aphasie. Le nombre d’erreurs au test permet d’établir la distinction entre des personnes dont la fonction cognitive est intacte, des personnes souffrant de la MA dont le déficit cognitif est léger et des personnes atteintes de la MA dont le déficit cognitif est modéré. L’intégrité oculoperceptive devrait être vérifiée si des erreurs se produisent lors du test. Les normes relatives au test sont fondées sur de petits groupes d’adultes; les données normatives s’appliquant aux personnes âgées sont encore moins abondantes. L’influence de l’âge et de l’éducation se manifeste lorsque les personnes sont âgées de plus de 70 ans. 3.11 Fonction oculoperceptive

Il est démontré que les tests de la fonction oculoperceptive sont sensibles aux lésions pariétocorticales. Étant donné que le cortex pariétal est une zone cérébrale subissant des lésions dans les phases précoces de la MA, ce type de tests paraît approprié pour déceler l’amélioration suscitée par une médicament. Malheureusement, ils ne sont pas d’usage courant dans les essais sur la pharmacothérapie de la MA.

3.11.1 Test d’organisation visuelle de Hooper (VOT)

3.11.1.1 Description

Ce test évalue la capacité de réorganiser des images qui ont été fragmentées. Il est semblable à d’autres tests de morcellement de dessins.

Page 56: Rapport la maladie d’Alzheimer. technologique II. Examen ...

42

Caractéristiques étudiées : Le test est axé sur la différentiation perceptive et la réorganisation conceptuelle. Administration : L’examinateur montre 30 dessins d’objets courants sur des cartons de 10 cm x 10 cm rassemblés dans une reliure. Les objets sont découpés en deux morceaux ou plus qui sont disposés de façon illogique sur le carton. La personne doit nommer l’objet. La durée du test est de 10 ou 15 minutes. La personne doit nommer de façon exacte tous les objets montrés. La qualité des réponses peut revêtir de l’importance. Application : À l’origine, le test a été conçu pour le dépistage des lésions cérébrales. Dans des études plus récentes, on a tenté de circonscrire davantage son utilisation. Le test est destiné à des adultes de tout âge. Cotation : Le score est formé du nombre total de réponses exactes – les réponses partiellement exactes se voient accorder une fraction de la note en question. 3.11.1.2 Évaluation

La constance test-retest et la fidélité pair-impair sont élevées. D’autre part, la validité de ce test ne fait pas l’unanimité. Le test est marqué par une diminution du rendement en fonction de l’âge, et cette baisse de rendement est interprétée comme découlant du déclin fonctionnel de l’hémisphère droit qui se produit avec l’âge. Selon Spreen et Strauss (100), ce test est utile pour examiner les difficultés qu’éprouvent certaines personnes sur le plan de l’organisation perceptuelle, mais il ne peut confirmer la présence de lésions cérébrales. Les résultats de personnes souffrant de troubles du langage sont à interpréter sous toute réserve, puisque le test fait appel à la capacité d’appellation. Ce qui revient à dire que la fonction du langage doit en quelque sorte être intacte pour que le test puisse évaluer véritablement la capacité oculoperceptive. La validité du test auprès de personnes atteintes de la MA n’aurait pas été évaluée.

3.11.2 Test des formes complexes de Rey-Osterrieth (RF)

3.11.2.1 Description

Le but du test est de mesurer la capacité constructive oculospatiale et la mémoire visuelle. Caractéristiques étudiées : Le test est axé sur les aptitudes de planification et d’organisation, la résolution de problèmes ainsi que sur les fonctions perceptuelle, motrice et de mémoire. Administration : La personne copie la forme Rey-Osterrieth, une forme géométrique bidimensionnelle complexe. Puis, dans un délai variant de quelques minutes à 45 minutes, on lui demande de reproduire cette figure de mémoire. Certains chercheurs mesurent également la mémoire immédiate. L'utilité d’évaluer cet aspect n’est pas déterminée, et l’on privilégie la mesure de la mémoire différée. La durée d’administration est d’environ dix minutes (sans compter le délai). Application : Le test constitue un outil diagnostique des lésions cérébrales.

Page 57: Rapport la maladie d’Alzheimer. technologique II. Examen ...

43

Cotation : Le test s’accompagne de lignes directrices rigoureuses et exhaustives sur la cotation. Le test permet d’obtenir deux mesures du rendement : un score déterminant la capacité constructive visuelle et un score reflétant la quantité d’information mémorisée au fil du temps. L’exactitude de la copie originale doit être vérifiée soigneusement, car des erreurs minimes peuvent indiquer la présence de certains types de lésions cérébrales. L’interprétation de ce test devrait tenir compte des aspects qualitatifs du rendement tels la stratégie de reproduction. La façon de copier est en rapport avec le rendement de remémoration. Une approche désordonnée au coup par coup dans la copie de la figure peut déboucher sur une reproduction exacte – mais la remémoration sera plutôt médiocre. Plus le score est élevé, plus le rendement est bon. Le score le plus élevé est 36. 3.11.2.2 Évaluation

Le respect des critères de cotation stricts se traduit par une fidélité inter-juges élevée. Des effets d'assimilation se manifestent chez des adultes sains (une amélioration d’environ 10 % est prévisible). Le test est utile pour différencier des lésions du lobe frontal, de l’hémisphère droit et de l’hémisphère gauche. Les résultats du test peuvent également se révéler utiles pour établir la distinction entre divers troubles de la mémoire. Le test s’accompagne de données normatives s’appliquant à des adultes sains âgés de 15 à 85 ans ayant un niveau d’éducation au-dessus de la moyenne. Tant l’âge que le quotient intellectuel influencent le rendement. Le test n’a pas été beaucoup utilisé auprès de personnes atteintes de la MA. Étant donné la complexité de la figure géométrique, le test est susceptible d’être marqué par un effet-seuil chez les personnes souffrant de MA (le test serait trop difficile).

3.12 Attention

3.12.1 Test de marquage des pistes

3.12.1.1 Description

Le but du test de marquage des pistes (100) est d’évaluer la rapidité de recherche visuelle, l’attention, la souplesse mentale et la fonction motrice. Le test se compose d’une partie A et d’une partie B. Caractéristiques étudiées : L’analyse factorielle met en évidence la saturation de deux facteurs désignés comme étant la recherche visuelle rapide et l’enchaînement oculospatial. Administration : À l’aide d’un crayon, la personne trace sur du papier une ligne entre les cercles dessinés sur la feuille; dans les cercles sont inscrits des chiffres (partie A) ou des lettres (partie B). L’objectif consiste à relier les points dans l’ordre croissant des chiffres ou des lettres (p. ex., 1, 2, … à 25 ou A, B, … à Z). La durée d’administration est de cinq ou dix minutes. Application : Le test est destiné à des personnes souffrant de lésions cérébrales (dont les traumatismes crâniens, la maladie de Korsakov et d’autres types de lésions) et des personnes atteintes de troubles neuropsychiatriques. Il est utilisé à l’évaluation initiale et de nouveau pendant la convalescence en période de suivi. Cotation : Dès que la personne fait une erreur, l’examinateur le lui mentionne. La personne continue alors à partir du point où l’erreur s’est produite. La durée en secondes d’exécution de la

Page 58: Rapport la maladie d’Alzheimer. technologique II. Examen ...

44

tâche constitue le score. Les erreurs sont prises en compte car elles augmentent la durée d’exécution. Des données normatives sont disponibles. 3.12.1.2 Évaluation

La fiabilité de la partie A serait supérieure à celle de la partie B. Selon les données, l’utilisation de scores correspondant à des durées plutôt que de scores composés à la fois du nombre d’erreurs et de la durée réduit la fiabilité, car la durée de la correction de l’erreur varie selon le degré de compréhension tant de l’examinateur que de la personne. Le test est très sensible aux lésions cérébrales, notamment au traumatisme crânien et à l’alcoolisme. À cet égard, la partie B est plus sensible que la partie A aux lésions cérébrales; en effet, l’exécution de la partie B nécessite une plus grande capacité de traitement de l’information que l’exécution de la partie A. L’aphasie n’influencerait pas le rendement à ce test. Le rendement à la partie B constitue une source d’information utile, notamment sur l’aptitude à changer de direction pendant une activité en cours et sur la capacité de composer avec plus d’un stimulus à la fois. Le niveau d’éducation influence grandement les scores. L’influence de l’intelligence (QI) est moins prononcée dans la partie B, mais notable tout de même.

3.12.2 Test chiffres-symboles – sous-test du WAIS-R

3.12.2.1 Description

Le test chiffres-symboles (101) est une tâche de substitution de codes. Il s’agit de quatre rangées contenant en tout 100 petits carrés vierges, tous appariés à un chiffre de 1 à 9 attribué au hasard. Au-dessus des carrés figure un tableau où les chiffres sont tous appariés à un symbole distinct dépourvu de sens. La personne doit remplir tous les carrés vierges aussi rapidement que possible en y inscrivant le symbole correspondant au chiffre. La durée est de 90 secondes et le score représente le nombre de réponses exactes. Les personnes âgées souffrant de troubles de la vue ou d’incoordination oculomotrice ou qui ont du mal à comprendre les consignes, ainsi que les personnes âgées accusant un ralentissement moteur prononcé ou de peu d’éducation sont désavantagées à ce test. Le sous-test chiffres-symboles est considéré comme plus sensible aux lésions cérébrales que les autres sous-tests du WAIS-R. Malgré sa sensibilité, le test ne permet pas de préciser la latéralité de la lésion. De nombreux facteurs influencent le rendement au test, ce qui explique probablement son peu de spécificité.

3.12.3 Test chiffres-symboles inversé (SDMT)

Dans le test chiffres-symboles inversé (SDMT), il s’agit des mêmes données que dans le sous-test chiffres-symboles du WAIS-R, sauf que leur présentation graphique est inversée de sorte que les carrés vierges sont appariés aux symboles et que les chiffres deviennent les clés des symboles. La personne peut ainsi répondre oralement ou par écrit. Le test comprend 110 items (plutôt que 90) et sa durée est de 90 secondes. Dans la mesure du possible, on préconise l’administration écrite et orale du test. L’éducation influence pour le mieux le score tant à l’écrit qu’à l’oral, et ce facteur doit donc être pris en considération. Un piètre rendement aux deux formes du test reflète des troubles de perception visuelle, de reconnaissance visuelle ou oculomoteurs, ou un ralentissement général mental ou moteur. Comme c’est le cas du sous-test chiffres-symboles, ce test est sensible aux effets du vieillissement normal ainsi qu’au dysfonctionnement cérébral. Des données normatives sont disponibles et s’appliquent à des personnes âgées de 74 ans ou moins.

Page 59: Rapport la maladie d’Alzheimer. technologique II. Examen ...

45

3.12.4 Sous-test de suites de nombres du WAIS-R

3.12.4.1 Description

Le sous-test de suites de nombres comprend deux tests, les suites dans l’ordre dicté et les suites dans l’ordre inverse. Les deux tests consistent en sept paires de suites de nombres aléatoires que l’examinateur lit à voix haute au rythme d’une par seconde. Dans le test de suites dans l’ordre dicté, la personne répète les suites de nombres exactement de la façon dont elles sont dictées. Lorsque la personne répète la suite de façon exacte, l’examinateur passe à une suite plus longue et continue ainsi jusqu’à ce que la personne commette une erreur ou répète de façon exacte une suite de neuf nombres. Ce test mesure le caractère efficient de l’attention. Cette capacité est relativement stable et ne semble pas être compromise par les états de démence.

Dans le cas des suites dans l’ordre inverse, la personne répète les suites de nombres exactement dans l’ordre inverse. Ce test, en fait un test de mémoire, met en parallèle deux opérations simultanées, à savoir la mémorisation et l’inversion de l’information. Ce test est très sensible aux lésions cérébrales diffuses qui surviennent dans les états de démence.

3.12.4.2 Évaluation

Ces deux tests font intervenir des processus mentaux différents, et ils se comportent différemment en présence de dysfonctionnement cérébral. Le test dans l’ordre de dictée fait preuve de stabilité avec l'âge, tandis que dans cette situation, la portée du test dans l’ordre inversé est réduite. Lezak (101) ne préconise pas d’établir la moyenne des scores des deux tests, comme le propose le manuel du WAIS-R, faisant remarquer qu’il serait possible alors qu’un score élevé au test dans l’ordre de dictée dissimule un faible score au test dans l’ordre inversé. Il recommande plutôt de considérer les scores de façon distincte pour optimiser la validité. Maîtrise mentale, sous-test de l’échelle Wechsler d’évaluation de la mémoire – version révisée : Le sous-test de maîtrise mentale est axé sur les automatismes (l’alphabet) et le pistage conceptuel simple (compter de 1 à 53 par paliers de quatre). Il s’agit d’un test brut de l’attention. 3.13 Abstraction

3.13.1 Test de repérage catégoriel

Nous n’avons pu cerner le test de repérage catégoriel censément utilisé par Tariot et collab. dans leur essai sur la sélégiline (99). La source de référence qu'ils indiquent mentionne le manuel de Lezak (101) et le test COWA (un test de langage). Dans son manuel, Lezak (101) n’indique aucune information sur un test de repérage catégoriel; elle traite toutefois d’un test de catégories.

3.14 Atouts et lacunes des tests neuropsychologiques particuliers

3.14.1 Atouts

Les tests examinés font preuve d’une fiabilité et d’une validité appropriées. Lorsqu’ils sont utilisés en combinaison sous forme d’une batterie de tests, ils permettent de tracer un profil cognitif mettant en relief les points forts et les lacunes ainsi que les aspects problématiques. Les tests neuropsychologiques particuliers contribuent également à la détection précoce de la démence.

Page 60: Rapport la maladie d’Alzheimer. technologique II. Examen ...

46

3.14.2 Lacunes

Signalons d’abord l’insuffisance des données normatives neuropsychologiques appropriées concernant les personnes âgées, ce que d’aucuns considèrent comme un domaine important auquel la recherche devrait s’attarder (50;69). De même, l’utilisation de ces tests souffre de l’absence de normes sur le plan éducatif, qui sont considérées tout aussi nécessaires puisque le rendement à de nombreux tests est influencé par la capacité intellectuelle prémorbide. Enfin, selon le nombre de tests administrés, le processus d’examen peut être long et éprouvant.

3.14.3 Sensibilité au changement

La sensibilité au changement est un aspect très peu abordé. En tout état de cause, cela n’est pas surprenant car les épreuves neuropsychologiques sont axées sur la détection et la détermination de déficits cognitifs particuliers, plutôt que sur le changement au fil du temps.

L’étude de Loscascio et collab. (102), étude distinctive et remarquable sur la sensibilité au changement, démontre la sensibilité au changement différentielle de tests neuropsychologiques particuliers. Ces chercheurs suivent 60 personnes saines et 123 personnes souffrant de MA pendant quatre ans. Ils surveillent les changements de la cognition à l’aide de 11 tests neuropsychologiques. Ils font état des observations suivantes : (i) les tests de mémoire des faits récents sont les tests qui permettent le mieux de différencier les personnes saines des personnes atteintes de démence ou de distinguer la démence légère de la démence plus grave; (ii) tous les tests font preuve d’une capacité relativement médiocre de distinguer les divers stades de la MA; (iii) les tests caractérisés par un déclin linéaire sont les tests qui conviennent le mieux pour suivre l’évolution de la maladie. Les auteurs (102) concluent d’une part que les tests de mémoire ne sont pas utiles dans les études longitudinales sur la cognition dans la MA en raison de l'apparition des effets-seuils aux stades précoces de la maladie. D’autre part, les tests cognitifs ne constituent pas des façons efficientes de déterminer le stade de la maladie. Cette constatation appuie d’ailleurs l’usage actuel des tests d’évaluation globale pour la stadification de la maladie. Enfin, des tests de fluidité verbale et de mémoire visuelle devraient être utilisés en tant qu’instruments de mesure dans les essais thérapeutiques ayant la prétention d’arrêter ou de ralentir la progression de la détérioration cognitive. Les renseignements sur les qualités métrologiques quant au changement sont essentiels, mais ils sont limités à l’heure actuelle.

3.15 Échelles d’évaluation de la fonction cognitive : atouts et limites

Dans les essais sur la MA examinés, on note deux approches quant à l’évaluation de la fonction cognitive. En vertu de l’une, les chercheurs n’utilisent que des échelles d’évaluation de la fonction cognitive; les chercheurs adoptant l’autre approche utilisent des tests neuropsychométriques particuliers et une échelle d’évaluation de la fonction cognitive ou plus.

Le MMSE et l’échelle BDS sont considérés par certains chercheurs (103) comme (i) des échelles valides pour mesurer la gravité du déficit cognitif et (2) des outils valables pour sélectionner des participants à un essai. Les critères NINCDS/ADRDA (33) préconisent l’utilisation de l’un ou l’autre de ces instruments pour tracer le profil cognitif d’une personne au cours de la procédure diagnostique de la MA. Toutefois, ni l’un ni l’autre de ces instruments ne devrait être utilisé comme instrument de mesure principal dans les essais sur la pharmacothérapie de la MA, en

Page 61: Rapport la maladie d’Alzheimer. technologique II. Examen ...

47

raison de l’effet de plafonnement qui entache le MMSE (103), et des résultats contradictoires sur la validité et la rareté des données sur la fiabilité de l’échelle BDS. Par contre, le MMSE peut être utilisé pour documenter l’évolution d’essais sur un médicament et obtenir un indice de portée universelle sur la gravité de la démence (104), alors qu’on ne devrait pas utiliser l’échelle BDS avant d’en savoir davantage à propos de sa fiabilité et de sa validité.

L’échelle ADAS-cog et le test SKT font tous deux preuve d’une fiabilité et d’une validité appropriées dans le contexte d’essais sur la pharmacothérapie de la MA. Toutefois, la sensibilité au changement devra faire l’objet d’une évaluation plus approfondie. Si l'on ne perfectionne pas cette qualité psychométrique, on ne pourra déterminer avec certitude les scores qui démontrent un effet thérapeutique. Cela étant dit, les deux échelles se révèlent de bons instruments de mesure.

Les tests neuropsychologiques devraient être utilisés comme instruments de mesure secondaires/exploratoires dans les essais sur les médicaments dans le traitement de la démence, en raison de leur portée limitée (les tests ne mesurent qu’un seul aspect de la cognition plutôt que cette fonction dans son ensemble). De plus, le processus d’examen est long et épuisant pour le malade lorsqu’ils sont utilisés en batterie. Étant donné que la cognition comprend de nombreux aspects et qu’il existe plusieurs tests neuropsychologiques, il importe de sélectionner l’instrument optimal qui mesurera le changement dans la dimension d’intérêt. Le fait que les essais ont recours à différents tests réduit la comparabilité des ECR évaluant le même médicament.

Il est absolument nécessaire de renverser la vapeur afin que les épidémiologistes,

neuropsychologues et gériatres collaborent pour mettre au point et perfectionner des échelles d’évaluation de la fonction cognitive dotées de bonnes qualités métrologiques, applicables à la maladie en cause et d’utilisation pratique dans les essais sur la pharmacothérapie de la MA.

Page 62: Rapport la maladie d’Alzheimer. technologique II. Examen ...

48

4 ÉCHELLES D’ÉVALUATION DE LA CAPACITÉ FONCTIONNELLE ET DE LA QUALITÉ DE VIE

4.1 Introduction : les échelles d’évaluation de la capacité fonctionnelle

Dans le cadre de référence de la Classification des déficiences, incapacités et handicaps de l’Organisation mondiale de la santé (OMS), l’incapacité fonctionnelle renvoie à toute restriction ou inaptitude dans l’exécution d’une activité de manière ou de portée considérée comme normale chez un être humain (105;106). Étant donné que la détérioration de la capacité fonctionnelle se produit inévitablement dans la MA, la mesure du degré d’incapacité dans les essais cliniques revêt une importance croissante (107-109). La prise en compte de cet aspect repose principalement sur la présomption que si un médicament employé dans le traitement de la démence améliore la fonction cognitive, cette amélioration devrait se répercuter sur la capacité fonctionnelle (107;108). En deuxième lieu, l’importance de l’incapacité tient à ce qu’elle a une énorme incidence sur la qualité de vie des malades et de leurs dispensateurs de soins (110). Troisièmement, la détérioration fonctionnelle est un indicateur prédictif de l’institutionnalisation, de sorte que les renseignements à son sujet peuvent aider les prestataires de soins de santé à prendre des décisions de placement et de gestion en ce qui concerne l’affectation des ressources (110;111). Enfin, l’évaluation de la capacité fonctionnelle permet de déterminer le niveau d’aide dont a besoin la personne âgée vivant dans la collectivité ou en établissement (110).

Bien que l’importance d’évaluer la capacité fonctionnelle fasse l’unanimité, un certain nombre d’aspects méthodologiques et théoriques en limitent l’utilité pratique dans le contexte des essais pharmacologiques dans le domaine de la MA. En fait, dans la majorité des essais examinés, on ne fait état d’aucun effet statistiquement significatif sur la capacité fonctionnelle. Selon Beck et Frank (110), les problèmes qui se posent dans la recherche sur la MA peuvent être attribués à : (i) la disparité des définitions conceptuelles et opérationnelles des résultats fonctionnels; (ii) l’absence de sensibilité découlant de l’utilisation de vastes catégories de tâches et d’échelles d’évaluation unidimensionnelles; (iii) l’absence d’une perspective contextuelle; (iv) la prépondérance de l’incapacité physique par rapport à un cadre de référence du déficit cognitif.

Il existe de nombreux instruments pour mesurer la capacité fonctionnelle des personnes

atteintes de la MA. En 1991, Kluger et Ferris (112) estimaient que 40 instruments étaient disponibles et, depuis lors, plusieurs autres ont été mis au point (113) (108). La multitude d'échelles utilisées dans les essais cliniques examinés s’explique sans doute par l’absence de procédure universelle d’évaluation de la capacité fonctionnelle.

Des 25 essais examinés dans le rapport I (Analyse comparative d’essais cliniques), 12

évaluent l’état fonctionnel et, pour ce faire, quatre d’entre eux s’en remettent à plus d’un instrument de mesure. Nous relevons 11 échelles dans ces 12 essais réunis. En règle générale, les échelles d’évaluation fonctionnelle, à l’exception de deux, sont utilisées comme instruments de mesure secondaires. Toutes ces échelles sont brièvement décrites, même si certaines d’entre elles ne sont mentionnées qu’une fois ou deux dans l'essai en question. Cette approche nous a permis d’élargir nos connaissances sur les avantages et les limites de l’évaluation de l’incapacité fonctionnelle et de la qualité de vie dans les essais cliniques sur la pharmacothérapie de la MA.

Page 63: Rapport la maladie d’Alzheimer. technologique II. Examen ...

49

4.2 L’instrument de cotation de l’évaluation gériatrique par les proches (GERRI)

4.2.1 Description

L’instrument de cotation de l’évaluation gériatrique par les proches (GERRI) (114) est une échelle que des proches utilisent pour évaluer des patients âgés externes qui présentent des symptômes de détérioration mentale. L’échelle est formée de 49 items, présentés sous forme d’énoncés brefs, conçus pour évaluer la fréquence de troubles de comportement et de symptômes types en ce qui a trait à la fonction cognitive (20 items), aux activités sociales (18 items) et à l’humeur (11 items). L’instrument a été mis au point afin de collecter des renseignements utiles en pharmacologie gériatrique. Cotation : Les items ont une cotation à cinq paliers de fréquence allant de « presque tout le temps » à « presque jamais ». Un score moyen (de 1,00 à 5,00), d’après tous les items applicables, est calculé, et plus le score est élevé, plus le déficit est prononcé. Le questionnaire doit être rempli aux deux semaines, en sélectionnant les items à évaluer d’après le comportement manifesté dans les deux semaines précédentes. 4.2.2 Évaluation

4.2.2.1 Fiabilité

Fidélité inter-juges : On constate que la fidélité inter-juges du score GERRI total est élevée lorsque 45 personnes atteintes de démence dégénérative primaire de divers degrés de gravité sont évaluées par deux personnes significatives (114). Dans ce cas, on estime que le coefficient de corrélation intraclasse (CCI) est de 0,94. Quant aux sous-échelles du fonctionnement cognitif, du fonctionnement social et de l’humeur, les coefficients sont respectivement de 0,96, de 0,94 et de 0,66. Pour ce qui est des items particuliers, les CCI varient de 0,02 à 0,98 (médiane de 0,72). Cohérence interne : S’agissant du score de l’échelle totale GERRI et de sa sous-échelle du fonctionnement cognitif, les coefficients alpha de Cronbach sont respectivement de 0,96 et de 0,95 (114), valeurs considérées comme très élevées. Lorsque le coefficient alpha est supérieur à 0,90, DeVellis (115) propose de revoir le choix des items étant donné la possibilité de redondance. Cette recommandation n’a pas été mise en application dans le cas de l’échelle GERRI. En ce qui concerne les échelles composées d’items hétérogènes, le coefficient alpha de Cronbach est réputé sous-estimer la fiabilité vraie. Toutefois, cela ne serait pas le cas de la sous-échelle de l’humeur (coefficient alpha de 0,66) qui comprend des aspects tels « mentionne qu’il/qu’elle est triste », « fait preuve de nervosité et ne tient pas en place », « mentionne se sentir bon/bonne à rien », « est facilement contrarié ou en colère », etc. La sous-échelle de l’humeur n’est donc pas fiable. 4.2.2.2 Validité

Validité de contenu : Les articles examinés ne mentionnent pas la validité de contenu de l’échelle GERRI, en ce qui a trait à la couverture et à la pertinence des items. Validité concomitante : Selon Rozenbilds et ses collègues (116), la corrélation est modérée ou bonne entre les sous-échelles du fonctionnement cognitif et du fonctionnement social de l’échelle GERRI et (i) l’échelle London d’évaluation psychogériatrique (infirmière en tant qu’informatrice; évalue la capacité physique, le comportement et la capacité mentale), (ii) le MMSE et (iii) le test

Page 64: Rapport la maladie d’Alzheimer. technologique II. Examen ...

50

des activités de la vie quotidienne. Les coefficients de corrélation vont de 0,35 à 0,59. Par contre, il y a peu de corrélation entre la sous-échelle de l’humeur GERRI et une échelle analogique visuelle de la dépression ou les échelles déjà mentionnées (116). Validité de structure : Rozenbilds et ses collègues (116) procèdent à une analyse de la variance pour évaluer la validité discriminative de l’échelle GERRI sur le plan de la différenciation de trois groupes de personnes atteintes de déficit cognitif faible, modéré ou élevé, d’après l’échelle GDS (34). Tant le score GERRI global que les groupes de scores permettent de distinguer les trois degrés de gravité (116). Il importe de souligner que la structure tridimensionnelle de l’échelle n’a pas été vérifiée par l’analyse factorielle. Toutefois, la validité apparente élevée et la solidité des corrélations inter-items viennent confirmer que les items se regroupent bien (114). 4.2.2.3 Sensibilité au changement

Des chercheurs démontrent que la sensibilité de l’instrument quant à la gravité de la démence permet de distinguer trois degrés de gravité généraux (116). D’après les renseignements disponibles, nous ne pouvons savoir si l’échelle GERRI est capable de déceler des changements fonctionnels minimes. Et il s’agit là d’une limite potentielle dans le cadre d’ECR. Le sujet des changements de portée clinique n’est pas abordé. Parce que le score total s’obtient en établissant la moyenne des items particuliers (plutôt qu’en les additionnant), il est nécessaire que le score comprenne deux décimales pour ne pas perdre de sensibilité.

L’échelle GERRI ne serait pas entachée d’un effet de plafonnement. Les scores moyens vont de 1,4 à 3,8 (gamme possible de 1,00 à 5,00) chez des personnes se rangeant dans les stades 2 à 7 de l'échelle GDS (116). Toutefois, il est probable qu’un effet-seuil se manifeste à l’évaluation de personnes dont le déficit est grave.

4.2.3 Examen critique

À toutes fins utiles, l’échelle n’étant pas fondée sur des hypothèses théoriques, il serait souhaitable d’évaluer de façon plus approfondie sa validité de structure. D’autre part, la constance test-retest n’a pas été étudiée. Par ailleurs, la validité et la fiabilité de la sous-échelle de l’humeur seraient plus faibles que celles des autres sous-échelles de l’instrument.

L’échelle GERRI est axée sur divers aspects de l’état fonctionnel des personnes âgées, qui

ont une grande incidence sur la qualité de vie des malades et sur le fardeau des soins. De plus, caractéristique fondamentale de l’échelle, l'information provient d'informateurs non formés. À ce titre, cette échelle pourrait constituer un instrument de mesure supplémentaire très pertinent dans le cadre d’ECR.

4.3 Échelle d’évaluation de l’autonomie physique (PSMS)

4.3.1 Description

L’échelle d’évaluation de l’autonomie physique (PSMS), mise au point par Lawton et Brody en 1969 (117), est une échelle d’observation qui porte sur les activités de la vie quotidienne des patients gériatriques. Il s’agit d’une adaptation d’une échelle mise au point en psychiatrie par Lowenthal [mentionnée dans (117)].

Page 65: Rapport la maladie d’Alzheimer. technologique II. Examen ...

51

Caractéristiques étudiées : Le concept d’autonomie physique est mesuré en évaluant l’aptitude dans six comportements : aller à la toilette, se nourrir, se vêtir, soigner son apparence, se déplacer et se laver. Du point de vue théorique, le concept est bien ancré et établi comme un élément précis de la hiérarchie des compétences comportementales humaines (117) (118). Administration : Un professionnel de la santé inexpérimenté dans ce domaine peut remplir le questionnaire PSMS d’après les renseignements fournis par un ou plusieurs informateurs (la personne, le dispensateur de soins, un ami, etc.). L’échelle porte sur des comportements concrets observables. Cotation : Chaque aspect comportemental s’accompagne d’un score de 1 ou 0, de sorte que le score global varie de 0 à 6. Chaque type de comportement comprend cinq réponses descriptives à cocher, selon la technique cumulative de Guttman. C’est ainsi que les énoncés expriment une attitude de façon de plus en plus forte, et les éléments sont classés par ordre croissant, de sorte que les répondants, une fois qu’ils ont déterminé l’énoncé qui s’applique, devraient cocher tous les énoncés exprimant un comportement fonctionnel moins complexe et ne pas cocher les énoncés exprimant un comportement fonctionnel plus complexe (7). 4.3.2 Évaluation

4.3.2.1 Fiabilité

Des données de diverses sources concernant 265 personnes indiquent le respect du critère de l’échelle Guttman. Deux études portent sur la reproductibilité inter-juges. Dans l’une d’elles, deux infirmières évaluent de façon indépendante 36 malades en perte d’autonomie de divers degrés (rp=0,87). Dans la seconde, deux assistants à la recherche évaluent de façon indépendante 14 personnes en perte d’autonomie ou non (rp=0,91). La documentation ne contient pas de renseignements sur l’homogénéité interne et la constance test-retest de l'échelle PSMS.

4.3.2.2 Validité

Afin de démontrer la validité de structure de l’échelle PSMS, les auteurs déterminent le degré de corrélation (rp) entre cet instrument et quatre mesures qui couvriraient le concept de capacité fonctionnelle. L’étude compte 180 personnes, mais peu d’entre elles subissent les cinq évaluations. Les coefficients de corrélation sont : PSMS-IADL (0,61) (n=77), PSMS-classification physique (cotation de l’état physique sur six points) (0,62) (n=130), PSMS-questionnaire sur l’état mental (0,38) (n=152), et PSMS-échelles d’évaluation du comportement et de l’adaptation (0,38) (n=98).

4.3.2.3 Sensibilité au changement

Aucune donnée n’est disponible sur la sensibilité au changement. Toutefois, d’après les qualités de la technique de l’échelle de Guttman, il y aurait une diminution de la redondance qui viendrait amoindrir la sensibilité, et le taux d’erreur peut être élevé. De plus, chaque item est coté comme une question dichotomique, d’où une perte de la capacité discriminative (118).

Page 66: Rapport la maladie d’Alzheimer. technologique II. Examen ...

52

4.3.3 Examen critique

L’échelle PSMS est un bref questionnaire d’évaluation objective des activités de la vie quotidienne destiné à des patients gériatriques. Sous l’angle théorique, l’instrument est solidement ancré et se révèle utile dans l’évaluation des personnes âgées institutionnalisées. Pour évaluer les effets psychopharmacologiques d’une intervention, on devrait utiliser les versions de l’échelle dont le score global s’obtient par la sommation des scores particuliers (118). De plus, s’agissant de l’évaluation de personnes âgées vivant dans la collectivité, il est probable que l’instrument soit marqué par un effet de plafonnement prononcé. Enfin, l’évaluation de ses qualités psychométriques est incomplète.

4.4 Échelle d’évaluation des activités instrumentales de la vie quotidienne (IADL)

4.4.1 Description

En 1969, Lawton et Brody (117) mettent au point l’échelle d’évaluation des activités instrumentales de la vie quotidienne (IADL) afin de mesurer l’autonomie des personnes âgées sur le plan des activités instrumentales personnelles, c’est-à-dire les activités complexes inhérentes au fonctionnement quotidien. Cet instrument a été mis au point et évalué en même temps que l’échelle d’évaluation de l’autonomie physique (PSMS), qui porte sur des capacités de base. Depuis lors, plusieurs versions d’autoévaluation de l’échelle IADL ont vu le jour (105). Caractéristiques étudiées : Le concept d’autonomie instrumentale se concrétise différemment chez les femmes et chez les hommes. Chez les femmes, l’ensemble d’attitudes évaluées comprend la conversation au téléphone, le magasinage, la préparation des repas, les tâches ménagères, la lessive, l’utilisation des modes de transport, la consommation de médicaments et la capacité de gérer de l’argent. Les hommes, pour leur part, ne sont pas évalués sur le plan de la préparation des repas, des tâches ménagères et de la lessive. Administration : Divers professionnels de la santé peuvent administrer l’échelle IADL, en interrogeant un ou plusieurs informateurs. L’échelle met l’accent sur les attitudes concrètes et favorise l'évaluation objective. Cotation : On attribue un score de 1 ou 0 à chaque catégorie d’attitudes, pour obtenir un score global qui varie de 0 à 8 chez les femmes et de 0 à 5 chez les hommes. Plus le score est élevé, plus la performance est bonne. De trois à cinq énoncés descriptifs accompagnent chaque attitude type, d’après la technique de l’échelle de Guttman. 4.4.2 Évaluation

4.4.2.1 Fiabilité

Il n’y a pas d’information sur l’homogénéité interne et la constance test-retest de l’échelle IADL. Les auteurs mentionnent une étude où 12 personnes sont évaluées par un examinateur, en présence d’un autre évaluateur qui ne participe pas au processus. La reproductibilité des résultats de l’échelle IADL est estimée à rp=0,85.

Page 67: Rapport la maladie d’Alzheimer. technologique II. Examen ...

53

4.4.2.2 Validité

Afin de démontrer la validité de structure de l’échelle IADL, Lawton et Brody (117) déterminent la corrélation (rp) entre cet instrument et quatre mesures qui couvriraient également le concept d’autonomie fonctionnelle. Dans l’ensemble, 180 personnes participent à cette étude, quoique peu d’entre elles subissent les cinq évaluations. Les coefficients de corrélation sont : IADL-PSMS (0,61) (n=77), IADL-classification physique (évaluation de l’état physique sur 6 points) (0,40) (n=50), IADL-questionnaire sur l’état mental (0,48) (n=74), et IADL-échelles d’évaluation du comportement et de l’adaptation (0,36) (n=44).

4.4.2.3 Sensibilité au changement

Il est probable, au même titre qu’avec l’échelle PSMS, qu’une perte de sensibilité découle de l’utilisation de la technique de l’échelle de Guttman et de la forme dichotomique des réponses de l’échelle.

4.4.3 Examen critique

L’échelle IADL est très fréquemment utilisée et souvent mentionnée dans l’évaluation de l’autonomie instrumentale des personnes âgées. Du point de vue théorique, l’échelle est solidement ancrée (118) et les attitudes évaluées sont susceptibles d’être perturbées aux stades précoces de la démence. Sous l’angle de son application dans les années 1990, le fait que l’instrument n’évalue pas exactement les mêmes activités chez les hommes que chez les femmes est toutefois remis en question. D’autre part, l’instrument n’a pas fait l’objet d’une évaluation approfondie de sa fiabilité. Quant à l’évaluation des effets psychopharmacologiques d’une intervention, on préconise l’utilisation de versions de l’échelle où l’on procède à la sommation des scores (118).

4.5 Échelle Blessed d’évaluation de la démence, partie 1 (BDS partie 1)

4.5.1 Introduction

En 1968, Blessed, Tomlinson et Roth (92) mettent au point l’échelle Blessed d’évaluation de la démence (BDS) dans l’intention de démontrer le lien entre la détérioration mentale grave chez les personnes âgées et la présence de changements cellulaires cérébraux. L’échelle se compose de deux parties : (1) l’évaluation des activités de la vie quotidienne et des changements de personnalité, d’intérêts et de motivation, et (2) l’évaluation de l’orientation, de la mémoire et de l'attention. Par ailleurs, de nombreuses autres versions de cet instrument ont vu le jour depuis ce temps (119). Dans la présente analyse, deux rapports font état de l’utilisation de la version originale de l’échelle BDS (99;120), alors qu’un autre mentionne l’utilisation d’une version modifiée (121). Dans les paragraphes qui suivent, nous présentons la partie 1 de l’échelle BDS et nous abordons brièvement la version modifiée de l’échelle BDS (mBDS).

4.5.2 Description de la partie 1 de l’échelle BDS

Caractéristiques étudiées : L’échelle BDS est conçue pour mesurer le degré de détérioration intellectuelle et de la personnalité chez les personnes âgées. Pour évaluer de façon concrète ce concept, la partie 1 de l’échelle quantifie la capacité de la personne à accomplir des tâches pratiques de la vie quotidienne. Elle comprend 22 items relatifs à l’autonomie personnelle, domestique et

Page 68: Rapport la maladie d’Alzheimer. technologique II. Examen ...

54

sociale, comme la capacité d’effectuer des tâches ménagères, de gérer de petites sommes d’argent ou de se débrouiller dans des cadres connus. Administration : Un examinateur procède à la cotation en interrogeant un parent ou un ami proche sur le rendement de la personne dans l’exécution de ces tâches au cours des six mois précédant l’évaluation. Cotation : Le score de la partie 1 de l’échelle BDS s’obtient en effectuant la sommation des scores des items de l’échelle. Le mécanisme de cotation des trois regroupements d’items est différent. En ce qui concerne le rendement dans les activités de la vie quotidienne (8 items), l’incapacité totale se traduit par un score de 1, l’incapacité partielle, variable ou intermittente par un score de 0,5 et la pleine capacité par un score de 0. Quant à la cotation des habitudes (3 items), les items s’accompagnent d’énoncés descriptifs dont le score est respectivement de 3, de 2 ou de 0. Pour les changements de personnalité, d’intérêts et de motivation (10 items), le score est soit de 1, soit de 0, selon des attitudes précises observables. Donc, le score total peut aller de 0 (pleine capacité) à +28 (incapacité totale). D’après leur expérience, Zerssen et ses collègues (122) proposent qu’un score total de 15 à la partie 1 de l’échelle BDS corresponde à une démence modérée chez les personnes atteintes de la MA. 4.5.3 Description de la version mBDS

La version mBDS comprend des items mesurant les activités de la vie quotidienne et les activités instrumentales de la vie quotidienne [Erkinjuntti, mentionné dans (123)]. Trois fonctions instrumentales (alimentation, habillement et continence) sont cotées de 0 à 3 (anciennement, les items sur les « habitudes ») et huit items évaluant les changements dans les activités de la vie quotidienne, telles l’exécution de tâches ménagères, la gestion d’argent et la débrouillardise, sont cotés 0, 0,5 ou 1 (anciennement les items sur les « activités de la vie quotidienne »). Par conséquent, le score total va de 0 (autonome) à 17 (dépendant). Dans une étude comptant 795 personnes âgées (123), l’échelle fait preuve d’une bonne capacité discriminative entre les personnes atteintes de démence et les personnes qui ne souffrent pas de cette affection (estimation de la SSC=0,90 à 0,96). Certains auteurs préconisent un score-seuil de 1,00 dans le dépistage de la démence.

4.5.4 Qualités psychométriques de la partie 1 de l’échelle BDS

4.5.4.1 Fiabilité

Nous n’avons pas relevé d'information sur l’évaluation de la fiabilité de la partie 1 de l’échelle BDS (119).

4.5.4.2 Validité

Dans leur étude comptant 264 personnes réparties dans divers groupes diagnostiques, les concepteurs de l’échelle (92) constatent que les personnes atteintes de démence sénile obtiennent des scores BDS moyens plus faibles que ceux des autres groupes (tests t de Student). À l’examen des résultats de 76 autopsies, il décèle une relation négative entre le nombre de plaques séniles et les scores BDS (r=0,77). Selon Mayeux, Stern et Spanton (124), il y a une corrélation modérée (r=0,50) entre la partie 1 de l’échelle BDS et la version modifiée du mini-examen de l’état mental (mMMSE). Ces résultats confirment la validité de structure des échelles.

Page 69: Rapport la maladie d’Alzheimer. technologique II. Examen ...

55

Stern, Hesdorffer et collab. (125) soumettent les items de la partie 1 de l’échelle BDS à une analyse en composantes principales fondée sur les données de 187 personnes dont le diagnostic est la MA probable. Ce processus met en lumière quatre facteurs indépendants : cognitif (7 items, score allant de 0 à 7), apathie/repli sur soi (3 items, score allant de 0 à 3), changement de personnalité (6 items, score allant de 0 à 6) et autonomie de base (3 items, score allant de 0 à 3) considérés comme les facteurs les plus descriptifs des changements de comportement particuliers. Ces constatations vont à l’encontre des prétentions originales concernant l’utilisation de l’échelle. Sensibilité au changement : Aucune donnée n’est disponible concernant cette qualité métrologique. 4.5.5 Examen critique

La partie 1 de l’échelle BDS est destinée précisément à une population de personnes âgées souffrant de démence, d’où la pertinence de son utilisation dans le cadre d’essais cliniques sur la pharmacothérapie de la MA. Il s’agit d’un bon outil possible de dépistage de la démence. Toutefois, sa capacité à détecter les effets bénéfiques modestes produits par des interventions particulières n’est pas fondée. L’étude des qualités psychométriques de l’échelle BDS est incomplète. Enfin, l’utilisation de versions modifiées vient compliquer les comparaison intercentres (119).

4.6 Échelle Nüremberg d’observation gériatrique (NAB)

4.6.1 Description

L’échelle Nüremberg d’observation gériatrique (NAB) comprend 15 items évaluant les activités de la vie quotidienne. Oswald et Schaltenbrand l’ont mise au point à l’intention de malades germanophones [mentionnée dans (46)] dans le cadre du recensement des troubles psychogériatriques de Nüremberg (NAI) (126;127). Le NAI consiste en une batterie de mesures visant à évaluer les changements produits par les interventions chez les personnes âgées. La documentation en anglais sur l’échelle NAB et ses qualités psychométriques est peu abondante. Caractéristiques étudiées : La nécessité d’aide/la capacité sur le plan des activités de la vie quotidienne. Les aspects examinés comprennent l’apparence, les occupations constructives, l’aide sur le plan financier, les activités de la vie quotidienne, la compréhension orale, l’expression orale, le comportement à l’extérieur de la maison, l’aide requise pour l’hygiène, les dispositions quant aux déplacements dans les endroits publics, l’ouïe, la vue, l’aide requise pour l’habillement, la marche, le régime alimentaire et l’aide sur le plan des repas. Administration : Le rendement de la personne est coté par des proches ou des infirmières, d’après leurs observations. Cotation : Chaque item est coté sur une échelle de 3 points. Les options de réponse diffèrent selon l’item en question. Le score total va de 15 à 45 points; l’amélioration se traduit par une diminution du score. 4.6.2 Évaluation et examen critique

Il n’y a pas d'information en anglais sur la fiabilité de l’échelle NAB. Quant à la validité sur le plan de l’évaluation de personnes atteintes de démence, les items sur l’ouïe et la vue sont moins

Page 70: Rapport la maladie d’Alzheimer. technologique II. Examen ...

56

pertinents et plutôt liés aux déficiences qu’à l’incapacité fonctionnelle. Dans une étude (126) comptant 44 personnes, les auteurs font état de coefficients (type non précisé) de corrélation modérée entre l’échelle NAB et d’autres tests du NAI, soit les tests du rendement cognitif (0,42), le NAS (autoévaluation psychogériatrique) (0,43) et le NAR (évaluation du comportement) (0,53). L’information disponible est insuffisante pour démontrer la validité et la sensibilité de l’échelle NAB.

4.7 Nüremberg-Alters-Alltags-Skala (NAA)

L’échelle Nüremberg-Alters-Alltags-Skala (NAA) comporte 20 items évaluant les activités de la vie quotidienne du point de vue de la personne. Les items comportent une cotation sur trois points. Le score total va de 20 à 60 points; plus le score est bas, plus l’amélioration est grande. Oswald et Schaltenbrand ont mis au point l’échelle NAA à l’intention de malades germanophones [mentionnée dans (46)] dans le cadre du recensement des troubles psychogériatriques de Nüremberg (NAI). Le NAI consiste en une batterie de mesures visant à évaluer les changements produits par les interventions chez les personnes âgées. Il n’y a pas de documentation en anglais sur l’échelle NAA et ses qualités psychométriques.

4.8 Liste de vérification des activités de la vie quotidienne (ADLC)

La liste de vérification des activités de la vie quotidienne (ADLC) est utilisée dans deux essais sur le métrifonate effectués par Becker et ses collègues (128;129). Il convient de souligner que les sources de référence sur la liste ADLC indiquées dans ces rapports sont erronées, laissant penser à tort que cette échelle a été publiée, ce qui n’est pas le cas. Dans l’un des essais cliniques (128), l’échelle est brièvement décrite comme une liste de 50 items portant sur des activités courantes de la vie quotidienne. Le dispensateur de soins cote les items en se fondant sur le même mécanisme de cotation progressive de 7 points allant de très grande amélioration à très grande détérioration. La liste ADLC compare les comportements actuels aux comportements prévalant avant l’admission à l’étude. Cette échelle n’a pas été évaluée et, pour le moment, son utilisation n’est pas justifiée.

4.9 Entrevue d’évaluation de la détérioration de l’exécution des activités de la vie

quotidienne dans la démence (IDDD)

4.9.1 Description

L’entrevue d’évaluation de la détérioration de l’exécution des activités de la vie quotidienne dans la démence (IDDD) (130) consiste en un questionnaire de 33 items conçu pour aider les cliniciens à déceler la perte d’autonomie fonctionnelle chez les personnes atteintes de démence vivant dans la collectivité. L’élaboration et l’évaluation initiales de l’instrument IDDD ont été effectuées et publiées en néerlandais. Caractéristiques étudiées : Cet instrument permet de déterminer l’incapacité fonctionnelle sur le plan de l’entretien personnel (16 items dont la propreté, l’habillement et l’alimentation) et des activités complexes (17 items tels le magasinage, la rédaction et la conversation téléphonique). Administration : Le questionnaire est rempli par des dispensateurs de soins dans le contexte d’une entrevue dirigée. Pour faire en sorte qu’ils n’interprètent pas de façon erronée la gravité de

Page 71: Rapport la maladie d’Alzheimer. technologique II. Examen ...

57

l’incapacité, les dispensateurs de soins doivent indiquer des descriptions concrètes de l’état fonctionnel de la personne évaluée. Cotation : Pour chaque item, on évalue la capacité d’amorcer les activités et le rendement dans l’exécution des activités. Selon Burns et ses collègues (135), l’intensité de la détérioration est cotée sur une échelle de 7 points, où 1-2=pas de détérioration ou détérioration minime, 3-4=détérioration légère, 5-6=détérioration modérée et 7=détérioration grave, pour obtenir un score total variant de 22 à 231.

Teunisse et ses collègues (130) ont modifié l’échelle initiale en incorporant d’autres options de réponse afin de pouvoir établir une comparaison avec l’état fonctionnel de base. Ces trois options sont : 1=aide nécessaire de même niveau, 2=aide nécessaire plus fréquente et 3=aide nécessaire dans presque tous les cas. Dans cette version, le score total va de 33 (aucune détérioration) à 99 (détérioration grave).

4.9.2 Évaluation

Fiabilité : Selon une publication (132), cet instrument est doté d’une cohérence interne élevée s’exprimant par un coefficient alpha de 0,94. Aucune autre donnée sur la fiabilité n’est disponible. Validité : Une étude de Teunisse et collab. (130) établit dans une certaine mesure la validité de structure de l’instrument quant à la gravité globale de la démence. Dans cette étude (n=30), les auteurs constatent qu’il y a une corrélation entre l'échelle IDDD et d’autres concepts apparentés, tel le déficit cognitif (r=0,77), les troubles de comportement (r=0,67), la charge de travail du dispensateur de soins (r=0,47) et la durée de la maladie (r=0,45). 4.9.3 Examen critique

Cette échelle fonctionnelle serait appropriée pour évaluer des personnes souffrant de démence légère ou modérée et vivant dans la collectivité. L’évaluation porte sur un assez grand nombre d’activités complexes dont l’exécution est susceptible d’être perturbée au cours des premiers stades de la MA. De plus, le nombre d’items distincts de l’échelle constitue un atout car il peut rehausser la sensibilité de l’outil. Toutefois, bien que les résultats d’une étude laissent entrevoir que l’instrument est doté d’une certaine validité de structure, nous ne pouvons que constater l’absence d’information empirique sur l’évaluation de l’IDDD et de ses qualités métrologiques.

4.10 Questionnaire unifié sur les activités de la vie quotidienne (ADL unifié)

En 1973, Donaldson et ses collègues (133) élaborent le questionnaire unifié sur les activités de la vie quotidienne (ADL unifié) afin de couvrir toutes les variables de l’entretien personnel et de la fonction motrice utilisées de façon courante pour évaluer l’état fonctionnel des personnes de 1950 à 1970. Ils produisent ainsi une échelle comportant 20 items, qui permet de calculer les indices d’écart réduit de Barthel, Katz et Kenny. Le degré d’aide nécessaire est coté en regard de chaque item, sur une échelle de 10 points. Les qualités psychométriques de l’échelle n’ont pas été étudiées.

Page 72: Rapport la maladie d’Alzheimer. technologique II. Examen ...

58

4.11 Échelle d’évaluation de l’autonomie (DS)

4.11.1 Description

Stern et ses collaborateurs mettent au point en 1994 l’échelle d’évaluation de l’autonomie (DS) pour établir un repère uniforme dans l’évolution de la démence. L’échelle permet de déterminer le degré d’autonomie des personnes quant à l’aide nécessaire à l’exécution de tâches instrumentales. L’instrument est conçu pour être administré à un informateur qui connaît bien les activités de la vie quotidienne de la personne. Il englobe 13 items qui sont cotés soit sur une échelle de 3 points (aucun besoin, besoin occasionnel, besoin fréquent) (2 items) ou sur une échelle de 2 points (non, oui) (11 items). Un degré de perte d’autonomie (degré 0 au degré 5) est calculé en fonction de critères précis. Plus le degré est élevé, plus la démence est prononcée. L’échelle comprend également un diagramme des équivalents des soins institutionnels afin de déterminer le niveau de soins prodigués.

4.11.2 Évaluation

4.11.2.1 Fiabilité

Pour évaluer la fidélité inter-juges de l’instrument, Stern et son équipe (134) étudient les données de 20 informateurs qui ont été interviewés de façon indépendante par deux examinateurs. Les résultats indiquent un taux de concordance de 100 % entre les degrés de perte d’autonomie et des CCI de 0,90 quant aux scores composites, et de 0,73 quant aux scores du diagramme. Sur un échantillon de 233 personnes, on estime que le coefficient alpha de Cronbach, exprimant la cohérence interne de l’échelle, est de 0,66.

L’analyse en composantes principales des réponses révèle l’existence de trois sous-échelles

dont les valeurs alpha sont accrues : soutien cognitif (4 items, alpha=0,93), aide-personne âgée active (5 items, alpha=0,87) et aide-personne âgée passive (4 items, alpha=0,78).

4.11.2.2 Validité

En ce qui concerne la validité, cette étude comptant 233 patients (134) démontre que les rapports entre l’instrument et diverses mesures de la détérioration fonctionnelle et cognitive sont marqués par des coefficients de corrélation statistiquement significatifs (p<0,01). Ces diverses mesures comprennent la version mMMSE, le score d’évaluation clinique de la démence, l'échelle BDRS (quatre sous-échelles) et la cotation du diagramme des soins institutionnels équivalents. Les scores BDRS et le degré de perte d’autonomie concordent tous deux avec les scores de la version mMMSE, faisant ressortir que ces échelles, loin de se chevaucher, couvrent différents concepts. L’étude démontre également le lien entre le degré de perte d’autonomie et la situation du malade (p<0,01) de même que la tendance temporelle de la perte d’autonomie (statistique F d’Hotelling : 29,68; p<0,001; n=150). Enfin, on évalue la structure hiérarchique des items de l’échelle à l’aide du scalogramme de Guttman. Les items satisfont cette exigence, comme l’indique un coefficient de reproductibilité de 0,97 et un coefficient d'échelonnabilité de 0,66.

4.11.3 Examen critique

La fiabilité de l’échelle d’évaluation de l’autonomie est appropriée sous l’angle de la fidélité inter-juges et de la cohérence interne des sous-échelles. Quant à la validité, elle a été étudiée sous

Page 73: Rapport la maladie d’Alzheimer. technologique II. Examen ...

59

plusieurs points de vue, étoffant la justification de son utilisation. De fait, les résultats démontrent la pertinence du concept de perte d’autonomie dans l’étude de personnes âgées atteintes de démence et la sensibilité de l’instrument au regard de l’évolution de la maladie. En conclusion, l’échelle d’évaluation de l’autonomie constitue un instrument de mesure valable dans le cadre de la recherche épidémiologique sur la MA.

4.12 Conclusion globale sur les échelles d’évaluation de l’état fonctionnel

Les échelles d’évaluation de la capacité fonctionnelle examinées dans la présente analyse comportent plusieurs limites sur le plan de leurs qualités psychométriques. Dans plusieurs cas, nous ne pouvons que constater l’absence de données objectives sur la fiabilité et la validité des instruments, même en ce qui concerne des échelles traditionnelles mises au point voilà plusieurs décennies, telles les échelles IADL, PSMS et BDS. Le fait de choisir ces anciennes échelles plutôt que des instruments mis au point récemment soulève également des questions, puisque la construction des instruments récents repose sur des connaissances théoriques et méthodologiques actualisées. Toutefois, le plus grave problème mis en relief par la présente analyse est le fait que nombre de ces échelles sont à peu près dénuées de sensibilité aux traitements médicamenteux symptomatiques de la démence, même lorsqu’il y a une amélioration cognitive mesurable. Compte tenu de la nature des comportements globaux que ces instruments permettent d’évaluer, il n’est pas surprenant de constater qu’ils ne peuvent déceler que des changements de grande ampleur. Il est peu probable d’ailleurs que de tels changements se produisent dans les cas de démence peu prononcée. Pour expliquer la faible sensibilité des instruments, on peut sans doute faire valoir que de nombreux facteurs, outre la capacité cognitive, influencent la capacité fonctionnelle des personnes âgées, tels les déficiences physiques et sensorielles ou des aspects psychosociaux. Par conséquent, il y a peut-être lieu d’adapter le cadre de référence théorique de l’évaluation fonctionnelle en mettant l’accent sur la cognition plutôt que sur le rendement. Dans le domaine des essais cliniques sur la MA, il est donc nécessaire de mettre au point des outils particuliers pour l’évaluation des résultats fonctionnels. L’un des plus récents instruments examinés, l’échelle d’évaluation de la perte d’autonomie, vient confirmer qu’une telle entreprise est judicieuse.

4.13 Introduction : les échelles d’évaluation de la qualité de vie

L’évaluation de la qualité de vie revêt de plus en plus d’importance dans le cadre d’essais cliniques sur la pharmacothérapie de la MA (135-138) (139) et de la recherche sur la MA (140) (141). Selon l’OMS [mentionnée dans (117)], la qualité de vie peut être définie comme une notion englobant le fonctionnement cognitif, les activités de la vie quotidienne, les interactions sociales et le bien-être psychologique. Cinq essais examinés font mention de l’utilisation d’échelles d’évaluation de la qualité de vie en tant qu’instruments de mesure secondaires. L’échelle d'évaluation de la qualité de vie (QoL) (142) et l’échelle de détérioration progressive (PDS) (143) sont utilisées respectivement dans quatre essais (135-138) et dans un essai (144). Nous présentons ces deux échelles dans les sections qui suivent.

4.14 L’échelle d'évaluation de la qualité de vie (QoL)

4.14.1 Description

L’instrument d’évaluation de la qualité de vie (QoL) (142) est une échelle d’autoévaluation comportant 10 items qui permet de circonscrire la sensation de bien-être de la personne. L’outil est

Page 74: Rapport la maladie d’Alzheimer. technologique II. Examen ...

60

conçu pour évaluer des comportements de la vie réelle ou des conditions de vie favorables en utilisant plusieurs indicateurs sociaux mesurables. L'échelle QoL est destinée à des personnes souffrant de troubles mentaux, qu’elles soient hospitalisées ou non. Caractéristiques étudiées : Les indicateurs sociaux couvrent les aspects du travail, des loisirs, de l’alimentation, du sommeil, des activités sociales, de la vie professionnelle, du rôle parental, de l’amour, de l’environnement et de l’estime de soi. Administration : Le questionnaire est rempli par la personne évaluée ou par des examinateurs externes. Les résultats différeront probablement selon l’un ou l’autre des modes d’administration (142). Application : Pour remplir le questionnaire QoL, il faut posséder des capacités minimales de lecture et de rédaction. Le score total maximal est de 500. Toutefois, comme l’item concernant le rôle parental ne s’applique pas à des personnes sans enfants, le score brut total maximal dans ce cas est de 450. Cotation : Les items de l’instrument sont évalués selon une échelle de cotation de 6 points et on leur attribue 0, 10, 20, 30, 40 ou 50 points. Les points d’ancrage inférieur et supérieur de chaque indicateur social sont définis, mais on ne précise pas dans la publication originale si les répondants connaissent ces définitions. Les scores-seuils sont : 350 ou plus signifiant des conditions de vie et une qualité de vie plutôt bonnes; 250-349 indiquant une adaptation difficile mais appropriée; 100-249 révélant que la personne éprouve une grande souffrance et a besoin d’aide immédiate; enfin, les personnes institutionnalisées pour troubles mentaux obtiennent un score inférieur à 100. Ces scores-seuils ont été déterminés dans le cadre d’études pilotes d’évaluation de l'échelle QoL auxquelles ont participé des personnes suivant une psychothérapie (142). 4.14.2 Évaluation

Blau (142) n'évalue pas la fiabilité ni la validité de l’échelle QoL. Toutefois, la description de la construction de l’instrument renferme des données objectives sur la validité de contenu (pertinence et couverture du contenu) de l’outil. Dans le document publié (142), l’auteur reconnaît la nécessité de procéder à des mises à l'essai pratiques en vue de réviser et de normaliser l'outil.

4.14.3 Examen critique

L’échelle QoL met l’accent sur la présence de comportements sociaux efficients plutôt que sur leur absence. De plus, le contenu de l’instrument est conforme à la définition de la qualité de vie de l’OMS (139). Toutefois, la mise au point de l’échelle en est au stade préliminaire, de sorte qu'on ne dispose pas de données sur la fiabilité, la validité et la sensibilité au changement de l’instrument. Cela peut expliquer, dans une certaine mesure, le fait que les auteurs des essais sur le donépézil font état de résultats contradictoires ou non significatifs (135-138).

Il importe de souligner que certains auteurs ont défini jusqu’à un certain point le fondement théorique de l’évaluation de la qualité de vie chez les personnes atteintes de la MA et que des mesures objectives de la qualité de vie sont décrites dans la documentation (141;145). Voici certains instruments d’évaluation de la qualité de vie utilisés à l’heure actuelle : EuroQoL, SEIQoL, SF-36, NHP, etc. (141). Par ailleurs, des exposés de synthèse (141;146) rendent compte des aspects

Page 75: Rapport la maladie d’Alzheimer. technologique II. Examen ...

61

méthodologiques en jeu dans l’évaluation de la qualité de vie, comme la sensibilité et l’autoévaluation par des personnes éprouvant des problèmes cognitifs/de communication. Au vu des publications récentes sur la théorie de la qualité de vie et des autres instruments disponibles, le choix de l’échelle QoL en tant qu’instrument de mesure est contestable.

4.15 Échelle de détérioration progressive (PDS)

4.15.1 Description

DeJong et ses collègues (143) mettent au point l’échelle PDS en 1989 pour mesurer la qualité de vie des personnes atteintes de la MA. L’instrument comprend 27 facteurs conçus pour produire un indicateur sensible des écarts et changements de la qualité de vie. Caractéristiques étudiées : L’instrument porte sur les activités de la vie quotidienne et les activités instrumentales de la vie quotidienne. La perte d’autonomie dans ces domaines altérerait de façon marquée la qualité de vie du malade. Voici des exemples du contenu de certains aspects étudiés (11 dans l’échelle PDS) : mesure dans laquelle la personne peut se déplacer hors du voisinage immédiat; utilisation d’appareils ménagers connus; participation à la gestion financière familiale, établissement d’un budget, etc.; entretien personnel et tâches courantes. Administration/application : Il s’agit d’un questionnaire que remplit le dispensateur de soins à l'aide d’une échelle analogique visuelle bipolaire. Il remplit le questionnaire en 10 ou 15 minutes, d’après ses observations concernant le comportement quotidien du malade. Cotation : Les questions sont notées par la mesure de la distance le long de la ligne de l’échelle de 0 à 100. On obtient le score composite, dont le maximum est 100, en calculant la moyenne des scores des items. Plus le score est élevé, plus la qualité de vie est bonne. 4.15.2 Évaluation

4.15.2.1 Fiabilité

La fidélité pair-impair de l’instrument, dont les coefficients de Kuder-Richardson vont de 0,92 à 0,95 (143), fait ressortir la cohérence interne de l’instrument. L’instrument serait fiable sur le plan test-retest à un intervalle d’une semaine entre les administrations. Quant aux trois stades de la MA (d’après les stades GDS 2-3, 4-5 et 6-7) et concernant l’échantillon dans l'ensemble, les coefficients de corrélation (rp) sont respectivement de 0,89 (n=14), 0,78 (n=44), 0,78 (n=65) et 0,90 (n=123).

4.15.2.2 Validité

La description de l’élaboration de l’instrument permet de conclure à la bonne validité de contenu de l’outil. En effet, cette procédure comporte des entrevues exhaustives avec les dispensateurs de soins suivies de la réduction systématique des données. Quant à la validité de structure, l’échelle PDS est capable d’établir la distinction entre des personnes âgées ne souffrant pas de démence et des personnes atteintes de la MA (n=80), la classification étant exacte à 95 % (143).

Page 76: Rapport la maladie d’Alzheimer. technologique II. Examen ...

62

4.15.2.3 Sensibilité au changement

Dans une étude comptant 141 personnes, DeJong et collab. (143) démontrent que l’échelle PDS peut différencier les trois stades de la MA, tels qu’ils sont mesurés par l’échelle GDS (ratio t<0,01). Toutefois, dans leur étude portant sur 62 personnes, Knopman et Gracon (147) constatent une variance intra-individuelle élevée. Par conséquent, il peut être difficile de définir une étendue de changement fiable sur une courte période.

4.15.3 Examen critique

L’instrument est précisément conçu pour évaluer les écarts et les changements de la qualité de vie des personnes atteintes de la MA au fil de l’évolution de la maladie. Des études démontrent que l’instrument est sensible aux trois stades de gravité de la démence et qu’il est doté d’une fiabilité et d’une validité bonnes. Toutefois, il est possible que l’instrument ne décèle pas les changements minimes en raison de la grande variance intra-individuelle (147). De plus, il faut souligner que l’instrument couvre des aspects évalués par des instruments de mesure de l’état fonctionnel. Néanmoins, l’échelle peut se révéler utile dans l’évaluation clinique de médicaments employés dans le traitement de la MA.

4.16 Conclusion globale sur les échelles d’évaluation de la qualité de vie

Plusieurs auteurs (139;145;148) confirment que l’étude de la qualité de vie en rapport avec la démence n’en est encore qu’à ses débuts, tant du point de vue conceptuel que du point de vue fonctionnel. Les outils d’évaluation de la qualité de vie auraient pour effet de brouiller la distinction entre les aspects biologiques de la maladie et ses répercussions sociales et fonctionnelles. Dans le cadre du processus d’harmonisation globale des lignes directrices concernant la démence, il est judicieux de recueillir des données sur la qualité de vie (au cours d’essais cliniques de phase III), mais il n’est pas nécessaire d’obtenir une amélioration de la qualité de vie mesurée pour démontrer l’efficacité d’un médicament et l’approuver par la suite (139). D’ailleurs, l’examen des échelles QoL et PDS met en évidence plusieurs limites sur le plan des qualités psychométriques, ce qui vient appuyer ce point de vue.

Page 77: Rapport la maladie d’Alzheimer. technologique II. Examen ...

63

5 ÉCHELLES D’ÉVALUATION DU COMPORTEMENT ET DE L’HUMEUR

5.1 Introduction

Les troubles de comportement et de l’humeur représentent des aspects bien connus et persistants de la MA (149). Toutefois, les milieux scientifiques ne s’entendent pas sur la définition des troubles de comportement et de l’humeur. Pour les désigner, ils emploient divers termes, dont désordres du comportement, symptômes psychiatriques, symptômes non cognitifs et symptômes neuropsychiatriques. En outre, la controverse porte sur la nature des troubles considérés comme caractéristiques de la MA et sur leur prévalence aux divers stades de la maladie (149-151).

Le rapport entre les troubles de comportement, la fonction cognitive et l’état fonctionnel dans la MA est complexe et, avec l’accroissement des connaissances, l’interaction de ces trois éléments revêt de plus en plus d’importance dans la mise au point des médicaments (150). Certains experts (152;153) (154) (155) estiment qu’il est nécessaire d’évaluer dans une certaine mesure le comportement et l’humeur dans les essais sur les médicaments contre la démence afin de surveiller les symptômes pouvant exacerber le déficit cognitif ou l’incapacité fonctionnelle, et d’évaluer les effets possibles des médicaments contre la démence sur les symptômes comportementaux. Dans la pratique, l’importance des troubles de comportement et de l’humeur dans la MA est indéniable, puisqu’ils influencent les niveaux de soins dans la prise en charge clinique des malades (150;156), la charge de travail des dispensateurs de soins ainsi que le coût des soins et services de santé (157).

5.2 Sélection des instruments à examiner

Seuls 13 des 25 essais examinés font mention de l’évaluation des troubles de comportement et de l’humeur. Fait à noter cependant, dans nombre des essais où les chercheurs n’évaluent pas le comportement et l’humeur, ils utilisent des instruments d’évaluation de l’état fonctionnel ou de la qualité de vie comportant des items permettant de relever des perturbations du comportement et de l’humeur. Les 12 essais mentionnés ci-dessus ont recours à 10 échelles pour l’évaluation du comportement et de l’humeur – une diversité remarquable dans le choix des instruments. Le comportement et l’humeur constituent des paramètres d’une importance particulière dans six essais où les chercheurs utilisent plus d’une échelle pour les évaluer. Partant de là, nous avons choisi d’évaluer l’échelle abrégée d’appréciation psychiatrique [désignée comme un instrument de mesure principal dans (158)], l’échelle ADAS-noncog (l’instrument le plus prisé de tous) ainsi que l’échelle d’évaluation comportementale dans la démence et la compilation des troubles neuropsychiatriques (deux instruments destinés aux personnes atteintes de démence). Pour divers motifs, nous n’avons pas examiné les échelles BfS (122) (mention de sources de référence en allemand) et IPSC-E (159) (160) (contraintes de temps). Enfin, nous ne décrivons que brièvement les autres échelles (c.-à-d., RAGS, DMAS, CSSD, DBD) qui ne sont utilisées que dans un ou deux essais. Mentionnons que les échelles d’évaluation du comportement et de l’humeur que nous n’examinons pas ou que nous ne décrivons que brièvement ne relèvent aucun écart significatif entre le groupe du placebo et les groupes du médicament.

Page 78: Rapport la maladie d’Alzheimer. technologique II. Examen ...

64

5.3 Échelle abrégée d’appréciation psychiatrique (BPRS)

5.3.1 Introduction

À l’origine, l’échelle abrégée d’appréciation psychiatrique (BPRS) (161) a été mise au point pour évaluer les effets thérapeutiques chez des adultes jeunes ou d’âge moyen dans le contexte de la recherche psychopharmacologique, et cet instrument destiné à des études psychiatriques est utilisé tel quel dans l’évaluation de la démence (162).

5.3.2 Description

Caractéristiques étudiées : L’échelle BPRS renferme 16 items portant sur des troubles psychiatriques tels la somatisation, l’anxiété, le repli émotif, la désorganisation conceptuelle, le sentiment de culpabilité, la tension, le maniérisme et l’affectation, la mégalomanie, l’humeur dépressive, l’hostilité, la paranoïa, les hallucinations, la déficience motrice, l’indocilité, l’idéation inhabituelle et l’affect émoussé. Initialement, les items ont été choisis d’après leur propension à mesurer la réponse au traitement de patients souffrant de troubles psychiatriques (163). Administration : Un intervieweur administre l’échelle BPRS par l’observation directe de la personne et dans le cadre d’une conversation avec celle-ci. Le dispensateur de soins n’intervient pas. L’entrevue est dirigée (les items sont présentés par une brève description du symptôme en question), mais non structurée. L’examinateur note chaque item sur une échelle de gravité de 7 points, allant de 0 (« non présent ») à 6 (« extrêmement grave »); l’intervieweur doit coter la sévérité du symptôme par comparaison à la population de malades (psychiatriques) qui ressentent le symptôme en question. Cotation : Le score total s’obtient par la sommation des scores des items. Plus le score est élevé, plus les problèmes sont nombreux. La gamme des scores est de 0 à 96. 5.3.3 Évaluation

5.3.3.1 Fiabilité

Fidélité inter-juges : Mack et Patterson (163) évaluent 61 personnes souffrant de la MA vivant dans la collectivité et 20 de leurs conjoints dont la fonction cognitive est intacte. Cette évaluation vise à recueillir des renseignements sur le comportement prévalant pendant la semaine précédant l’entrevue. Deux intervieweurs évaluent 55 de ces 81 personnes au cours d’une session où tous les deux sont présents, mais où un seul dirige l’entrevue. Les auteurs estiment que la prévalence des troubles relatifs à des symptômes précis va de 0 à 50 % et qu’elle est faible pour la plupart des items. Toutefois, la cotation de la plupart des malades et des personnes témoins fait ressortir la présence d’au moins un symptôme. La valeur statistique kappa s’échelonne de 0,134 à 1,00 (médiane de 0,448). Le taux de concordance sur la présence des symptômes n’est que de 33 % pour tous les symptômes combinés. La faible prévalence de symptômes limite l’évaluation de la fiabilité. 5.3.3.2 Validité

Validité de contenu : La structure factorielle de l’échelle BPRS est étudiée chez 117 personnes souffrant de la MA. Ownby et collab. (164) suppriment six symptômes qui, selon eux, ne procureront pas d’information utile à l’analyse. Tout en faisant remarquer la stabilité notable de

Page 79: Rapport la maladie d’Alzheimer. technologique II. Examen ...

65

l’instrument, les chercheurs sont d’avis que l’interprétation de la structure factorielle doit être axée sur le contexte particulier de la MA (c.-à-d., plutôt que dans le contexte des troubles psychiatriques). Validité de structure/validité concomitante : Une étude menée par Mack et Patterson (163) compare la ventilation de la cotation sur l’échelle BPRS à celle du BEHAVE-AD et de l’échelle Cornell d’évaluation de la dépression associée à la démence (CSDD). L’analyse révèle que le contenu de l’échelle BPRS ne couvre pas certains aspects importants (p. ex., les peurs et les phobies), alors que d’autres aspects concernent les personnes dont la fonction cognitive est intacte mais pas les personnes atteintes de la MA (p. ex., la somatisation). Dans l’ensemble, l’échelle BPRS est moins sensible au regard des symptômes que le BEHAVE-AD et l’échelle CSSD. L’échelle BPRS distingue moins bien les deux groupes de personnes l’un de l’autre que le BEHAVE-AD. 5.3.4 Examen critique

Cet instrument est d’une utilité limitée dans l’évaluation de personnes âgées souffrant de démence (163;164). L’échelle est caractérisée par d’importantes lacunes sur le plan du contenu, car elle ne couvre pas toute la gamme des troubles de comportement et de l’humeur susceptibles de se produire dans la MA. L’entrevue directe avec le malade, qui constitue la procédure d’administration de l’échelle BPRS, peut déboucher sur une évaluation comportementale inappropriée, puisque le malade est souvent incapable de fournir un compte rendu précis; à ce compte-là, il est préférable d’interviewer le dispensateur de soins. Manifestement, l’échelle BPRS, initialement mise au point pour évaluer le traitement pharmacologique de troubles psychiatriques, ne représente pas un instrument de mesure approprié dans les essais cliniques sur des médicaments contre la démence.

5.4 Échelle d’évaluation de la maladie d’Alzheimer-non cognitive (ADAS-noncog)

5.4.1 Introduction

L’échelle d’évaluation de la maladie d’Alzheimer-non cognitive (ADAS-noncog) (53;54;56) est la sous-échelle de l’échelle ADAS qui est axée sur les troubles de comportement et de l’humeur. Comme nous le mentionnions plus haut, l’échelle ADAS est conçue pour mesurer les changements se produisant chez les personnes atteintes de la MA par suite d’un traitement médicamenteux. L’échelle ADAS-noncog comporte 10 items répartis en six catégories (perturbation affective, hallucinations, délires, troubles de l’activité motrice, attention et appétit). Caractéristiques étudiées : Les items de l’instrument sont la dépression, les pleurs faciles, les délires, les hallucinations, les déplacements de long en large (faire les cent pas), l’activité motrice accrue, les tremblements, la concentration/distractibilité, l’indocilité au cours de l’épreuve et l’appétit accru/diminué. Certains chercheurs ont réduit le nombre d’items de l’échelle ADAS-noncog à 9 en supprimant l’item sur les hallucinations. Administration : Un clinicien procède à la cotation d’après ses observations sur le comportement de la personne et par une entrevue avec le dispensateur de soins. La période d’intérêt est la semaine précédant l’entrevue. L’administration de l’échelle est dirigée, mis non structurée. Cotation : Les items non cognitifs sont cotés sur une échelle de 6 points allant de 0 (pas de déficit) à 5 (déficit grave). Tous les items s’accompagnent de descripteurs de gravité particuliers (56). Le

Page 80: Rapport la maladie d’Alzheimer. technologique II. Examen ...

66

score maximal est de 50 (ou de 45 dans le cas de l’échelle à 9 items); plus le score est élevé, plus les troubles sont nombreux ou graves. 5.4.2 Évaluation

5.4.2.1 Fiabilité

Constance test-retest : Les concepteurs de l’échelle (56) font état d’une fidélité test-retest de 0,59 à un intervalle d’un mois chez 27 personnes souffrant de la MA. Pour leur part, Standish et collab. (63) obtiennent un coefficient de corrélation test-retest plus élevé (CCI=0,70) chez un différent groupe de 27 personnes âgées souffrant de la MA. Les examinateurs sont des étudiants en médecine ayant suivi une formation dans ce domaine. Weyer et collab. (61) indiquent une constance test-retest (rp) de 0,98 chez un groupe de 440 personnes âgées atteintes de la MA sur une période de trois à quatre semaines.

Pour ce qui est de la fidélité inter-juges dans le groupe initial de 27 personnes souffrant de la MA, elle est de 0,95 (CCI) (56). Par contre, Standish et collab. (63) font état de CCI de 0,42 et de 0,55 pour leur groupe de 27 personnes âgées.

D’après les données tirées de leur évaluation de la fiabilité test-retest, Weyer et collab. (61) estiment que le score fiable de changement individuel sur l’échelle ADAS-noncog est de 3 points.

5.4.2.2 Validité

Validité de contenu : Weyer et collab. (61) obtiennent un coefficient alpha de cohérence interne de 0,83 pour l’échelle ADAS-noncog, ce qui indique l’homogénéité élevée du contenu des items. Nous n’avons pu déterminer si le coefficient a été surestimé en raison d’un « effet de halo » (c.-à-d., tendance à évaluer des symptômes de gravité indéterminée de la même manière que les symptômes antérieurement évalués). Validité de structure/validité concomitante : En se basant sur les scores de 440 personnes souffrant de la MA, Weyer et collab. (61) établissent la corrélation entre l’échelle ADAS-noncog et le MMSE (-0,49), le SKT (0,50), l’échelle ADAS-cog (0,67) et l’échelle d’observation des infirmières pour les patients gériatriques (NOSGER) (0,79). L’échelle NOSGER, que nous ne décrivons pas, évalue les comportements observables dans six domaines relatifs au fonctionnement quotidien (la mémoire, les activités instrumentales de la vie quotidienne, les activités de la vie quotidienne, l’humeur, le comportement social et le comportement perturbé). 5.4.2.3 Sensibilité au changement

Périodicité : L'utilisation répandue de l’échelle ADAS-noncog pour surveiller le changement dans les essais cliniques sur les médicaments est parfois considérée comme une indication que l’échelle est sensible au changement. Soulignons cependant que l’acceptation d’une échelle et la sensibilité d’une échelle ne veulent pas dire la même chose. Gravité : Dans le groupe de personnes souffrant de la MA évaluées par Weyer et collab. (61), la valeur moyenne du score ADAS-noncog du groupe de 166 personnes souffrant de démence légère est de 9,4 (écart-type=4,9), alors que la valeur moyenne du groupe de 274 personnes souffrant de

Page 81: Rapport la maladie d’Alzheimer. technologique II. Examen ...

67

démence modérée est de 15,3 (écart-type=6,8). Ces valeurs concordent avec l’accroissement des troubles de comportement et de l’humeur qui accompagne l’aggravation de la démence. 5.4.3 Examen critique

L’échelle ADAS-noncog est une échelle bien évaluée qui fait preuve d’une fiabilité et d’une validité adéquates. Toutefois, elle est moins fiable lorsqu’elle est utilisée par des personnes autres que des cliniciens. Standish et collab. (63) ont élaboré une version normalisée de l’échelle ADAS-noncog (SADAS-noncog) et démontrent qu’une administration plus structurée améliore l’échelle.

Ne comportant que 10 items, cet instrument est considéré comme une échelle « brève ».

L’instrument évalue une combinaison de troubles psychopathologiques et d’autres anomalies (162). Par exemple, trois des items couvrent des aspects autres que le comportement et l’humeur (les tremblements, la concentration/distractibilité et l’appétit accru/diminué), tandis que des problèmes assez fréquents particuliers à la MA ne sont pas pris en compte par l’échelle, tels l’agressivité, l’anxiété et la phobie (165). Par ailleurs, il y a des raisons de croire que l’échelle ne décèlerait pas le changement. Pour des motifs liés au contenu, l’échelle ADAS-noncog ne représente pas l’échelle de choix pour surveiller les troubles de comportement et de l’humeur dans la MA. Comme l’affirment Ferris et collab., « l’évaluation comportementale dans le contexte des essais cliniques devrait être centrée sur les aspects comportementaux et ne pas porter sur le fonctionnement cognitif, car ce domaine est couvert par des instruments conçus dans cette intention. De plus, ces évaluations comportementales devraient permettre de cerner les effets indésirables du médicament sans biaiser l'évaluation de l’efficacité globale du médicament » (166).

5.5 Échelle d’évaluation comportementale CERAD (C-BRSD)

5.5.1 Introduction

L’échelle d’évaluation comportementale CERAD (C-BRSD) a été mise au point par le Consortium to Establish a Registry for Alzheimer’s Disease (CERAD) pour évaluer le comportement de personnes atteintes de la MA par des entrevues avec les principaux dispensateurs de soins (167). La sélection des items de l’échelle est fondée sur une analyse documentaire et des consultations avec des experts afin qu’une vaste gamme de symptômes comportementaux soient représentés (167).

5.5.2 Description

Caractéristiques étudiées : L’échelle C-BRSD renferme 48 items que l’on peut regrouper sous huit facteurs, notamment les symptômes dépressifs, les symptômes psychotiques, l’automaîtrise déficiente, l’irritabilité/l’agitation, les aspects végétatifs (c.-à-d., le sommeil, la fatigue, l’appétit), l’apathie, l’agressivité et l’instabilité affective (167) (168). La fréquence des comportements est mesurée, mais pas la gravité (considérée comme plus difficile à baliser). De ces items, 40 sont cotés sur une échelle de 4 points allant de « 1 » (signes présents un ou deux jours au cours du dernier mois) à « 4 » (>16 jours au cours du dernier mois); les autres items sont des questions dichotomiques (oui/non) (167) (168). Administration : Un intervieweur qualifié remplit le questionnaire C-BRSD au cours d’une entrevue dirigée avec le principal dispensateur de soins de la personne. L’échelle évalue le comportement au

Page 82: Rapport la maladie d’Alzheimer. technologique II. Examen ...

68

cours du mois précédant l’entrevue, tout en tenant compte également du comportement antérieur depuis le début de la maladie (167) (168). L’intervieweur doit poser un jugement d’ensemble sur la validité des réponses du dispensateur de soins. La durée d’administration va de 20 à 45 minutes. Cotation : Dans leur article de fond, Tariot et collab. (168) ne formulent pas de recommandations quant à la cotation de l’échelle C-BRSD. La documentation rend compte de deux mécanismes de cotation. Il s’agit de la sommation des scores de fréquence des items (169) ou du dénombrement des troubles de comportement recensés (170). Quelle que soit la méthode choisie, plus le score est élevé, plus les troubles de comportement sont nombreux. 5.5.3 Évaluation

5.5.3.1 Fiabilité

Constance test-retest : La fidélité test-retest a été évaluée dans le cadre du Alzheimer’s Disease Cooperative Study (ADCS) Instrument Project (169). On a effectué des entrevues répétées à intervalle d’un mois avec les dispensateurs de soins de personnes dont la fonction cognitive est intacte (n=64) et avec les dispensateurs de soins de personnes souffrant de la MA à divers degrés d’intensité (n=241). On a établi la gravité de la maladie (5 degrés) d’après les scores-seuils du MMSE, et la représentation est équivalente dans chaque degré de gravité. La fiabilité, exprimée par le coefficient de corrélation des rangs de Spearman, est de 0,62 en ce qui concerne les personnes dont la fonction cognitive est intacte, et va de 0,70 à 0,89 en ce qui a trait aux personnes souffrant de démence. Fidélité inter-juges : Pour établir la fidélité inter-juges, deux examinateurs notent les entrevues avec 104 personnes sélectionnées dans un échantillon de commodité de 303 personnes atteintes de la MA (167). La fidélité inter-juges est étudiée sous l’angle de la concordance globale et du coefficient kappa pondéré. Le taux de concordance globale est élevé, allant de 91,3 % à 100 %. Quant aux coefficients kappa pondérés, ils s'échelonnent de 0,77 à 1,00, la plupart des items ayant un coefficient kappa pondéré se situant entre 0,90 et 1,00. Même s’ils affirment que la concordance inter-juges de l’échelle C-BRSD est élevée, les auteurs (167) ne manquent pas de souligner que, si deux intervieweurs avaient procédé à la cotation de façon indépendante, la concordance serait possiblement moindre. En outre, étant donné que l’échantillon dans l’ensemble ne comprend pas de personnes souffrant de troubles psychopathologiques étendus, le taux de concordance est probablement exagéré en raison du taux d'accord élevé sur l’absence de symptômes. 5.5.3.2 Validité

Validité de structure : L’analyse factorielle confirme la validité de structure de l’échelle, car elle indique la saturation de huit facteurs (voir ci-dessus) (168). Validité de structure/validité concomitante : On a évalué la validité concomitante de l’échelle C-BRSD au regard de la symptomatologie de la dépression. Par une entrevue semi-dirigée évaluant les symptômes comportementaux en vue de poser un diagnostic de dépression clinique (tant mineure que majeure), Jacobs et collab. (170) répartissent les personnes souffrant de la MA en un groupe souffrant de dépression et un autre groupe sans symptômes de dépression. Des 69 personnes sélectionnées, 29 sont diagnostiquées comme souffrant de dépression. D’après leurs réponses aux

Page 83: Rapport la maladie d’Alzheimer. technologique II. Examen ...

69

items sur l’anxiété et la dépression de l’échelle C-BRSD, le diagnostic de 70 % des personnes, qu’il s’agisse de dépression ou non, est exact. 5.5.3.3 Sensibilité au changement

Les données sur la sensibilité au changement proviennent d'une seule étude, soit le ADCS Instrument Project (169). Dans cette étude, le score C-BRSD total s’obtient par la sommation des scores de fréquence des items, tout en supprimant le dernier item, « survenue d’autres symptômes comportementaux »; les scores vont de 0 à 164. Les chercheurs évaluent à intervalles réguliers des personnes dont la fonction cognitive est intacte et des personnes souffrant de la MA sur une période d’un an. Étude longitudinale : On étudie le score de changement sur l’échelle C-BRSD entre l’évaluation du premier mois et l’évaluation du douzième mois afin de déterminer la sensibilité au changement de l’instrument (169). Les scores de changement varient de -2,5 (écart-type de 20,8) dans le groupe le plus gravement atteint à 3,7 (écart-type de 17,5) dans le groupe de la maladie de stade intermédiaire. L’ampleur du changement moyen est semblable chez les personnes dont la fonction cognitive est intacte (c.-à-d., -1,5), mais la variation des résultats est beaucoup moindre (c.-à-d., écart-type de 4,5). Selon les auteurs, l’échelle C-BRSD décèle peu de changement du comportement sur une période de 12 mois. Gravité : Dans le ADCS Instrument Project, l’échelle C-BRSD permet d’établir la distinction entre les personnes souffrant de la MA et les personnes témoins dont la fonction cognitive est intacte (169). Le score C-BRSD moyen (de référence) des personnes dont la fonction cognitive est intacte est de 4,7 (écart-type de 8,3), alors que le score moyen (de référence) des personnes souffrant de la MA va de 18,9 (écart-type de 12,8) quant au degré de gravité le plus faible à 40,4 (écart-type de 26,8) en ce qui concerne le degré de gravité le plus élevé. 5.5.4 Examen critique

La fiabilité de l’échelle C-BRSD est bonne. Toutefois, la concordance inter-juges est probablement surestimée car l’évaluation porte sur un grand nombre de personnes ne présentant que des symptômes légers. C’est pourquoi l’évaluation de la fiabilité de l’instrument doit se poursuivre et être fondée sur des personnes plus gravement atteintes. Par ailleurs, la validité concomitante de l’instrument en ce qui a trait à la dépression et à l’anxiété est adéquate.

Il y a lieu de s’attendre à ce que la fréquence des symptômes comportementaux augmente au cours de l’évolution de la maladie (166). L’instrument toutefois ne décèle pas cette augmentation, peut-être parce qu’une période de 12 mois n’est pas suffisante pour détecter le changement. Toutefois, l’augmentation des troubles de comportement et de l’humeur n’accompagne pas également la diminution des scores MMSE. Patterson et collab. (169) constatent que l’échelle C-BRSD représente une combinaison synergique de divers items. Même si certains items peuvent se détériorer à mesure que s’aggrave la démence, d’autres items peuvent en revanche vraiment s’améliorer. Il n’y aurait pas de motif de supposer que tous les items évoluent de la même façon. Par conséquent, ces auteurs (169) préconisent la mise au point de sous-échelles homogènes axées sur un facteur afin d’accroître la précision et la portée de la surveillance des troubles de comportement.

Page 84: Rapport la maladie d’Alzheimer. technologique II. Examen ...

70

5.6 Compilation des troubles neuropsychiatriques (NPI)

5.6.1 Introduction

La compilation des troubles neuropsychiatriques (NPI) est une échelle mise au point par Cummings et collab. en 1994 (171). Cet instrument, qui évalue une vaste gamme de troubles neuropsychiatriques, est conçu pour établir la distinction entre les diverses formes de démence. Le fait que l’outil évalue des symptômes plutôt rares dans la MA mais courants dans d’autres types de démence (p. ex., l’euphorie et la désinhibition, les comportements compulsifs et obsessionnels) accroît sa portée diagnostique. La NPI (157;171) consiste en une entrevue dirigée avec un dispensateur de soins qui est en mesure de bien observer le comportement du malade. Des questions de sélection, des sous-questions et la cotation de la fréquence et de la gravité représentent les principaux paramètres de l’échelle. Caractéristiques étudiées : L’échelle originale comprend 10 items : les délires, les hallucinations, la dysphorie (humeur dépressive), l’anxiété, l’agitation, l’euphorie, l’apathie, l’irritabilité, la désinhibition et le comportement moteur aberrant (faire les cents pas et fouiller partout). Par la suite, deux items – le comportement nocturne et les changements de comportement sur le plan de l’appétit et de l’alimentation – sont venus s’ajouter afin de pouvoir évaluer un plus grand nombre de syndromes. Les qualités psychométriques de la NPI ont été établies par l’examen de l’échelle originale de 10 items (171). Administration : Un intervieweur administre la NPI à un dispensateur de soins bien informé. L’examinateur pose d’abord les questions de sélection afin de réduire au minimum la durée de l’épreuve tout en offrant un aperçu de tous les aspects comportementaux particuliers. Lorsque la réponse à l’une ou l’autre des questions de sélection laisse entrevoir la présence de problèmes dans le domaine étudié, le dispensateur de soins répond à sept ou huit sous-questions supplémentaires pour coter la fréquence du trouble comportemental sur une échelle de 4 points (1 = <1 par semaine; 4=une fois par jour ou plus) et la gravité sur une échelle de 3 points (1=léger, 2=modéré, 3=grave). Cotation : Pour chaque aspect, le score total est calculé en multipliant le score de fréquence par le score de gravité. Le score total de l’instrument s’obtient en effectuant la sommation des scores dans chaque domaine. Plus le score est élevé, plus les problèmes sont nombreux. Le score total maximal est de 120 lorsque 10 domaines sont évalués et de 144 lorsque 12 domaines sont évalués. 5.6.2 Évaluation

5.6.2.1 Fiabilité

Constance test-retest : La fidélité test-retest a été déterminée en effectuant deux entrevues à un intervalle de trois semaines avec 20 dispensateurs de soins; dans la moitié des cas, il s’agit d’entrevues téléphoniques (157). Les coefficients de corrélation sont de 0,79 en ce qui a trait à la fréquence globale et de 0,86 quant à la gravité globale. Les coefficients de corrélation de certains aspects particuliers sont un peu moindres, notamment la gravité de l’agitation (0,51), la gravité de l’irritabilité (0,53), la fréquence de l’anxiété (0,51) et la fréquence de l’irritabilité (0,51). Fidélité inter-juges : Deux examinateurs notent les questionnaires NPI remplis à l’occasion d’entrevues effectuées par l’un des examinateurs (157). Les examinateurs ne connaissent que leur propre cotation. Ils évaluent ainsi 45 personnes dont les scores MMSE couvrent une vaste gamme

Page 85: Rapport la maladie d’Alzheimer. technologique II. Examen ...

71

(moyenne de 17,4). Les résultats, exprimés sous forme de taux de concordance bruts entre les examinateurs, vont de 90 % à 100 % selon les comportements. Enfin, la fiabilité inter-juges de la cotation de la fréquence et celle de la cotation de la gravité sont semblables. 5.6.2.2 Validité

Validité de contenu : L’échelle est présentée à un « panel Delphi » composé de 10 experts dans le domaine du comportement et de la gériatrie (157) (171). Tous les experts évaluent les questions de sélection et les sous-questions sur le plan de la validité de contenu. Ils ne relèvent qu’un seul item nécessitant une reformulation (p. ex., « comportement gênant » devient « comportement moteur aberrant »). Validité de structure/validité concomitante : On a comparé la NPI à l’échelle BEHAVE-AD en établissant le lien entre les questions des deux échelles mesurant des comportements semblables (157) (171). Cette étude compte 40 malades et leurs dispensateurs de soins; de ces malades, 20 sont atteints de la MA, 9 souffrent de démence vasculaire et 11 sont atteints d’une autre forme de démence (score MMSE moyen = 19,2). La corrélation entre la plupart des paires d’items va de modérée à bonne (rs=0,54 à 0,80). Le lien entre l’item sur la «dysphorie » de l’échelle NPI et l’échelle Hamilton d’évaluation de la dépression (HAM-D) est caractérisé par une corrélation modérée (rs=0,62). 5.6.2.3 Sensibilité au changement

Périodicité : C’est un fait admis que les malades ne présentent pas tous des troubles de comportement et de l’humeur, et que ces troubles n’évoluent pas nécessairement au même rythme que d’autres manifestations cliniques de la démence (156;157). Le fait que la progression de ces troubles ne soit pas constante peut entraver la détection et la mesure du changement, de sorte que l’évaluation de la sensibilité au changement des échelles comportementales s’en trouve limitée. Une étude ouverte sur la tacrine révèle que les scores NPI s’améliorent chez les personnes traitées; cette amélioration reliée à la dose touche les aspects de l’apathie et du comportement moteur aberrant (157). Faute de données plus probantes, ces résultats sont interprétés comme étant la démonstration de la sensibilité au changement de l’échelle. Gravité : Sous l’angle des scores NPI, les personnes âgées dont la fonction cognitive est intacte diffèrent des personnes âgées souffrant de démence, sauf en ce qui concerne la dysphorie, la désinhibition et l’irritabilité. Les scores NPI de 40 personnes âgées dont la fonction cognitive est intacte indiquent l’absence de problèmes. Par opposition, les données sur 50 personnes atteintes de la MA révèlent que la plupart de ces personnes souffrent de l’un ou l’autre des troubles neuropsychiatriques recensés par la NPI. Les troubles dont la fréquence s’accroît avec l’aggravation de la démence sont l’agitation, la dysphorie, l’anxiété, l’apathie et le comportement moteur aberrant (157). 5.6.3 Examen critique

Un groupe d’experts internationaux a établi avec certitude la validité de contenu de l’instrument. Le fait que cette épreuve repose sur l’information d’un dispensateur de soins fait en sorte qu’il est possible d’obtenir une évaluation exhaustive du comportement. La fiabilité et la validité de l’outil sont donc satisfaisantes. Nous avons toutefois cerné certaines lacunes ou limites.

Page 86: Rapport la maladie d’Alzheimer. technologique II. Examen ...

72

L’évaluation comportementale porterait sur les symptômes prévalant pendant les quatre semaines précédant l’entrevue, mais cette période n’est pas clairement précisée dans la description de l’échelle dans divers contextes. Le fait que la période en question puisse varier influence probablement la fiabilité et la validité de l’instrument. Par ailleurs, les auteurs n’indiquent pas la justification de leur système de cotation basé sur le produit de la fréquence par la gravité. Quant à la fiabilité inter-juges, elle est exprimée sous forme de concordance globale, une mesure qui ne s’applique pas à la comparaison de cotations continues. D’autre part, il n’y a à peu près pas d’information pour étayer le faible taux faux négatif mentionné en ce qui concerne les questions de sélection (moins de 5 %). Comme nous n’avons pas obtenu d’exemplaire du questionnaire, nous n’avons pu évaluer la pertinence des questions de sélection et des sous-questions. Enfin, les résultats tirés de l’étude ouverte sur la tacrine ne constituent pas des données probantes valables sur la sensibilité au changement de l’instrument.

5.7 Évaluation de la symptomatologie globale par un proche (RAGS)

Le questionnaire d’évaluation de la symptomatologie globale par un proche (RAGS) (172), qui est conçu pour évaluer le comportement d’un malade vivant dans la collectivité, est rempli par un parent ou un ami proche. Cette échelle autoadministrée comporte 21 items portant sur des symptômes et comportements de nature psychiatrique plutôt que sur des aspects d’adaptation sociale ou interpersonnelle. La présence des symptômes est cotée sur une échelle de 5 points allant de « 1=pas du tout » à « 5=au plus haut point ». L’examinateur évalue les symptômes et les comportements prévalant la semaine précédant l’épreuve. Les auteurs préconisent que les items soient cotés de façon distincte. Toutefois, le cas échéant, on peut calculer un score moyen en effectuant la sommation des scores des divers items, puis en divisant cette somme par 21 – le score moyen va de 1 à 5; plus le score est élevé, plus les symptômes sont accrus.

L’instrument permet de distinguer des personnes souffrant de démence d’autres groupes de malades et les items sur la dépression font preuve de validité concomitante lorsqu’ils sont comparés à la compilation des manifestations psychiques et somatiques chez les personnes âgées (IPSCE) (159). Toutefois, plusieurs items de l’échelle renvoient à des problèmes qu’éprouvent les personnes âgées souffrant de démence quel que soit leur état sur le plan du comportement et de l’humeur, et qui rendent compte de l’état de la fonction cognitive ou de l’état de santé global plutôt que de l’humeur (p. ex., besoin d’aide dans les activités de la vie quotidienne, fatigue, perte de coordination motrice, déclin de la mémoire, désorientation, difficulté d’expression orale, variabilité de l’état mental). Manifestement, cette échelle, qui n’est pas destinée à des personnes souffrant de la MA, est dotée d’une validité de contenu limitée s’agissant de l’évaluation des troubles de comportement et de l’humeur particuliers à la MA.

5.8 Échelle d’évaluation de l’humeur dans la démence de l’Institut national de la santé

mentale (DMAS)

L’échelle d’évaluation de l’humeur dans la démence de l’Institut national de la santé mentale (DMAS) (173) est conçue pour être une mesure objective de l’humeur chez les personnes souffrant d’un déficit cognitif. Le questionnaire est rempli d’après l’information concernant la semaine précédant l’épreuve, information provenant de toutes les sources possibles, notamment de la famille ou du personnel infirmier. L’échelle comporte 24 items, dont les 17 premiers sont conçus pour mesurer la gravité de la dépression, alors que les sept derniers visent à offrir une indication de la gravité de la démence. Des indicateurs de gravité (c.-à-d., des énoncés descriptifs) accompagnent

Page 87: Rapport la maladie d’Alzheimer. technologique II. Examen ...

73

les étapes paires (c.-à-d., 0, 2, 4 et 6), mais sont absents aux étapes impaires (c.-à-d., 1, 3, 5). L’examinateur tient compte des symptômes et du comportement prévalant la semaine précédant l’épreuve. La gamme des scores de la sous-échelle de 17 items est de 0 à 102, alors qu’elle est de 0 à 42 pour la sous-échelle de 7 items; plus le score est élevé, plus les troubles sont nombreux. L’analyse factorielle de la sous-échelle de 17 items met en évidence quatre facteurs : la dépression, l’interaction sociale, l’anxiété et les symptômes végétatifs. La corrélation entre la sous-échelle de 7 items et certaines mesures de la capacité cognitive est bonne (173).

Les concepteurs de l’échelle précisent que leur instrument n’est pas approprié dans le cas de démence grave ou d’indocilité. Sans égard au degré de gravité de la démence, l’utilité de l’échelle DMAS dans l’évaluation du comportement et de l’humeur est limitée. En effet, d’une part, la sous-échelle de 17 items est principalement axée sur la dépression, ce qui restreint l’étendue des problèmes évalués. D’autre part, la sous-échelle de 7 items ne porte pas du tout sur les troubles de comportement et de l’humeur.

5.9 Échelle des troubles de comportement dans la démence (DBD)

L’échelle des troubles de comportement dans la démence (DBD) (174), qui comporte 28 items, a été mise au point pour quantifier les troubles de comportement chez les personnes souffrant de démence. Le comportement perturbé est défini comme étant « la manifestation extériorisée d’un déficit cognitif, psychologique ou physiologique sous-jacent – peu importe son étiologie – susceptible de causer un stress aux personnes dispensant des soins au malade » (p. 221). Les items se rapportent aux aspects habituellement associés à la démence : la passivité, l’agitation, les désordres alimentaires, l’agressivité, la perturbation du cycle circadien et l’inconduite sexuelle. Pour accroître la précision conceptuelle, les items sélectionnés renvoient à des comportements observables (p. ex., des allégations ou des doléances) plutôt qu’à l’idéation relative au comportement (p. ex., la paranoïa). L’échelle est conçue pour être utilisée, sous la forme d’une entrevue ou d’un questionnaire autoadministré, hors du cadre clinique auprès du dispensateur de soins qui agit à titre d’informateur. Les divers comportements sont cotés sur une échelle de Likert en fonction de leur fréquence au cours de la semaine précédente (0=jamais, 4=tout le temps). La gamme des scores est de 0 à 112; plus le score est élevé, plus les troubles sont nombreux. Les auteurs ne proposent pas de période de référence, mais l’étude de validation a été effectuée sur des périodes de une et de deux semaines.

Les concepteurs de l’échelle font mention de résultats préliminaires de l’évaluation indiquant que la fiabilité test-retest et la validité de structure de l’instrument sont adéquates. Ils font remarquer cependant que certains comportements sont très fréquents chez les personnes âgées souffrant de démence (p. ex., les questions répétitives, égarer des objets; allégations non fondées), alors que d’autres se produisent si rarement qu’ils pourraient être exclus de l’évaluation (p. ex., l’exhibitionnisme, les hurlements ou lancer de la nourriture). D’autre part, bien que certains items représentent des comportements susceptibles d’accroître la charge de travail du dispensateur de soins, ils renvoient à des activités de la vie quotidienne ou au rendement (p. ex., sommeil diurne prolongé; incontinence urinaire ou fécale), qui sont des aspects manifestement hors du domaine des troubles de comportement et de l’humeur.

Page 88: Rapport la maladie d’Alzheimer. technologique II. Examen ...

74

5.10 Échelle Cornell d’évaluation de la dépression associée à la démence (CSDD)

L’échelle Cornell d’évaluation de la dépression associée à la démence (CSDD) (175) comprend 19 items rattachés aux fondements actuels de la phénoménologie de la dépression (notamment les changements liés à l’humeur; la perturbation comportementale; les signes physiques; les fonctions cycliques; et les troubles de l’idéation). Son mécanisme de cotation reposant principalement sur l’observation, cette échelle ne comporte pas d’items tels les phobies ou les obsessions, dont l’évaluation nécessite un compte rendu fiable du malade. L’entrevue se déroule en deux étapes. D’abord, le clinicien couvre tous les items dans une entrevue avec le dispensateur de soins du malade. Puis, il s’entretient brièvement avec le malade à propos des items de l’échelle et des observations recueillies à la première étape. S’il y a une divergence de contenu importante entre les deux entrevues, le clinicien s’entretient de nouveau avec le dispensateur de soins afin de clarifier les aspects discordants. Le jugement du clinicien préside à la cotation : 0=absent, 1=léger ou intermittent, 2=grave. Le score total va de 0 à 38; plus il est élevé, plus la dépression est grave. La durée totale d’administration est d’environ 30 minutes (20 minutes avec le dispensateur de soins, 10 minutes avec le malade). Le caractère distinctif de l’échelle CSDD tient au fait qu’il s’agit d’une échelle d’évaluation de la dépression dont la validité est reconnue chez une population de personnes souffrant de démence (176).

5.11 Conclusion globale sur les échelles d’évaluation du comportement et de l’humeur

La mesure des troubles de comportement et de l’humeur n’est pas une mince affaire en raison de l’absence à la fois d’une terminologie commune et d’un corpus de notions théoriques s’apparentant à celui sur la cognition (177). Dans bien des cas, le domaine du comportement et de l’humeur englobe des indicateurs de l’état fonctionnel, des changements d’humeur, des interventions inappropriées du point de vue social, des symptômes psychiatriques tels les hallucinations et les délires, comme si tous ces aspects relevaient du même fondement biologique. La comparabilité des diverses échelles souffre du fait qu'elles comportent des items considérablement différents sur le plan de leur définition, qui couvrent des aspects assez peu délimités. L’échelle BPRS, par exemple, ne couvre pas de façon appropriée toute la gamme des troubles propres à la MA. Quant à l’échelle ADAS-noncog (53;54;56), elle comprend des items hors du domaine, tout en ne comportant pas certains items importants dans la MA. De plus, dans une perspective cognitive, les stimuli sont bien connus, tandis que dans bien des cas les stimuli du comportement et de l’humeur sont indéterminés, ce qui accroît les risques d’erreur de mesure.

L’utilisation des échelles d’évaluation du comportement et de l’humeur dans les essais cliniques est fondée sur l’opinion voulant qu’une intervention doive, au fil du temps, atténuer (ou prévenir) les symptômes sans provoquer d’autres troubles de comportement ou de l’humeur. Bien que la nature de l’évolution de la détérioration du comportement et de l’humeur dans la MA soit encore incertaine, certains faits indirects (p. ex., la corrélation avec la gravité de la démence) laissent entrevoir un certain déclin (150), qui ne se produit toutefois pas à court terme (149;151). De nombreux essais cliniques sur la pharmacothérapie de la MA n’admettent pas de malades souffrant de troubles de comportement et de l’humeur, tout en évaluant ces aspects comme résultat secondaire. Ces ECR sont en mesure de bien évaluer les effets indésirables (ou les effets mixtes) d’une intervention sur le comportement et l’humeur, pourvu que les échelles utilisées soient sensibles au changement.

Page 89: Rapport la maladie d’Alzheimer. technologique II. Examen ...

75

Il faut tenir compte d’un certain nombre de paramètres dans l’interprétation des résultats des échelles d’évaluation du comportement et de l’humeur. La période sous observation (ou la période d’évocation) n’est pas précisée dans le cas de nombreuses échelles, et si le cadre temporel n’est pas défini avec précision et constance, la logique et la comparabilité des mesures en souffriront (177). Par exemple, le cadre temporel de référence de la NPI est imprécis (157;171).

La source d’information des évaluateurs constitue un risque d’erreur que l’on ne peut contrer

entièrement. Ainsi, les échelles dont certaines des données sont indiquées par la personne évaluée, ce qui est le cas en partie de l’échelle BPRS, peuvent se révéler peu fiables pour mesurer quoi que ce soit d’autre que la situation qui prévaut dans l’immédiat (162). De plus, l’évocation de faits anciens transitoires par des personnes souffrant de démence, même d’intensité légère, laisse à désirer, comme le fait ressortir une étude de validité de l’échelle de dépression gériatrique (178). D’autre part, les membres de la famille du malade ne possèdent pas, en général, les compétences nécessaires pour procéder à une observation fine et peuvent être enclins également à fonder leur évaluation sur des rapports antérieurs avec la personne. Quant aux autres informateurs, leurs périodes d’observation sont souvent moins nombreuses et de plus courte durée. Plus précisément, l’observation directe effectuée par le clinicien, quoique fine, est considérablement limitée dans le temps et n’est utile qu’en ce qui concerne les comportements dont le changement est aigu et les manifestations immédiates.

La stratégie d’évaluation diffère selon les échelles. Ainsi, certaines d’entre elles ne font

qu’éclairer le sujet (telle l’échelle ADAS-noncog), alors que d’autres sont exhaustives (comme c’est le cas de l’échelle BRSD), ou que d'autres encore adoptent une démarche en deux étapes, une sélection initiale et un approfondissement subséquent (comme la NPI). La stratégie d’évaluation doit être prise en considération dans le choix de l’échelle appropriée en fonction des besoins de l’essai clinique, tout en tenant compte également des contraintes de temps et de l’exhaustivité de la démarche.

Enfin, dans bien des cas, le mécanisme de cotation est adapté aux besoins du moment, sans que sa validité soit véritablement démontrée. La cotation par la sommation des items présents est logique, pourvu que les items en question soient véritablement unidimensionnels dans le contexte de la MA (177;179) (172) (174). Il est de la plus haute importance que l’échelle soit dotée d’une sensibilité au changement la rendant apte, au cours de l’essai, à distinguer la rémission spontanée de la survenue de nouveaux symptômes comportementaux (particulièrement en ce qui concerne les scores sommables) (162). C’est pourquoi l’amélioration globale peut représenter un objectif trop élevé. Lorsque l’échelle couvre une gamme étendue de troubles comportementaux, son utilité est d’autant plus accrue qu’on examine de façon distincte les résultats de ses sous-échelles factorielles qui sont centrées sur des catégories comportementales délimitées (155). Comme dans d’autres domaines, la conception de nombreuses échelles d’évaluation du comportement et de l’humeur ne repose pas sur des connaissances empiriques concernant les changements de portée clinique.

Page 90: Rapport la maladie d’Alzheimer. technologique II. Examen ...

76

6 OBSERVATIONS GÉNÉRALES ET CONCLUSION

Nous avons examiné de façon critique les instruments de mesure, regroupés selon le domaine, utilisés dans les essais cliniques sur la pharmacothérapie de la MA, essais analysés dans la première partie du présent rapport (I : Analyse comparative d’essais cliniques). Les domaines ayant fait l’objet de l’évaluation sont apparentés à ceux que proposent Berg et Montgomery (140) dans la métrologie de l’efficacité pratique dans la recherche sur la MA. Ces domaines sont : (i) l’état global, dont l’évaluation s’exprime par des scores globaux distincts; (ii) la fonction cognitive, dont l’évaluation repose sur l’utilisation d’échelles d’évaluation de la fonction cognitive et de tests neuropsychologiques particuliers; (iii) l’état fonctionnel, évalué par des échelles d’évaluation de l’incapacité fonctionnelle et des mesures de la qualité de vie; (iv) le comportement et l’humeur. Par contre, nous n’avons pas pris en considération d’autres mesures diverses rarement utilisées, tel le délai de survie (121).

Connaître les qualités psychométriques de ces instruments de mesure est primordial pour

être en mesure de déterminer l’utilité des échelles dans l’évaluation de l’efficacité thérapeutique dans le cadre d’essais cliniques sur la pharmacothérapie de la MA. L’utilisation d’instruments de mesure fiables et valides fait en sorte que les résultats sur l’efficacité du médicament sont fondés et peuvent être interprétés de façon appropriée. Par contre, l’utilisation d’instruments dénués de fiabilité, de validité et de sensibilité au changement peut compromettre la crédibilité des constatations de l’essai.

L’une des principales observations découlant de cet examen se rapporte à la grande diversité

des instruments utilisés dans les domaines mentionnés plus haut (voir les tableaux 1 et 2 au chapitre 1). Du point de vue méthodologique, la quantité de renseignements obtenus sur chaque instrument particulier est limitée en raison du grand nombre d’échelles utilisées. En effet, il était pratiquement impossible de rassembler toute la documentation portant sur les échelles examinées, particulièrement dans les domaines où la diversité des instruments est la plus marquée (p. ex., la cognition, et le comportement et l’humeur). Toutefois, comme nous avons procédé à des recherches documentaires exhaustives et à l’examen approfondi des sources de référence des documents relevés, nous pensons avoir examiné la documentation la plus importante publiée en anglais. Soulignons également que l’abondance de la documentation disponible varie selon les échelles. Par conséquent, nous avons examiné certains instruments de façon plus approfondie que d’autres, sans tenir compte de la fréquence d’utilisation.

Dans une perspective théorique, le fait que ces essais aient recours à diverses échelles dans l’évaluation d’un même domaine a des répercussions sur les comparaisons que l’on peut établir entre ces essais (14;107;108;139). Les essais examinés sont manifestement caractérisés par la disparité dans le choix des échelles utilisées, et l’unanimité à cet égard est limitée dans l’ensemble des essais. Ainsi, dans le domaine de l’évaluation globale, on préconise l’utilisation de l’échelle CDR, qui n’est en fait utilisée que dans un cas (121) (99) comme instrument de mesure principal. D’autre part, il est notoire que l’échelle ADAS-cog et le SKT sont de bons instruments d'évaluation de la fonction cognitive. Toutefois, seule l’échelle ADAS-cog est utilisée dans plusieurs essais (128;135-138;154;180-184) en tant qu’instrument de mesure principal. En ce qui concerne l’évaluation de l’état fonctionnel, la même échelle n’est pas utilisée dans plus de trois [p. ex., IADL (99;154;182); PSMS (99;154;182), GERRI (154;158;183)] ou quatre essais [p. ex., QoL (135-138)].

Page 91: Rapport la maladie d’Alzheimer. technologique II. Examen ...

77

Enfin, s’agissant du domaine du comportement et de l’humeur, le choix est plus homogène puisqu’il se réduit à deux échelles, les échelles ADAS-noncog (128;158;180-182;184;185) et BPRS (98;99;158;186).

Certains des instruments examinés sont prometteurs, sans toutefois que l’un ou l’autre ne se détache du lot. Voyons cela de façon plus détaillée en fonction des aspects évalués. Dans le domaine de l’évaluation globale, le concept évalué n’est pas, dans tous les cas, de nature « globale » et parfois ne repose pas sur un fondement théorique solide. Quant à la fonction cognitive, même les échelles les plus réputées ne comportent pas d’items de difficulté appropriée pour des personnes âgées souffrant de démence légère ou modérée. En ce qui concerne les échelles d’évaluation de l’état fonctionnel et de la qualité de vie, il est manifestement nécessaire de mettre au point un outil particulièrement conçu pour les personnes âgées souffrant de démence. D’autre part, notre examen met en évidence la mésentente qui règne dans les milieux médicaux en ce qui a trait à la définition des troubles de comportement et de l’humeur particuliers à la MA. Cette situation explique sans doute en partie l’utilisation inappropriée des échelles d’évaluation du comportement et de l’humeur auprès des personnes sélectionnées dans les essais cliniques sur la pharmacothérapie de la MA.

Si nous considérons l’ensemble des échelles, l’absence de définition du changement

individuel fiable constitue l’un des problèmes les plus courants. Comme notre analyse le démontre, les coefficients de corrélation sont utilisés presque exclusivement pour rendre compte de la fiabilité des échelles examinées. Nous sommes d’avis que la démarche reste en surface. De fait, les coefficients de corrélation peuvent être faussement élevés lorsque la gamme des valeurs du malade est vaste et, parce qu’ils sont adimensionnels, ils ne peuvent être mis en rapport direct avec l’erreur de mesure de l’échelle. L’évaluation de la fiabilité ne devrait pas s’en tenir aux coefficients de fiabilité, mais indiquer également l’erreur de mesure de l’échelle exprimée dans les unités de l’échelle. Grâce à cette information, il serait possible d’identifier de façon appropriée les personnes qui répondent au traitement.

L’insuffisance des données sur la sensibilité au changement constitue un autre problème courant sur le plan des qualités métrologiques des échelles examinées. De telles données ne sont pas disponibles pour la majorité des échelles examinées, bien qu’elles aient été sélectionnées dans l’intention d’illustrer le changement. Voilà pourquoi, en règle générale, les chercheurs ne divulguent pas a priori de renseignements sur la nature du changement considéré comme étant de portée clinique, mais s’en remettent plutôt à la signification statistique de leurs résultats pour déterminer le changement en question. Autre aspect étroitement lié aux qualités métrologiques, plusieurs échelles sont marquées par un effet de plafonnement et un effet-seuil, certain ou probable (p. ex., CIBIC, SKT, MMSE, GERRI, PSMS, IADL), susceptibles de limiter leur capacité de mesurer le changement. Dans l’ensemble, l’incidence de ces limites est considérable, car elles peuvent contribuer soit à la surestimation, soit à la sous-estimation de la véritable efficacité des médicaments étudiés dans ces essais.

Le présent examen soulève une autre préoccupation, qui, bien que moins répandue, est tout

de même importante, à savoir l’utilisation d’échelles adaptées de tests mis au point dans des pays autres que ceux où les ECR se sont déroulés. Dans certains cas, la validité de l’échelle (p. ex., le SKT) a été établie dans le pays d’origine, mais les renseignements à ce sujet ne sont pas disponibles dans la langue du pays d’utilisation; dans d’autres cas, la stabilité interculturelle de la version traduite de l’échelle n’est pas démontrée (p. ex., NAA, NAB), de sorte que l’interprétation des

Page 92: Rapport la maladie d’Alzheimer. technologique II. Examen ...

78

résultats est entachée d’un doute. En raison de la tenue d’essais cliniques multicentriques, auxquels participent des personnes de culture et de degré d’éducation différents, et de la mondialisation des questions de santé, il est manifeste qu’il faudra poursuivre la recherche dans ce domaine.

Il faut tenir compte des procédures d’administration des instruments de mesure pour établir l’utilité de leurs résultats. Lorsque l’instrument de mesure s’accompagne de directives normalisées, il importe que celles-ci soient suivies. Par exemple, la pratique qui consiste à substituer un répondant par procuration à un malade, dans le cas d’une échelle axée sur la perception du patient, n’est pas admise à moins que les auteurs le préconisent. D’autres façons de faire, courantes mais incorrectes, consistent à modifier des items, à en élaborer de nouveaux ou à n’utiliser que certaines parties d’une échelle. Ces modifications influencent les qualités psychométriques d’un instrument et entravent le processus d’interprétation des résultats. Par ailleurs, la formation des examinateurs a également une grande incidence sur la fiabilité des scores. La formation inappropriée peut influencer l’évaluation de l’effet thérapeutique en l’atténuant. C’est pourquoi il est de la toute première importance que les examinateurs participant à des essais multicentriques suivent la même formation. L’administration répétée d’un instrument aux mêmes personnes produit des effets d’apprentissage ou de pratique. Des intervalles trop courts entre les applications répétées d’un instrument sont susceptibles d’influencer la cotation, bien que cela ne soit sans doute pas un problème important dans la maladie d’Alzheimer. Particulièrement en ce qui concerne les échelles cognitives, il faut pouvoir contrer ces effets, par exemple, en utilisant divers ensembles de stimuli. De plus, les échelles doivent être utilisées auprès de populations dont le degré de gravité des symptômes est approprié, si l’on veut éviter les effets-seuils et de plafonnement trompeurs.

Nous pourrions formuler plusieurs recommandations quant à l’amélioration des instruments

de mesure, mais nous nous en tenons à celles qui suivent. La plus importante est la nécessité de mettre l’accent sur la mise au point d’échelles particulières au contexte d’essais cliniques sur la pharmacothérapie de la MA. Lors de son élaboration, il faut s’assurer avant tout que l’instrument est doté d’une sensibilité au changement afin de détecter les améliorations de portée clinique chez les personnes souffrant de la MA sur le plan de l’état global, de la cognition, de l’état fonctionnel, de la qualité de vie, et du comportement et de l’humeur. Le Alzheimer Disease Cooperative Study-Instrument Development Project (187;188) est un exemple de mise en œuvre d’un plan d’amélioration d’un instrument de mesure. Étant donné les percées actuelles et le nombre croissant d’instruments disponibles, les chercheurs se doivent plus que jamais de procéder à la sélection optimale des instruments de mesure des résultats dans le cadre des ECR.

Page 93: Rapport la maladie d’Alzheimer. technologique II. Examen ...

79

7 RÉFÉRENCES

(1) Reisberg B, Ferris SH, de Leon MJ, Crook T. The global deterioration scale for assessment of primary degenerative dementia. Am J Psychiatry 1982; 139(9):1136-1139.

(2) Reisberg B, Schneck MK, Ferris SH et al. The Brief Cognitive Rating Scale (BCRS): Findings in primary degenerative dementia (PDD). Psychopharmacol Bull 1983; 19(1):47-50.

(3) Reisberg B, Ferris SH. Brief Cognitive Rating Scale (BCRS). Psychopharmacol Bull 1988; 24:629-636.

(4) Hughes CP, Berg L, Danziger WL et al. A new clinical scale for the staging of dementia. Brit J Psychiat 1982; 140:566-572.

(5) Streiner DL, Norman GR. Health Measurement Scales: A Practical Guide to their Development and Use. New York: Oxford University Press, 1989.

(6) Messick S. Test validity and the ethics of assessment. Am Psychol 1980; 35:1012-1027.

(7) Crocker L, Algina J. Introduction to Classical and Modern Test Theory. Orlando: Harcourt Brace Jovanovich, 1986.

(8) Guyatt G, Walter S, Norman G. Measuring change over time: Assessing the usefulness of evaluative instruments. J Chron Dis 1987; 40(2):171-178.

(9) May L. The challenge of measuring change: Responsiveness of outcome measurements. Can J Rehab 1997; 10(1):15-24.

(10) Kirshner B, Guyatt G. A methodological framework for assessing health indices. J Chron Dis 1985; 38(1):27-36.

(11) Leber PD. FDA Letter to Sponsors Recommending Use of CIBIC in Dementia Trials. 1991.

(12) Cohen-Mansfield J, Reisberg B, Bonnema J et al. Staging methods for the assessment of dementia: Perspectives. J Clin Psychiatry 1996; 57(5):190-198.

(13) Burke WJ, Miller JP, Rubin EH et al. Reliability of the Washington University Clinical Dementia Rating. Arch Neurol 1988; 45:31-32.

(14) Juva K, Sulkava R, Erkinjuntti T et al. Staging the severity of dementia: Comparison of clinical (CDR, DSM-III-R), functional (ADL, IADL) and cognitive (MMSE) scales. Acta Neurol Scand 1994; 90:293-298.

Page 94: Rapport la maladie d’Alzheimer. technologique II. Examen ...

80

(15) Rockwood K, Morris JC. Global staging measures in dementia. In: Gauthier S, editor. Clinical Management and Diagnosis of Alzheimer's Disease. London: Martin Dunitz Ltd., 1996: 141-153.

(16) Guy W. ECDEU Assessment Manual for Psychopharmacology, Revised. Rockville, MD: DHEW, 1976.

(17) Meya U, Raschig A, Siegfried K, Wannenmacher W. Primary outcome measures in dementia drug trials: Modified clinical interview-based impression of change (CIBIC-M). International Journal of Methods in Psychiatric Research 1994; 4(3):189-192.

(18) Boothby H, Mann AH, Barker A. Factors determining interrater agreement with rating global change in dementia: The CIBIC-plus. Int J Geriatr Psychiatry 1995; 10(12):1037-1045.

(19) Schneider LS, Olin JT. Clinical global impressions in Alzheimer's clinical trials. Int Psychogeriatr 1996; 8(2):277-88; discussion 288-9.

(20) Knopman DS, Knapp MJ, Gracon SI et al. The Clinician Interview-Based Impression (CIBI): A clinician's global change rating scale in Alzheimer's disease. Neurology 1994; 44:2315-2321.

(21) Dahlke F, Lohaus A, Gutzmann H. Reliability and clinical concepts underlying global judgments in dementia: Implications for clinical research. Psychopharmacol Bull 1992; 28(4):425-432.

(22) Claus JJ, Teunisse S, Walstra GJM, van Gool WA. Determinants of global clinical change assessment in patients with early Alzheimer's disease. Dement Geriatr Cogn Disord 1998; 9(3):157-163.

(23) Huppert FA, Jorm AF, Brayne C, Girling DM. Psychometric properties of the CAMCOG and its efficacy in the diagnosis of dementia. Aging Neuropsychology & Cognition 1996; 3(3):201-214.

(24) Korner A, Lauritzen L, Bech P. A psychometric evaluation of dementia rating scales. European Psychiatry 1996; 11(4):185-191.

(25) Quinn JF, Benson F, Clark C et al. Outcome measures in dementia trials-video CIBIC validity and reliability [abstract]. Neurology 48, A233. 1997.

(26) Schneider LS, Olin JT, Doody RS et al. Validity and reliability of the Alzheimer's Disease Cooperative Study-Clinical Global Impression of Change (ADCS-CGIC). In: Becker R, Giacobini E, editors. Alzheimer Disease: From Molecular Biology to Therapy. Boston: Birkhauser, 1996: 425-429.

Page 95: Rapport la maladie d’Alzheimer. technologique II. Examen ...

81

(27) Beneke M, Rasmus W. "Clinical Global Impressions" (ECDEU): Some critical comments. Pharmacopsychiatry 1992; 25:171-176.

(28) Berg L, Miller JP, Storandt M et al. Mild senile dementia of the Alzheimer type: 2. Longitudinal assessment. Ann Neurol 1988; 23(5):477-484.

(29) Morris JC. The Clinical Dementia Rating (CDR): Current version and scoring rules. Neurology 1993; 43:2412-2414.

(30) Dooneief G, Marder K, Tang M-X et al. The clinical dementia rating scale: Community-based validation of 'profound' and 'terminal' stages. Neurology 1996; 46(6):1746-1749.

(31) Morris JC, Ernesto C, Schafer K et al. Clinical Dementia Rating training and reliability in multicenter studies: The Alzheimer's Disease Cooperative Study experience. Neurology 1997; 48(6):1508-1510.

(32) Rubin EH, Morris JC, Grant EA, Vendegna T. Very mild senile dementia of the Alzheimer type. Arch Neurol 1989; 46:379-382.

(33) McKhann G, Drachman D, Folstein M, et al. Clinical diagnosis of Alzheimer's disease: Report of the NINCDS-ADRDA work group under the auspices of Department of Health and Human Services Task Force on Alzheimer's Disease. Neurology 1984; 34:939-944.

(34) Reisberg B, Ferris SH, de Leon MJ, Crook T. Global Deterioration Scale (GDS). Psychopharmacol Bull 1988; 24(4):661-663.

(35) Gottlieb GL, Gur RE, Gur RC. Reliability of psychiatric scales in patients with dementia of the Alzheimer type. Am J Psychiatry 1988; 145(7):857-860.

(36) Foster JR, Sclan S, Welkowitz J et al. Psychiatric assessment in medical long-term care facilities: Reliability of commonly used rating scales. Int J Geriatr Psychiatry 1988; 3(3):229-233.

(37) Eisdorfer C, Cohen D, Paveza GJ et al. An empirical evaluation of the Global Deterioration Scale for staging Alzheimer's disease. Am J Psychiatry 1992; 149(2):190-194.

(38) Heun R, Papassotiropoulos A, Jennssen F. The validity of psychometric instruments for detection of dementia in the elderly general population. Int J Geriatr Psychiatry 1998; 13(6):363-380.

(39) Gottfries CG, BrDne G, Gullberg B, Steen G. A new rating scale for dementia syndromes. Arch Gerontol Geriatr 1982; 1:311-330.

Page 96: Rapport la maladie d’Alzheimer. technologique II. Examen ...

82

(40) Villardita C, Lomeo C. Alzheimer's disease: Correlational analysis of three screening tests and three behavioral scales. Acta Neurol Scand 1992; 86(6):603-608.

(41) Jensen E, Dehlin O, Gustafson L. A comparison between three psychogeriatric rating scales. Int J Geriatr Psychiatry 1993; 8(3):215-229.

(42) Folnegovic-Smalc V, Mimica N, Makaric G et al. Rating scales and computed tomography in multi-infarct dementia. Neurologia Croatica 1992; 41(4):183-190.

(43) Parnetti L, Brooks JO, Pippi M et al. Diagnosing Alzheimer's disease in very elderly patients: Relevance of some functional and psychobehavioral aspects assessed by the Gottfries-Brane-Steen Rating Scale for Dementia. Gerontology 1997; 43(6):335-342.

(44) Nyth AL, BrDne G. Principal component analysis of the GBS scale. Dementia 1992; 3(4):193-199.

(45) Olafsson K, Korner A, Bille A et al. The GBS scale in multi-infarct dementia and senile dementia of Alzheimer type. Acta Psychiatr Scand 1989; 79(1):94-97.

(46) Marcusson J, Rother M, Kittner B et al. A 12-month, randomized, placebo-controlled trial of propentofylline (HWA 285) in patients with dementia according to DSM III-R. The European Propentofylline Study Group. Dement Geriatr Cogn Disord 1997; 8(5):320-328.

(47) Strub RL, Black FW. The Mental Status Examination in Neurology. 3 ed. Philadelphia: F.A. Davis Company, 1993.

(48) Albert MS. Cognitive function. In: Albert MS, Moss MB, editors. Geriatric Neuropsychology. New York: The Guilford Press, 1988: 33-53.

(49) Albert MS. Assessment of cognitive dysfunction. In: Albert MS, Moss MB, editors. Geriatric Neuropsychology. New York: The Guilford Press, 1988: 57-81.

(50) Zec RF, Landreth ES, Vicari SK, Feldman E, Belman J, Andrise A et al. Alzheimer Disease Assessment Scale: Useful for both early detection and staging of dementia of the Alzheimer type. Alzheimer Dis Assoc Disord 1992; 6(2):89-102.

(51) Leber P. Guidelines for the Clinical Evaluation of Antidementia Drugs. First Draft. Rockville, MD: US Food and Drug Administration, 1990.

(52) Ferris SH, Mackell JA, Mohs R et al. A multicentre evaluation of new treatment efficacy instruments for Alzheimer's disease clinical trials: Overview and general results. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 2):S1-S12.

Page 97: Rapport la maladie d’Alzheimer. technologique II. Examen ...

83

(53) Mohs RC, Rosen WG, Davis KL. The Alzheimer's Disease Assessment Scale: An instrument for assessing treatment efficacy. Psychopharmacol Bull 1983; 19(3):448-450.

(54) Rosen WG, Mohs RC, Davis K. A new rating scale for Alzheimer's disease. Am J Psychiatry 1984; 141:1356-1364.

(55) Ihl R, Frolich L, Dierks T et al. Differential validity of psychometric tests in dementia of the Alzheimer type. Psychiatry Res 1992; 44:93-106.

(56) Mohs RC, Cohen L. Alzheimer's Disease Assessment Scale (ADAS). Psychopharmacol Bull 1988; 24(4):627-628.

(57) Olin JT, Schneider LS. Assessing response to tacrine using the factor analytic structure of the Alzheimer's Disease Assessment Scale (ADAS)-cognitive subscale. Int J Geriatr Psychiatry 1995; 10:753-756.

(58) Kim YS, Nibbelink DW, Overall JE. Factor structure and reliability of the Alzheimer`s Disease Assessment Scale in a multicenter trial with linopirdine. J Geriatr Psychiatry Neurol 1994; 7(2):74-83.

(59) Talwalker S, Overall JE, Srirama MK, Gracon SI. Cardinal features of cognitive dysfunction in Alzheimer's disease: A factor-analytic study of the Alzheimer's Disease Assessment Scale. J Geriatr Psychiatry Neurol 1996; 9:39-46.

(60) Armitage P, Berry G. Statistical Methods in Medical Research. 2 ed. Oxford: Blackwell Scientific Publications, 1987.

(61) Weyer G, Erzigkeit H, Kanowski S et al. Alzheimer's Disease Assessment Scale: Reliability and validity in a multicenter clinical trial. Int Psychogeriatr 1997; 9(2):123-138.

(62) Ritchie K. The screening of cognitive impairment in the elderly: A critical review of current methods. J Clin Epidemiol 1988; 41(7):635-643.

(63) Standish TI, Molloy DW, Bedard M et al. Improved reliability of the Standardized Alzheimer's Disease Assessment Scale (SADAS) compared with the Alzheimer's Disease Assessment Scale (ADAS). J Am Geriatr Soc 1996; 44(6):712-716.

(64) Mohr E, Feldman H, Gauthier S. Canadian guidelines for the development of antidementia therapies: A conceptual summary. Can J Neurol Sci 1995; 22:62-71.

(65) Burch EA, Andrews SR. Comparison of two cognitive rating scales in mentally ill patients. Int J Psychiatry Medicine 1987; 17(2):193-200.

Page 98: Rapport la maladie d’Alzheimer. technologique II. Examen ...

84

(66) Doraiswamy PM, Bieber F, Kaiser L et al. The Alzheimer's Disease Assessment Scale: Patterns and predictors of baseline cognitive performance in multicenter Alzheimer's disease trials. Neurology 1997; 48(6):1511-1517.

(67) Kramer-Ginsberg E, Mohs RC, Aryan M et al. Clinical predictors of course of Alzheimer`s patients in a longitudinal study: A preliminary report. Psychopharmacol Bull 1988; 24:458-462.

(68) Stern RG, Mohs RC, Davidson M et al. A longitudinal study of Alzheimer`s disease: Measurement, rate and predictors of cognitive deterioration. Am J Psychiatry 1994; 151:390-396.

(69) Zec RF, Landreth ES, Vicari SK, Belman J, Feldman E, Andrise A et al. Alzheimer Disease Assessment Scale: A subtest analysis. Alzheimer Dis Assoc Disord 1992; 6(3):164-181.

(70) Doraiswamy PM, Krishen A, Stallone F et al. Cognitive performance on the Alzheimer's Disease Assessment Scale: Effect of education. Neurology 1995; 45:1980-1984.

(71) Mohs RC. Methodological aspects of evaluating effects of AD progression. Neurobiol Aging 1995; 16(6):867-870.

(72) Jarvik LF, Berg L, Bartus R et al. Clinical drug trials in Alzheimer disease. What are some of the issues? Alzheimer Dis Assoc Disord 1990; 4(4):193-202.

(73) Mattes JA. Can the sensitivity of the Alzheimer's disease assessment scale be increased? Am J Geriatr Psychiatry 1997; 5(3):258-260.

(74) Kim YS, Nibbelink DW, Overall JE. Factor structure and scoring of the SKT test battery. J Clin Psychol 1993; 49(1):61-71.

(75) Lehfeld H, Rudinger G, Rietz C et al. Evidence of the cross-cultural stability of the factor structure of the SKT short test for assessing deficits of memory and attention. Int Psychogeriatr 1997; 9(2):139-153.

(76) Erzigkeit H. The SKT - A short cognitive performance test as an instrument for the assessment of clinical efficacy of cognition enhancers. In: Bergener M, Reisberg B, editors. Diagnosis and Treatment of Senile Dementia. Berlin Heidelberg: Springer-Verlag, 1989: 164-174.

(77) Lehfeld H, Erzigkeit H. The SKT - A short cognitive performance test for assessing deficits of memory and attention. Int Psychogeriatr 1997; 9(1):115-121.

(78) Overall JE, Schaltenbrand R. The SKT neuropsychological test battery. J Geriatr Psychiatry Neurol 1992; 5:220-227.

Page 99: Rapport la maladie d’Alzheimer. technologique II. Examen ...

85

(79) Folstein NF, Folstein SE, McHugh PR. Mini-Mental State: A practical method for grading the cognitive state of patients for the clinician. J Psychiatr Res 1975; 12:189-198.

(80) Yesavage JA, Poulsen SL, Sheikh J, Tanke E. Rates of change of common measures of impairment in senile dementia of the Alzheimer's type. Psychopharmacol Bull 1988; 24:531-534.

(81) Tombaugh TN, McIntyre NJ. The Mini-Mental State Examination: A comprehensive review. J Am Geriatr Soc 1992; 40(9):922-935.

(82) Foreman MD. Reliability and validity of mental status questionnaires in elderly hospitalized patients. Nurs Res 1987; 36(4):216-220.

(83) Fillenbaum GG, Heyman A, Wilkinson WE, Haynes CS. Comparison of two screening tests in Alzheimer's disease: The correlation and reliability of the Mini-Mental State Examination and the Modified Blessed Test. Arch Neurol 1987; 44:924-927.

(84) Roth M, Tym EJ, Mountjoy CQ et al. CAMDEX - A standardized instrument for the diagnosis of mental disorder in the elderly with special reference to the early detection of dementia. Br J Psychiatry 1986; 149:698-709.

(85) Clark CM, Sheppard L, Fillenbaum GG et al. Variability in annual Mini-Mental State Examination score in patients with probable Alzheimer disease: A clinical perspective of data from the Consortium to Establish a Registry for Alzheimer’s Disease. Arch Neurol 1999; 56:857-862.

(86) Bowie P, Branton T, Holmes J. Should the Mini Mental State Examination be used to monitor dementia treatments? Lancet 1999; 354:1527-1528.

(87) Small BJ, Viitanen M, Winbald B, Baeckman L. Cognitive changes in very old persons with dementia: The influence of demographic, psychometric and biological variables. J Clin Exp Neuropsychol 1997; 19:245-260.

(88) Magni E, Binetti G, Cappa S et al. Effect of age and education on performance on the Mini-Mental State Examination in a healthy older population and during the course of Alzheimer's disease. J Am Geriatr Soc 1995; 43:942-943.

(89) McDowell I, Newell C. Measuring Health: A Guide to Rating Scales and Questionnaires. 2 ed. New York: Oxford University Press, 1996.

(90) Boller F, Becker JT, Holland AL et al. Predictors of decline in Alzheimer's disease. Cortex 1991; 27:9-17.

Page 100: Rapport la maladie d’Alzheimer. technologique II. Examen ...

86

(91) Kraemer HC, Taylor JL, Tinklenberg JR, Yesavage JA. The stages of Alzheimer's disease: A reappraisal. Dement Geriat Cogn Disord 1998; 9:299-308.

(92) Blessed G, Tomlinson BE, Roth M. The association between quantitative measures of dementia and of senile change in the cerebral grey matter of elderly subjects. Br J Psychiatry 1968; 114:797-811.

(93) Cole MG. Interrater reliability of the Blessed Dementia Scale. Can J Psychiatry 1990; 35(4):328-330.

(94) Morris JC, Edland S, Clark C et al. The Consortium to Establish a Registry for Alzheimer's Disease (CERAD). Part IV. Rates of cognitive change in the longitudinal assessment of probable Alzheimer's disease. Neurology 1993; 43:2457-2465.

(95) Davis PB, Morris JC, Grant E. Brief screening tests versus clinical staging in senile dementia of the Alzheimer type. J Am Geriatr Soc 1990; 38(2):129-135.

(96) Drachman DA, Swearer JM, Kane K et al. The Cognitive Assessment Screening Test (CAST) for dementia. J Geriatr Psychiatry Neurol 1996; 9(4):200-208.

(97) Flicker C. Neuropsychological evaluation of treatment effects in the elderly: A critique of tests in current use. Psychopharmacol Bull 1988; 24(4):535-556.

(98) Burke WJ, Roccaforte WH, Wengel SP et al. L-deprenyl in the treatment of mild dementia of the Alzheimer type: Results of a 15-month trial. J Am Geriatr Soc 1993; 41(11):1219-1225.

(99) Tariot PN, Goldstein B, Podgorski CA et al. Short-term administration of selegiline for mild-to-moderate dementia of the Alzheimer`s type. Am J Geriatr Psychiatry 1998; 6(2):145-154.

(100) Spreen O, Strauss E. A Compendium of Neuropsychological Tests: Administration, Norms, and Commentary. New York: Oxford University Press, 1991.

(101) Lezak MD. Neuropsychological Assessment. 2 ed. New York: Oxford University Press, 1983.

(102) Losascio JJ, Growdon JH, Corkin S. Cognitive test performance in detecting, staging, and tracking Alzheimer's disease. Arch Neurol 1995; 52:1087-1099.

(103) Morgan CD, Baade LE. Neuropsychological testing and assessment scales for dementia of the Alzheimer's type. Geriatr Psychiatry 1997; 20(1):25-43.

Page 101: Rapport la maladie d’Alzheimer. technologique II. Examen ...

87

(104) Zec RF. Neuropsychological functioning in Alzheimer disease. In: Parks RW, Zec RF, Wilson RS, editors. Neuropsychology of Alzheimer's Disease and Other Dementias. New York: Oxford University Press, 1993: 3-80.

(105) Kovar MG, Lawton MP. Functional disability: Activities and instrumental activities of daily living. In: Lawton MP, Teresi JA, editors. Focus on Assessment Techniques. New York: Springer, 1994: 57-75.

(106) World Health Organization. International Classification of Impairment, Disabilities and Handicaps. Geneva: World Health Organization, 1980.

(107) Gauthier S, Bodick N, Erzigkeit E et al. Activities of daily living as an outcome measure in clinical trials of dementia drugs - Position paper from the International Working Group on Harmonization of Dementia Drug guidelines. Alzheimer Dis Assoc Disord 1997; 11:6-7.

(108) Galasko D, Bennett D, Sano M et al. An inventory to assess activities of daily living for clinical trials in Alzheimer’s disease. Alzheimer Dis Assoc Disord 1997; 11(Suppl.2):S33-S39.

(109) Stern Y, Albert SM, Sano M et al. Assessing patient dependence in Alzheimer`s disease. J Gerontol A Biol Sci Med Sci 1994; 49:M216-M222.

(110) Beck CK, Frank LB. Assessing functioning and self-care abilities in Alzheimer disease. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 6):73-80.

(111) Morgan CD, Baade LE. Neuropsychological testing and assessment scales for dementia of the Alzheimer’s type. Geriatric Psychiatry 1997; 20(1):25-43.

(112) Kluger A, Ferris S. Scales for the assessment of Alzheimer's disease. Psychiatr Clin North Am 1991; 14(2):309-326.

(113) Gauthier S, Gélinas I, Gauthier L. Functional disability in Alzheimer’s Disease. Int Psychogeriatr 1997; 9(Suppl.1):163-165.

(114) Schwartz GE. Development and evaluation of the Geriatric Evaluation by Relatives Rating Instrument. Psychol Rep 1983; 53:479-488.

(115) DeVellis RF. Scale Development - Theory and Application. Newbury Park: Sage, 1991.

(116) Rozenbilds U, Goldney RD, Gilchrist PN. Assessment by relatives of elderly patients with psychiatric illness. Psychol Rep 1986; 58:795-801.

Page 102: Rapport la maladie d’Alzheimer. technologique II. Examen ...

88

(117) Lawton MP, Brody EM, ACSW. Assessment of older people: Self-maintaining and Instrumental Activities of Daily Living. Gerontologist 1969; 9:179-186.

(118) Lawton MP. Scales to measure competence in everyday activities. Psychopharmacol Bull 1988; 24(4):609-614.

(119) Albert MS. Brief assessment of cognitive function in the elderly. In: Lawton MP, Teresi JA, editors. Focus on Assessment Techniques. New York: Springer, 1994: 93-106.

(120) Mangoni A, Grassi MP, Frattola L et al. Effects of a MAO-B inhibitor in the treatment of Alzheimer disease. Eur Neurol 1991; 31(2):100-107.

(121) Sano M, Ernesto C, Thomas RG et al. A controlled trial of selegiline, alpha-tocopherol, or both as treatment for Alzheimer`s disease. N Engl J Med 1997; 336(17):1216-1222.

(122) Zerssen D von, Koeller D-M, Rey E-R. Die Befindlichkeitsskala (BfS), ein einfaches Instrument zur Objektivierung van Befindlichkeits-Störungen, insbesondere im Rahmen van Längsschnitt-Untersuchungen. Arzneimittelforschung 1970; 20:719-748.

(123) Juva K, Makela M, Erkinjuntti T et al. Functional assessment scales in detecting dementia. Age Ageing 1997; 26:393-400.

(124) Mayeux R, Stern Y, Spanton S. Heterogeneity in dementia of the Alzheimer type: Evidence of subgroups. Neurology 1985; 35:453-461.

(125) Stern Y, Hesdorffer D, Sano M, Mayeux R. Measurement and prediction of functional capacity in Alzheimer's disease. Neurology 1990; 40:8-14.

(126) Oswald WD, Fleischmann UM. Psychometrics in aging and dementia: Advances in geropsychological assessments. Arch Gerontol Geriatr 1985; 4:299-309.

(127) Oswald WD, Gunzelmann T. Functional rating scales and psychometric assessment in Alzheimer`s disease: Applications in pharmacological trials. Int Psychogeriatr 1992; 4(Suppl. 1):79-88.

(128) Becker RE, Colliver JA, Markwell SJ et al. Double-blind, placebo-controlled study of metrifonate, an acetylcholinesterase inhibitor, for Alzheimer`s disease. Alzheimer Dis Assoc Disord 1996; 10(3):124-131.

(129) Becker RE, Colliver JA, Markwell SJ et al. Effects of metrifonate on cognitive decline in Alzheimer`s disease: A double-blind, placebo-controlled, 6-month study. Alzheimer Dis Assoc Disord 1998; 12(1):54-57.

Page 103: Rapport la maladie d’Alzheimer. technologique II. Examen ...

89

(130) Teunisse S, Derik MMA, Van Crevel H. Assessing the severity of dementia: Patient and caregiver. Arch Neurol 1991; 48:274-277.

(131) Stern Y, Sano M, Mayeux R. Long-Term Administration of Oral Physostigmine in Alzheimer`s Disease. Neurology 1988; 38(12):1837-1841.

(132) Teunisse S, Derik MMA. Functional and global evaluations: The Interview for Deterioration in Daily Living Activities in Dementia: Agreement between primary and secondary caregivers. Int Psychogeriatr 1997; 9(Suppl. 1):155-162.

(133) Donaldson SW, Wagner CC, Gresham GE. A unified ADL evaluation form. Arch Phys Med Rehabilitation 1973; 54:175-179.

(134) Stern Y, Mayeux R, Sano M. Predictors of disease course in patients with probable Alzheimer`s disease. Neurology 1987; 37(1649):1653.

(135) Burns A, Rossor M, Hecker J et al. The effects of donepezil in Alzheimer's disease - Results from a multinational trial. Dement Geriatr Cogn Disord 1999; 10:237-244.

(136) Rogers SL, Farlow MR, Doody RS et al. A 24-week, double-blind, placebo-controlled trial of donepezil in patients with Alzheimer`s disease. Donepezil study group. Neurology 1998; 50(1):136-145.

(137) Rogers SL, Doody RS, Mohs RC. Donepezil improves cognition and global function in Alzheimer disease, a 15-week, double-blind, placebo-controlled study. Donepezil Study Group. Arch Intern Med 1998; 158(9):1021-1031.

(138) Rogers SL, Freidhoff LT. The efficacy and safety of donepezil in patients with Alzheimer`s disease: Results of a US multicentre, randomized, double-blind, placebo-controlled trial. The donepezil study group. Dementia 1996; 7(6):293-303.

(139) Whitehouse PJ, Orgogozo JM, Becker RE et al. Quality-of-life assessment in dementia drug development. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 3):56-60.

(140) Berg L, Montgomery R. Metrics of effectiveness within Alzheimer disease research and across diseases. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 6):181-183.

(141) Carr AJ, Thompson PW, Kirwan JR. Quality of life measures. Br J Rheumatol 1996; 35:275-281.

(142) Blau TH. Quality of life, social indicators and criteria of change. Prof Psychol 1977; 8:464-473.

Page 104: Rapport la maladie d’Alzheimer. technologique II. Examen ...

90

(143) DeJong R, Osterlund OW, Roy GW. Measurement of quality-of-life changes in patients with Alzheimer's disease. Clin Ther 1989; 11(4):545-54.

(144) Corey-Bloom J, Anand R, Veach J et al. A randomized trial evaluating the efficacy and safety of ENA 713 (rivastigmine tartrate), a new acetylcholinesterase inhibitor, in patients with mild to moderately severe Alzheimer`s disease. Int J Geriatr Psychiatry 1998; 1:55-65.

(145) Lawton MP. Assessing quality of life in Alzheimer disease research. Alzheimer Dis Assoc Disord 1997; 11(6):91-99.

(146) Dijkers M. Measuring quality of life: Methodological issues. Am J Phys Med Rehabil 1999; 78:286-300.

(147) Knopmann D, Gracon S. Observations on the short-term 'natural history' of probable Alzheimer's disease in a controlled clinical trial. Neurology 1994; 44(2):260-265.

(148) Gwyther LP. The perspective of the person with Alzheimer disease: Which outcomes matter in early to middle stages of dementia. Alzheimer Dis Assoc Disord 1997; 11(Suppl 6):18-24.

(149) Teri L, Larson EB, Reifler BV. Behavioral disturbance in dementia of the Alzheimer's type. J Am Geriatr Soc 1988; 36:1-6.

(150) Little JT, Molchan SE, Cantillon M, Sunderland T. Measurement of behavioral changes. In: Lawlor BA, editor. Behavioral Complications in Alzheimer’s Disease. Washington: American Psychiatric Press, Inc., 1995:103-127.

(151) Reisberg B, Borenstein J, Salob SP et al. Behavioral symptoms in Alzheimer's disease: Phenomenology and treatment. J Clin Psychiatry 1987; 48(5 Suppl.):9-15.

(152) Amaducci L, Angst J, Bech P et al. Consensus conference on the methodology of clinical trials of "nootropics", Munich, June 1989: Report of the consensus committee. Pharmacopsychiatry 1990; 23:171-175.

(153) Ad Hoc FDA Dementia Assessment Task Force. Antidementia drug assessment symposium. Neurobiol Aging 1991; 12:379-382.

(154) Cummings JL, Cyrus PA, Bieber F et al. Metrifonate treatment of the cognitive deficits of Alzheimer`s disease. Metrifonate Study Group. Neurology 1998; 50(5):1214-1221.

(155) Mackell JA, Ferris SH, Mohs R et al. Multicentre evaluation of new instruments for Alzheimer's disease clinical trials: Summary of results. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 2):S65-S69.

Page 105: Rapport la maladie d’Alzheimer. technologique II. Examen ...

91

(156) Marin DB, Green CR, Schmeidler J et al. Noncognitive disturbances in Alzheimer's disease: Frequency, longitudinal course, and relationship to cognitive symptoms. J Am Geriatr Soc 1997; 45(11):1331-1338.

(157) Cummings JL. The Neuropspychiatric Inventory: Assessing psychopathology in dementia patients. Neurology 1997; 48(Suppl. 6):S10-S16.

(158) Freedman M, Rewilak D, Cohen S et al. L-deprenyl in Alzheimer`s disease: Cognitive and behavioral effects. Neurology 1998; 50(3):660-668.

(159) Reisberg B, Ferris SH, Schneck MK et al. The relationship between psychiatric assessments and cognitive test measures in mild to moderately cognitively impaired elderly. Psychopharmacol Bull 1981; 17(1):99-103.

(160) Raskin A, Rae DS. Psychiatric symptoms in the elderly. Psychopharmacol Bull 1981; 17(1):96-99.

(161) Overall J, Gorham D. The Brief Psychiatric Rating Scale. Psychological Rep 1962; 10:799-812.

(162) Cummings JL, Masterman DL. Assessment of treatment-associated changes in behavior and cholinergic therapy of neuropsychiatric symptoms in Alzheimer's disease. J Clin Psychiatry 1998; 59(Suppl. 13):23-30.

(163) Mack JL, Patterson MB. The evaluation of behavioral disturbances in Alzheimer's disease: The utility of three rating scales. J Geriatr Psychiatry Neurol 1994; 7:101-117.

(164) Ownby RL, Koss E, Smyth KA, Whitehouse PJ. The factor structure of the Brief Psychiatric Rating Scale in Alzheimer's disease. J Geriatr Psychiatry Neurol 1994; 7:245-250.

(165) Patterson MB, Bolger JP. Assessment of behavioral symptoms in Alzheimer disease. Alzheimer Dis Assoc Disord 1994; 8(Suppl. 3):4-20.

(166) Ferris SH, Mackell JA. Behavioral outcomes in clinical trials for Alzheimer disease. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 4):S10-S15.

(167) Tariot PN, Mack JL, Patterson MB et al. The Behavior Rating Scale for Dementia of the Consortium to Establish a Registry for Alzheimer`s Disease: The Behavioral Pathology Committee of the Consortium to Establish a Registry for Alzheimer`s Disease. Am J Psychiatry 1995; 152:1349-1359.

(168) Tariot PN. CERAD Behavior Rating Scale for Dementia. Int Psychogeriatr 1996; 8(Suppl. 3):514-518.

Page 106: Rapport la maladie d’Alzheimer. technologique II. Examen ...

92

(169) Patterson M, Thomas R, Mack J et al. A longitudinal study of behavioral pathology across five levels of dementia severity in Alzheimer's disease: The CERAD Behavior Rating Scale for Dementia. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 2):S40-S44.

(170) Jacobs MR, Strauss ME, Patterson MB, Mack JL. Characterization of depression in Alzheimer's disease by the CERAD Behavior Rating Scale for Dementia (BRSD). Am J Geriatr Psychiatry 1998; 6:53-58.

(171) Cummings JL, Mega MS, Gray K et al. The Neuropsychiatric Inventory: Comprehensive assessment in psychopathology in dementia. Neurology 1994; 44:2308-2314.

(172) Raskin A, Crook T. Relative's Assessment of Global Symptomatology. Psychopharmacol Bull 1988; 24(4):759-763.

(173) Sunderland T, Hill JL, Lawlor BA. NIMH Dementia Mood Assessment Scale (DMAS). Psychopharmacol Bull 1988; 24(4):747-753.

(174) Baumgarten M, Becker R, Gauthier S. Validity and reliability of the Dementia Behavior Disturbance Scale. J Am Geriatr Soc 1990; 38(3):221-226.

(175) Alexopoulos GS, Abrams RC, Young RC, Shamoian CA. Cornell Scale for Depression in Dementia. Biol Psychiatry 1988; 23:271-284.

(176) Mack JL, Patterson MB. The evaluation of behavioral disturbances in Alzheimer's disease: The utility of three rating scales. J Geriatr Psychiatry Neurol 1994; 7:101-117.

(177) Gilley DW. Behavioral and affective disorders in Alzheimer's disease. In: Parks RW, Zec RF, Wilson RS, editors. Neuropsychology of Alzheimer's Disease and Other Dementias. New York: Oxford University Press, 1993: 112-137.

(178) Burke WJ. Use of the Geriatric Depression Scale in dementia of the Alzheimer type. J Am Geriatr Soc 1989; 37:856-860.

(179) Teri L, Borson S, Kiyak HA, Yamagishi M. Behavioral disturbance, cognitive dysfunction, and functional skill. Prevalence and relationship in Alzheimer's disease. J Am Geriatr Soc 1989; 37:109-116.

(180) Foster NL, Petersen RC, Gracon SI, Lewis K. An enriched-population, double-blind, placebo-controlled, crossover study of tacrine and lecithin in Alzheimer`s disease. The tacrine 970-6 study group. Dementia 1996; 7(5):260-266.

(181) Morris JC, Cyrus PA, Orazem J et al. Metrifonate benefits cognitive, behavioral, and global function in patients with Alzheimer`s disease. Neurology 1998; 50(5):1222-1230.

Page 107: Rapport la maladie d’Alzheimer. technologique II. Examen ...

93

(182) Rockwood K, Beattie BL, Eastwood MR et al. A randomized, controlled trial of linopirdine in the treatment of Alzheimer`s disease. Can J Neurol Sci 1997; 24(2):140-145.

(183) Le Bars PL, Katz MM, Berman N et al. A placebo-controlled, double-blind, randomized trial of an extract of ginkgo biloba for dementia. North American EGb study group. JAMA 1997; 278(16):1327-1332.

(184) Jann MW, Cyrus PA, Eisner LS et al. Efficacy and safety of a loading-dose regimen versus a no-loading dose regimen of metrifonate in the symptomatic treatment of Alzheimer's disease: A randomized, double-masked, placebo-controlled trial. Metrifonate Study Group. Clin Ther 1999; 21(1):88-102.

(185) Raskind MA, Cyrus PA, Ruzicka BB, Gulanski BI. The effects of metrifonate on the cognitive, behavioral, and functional performance of Alzheimer's disease patients. Metrifonate Study Group. J Clin Psychiatry 1999; 60(5):318-325.

(186) Lawlor BA, Aisen PS, Green C et al. Selegiline in the treatment of behavioral disturbance in Alzheimer`s disease. Int J Geriatric Psychiatry 1997; 12:319-322.

(187) Mohs RC, Knopman D, Petersen RC et al. Development of cognitive instruments for use in clinical trials of antidementia drugs: Additions to the Alzheimer's Disease Assessment Scale that broaden its scope. The Alzheimer's Disease Cooperative Study. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 2):S13-S21.

(188) Mohs RC, Marin DB, Green CR, Davis KL. The Alzheimer's Disease Assessment Scale: Modifications that can enhance its use in future clinical trials. In: Becker RE, Giacobini E et al., editors. Alzheimer Disease: From Molecular Biology to Therapy. Boston: Birkhauser, 1996: 407-411.

Page 108: Rapport la maladie d’Alzheimer. technologique II. Examen ...

94

8 BIBLIOGRAPHIE PAR AUTEURS

Ad Hoc FDA Dementia Assessment Task Force. Antidementia drug assessment symposium. Neurobiol Aging 1991; 12:379-382.

Albert MS. Brief assessment of cognitive function in the elderly. In: Lawton MP, Teresi JA, editors. Focus on Assessment Techniques. New York: Springer, 1994: 93-106.

Albert MS. Assessment of cognitive dysfunction. In: Albert MS, Moss MB, editors. Geriatric Neuropsychology. New York: The Guilford Press, 1988: 57-81.

Albert MS. Cognitive function. In: Albert MS, Moss MB, editors. Geriatric Neuropsychology. New York: The Guilford Press, 1988: 33-53.

Alexopoulos GS, Abrams RC, Young RC, Shamoian CA. Cornell Scale for Depression in Dementia. Biol Psychiatry 1988; 23:271-284.

Amaducci L, Angst J, Bech P, Benkert O, Bruinvels J, Engel RR et al. Consensus conference on the methodology of clinical trials of "nootropics", Munich, June 1989: Report of the consensus committee. Pharmacopsychiatry 1990; 23:171-175.

Armitage P, Berry G. Statistical Methods in Medical Research. 2 ed. Oxford: Blackwell Scientific Publications, 1987.

Baumgarten M, Becker R, Gauthier S. Validity and reliability of the Dementia Behavior Disturbance Scale. J Am Geriatr Soc 1990; 38(3):221-226.

Beck CK, Frank LB. Assessing functioning and self-care abilities in Alzheimer disease. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 6):73-80.

Becker RE, Colliver JA, Markwell SJ et al. Double-blind, placebo-controlled study of metrifonate, an acetylcholinesterase inhibitor, for Alzheimer`s disease. Alzheimer Dis Assoc Disord 1996; 10(3):124-131.

Becker RE, Colliver JA, Markwell SJ et al. Effects of metrifonate on cognitive decline in Alzheimer`s disease: A double-blind, placebo-controlled, 6-month study. Alzheimer Dis Assoc Disord 1998; 12(1):54-57.

Beneke M, Rasmus W. "Clinical Global Impressions" (ECDEU): Some critical comments. Pharmacopsychiatry 1992; 25:171-176.

Berg L, Miller JP, Storandt M et al. Mild senile dementia of the Alzheimer type: 2. Longitudinal assessment. Ann Neurol 1988; 23(5):477-484.

Berg L, Montgomery R. Metrics of effectiveness within Alzheimer disease research and across diseases. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 6):181-183.

Blau TH. Quality of life, social indicators and criteria of change. Prof Psychol 1977; 8:464-473.

Page 109: Rapport la maladie d’Alzheimer. technologique II. Examen ...

95

Blessed G, Tomlinson BE, Roth M. The association between quantitative measures of dementia and of senile change in the cerebral grey matter of elderly subjects. Br J Psychiatry 1968; 114:797-811.

Boller F, Becker JT, Holland AL et al. Predictors of decline in Alzheimer's disease. Cortex 1991; 27:9-17.

Boothby H, Mann AH, Barker A. Factors determining interrater agreement with rating global change in dementia: The CIBIC-plus. Int J Geriatr Psychiatry 1995; 10(12):1037-1045.

Bowie P, Branton T, Holmes J. Should the Mini Mental State Examination be used to monitor dementia treatments? Lancet 1999; 354:1527-1528.

Burch EA, Andrews SR. Comparison of two cognitive rating scales in mentally ill patients. Int J Psychiatry Medicine 1987; 17(2):193-200.

Burke WJ. Use of the Geriatric Depression Scale in dementia of the Alzheimer type. J Am Geriatr Soc 1989; 37:856-860.

Burke WJ, Miller JP, Rubin EH et al. Reliability of the Washington University Clinical Dementia Rating. Arch Neurol 1988; 45:31-32.

Burke WJ, Roccaforte WH, Wengel SP et al. L-deprenyl in the treatment of mild dementia of the Alzheimer type: Results of a 15-month trial. J Am Geriatr Soc 1993; 41(11):1219-1225.

Burns A, Rossor M, Hecker J et al. The effects of donepezil in Alzheimer's disease - Results from a multinational trial. Dement Geriatr Cogn Disord 1999; 10:237-244.

Carr AJ, Thompson PW, Kirwan JR. Quality of life measures. Br J Rheumatol 1996; 35:275-281.

Clark CM, Sheppard L, Fillenbaum GG et al. Variability in annual Mini-Mental State Examination score in patients with probable Alzheimer disease: A clinical perspective of data from the Consortium to Establish a Registry for Alzheimer’s Disease. Arch Neurol 1999; 56:857-862.

Claus JJ, Teunisse S, Walstra GJM, van Gool WA. Determinants of global clinical change assessment in patients with early Alzheimer's disease. Dement Geriatr Cogn Disord 1998; 9(3):157-163.

Cohen-Mansfield J, Reisberg B, Bonnema J et al. Staging methods for the assessment of dementia: Perspectives. J Clin Psychiatry 1996; 57(5):190-198.

Cole MG. Interrater reliability of the Blessed Dementia Scale. Can J Psychiatry 1990; 35(4):328-330.

Corey-Bloom J, Anand R, Veach J et al. A randomized trial evaluating the efficacy and safety of ENA 713 (rivastigmine tartrate), a new acetylcholinesterase inhibitor, in patients with mild to moderately severe Alzheimer`s disease. Int J Geriatr Psychiatry 1998; 1:55-65.

Page 110: Rapport la maladie d’Alzheimer. technologique II. Examen ...

96

Crocker L, Algina J. Introduction to Classical and Modern Test Theory. Orlando: Harcourt Brace Jovanovich, 1986.

Cummings JL, Cyrus PA, Bieber F et al. Metrifonate treatment of the cognitive deficits of Alzheimer`s disease. Metrifonate Study Group. Neurology 1998; 50(5):1214-1221.

Cummings JL, Masterman DL. Assessment of treatment-associated changes in behavior and cholinergic therapy of neuropsychiatric symptoms in Alzheimer's disease. J Clin Psychiatry 1998; 59 (Suppl. 13):23-30.

Cummings JL. The Neuropspychiatric Inventory: Assessing psychopathology in dementia patients. Neurology 1997; 48 (Suppl. 6):S10-S16.

Cummings JL, Mega MS, Gray K et al. The Neuropsychiatric Inventory: Comprehensive assessment in psychopathology in dementia. Neurology 1994; 44:2308-2314.

Dahlke F, Lohaus A, Gutzmann H. Reliability and clinical concepts underlying global judgments in dementia: Implications for clinical research. Psychopharmacol Bull 1992; 28(4):425-432.

Davis PB, Morris JC, Grant E. Brief screening tests versus clinical staging in senile dementia of the Alzheimer type. J Am Geriatr Soc 1990; 38(2):129-135.

DeJong R, Osterlund OW, Roy GW. Measurement of quality-of-life changes in patients with Alzheimer’s disease. Clin Ther 1989; 11(4):545-54.

DeVellis RF. Scale Development - Theory and Application. Newbury Park: Sage, 1991.

Dijkers M. Measuring quality of life: Methodological issues. Am J Phys Med Rehabil 1999; 78:286-300.

Donaldson SW, Wagner CC, Gresham GE. A unified ADL evaluation form. Arch Phys Med Rehabilitation 1973; 54:175-179.

Dooneief G, Marder K, Tang M-X et al. The clinical dementia rating scale: Community-based validation of 'profound' and 'terminal' stages. Neurology 1996; 46(6):1746-1749.

Doraiswamy PM, Bieber F, Kaiser L et al. The Alzheimer's Disease Assessment Scale: Patterns and predictors of baseline cognitive performance in multicenter Alzheimer's disease trials. Neurology 1997; 48(6):1511-1517.

Doraiswamy PM, Krishen A, Stallone F et al. Cognitive performance on the Alzheimer's Disease Assessment Scale: Effect of education. Neurology 1995; 45:1980-1984.

Drachman DA, Swearer JM, Kane K et al. The Cognitive Assessment Screening Test (CAST) for dementia. J Geriatr Psychiatry Neurol 1996; 9(4):200-208.

Eisdorfer C, Cohen D, Paveza GJ et al. An empirical evaluation of the Global Deterioration Scale for staging Alzheimer's disease. Am J Psychiatry 1992; 149(2):190-194.

Page 111: Rapport la maladie d’Alzheimer. technologique II. Examen ...

97

Erzigkeit H. The SKT - A short cognitive performance test as an instrument for the assessment of clinical efficacy of cognition enhancers. In: Bergener M, Reisberg B, editors. Diagnosis and Treatment of Senile Dementia. Berlin Heidelberg: Springer-Verlag, 1989: 164-174.

Ferris SH, Mackell JA. Behavioral outcomes in clinical trials for Alzheimer disease. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 4):S10-S15.

Ferris SH, Mackell JA, Mohs R et al. A multicentre evaluation of new treatment efficacy instruments for Alzheimer's disease clinical trials: Overview and general results. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 2):S1-S12.

Fillenbaum GG, Heyman A, Wilkinson WE, Haynes CS. Comparison of two screening tests in Alzheimer's disease: The correlation and reliability of the Mini-Mental State Examination and the Modified Blessed Test. Arch Neurol 1987; 44:924-927.

Flicker C. Neuropsychological evaluation of treatment effects in the elderly: A critique of tests in current use. Psychopharmacol Bull 1988; 24(4):535-556.

Folnegovic-Smalc V, Mimica N, Makaric G et al. Rating scales and computed tomography in multi-infarct dementia. Neurologia Croatica 1992; 41(4):183-190.

Folstein NF, Folstein SE, McHugh PR. Mini-Mental State: A practical method for grading the cognitive state of patients for the clinician. J Psychiatr Res 1975; 12:189-198.

Foreman MD. Reliability and validity of mental status questionnaires in elderly hospitalized patients. Nurs Res 1987; 36(4):216-220.

Foster JR, Sclan S, Welkowitz J et al. Psychiatric assessment in medical long-term care facilities: Reliability of commonly used rating scales. Int J Geriatr Psychiatry 1988; 3(3):229-233.

Foster NL, Petersen RC, Gracon SI, Lewis K. An enriched-population, double-blind, placebo-controlled, crossover study of tacrine and lecithin in Alzheimer`s disease. The tacrine 970-6 study group. Dementia 1996; 7(5):260-266.

Freedman M, Rewilak D, Cohen S et al. L-deprenyl in Alzheimer`s disease: Cognitive and behavioral effects. Neurology 1998; 50(3):660-668.

Galasko D, Bennett D, Sano M et al. An inventory to assess activities of daily living for clinical trials in Alzheimer’s disease. Alzheimer Dis Assoc Disord 1997; 11(Suppl.2):S33-S39.

Gauthier S, Bodick N, Erzigkeit E et al. Activities of daily living as an outcome measure in clinical trials of dementia drugs - Position paper from the International Working Group on Harmonization of Dementia Drug guidelines. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 3):6-7.

Gauthier S, Gélinas I, Gauthier L. Functional disability in Alzheimer’s Disease. Int Psychogeriatr 1997; 9(Suppl.1):163-165.

Page 112: Rapport la maladie d’Alzheimer. technologique II. Examen ...

98

Gilley DW. Behavioral and affective disorders in Alzheimer's disease. In: Parks RW, Zec RF, Wilson RS, editors. Neuropsychology of Alzheimer's Disease and Other Dementias. New York: Oxford University Press, 1993: 112-137.

Gottfries CG, Brane G, Gullberg B, Steen G. A new rating scale for dementia syndromes. Arch Gerontol Geriatr 1982; 1:311-330.

Gottlieb GL, Gur RE, Gur RC. Reliability of psychiatric scales in patients with dementia of the Alzheimer type. Am J Psychiatry 1988; 145(7):857-860.

Guy W. ECDEU Assessment Manual for Psychopharmacology, Revised. Rockville, MD: DHEW, 1976.

Guyatt G, Walter S, Norman G. Measuring change over time: Assessing the usefulness of evaluative instruments. J Chron Dis 1987; 40(2):171-178.

Gwyther LP. The perspective of the person with Alzheimer disease: Which outcomes matter in early to middle stages of dementia. Alzheimer Dis Assoc Disord 1997; 11(Suppl 6):18-24.

Heun R, Papassotiropoulos A, Jennssen F. The validity of psychometric instruments for detection of dementia in the elderly general population. Int J Geriatr Psychiatry 1998; 13(6):363-380.

Hughes CP, Berg L, Danziger WL et al. A new clinical scale for the staging of dementia. Brit J Psychiat 1982; 140:566-572.

Huppert FA, Jorm AF, Brayne C, Girling DM. Psychometric properties of the CAMCOG and its efficacy in the diagnosis of dementia. Aging Neuropsychology & Cognition 1996; 3(3):201-214.

Ihl R, Frolich L, Dierks T, Martin EM, Maurer K. Differential validity of psychometric tests in dementia of the Alzheimer type. Psychiatry Res 1992; 44:93-106.

Jacobs MR, Strauss ME, Patterson MB, Mack JL. Characterization of depression in Alzheimer's disease by the CERAD Behavior Rating Scale for Dementia (BRSD). Am J Geriatr Psychiatry 1998; 6:53-58.

Jann MW, Cyrus PA, Eisner LS et al. Efficacy and safety of a loading-dose regimen versus a no-loading dose regimen of metrifonate in the symptomatic treatment of Alzheimer's disease: A randomized, double-masked, placebo-controlled trial. Metrifonate Study Group. Clin Ther 1999; 21(1):88-102.

Jarvik LF, Berg L, Bartus R et al. Clinical drug trials in Alzheimer disease. What are some of the issues? Alzheimer Dis Assoc Disord 1990; 4(4):193-202.

Jensen E, Dehlin O, Gustafson L. A comparison between three psychogeriatric rating scales. Int J Geriatr Psychiatry 1993; 8(3):215-229.

Juva K, Makela M, Erkinjuntti T et al. Functional assessment scales in detecting dementia. Age Ageing 1997; 26:393-400.

Page 113: Rapport la maladie d’Alzheimer. technologique II. Examen ...

99

Juva K, Sulkava R, Erkinjuntti T et al. Staging the severity of dementia: comparison of clinical (CDR, DSM-III-R), functional (ADL, IADL) and cognitive (MMSE) scales. Acta Neurol Scand 1994; 90:293-298.

Kim YS, Nibbelink DW, Overall JE. Factor structure and scoring of the SKT test battery. J Clin Psychol 1993; 49(1):61-71.

Kim YS, Nibbelink DW, Overall JE. Factor structure and reliability of the Alzheimer`s Disease Assessment Scale in a multicenter trial with linopirdine. J Geriatr Psychiatry Neurol 1994; 7(2):74-83.

Kirshner B, Guyatt G. A methodological framework for assessing health indices. J Chron Dis 1985; 38(1):27-36.

Kluger A, Ferris S. Scales for the assessment of Alzheimer's disease. Psychiatr Clin North Am 1991; 14(2):309-326.

Knopman DS, Knapp MJ, Gracon SI et al. The Clinician Interview-Based Impression (CIBI): A clinician's global change rating scale in Alzheimer`s disease. Neurology 1994; 44:2315-2321.

Knopmann D, Gracon S. Observations on the short-term 'natural history' of probable Alzheimer’s disease in a controlled clinical trial. Neurology 1994; 44(2):260-265.

Korner A, Lauritzen L, Bech P. A psychometric evaluation of dementia rating scales. European Psychiatry 1996; 11(4):185-191.

Kovar MG, Lawton MP. Functional disability: Activities and instrumental activities of daily living. In: Lawton MP, Teresi JA, editors. Focus on Assessment Techniques. New York: Springer, 1994: 57-75.

Kraemer HC, Taylor JL, Tinklenberg JR, Yesavage JA. The stages of Alzheimer's disease: A reappraisal. Dement Geriat Cogn Disord 1998; 9:299-308.

Kramer-Ginsberg E, Mohs RC, Aryan M et al. Clinical predictors of course of Alzheimer`s patients in a longitudinal study: A preliminary report. Psychopharmacol Bull 1988; 24:458-462.

Lawlor BA, Aisen PS, Green C et al. Selegiline in the treatment of behavioral disturbance in Alzheimer`s disease. Int J Geriatric Psychiatry 1997; 12:319-322.

Lawton MP. Assessing quality of life in Alzheimer disease research. Alzheimer Dis Assoc Disord 1997; 11(6):91-99.

Lawton MP, Brody EM, ACSW. Assessment of older people: Self-maintaining and Instrumental Activities of Daily Living. Gerontologist 1969; 9:179-186.

Lawton MP. Scales to measure competence in everyday activities. Psychopharmacol Bull 1988; 24(4):609-614.

Page 114: Rapport la maladie d’Alzheimer. technologique II. Examen ...

100

Le Bars PL, Katz MM, Berman N et al. A placebo-controlled, double-blind, randomized trial of an extract of ginkgo biloba for dementia. North American EGb study group. JAMA 1997; 278(16):1327-1332.

Leber P. Guidelines for the Clinical Evaluation of Antidementia Drugs. First Draft. Rockville, MD: US Food and Drug Administration, 1990.

Leber PD. FDA Letter to Sponsors Recommending Use of CIBIC in Dementia Trials. 1991.

Lehfeld H, Erzigkeit H. The SKT - A short cognitive performance test for assessing deficits of memory and attention. Int Psychogeriatr 1997; 9(1):115-121.

Lehfeld H, Rudinger G, Rietz C, Heinrich C, Wied V, Fornazzari L et al. Evidence of the cross-cultural stability of the factor structure of the SKT short test for assessing deficits of memory and attention. Int Psychogeriatr 1997; 9(2):139-153.

Lezak MD. Neuropsychological Assessment. 2 ed. New York: Oxford University Press, 1983.

Little JT, Molchan SE, Cantillon M, Sunderland T. Measurement of behavioral changes. In: Lawlor BA, editor. Behavioral Complications in Alzheimer’s Disease. Washington: American Psychiatric Press, Inc., 1995:103-127.

Losascio JJ, Growdon JH, Corkin S. Cognitive test performance in detecting, staging, and tracking Alzheimer's disease. Arch Neurol 1995; 52:1087-1099.

Mack JL, Patterson MB. The evaluation of behavioral disturbances in Alzheimer's disease: The utility of three rating scales. J Geriatr Psychiatry Neurol 1994; 7:101-117.

Mackell JA, Ferris SH, Mohs R et al. Multicentre evaluation of new instruments for Alzheimer's disease clinical trials: Summary of results. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 2):S65-S69.

Magni E, Binetti G, Cappa S et al. Effect of age and education on performance on the Mini-Mental State Examination in a healthy older population and during the course of Alzheimer's disease. J Am Geriatr Soc 1995; 43:942-943.

Mangoni A, Grassi MP, Frattola L et al. Effects of a MAO-B inhibitor in the treatment of Alzheimer disease. Eur Neurol 1991; 31(2):100-107.

Marcusson J, Rother M, Kittner B et al. A 12-month, randomized, placebo-controlled trial of propentofylline (HWA 285) in patients with dementia according to DSM III-R. The European Propentofylline Study Group. Dement Geriatr Cogn Disord 1997; 8(5):320-328.

Marin DB, Green CR, Schmeidler J et al. Noncognitive disturbances in Alzheimer's disease: Frequency, longitudinal course, and relationship to cognitive symptoms. J Am Geriatr Soc 1997; 45(11):1331-1338.

Mattes JA. Can the sensitivity of the Alzheimer's Disease Assessment Scale be increased? Am J Geriatr Psychiatry 1997; 5(3):258-260.

Page 115: Rapport la maladie d’Alzheimer. technologique II. Examen ...

101

May L. The challenge of measuring change: Responsiveness of outcome measurements. Can J Rehab 1997; 10(1):15-24.

Mayeux R, Stern Y, Spanton S. Heterogeneity in dementia of the Alzheimer type: Evidence of subgroups. Neurology 1985; 35:453-461.

McDowell I, Newell C. Measuring Health: A Guide to Rating Scales and Questionnaires. 2 ed. New York: Oxford University Press, 1996.

McKhann G, Drachman D, Folstein M, et al. Clinical diagnosis of Alzheimer's disease: Report of the NINCDS-ADRDA work group under the auspices of Department of Health and Human Services Task Force on Alzheimer's Disease. Neurology 1984; 34:939-944.

Messick S. Test validity and the ethics of assessment. Am Psychol 1980; 35:1012-1027.

Meya U, Raschig A, Siegfried K, Wannenmacher W. Primary outcome measures in dementia drug trials: Modified clinical interview-based impression of change (CIBIC-M). International Journal of Methods in Psychiatric Research 1994; 4(3):189-192.

Mohr E, Feldman H, Gauthier S. Canadian guidelines for the development of antidementia therapies: A conceptual summary. Can J Neurol Sci 1995; 22:62-71.

Mohs RC, Marin DB, Green CR, Davis KL. The Alzheimer's Disease Assessment Scale: Modifications that can enhance its use in future clinical trials. In: Becker RE, Giacobini E et al., editors. Alzheimer Disease: From Molecular Biology to Therapy. Boston: Birkhauser, 1996: 407-411.

Mohs RC. Methodological aspects of evaluating effects of AD progression. Neurobiol Aging 1995; 16(6):867-870.

Mohs RC, Cohen L. Alzheimer's Disease Assessment Scale (ADAS). Psychopharmacol Bull 1988; 24(4):627-628.

Mohs RC, Knopman D, Petersen RC et al. Development of cognitive instruments for use in clinical trials of antidementia drugs: Additions to the Alzheimer's Disease Assessment Scale that broaden its scope. The Alzheimer's Disease Cooperative Study. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 2):S13-S21.

Mohs RC, Rosen WG, Davis KL. The Alzheimer's Disease Assessment Scale: An instrument for assessing treatment efficacy. Psychopharmacol Bull 1983; 19(3):448-450.

Morgan CD, Baade LE. Neuropsychological testing and assessment scales for dementia of the Alzheimer's type. Geriatr Psychiatry 1997; 20(1):25-43.

Morris JC. The Clinical Dementia Rating (CDR): Current version and scoring rules. Neurology 1993; 43:2412-2414.

Morris JC, Cyrus PA, Orazem J et al. Metrifonate benefits cognitive, behavioral, and global function in patients with Alzheimer`s disease. Neurology 1998; 50(5):1222-1230.

Page 116: Rapport la maladie d’Alzheimer. technologique II. Examen ...

102

Morris JC, Ernesto C, Schafer K et al. Clinical Dementia Rating training and reliability in multicenter studies: The Alzheimer's Disease Cooperative Study experience. Neurology 1997; 48(6):1508-1510.

Morris JC, Edland S, Clark C, Galasko D, Koss E, Mohs R et al. The Consortium to Establish a Registry for Alzheimer's Disease (CERAD). Part IV. Rates of cognitive change in the longitudinal assessment of probable Alzheimer's disease. Neurology 1993; 43:2457-2465.

Nyth AL, BrDne G. Principal component analysis of the GBS scale. Dementia 1992; 3(4):193-199.

Olafsson K, Korner A, Bille A et al. The GBS scale in multi-infarct dementia and senile dementia of Alzheimer type. Acta Psychiatr Scand 1989; 79(1):94-97.

Olin JT, Schneider LS. Assessing response to tacrine using the factor analytic structure of the Alzheimer's Disease Assessment Scale (ADAS)-cognitive subscale. Int J Geriatr Psychiatry 1995; 10:753-756.

Oswald WD, Fleischmann UM. Psychometrics in aging and dementia: Advances in geropsychological assessments. Arch Gerontol Geriatr 1985; 4:299-309.

Oswald WD, Gunzelmann T. Functional rating scales and psychometric assessment in Alzheimer`s disease: Applications in pharmacological trials. Int Psychogeriatr 1992; 4(Suppl. 1):79-88.

Overall J, Gorham D. The Brief Psychiatric Rating Scale. Psychological Rep 1962; 10:799-812.

Overall JE, Schaltenbrand R. The SKT neuropsychological test battery. J Geriatr Psychiatry Neurol 1992; 5:220-227.

Ownby RL, Koss E, Smyth KA, Whitehouse PJ. The factor structure of the Brief Psychiatric Rating Scale in Alzheimer's disease. J Geriatr Psychiatry Neurol 1994; 7:245-250.

Parnetti L, Brooks JO, Pippi M et al. Diagnosing Alzheimer's disease in very elderly patients: Relevance of some functional and psychobehavioral aspects assessed by the Gottfries-Brane-Steen Rating Scale for Dementia. Gerontology 1997; 43(6):335-342.

Patterson M, Thomas R, Mack J et al. A longitudinal study of behavioral pathology across five levels of dementia severity in Alzheimer's disease: The CERAD Behavior Rating Scale for Dementia. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 2):S40-S44.

Patterson MB, Bolger JP. Assessment of behavioral symptoms in Alzheimer disease. Alzheimer Dis Assoc Disord 1994; 8(Suppl. 3):4-20.

Quinn JF, Benson F, Clark C et al. Outcome measures in dementia trials-video CIBIC validity and reliability [abstract]. Neurology 48, A233. 1997.

Raskin A, Crook T. Relative's Assessment of Global Symptomatology. Psychopharmacol Bull 1988; 24(4):759-763.

Raskin A, Rae DS. Psychiatric symptoms in the elderly. Psychopharmacol Bull 1981; 17(1):96-99.

Page 117: Rapport la maladie d’Alzheimer. technologique II. Examen ...

103

Raskind MA, Cyrus PA, Ruzicka BB, Gulanski BI. The effects of metrifonate on the cognitive, behavioral, and functional performance of Alzheimer's disease patients. Metrifonate Study Group. J Clin Psychiatry 1999; 60(5):318-325.

Reisberg B, Ferris SH. Brief Cognitive Rating Scale (BCRS). Psychopharmacol Bull 1988; 24:629-636.

Reisberg B, Ferris SH, de Leon MJ, Crook T. The global deterioration scale for assessment of primary degenerative dementia. Am J Psychiatry 1982; 139(9):1136-1139.

Reisberg B, Ferris SH, de Leon MJ, Crook T. Global Deterioration Scale (GDS). Psychopharmacol Bull 1988; 24(4):661-663.

Reisberg B, Ferris SH, Schneck MK et al. The relationship between psychiatric assessments and cognitive test measures in mild to moderately cognitively impaired elderly. Psychopharmacol Bull 1981; 17(1):99-103.

Reisberg B, Borenstein J, Salob SP et al. Behavioral symptoms in Alzheimer's disease: Phenomenology and treatment. J Clin Psychiatry 1987; 48(5 Suppl.):9-15.

Reisberg B, Schneck MK, Ferris SH et al. The Brief Cognitive Rating Scale (BCRS): Findings in primary degenerative dementia (PDD). Psychopharmacol Bull 1983; 19(1):47-50.

Ritchie K. The screening of cognitive impairment in the elderly: A critical review of current methods. J Clin Epidemiol 1988; 41(7):635-643.

Rockwood K, Beattie BL, Eastwood MR et al. A randomized, controlled trial of linopirdine in the treatment of Alzheimer`s disease. Can J Neurol Sci 1997; 24(2):140-145.

Rockwood K, Morris JC. Global staging measures in dementia. In: Gauthier S, editor. Clinical Management and Diagnosis of Alzheimer's Disease. London: Martin Dunitz Ltd., 1996: 141-153.

Rogers SL, Doody RS, Mohs RC. Donepezil improves cognition and global function in Alzheimer disease, a 15-week, double-blind, placebo-controlled study. Donepezil Study Group. Arch Intern Med 1998; 158(9):1021-1031.

Rogers SL, Farlow MR, Doody RS et al. A 24-week, double-blind, placebo-controlled trial of donepezil in patients with Alzheimer`s disease. Donepezil study group. Neurology 1998; 50(1):136-145.

Rogers SL, Freidhoff LT. The efficacy and safety of donepezil in patients with Alzheimer`s disease: Results of a US multicentre, randomized, double-blind, placebo-controlled trial. The donepezil study group. Dementia 1996; 7(6):293-303.

Rosen WG, Mohs RC, Davis K. A new rating scale for Alzheimer's disease. Am J Psychiatry 1984; 141:1356-1364.

Page 118: Rapport la maladie d’Alzheimer. technologique II. Examen ...

104

Roth M, Tym EJ, Mountjoy CQ, Huppert FA, Hendrie H, Verma S et al. CAMDEX - A standardized instrument for the diagnosis of mental disorder in the elderly with special reference to the early detection of dementia. Br J Psychiatry 1986; 149:698-709.

Rozenbilds U, Goldney RD, Gilchrist PN. Assessment by relatives of elderly patients with psychiatric illness. Psychol Rep 1986; 58:795-801.

Rubin EH, Morris JC, Grant EA, Vendegna T. Very mild senile dementia of the Alzheimer type. Arch Neurol 1989; 46:379-382.

Sano M, Ernesto C, Thomas RG et al. A controlled trial of selegiline, alpha-tocopherol, or both as treatment for Alzheimer`s disease. N Engl J Med 1997; 336(17):1216-1222.

Schneider LS, Olin JT, Doody RS et al. Validity and reliability of the Alzheimer's Disease Cooperative Study-Clinical Global Impression of Change (ADCS-CGIC). In: Becker R, Giacobini E, editors. Alzheimer Disease: From Molecular Biology to Therapy. Boston: Birkhauser, 1996: 425-429.

Schneider LS, Olin JT. Clinical global impressions in Alzheimer's clinical trials. Int Psychogeriatr 1996; 8(2):277-88; discussion 288-9.

Schwartz GE. Development and evaluation of the Geriatric Evaluation by Relatives Rating Instrument. Psychol Rep 1983; 53:479-488.

Small BJ, Viitanen M, Winbald B, Baeckman L. Cognitive changes in very old persons with dementia: The influence of demographic, psychometric and biological variables. J Clin Exp Neuropsychol 1997; 19:245-260.

Spreen O, Strauss E. A Compendium of Neuropsychological Tests: Administration, Norms, and Commentary. New York: Oxford University Press, 1991.

Standish TI, Molloy DW, Bedard M, Layne EC, Murray EA, Strang D. Improved reliability of the Standardized Alzheimer's Disease Assessment Scale (SADAS) compared with the Alzheimer's Disease Assessment Scale (ADAS). J Am Geriatr Soc 1996; 44(6):712-716.

Stern RG, Mohs RC, Davidson M et al. A longitudinal study of Alzheimer`s disease: Measurement, rate and predictors of cognitive deterioration. Am J Psychiatry 1994; 151:390-396.

Stern Y, Albert SM, Sano M et al. Assessing patient dependence in Alzheimer`s disease. J Gerontol A Biol Sci Med Sci 1994; 49:M216-M222.

Stern Y, Mayeux R, Sano M. Predictors of disease course in patients with probable Alzheimer`s disease. Neurology 1987; 37(1649):1653.

Stern Y, Sano M, Mayeux R. Long-Term Administration of Oral Physostigmine in Alzheimer`s Disease. Neurology 1988; 38(12):1837-1841.

Stern Y, Hesdorffer D, Sano M, Mayeux R. Measurement and prediction of functional capacity in Alzheimer's disease. Neurology 1990; 40:8-14.

Page 119: Rapport la maladie d’Alzheimer. technologique II. Examen ...

105

Streiner DL, Norman GR. Health Measurement Scales: A Practical Guide to their Development and Use. New York: Oxford University Press, 1989.

Strub RL, Black FW. The Mental Status Examination in Neurology. 3 ed. Philadelphia: F.A. Davis Company, 1993.

Sunderland T, Hill JL, Lawlor BA. NIMH Dementia Mood Assessment Scale (DMAS). Psychopharmacol Bull 1988; 24(4):747-753.

Talwalker S, Overall JE, Srirama MK, Gracon SI. Cardinal features of cognitive dysfunction in Alzheimer's disease: A factor-analytic study of the Alzheimer's Disease Assessment Scale. J Geriatr Psychiatry Neurol 1996; 9:39-46.

Tariot PN. CERAD Behavior Rating Scale for Dementia. Int Psychogeriatr 1996; 8(Suppl. 3):514-518.

Tariot PN, Goldstein B, Podgorski CA et al. Short-term administration of selegiline for mild-to-moderate dementia of the Alzheimer`s type. Am J Geriatr Psychiatry 1998; 6(2):145-154.

Tariot PN, Mack JL, Patterson MB et al. The Behavior Rating Scale for Dementia of the Consortium to Establish a Registry for Alzheimer`s Disease: The Behavioral Pathology Committee of the Consortium to Establish a Registry for Alzheimer`s Disease. Am J Psychiatry 1995; 152:1349-1359.

Teri L, Borson S, Kiyak HA, Yamagishi M. Behavioral disturbance, cognitive dysfunction, and functional skill. Prevalence and relationship in Alzheimer's disease. J Am Geriatr Soc 1989; 37:109-116.

Teri L, Larson EB, Reifler BV. Behavioral disturbance in dementia of the Alzheimer's type. J Am Geriatr Soc 1988; 36:1-6.

Teunisse S, Derik MMA. Functional and Global Evaluations: The Interview for Deterioration in Daily Living Activities in Dementia: Agreement Between Primary and Secondary Caregivers. Int Psychogeriatr 1997; 9(Suppl. 1):155-162.

Teunisse S, Derik MMA, Van Crevel H. Assessing the severity of dementia: Patient and caregiver. Arch Neurol 1991; 48:274-277.

Tombaugh TN, McIntyre NJ. The Mini-Mental State Examination: A comprehensive review. J Am Geriatr Soc 1992; 40(9):922-935.

Villardita C, Lomeo C. Alzheimer's disease: Correlational analysis of three screening tests and three behavioral scales. Acta Neurol Scand 1992; 86(6):603-608.

Weyer G, Erzigkeit H, Kanowski S, Ihl R, Hadler D. Alzheimer's Disease Assessment Scale: Reliability and validity in a multicenter clinical trial. Int Psychogeriatr 1997; 9(2):123-138.

Whitehouse PJ, Orgogozo JM, Becker RE et al. Quality-of-life assessment in dementia drug development. Alzheimer Dis Assoc Disord 1997; 11(Suppl. 3):56-60.

Page 120: Rapport la maladie d’Alzheimer. technologique II. Examen ...

106

World Health Organization. International Classification of Impairment, Disabilities and Handicaps. Geneva: World Health Organization, 1980.

Yesavage JA, Poulsen SL, Sheikh J, Tanke E. Rates of change of common measures of impairment in senile dementia of the Alzheimer's type. Psychopharmacol Bull 1988; 24:531-534.

Zec RF. Neuropsychological functioning in Alzheimer disease. In: Parks RW, Zec RF, Wilson RS, editors. Neuropsychology of Alzheimer's Disease and Other Dementias. New York: Oxford University Press, 1993: 3-80.

Zec RF, Landreth ES, Vicari SK, Belman J, Feldman E, Andrise A et al. Alzheimer Disease Assessment Scale: A subtest analysis. Alzheimer Dis Assoc Disord 1992; 6(3):164-181.

Zec RF, Landreth ES, Vicari SK, Feldman E, Belman J, Andrise A et al. Alzheimer Disease Assessment Scale: Useful for both early detection and staging of dementia of the Alzheimer type. Alzheimer Dis Assoc Disord 1992; 6(2):89-102.

Zerssen D von, Koeller D-M, Rey E-R. Die Befindlichkeitsskala (BfS), ein einfaches Instrument zur Objektivierung van Befindlichkeits-Störungen, insbesondere im Rahmen van Längsschnitt-Untersuchungen. Arzneimittelforschung 1970; 20:719-748.

Page 121: Rapport la maladie d’Alzheimer. technologique II. Examen ...

107

9 BIBLIOGRAPHIE DES ESSAIS CLINIQUES SUR LA MALADIE D'ALZHEIMER EXAMINÉS DANS LE PREMIER RAPPORT I

Becker RE, Colliver JA, Markwell SJ et al. Effects of metrifonate on cognitive decline in Alzheimer`s disease: A double-blind, placebo-controlled, 6-month study. Alzheimer Dis Assoc Disord 1998; 12(1):54-57.

Becker RE, Colliver JA, Markwell SJ et al. Double-blind, placebo-controlled study of metrifonate, an acetylcholinesterase inhibitor, for Alzheimer`s disease. Alzheimer Dis Assoc Disord 1996; 10(3):124-131.

Burke WJ, Roccaforte WH, Wengel SP et al. L-deprenyl in the treatment of mild dementia of the Alzheimer type: Results of a 15-month trial. J Am Geriatr Soc 1993; 41(11):1219-1225.

Burns A, Rossor M, Hecker J et al. The effects of donepezil in Alzheimer's disease - Results from a multinational trial . Dement Geriatr Cogn Disord 1999; 10:237-244.

Corey-Bloom J, Anand R, Veach J et al. A randomized trial evaluating the efficacy and safety of ENA 713 (rivastigmine tartrate), a new acetylcholinesterase inhibitor, in patients with mild to moderately severe Alzheimer`s disease. Int J Geriatr Psychiatry 1998; 1:55-65.

Cummings JL, Cyrus PA, Bieber F et al. Metrifonate treatment of the cognitive deficits of Alzheimer`s disease. Metrifonate Study Group. Neurology 1998; 50(5):1214-1221.

Foster NL, Petersen RC, Gracon SI, Lewis K. An enriched-population, double-blind, placebo-controlled, crossover study of tacrine and lecithin in Alzheimer`s disease. The tacrine 970-6 study group. Dementia 1996; 7(5):260-266.

Freedman M, Rewilak D, Cohen S et al. L-deprenyl in Alzheimer`s disease: Cognitive and behavioral effects. Neurology 1998; 50(3 ):660-668.

Jann MW, Cyrus PA, Eisner LS et al. Efficacy and safety of a loading-dose regimen versus a no-loading dose regimen of metrifonate in the symptomatic treatment of Alzheimer's disease: A randomized, double-masked, placebo-controlled trial. Metrifonate Study Group. Clin Ther 1999; 21(1):88-102.

Kanowski S, Herrmann WM, Stephan K et al. Proof of efficacy of the ginkgo biloba special extract EGb 761 in outpatients suffering from mild to moderate primary degenerative dementia of the Alzheimer type or multi-infarct dementia. Pharmacopsychiatry 1996; 29(2):47-56.

Lawlor BA, Aisen PS, Green C et al. Selegiline in the treatment of behavioral disturbance in Alzheimer`s disease. Int J Geriatric Psychiatry 1997; 12 :319-322.

Page 122: Rapport la maladie d’Alzheimer. technologique II. Examen ...

108

Le Bars PL, Katz MM, Berman N et al. A placebo-controlled, double-blind, randomized trial of an extract of ginkgo biloba for dementia. North American EGb study group. JAMA 1997; 278(16):1327-1332.

Mangoni A, Grassi MP, Frattola L et al. Effects of a MAO-B inhibitor in the treatment of Alzheimer disease. Eur Neurol 1991; 31(2):100-107.

Marcusson J, Rother M, Kittner B et al. A 12-month, randomized, placebo-controlled trial of propentofylline (HWA 285) in patients with dementia according to DSM III-R. The European Propentofylline Study Group. Dement Geriatr Cogn Disord 1997; 8(5):320-328.

Maurer K, Ihl R, Dierks T, Frolich L. Clinical efficacy of ginkgo biloba special extract EGb 761 in dementia of the Alzheimer type. J Psychiatr Res 1997; 31(6):645-655.

Mielke R, Ghaemi M, Kessler J et al. Propentofylline enhanced cerebral metabolic response to auditory memory stimulation in Alzheimer`s disease. J Neurol Sci 1998; 154(1):76-82.

Morris JC, Cyrus PA, Orazem J et al. Metrifonate benefits cognitive, behavioral, and global function in patients with Alzheimer`s disease. Neurology 1998; 50(5):1222-1230.

Raskind MA, Cyrus PA, Ruzicka BB, Gulanski BI. The effects of metrifonate on the cognitive, behavioral, and functional performance of Alzheimer's disease patients. Metrifonate Study Group. J Clin Psychiatry 1999; 60(5):318-325.

Rockwood K, Beattie BL, Eastwood MR et al. A randomized, controlled trial of linopirdine in the treatment of Alzheimer`s disease. Can J Neurol Sci 1997; 24(2):140-145.

Rogers SL, Doody RS, Mohs RC. Donepezil improves cognition and global function in Alzheimer disease, a 15-week, double-blind, placebo-controlled study. Donepezil Study Group. Arch Intern Med 1998; 158 (9):1021-1031.

Rogers SL, Farlow MR, Doody RS et al. A 24-week, double-blind, placebo-controlled trial of donepezil in patients with Alzheimer`s disease. Donepezil study group. Neurology 1998; 50(1):136-145.

Rogers SL, Freidhoff LT. The efficacy and safety of donepezil in patients with Alzheimer`s disease: Results of a US multicentre, randomized, double-blind, placebo-controlled trial. The donepezil study group. Dementia 1996; 7(6):293-303.

Rösler M, Anand R, Cicin-Sain A et al. Efficacy and safety of rivastigmine in patients with Alzheimer`s disease: International randomized controlled trial. BMJ 1999; 318(7184):633-640.

Page 123: Rapport la maladie d’Alzheimer. technologique II. Examen ...

109

Sano M, Ernesto C, Thomas RG et al. A controlled trial of selegiline, alpha-tocopherol, or both as treatment for Alzheimer`s disease. N Engl J Med 1997; 336(17):1216-1222.

Schneider LS, Olin JT, Pawluczyk S. A double-blind crossover pilot study of l-deprenyl (selegiline) combined with cholinesterase inhibitor in Alzheimer`s disease. Am J Psychiatry 1993; 150(2):321-323.

Tariot PN, Goldstein B, Podgorski CA et al. Short-term administration of selegiline for mild-to-moderate dementia of the Alzheimer`s type. Am J Geriatr Psychiatry 1998; 6(2):145-154.

Page 124: Rapport la maladie d’Alzheimer. technologique II. Examen ...

110

ANNEXE A : NOTE DE LA TRADUCTION

Comme le présent rapport mentionne plusieurs instruments de mesure ou échelles d'évaluation, leur appellation au long n'apparaît en général qu'une fois afin d'alléger le texte. Par la suite, l'instrument est désigné par son acronyme anglais. C'est pourquoi le lecteur est prié de consulter le tableau ci-dessous :

Acronyme Appellation anglaise Appellation française (reconnue ou

proposée) ADAS-cog Alzheimer's Disease Assessment Scale-

cognitive échelle d'évaluation de la maladie d'Alzheimer - cognitive

ADAS-noncog Alzheimer's Disease Assessment Scale-noncognitive

échelle d'évaluation de la maladie d'Alzheimer - non cognitive

ADLC Activities of Daily Living Checklist liste de vérification des activités de la vie quotidienne

AMTS Abbreviated Mental Test Score épreuve mentale abrégée

AP Aphasia Battery batterie de tests sur l'aphasie

BDS Blessed Dementia Scale échelle Blessed d'évaluation de la démence

BDS-part I Blessed Dementia Scale- part I 1re partie de l'échelle Blessed d'évaluation de la démence

Behave-AD Behavioural Pathology in Alzheimer's Disease

troubles de comportement dans la maladie d'Alzheimer

BIMC Blessed Information, Memory and Concentration scale

échelle Blessed sur l'information, la mémoire et l'attention

BNT Boston Naming Test test d'appellation de Boston

BPC Behavioural Problem Checklist liste de vérification des troubles de comportement

BPRS Brief Psychiatric Rating Scale échelle abrégée d'appréciation psychiatrique

BPRS Behavioral Problem Rating Scale échelle d'évaluation des troubles de comportement

BRSD Behavior Rating Scale for Dementia échelle d'évaluation comportementale dans la démence

BSRT Buschke Selective Reminding Test test Buschke de remémoration sélective

CAMCOG Cambridge Mental Disorders of the Elderly Examination-cognitive

examen Cambridge des troubles mentaux chez les personnes âgées - fonction cognitive

CAST Cognitive Assessment Screening Test test de sélection - évaluation de la fonction cognitive

C-BRSD CERAD Behavior Rating Scale échelle d'évaluation comportementale CERAD

CDR Clinical Dementia Rating échelle d'évaluation clinique de la démence

CDR-SB Clinical Dementia Rating - Sum of Boxes échelle d'évaluation clinique de la démence - sommation des scores

CGI Clinical Global Impression impressions cliniques globales

CGIC Clinician Global Impression of Change scale

échelle d'impression clinique de changement global

CIBIC Clinician Interview-Based Impression of Change

Impression clinique de changement relevée en entrevue

Page 125: Rapport la maladie d’Alzheimer. technologique II. Examen ...

111

Acronyme Appellation anglaise Appellation française (reconnue ou proposée)

CIBIC-plus Clinician's Interview Based Impression of Change with caregiver input

impression clinique de changement relevée en entrevue conjuguée à l'apport du prestataire de soins

COWA Controlled Oral Word Association test oral contrôlé d'association de mots

CPRS Comprehensive Psychological Rating Scale

échelle d'évaluation psychopathologique générale

CSDD Cornell Scale for Depression in Dementia échelle Cornell d'évaluation de la dépression associée à la démence

DAD Disability Assessment in Dementia échelle d'évaluation de l'incapacité dans la démence

DBD Dementia Behavior Disturbance Scale échelle des troubles de comportement dans la démence

DMAS The National Institute of Mental Health Dementia Mood Assessment Scale

échelle d'évaluation de l'humeur dans la démence de l'Institut national de la santé mentale

DS Dependence Scale échelle d'évaluation de l'autonomie

DSC Dementia Scale Cognitive échelle d'évaluation de la démence - cognitive

FCS Functional Capacity Scale échelle d'évaluation de la capacité fonctionnelle

FHT Face-Hand Test

GBS Gottfries-Brane-Steen scale échelle Gottfries-Brane-Steen

GDS Global Deterioration Scale échelle de détérioration globale

GDS Geriatric Deterioration Scale échelle d'évaluation gériatrique de la détérioration

GERRI Geriatric Evaluation by Relatives Rating Instrument

instrument de cotation de l'évaluation gériatrique par les proches

GIS Global Improvement Scale échelle d'amélioration globale

GRSGG Geriatric Rating Scale of Gottfries and Gottfries

échelle d'évaluation gériatrique de Gottfries et Gottfries

IADL Instrumental Activities of Daily Living Scale

échelle d'évaluation des activités instrumentales de la vie quotidienne

IDDD Interview for Deterioration in Daily living activities in Dementia

entrevue d'évaluation de la détérioration de l'exécution des activités de la vie quotidienne dans la démence

Index ADL Index of Activities of Daily Living indice des activités de la vie quotidienne (indice ADL)

IPSCE Inventory of Psychic and Somatic Complaints in the Elderly

compilation des manifestations psychiques et somatiques chez les personnes âgées

mBDS Modified Blessed Dementia Scale version modifiée de l'échelle Blessed d'évaluation de la démence

MMSE Mini Mental State Examination mini-examen de l'état mental

MWT-B Multiple choice Vocabulary Test test de vocabulaire à choix multiple

NAA Nüremberg-Alters-Altags-Skala Nüremberg-Alters-Altags-Skala

NAB Nüremberg Geriatric Observation Scale échelle Nüremberg d'observation gériatrique

Page 126: Rapport la maladie d’Alzheimer. technologique II. Examen ...

112

Acronyme Appellation anglaise Appellation française (reconnue ou proposée)

NAI Nüremberg Gerontopsychological Inventory

recensement Nüremberg des troubles psychogériatriques

NOSGER Nurses' Observation Scale for Geriatric Patients

échelle d'observation des infirmières sur les patients gériatriques

NPI Neuropsychiatric Inventory compilation des troubles neuropsychiatriques

OBS Organic Brain Syndrome Scale échelle d'évaluation du syndrome cérébral organique

PDS Progressive Deterioration Scale échelle de détérioration progressive

PSMS Physical Self-Maintenance Scale échelle d'évaluation de l'autonomie physique

QoL Quality of Life scale échelle d'évaluation de la qualité de vie

RAGS Relative's Assessment of Global Symptomatology

échelle d'évaluation de la symptomatologie globale par les proches

RF Rey-Osterrieth Complex Figure Test test des formes complexes de Rey-Osterrieth

sBIMC short Blessed Information, Memory and Concentration

échelle Blessed brève sur l'information, la mémoire et l'attention

SBT Short Blessed Test test Blessed abrégé

SCAG Sandoz Clinical Assessment Geriatric évaluation gériatrique clinique Sandoz

SDMT Symbol Digit Modalities Test test chiffres-symboles inversé

SKT Syndrome Kurtz Test test du syndrome de Kurtz

SPMSQ Short Portable Mental Status Questionnaire

questionnaire court sur l'état mental

Unified ADL Unified Activities of Daily Living Form questionnaire unifié sur les activités de la vie quotidienne (ADL unifié)

VOT Hooper Visual Organization Test test d'organisation visuelle de Hooper

WMS-R Wechsler Memory Scale-Revised échelle Wechsler d'évaluation de la mémoire (version révisée)