Doctorat de l’Université TOULOUSE III- Paul...

267
THESE présentée devant L’Université de Toulouse III, Paul Sabatier en vue de l’obtention du Doctorat de l’Université TOULOUSE III- Paul Sabatier Spécialité : Biologie Moléculaire Par Coralie HOAREAU-AVEILLA Caractérisation de la protéine Naf1 chez Saccharomyces cerevisiae et chez l’homme Soutenance publique le 22 octobre 2007 à 14H30, dans la salle de conférence de l’IEFG devant la commission d’examen: M. Pierre-Emmanuel GLEIZES, Professeur, Université Toulouse III Président M. Bertrand SERAPHIN, D.R, CGM CNRS, Paris Rapporteur M. Jamal TAZI, Professeur, Université Montpellier II Rapporteur M. Alain JACQUIER, D.R, Institut Pasteur, Paris Examinateur Mme. Michèle CAIZERGUES-FERRER, DR, LBME,CNRS Directeur du laboratoire M. Yves HENRY, DR, LBME,CNRS Directeur de thèse

Transcript of Doctorat de l’Université TOULOUSE III- Paul...

Page 1: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

THESE

présentée devant L’Université de Toulouse III, Paul Sabatier

en vue de l’obtention du

Doctorat de l’Université TOULOUSE III- Paul Sabatier

Spécialité : Biologie Moléculaire

Par

Coralie HOAREAU-AVEILLA

Caractérisation de la protéine Naf1 chez Saccharomyces cerevisiae et chez l’homme

Soutenance publique le 22 octobre 2007 à 14H30, dans la salle de conférence de l’IEFG devant la commission d’examen:

M. Pierre-Emmanuel GLEIZES, Professeur, Université Toulouse III Président

M. Bertrand SERAPHIN, D.R, CGM CNRS, Paris Rapporteur

M. Jamal TAZI, Professeur, Université Montpellier II Rapporteur

M. Alain JACQUIER, D.R, Institut Pasteur, Paris Examinateur

Mme. Michèle CAIZERGUES-FERRER, DR, LBME,CNRS Directeur du laboratoire

M. Yves HENRY, DR, LBME,CNRS Directeur de thèse

Page 2: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 3: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

RESUME

Mes travaux de thèse se sont concentrés sur l’étude de la biogenèse des particules

ribonucléoprotéiques H/ACA (RNP H/ACA). Ces RNP sont impliquées dans divers processus

cellulaires essentiels comprenant la synthèse des ribosomes et des télomères. Les RNP

H/ACA se composent d'un petit ARN non-codant (ARN H/ACA) et de 4 protéines : Cbf5p,

Gar1p, Nhp2p et Nop10p.

Au début de mon travail de thèse, nous disposions de plusieurs résultats suggérant que

la protéine Naf1p, chez la levure, est impliquée dans l'assemblage de RNP H/ACA. Pendant

ma thèse, j'ai caractérisé l'orthologue humain (hNaf1) de la protéine Naf1p de Levure. J'ai

prouvé que hNaf1 peut fonctionnellement remplacer Naf1p endogène chez la levure et que, au

sein des cellules humaines, hNaf1 est requise pour l'accumulation des composants des RNP

H/ACA. De plus, j'ai démontré que hNaf1 interagi avec les différents types d’ARN H/ACA

c'est-à-dire: les scaARN H/ACA, les snoARN H/ACA et l'ARN de télomérase. Afin de

déterminer le rôle exact de Naf1p, j'ai réalisé une purification des complexes qui lui sont

associés chez la levure. J'ai ainsi démontré que Naf1p interagi avec la machinerie de

transcription associée à l’ARN polymérase II. Puis, en collaboration avec l’équipe de

Guillaume Chanfreau, nous avons mis en évidence que Naf1p est associée aux gènes codant

les snoARN H/ACA. Ce qui suggère fortement que Naf1p pourrait permettre le recrutement

des protéines Cbf5p, Nhp2p et Nop10p sur les ARN H/ACA en cours de synthèse. En

collaboration avec l’équipe de H. van Tilbeurgh, nous avons déterminé la structure

cristallographique du domaine central de Naf1p. Ce domaine présente une structure similaire

à la protéine aGar1. J'ai également démontré que ce domaine est essentiel in vivo et qu'il

permet l'interaction avec la protéine Cbf5p in vitro.

Nous proposons que Naf1p promeut les étapes précoces d’assemblage des RNP

H/ACA en recrutant Cbf5p, Nhp2p et Nop10p au niveau des sites de transcription des

snoARN H/ACA. Naf1p serait ensuite requise pour prévenir une activité prématurée des

complexes en cours d’assemblage en inhibant l’interaction de Cbf5p avec Gar1p.

Page 4: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 5: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

A Mme Ferlicot,

Professeur de SVT au lycée Amiral Bouvet de St Benoit à l’Ile de la Réunion

Page 6: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 7: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

REMERCIEMENTS Je tiens à remercier Bertrand Séraphin, Jamal Tazi, Alain Jacquier et Pierre-Emmanuel Gleizes d’avoir acceptés d’être dans mon jury de thèse. Merci à tous nos collaborateurs, Sophie Quévillon-Chéruel, Nicolas Leulliot, Carine Froment, Guillaume Chanfreau.

Michou, je vous remercie de m’avoir accueillie dans votre équipe pendant ces 5 années. J’ai eu la grande chance, lorsque je suis arrivée en maîtrise, de travailler avec vous. J’ai développé, grâce à vous, mon envie de résoudre des questions scientifiques ainsi que la patience (voir l’acharnement) indispensable pour accomplir cette tache. Vous êtes une scientifique brillante qui a su mener de front, et avec succès, sa vie de famille et sa vie professionnelle, vous êtes pour moi une référence dans de nombreux domaines. De plus, je voudrais vous remercier de m’avoir permis de réaliser ma thèse dans une équipe où règne une atmosphère saine et amicale (vos talents de manager y sont pour beaucoup). Merci également pour les bons moments passés lors des rendez-vous hors labo, entre autre dans votre maison de campagne.

Yves merci de m’avoir encadré pendant mes 4 années de thèse. Je te remercie de m’avoir accordé ta confiance et de m’avoir laissé une certaine autonomie grâce à laquelle j’ai pu choisir les questions qui me paraissaient intéressantes ainsi que les moyens d’y répondre. Néanmoins, tu as été présent à chaque fois que j’ai eu besoin de toi. Cela a vraiment été très formateur pour moi. Merci pour ta rigueur, pour les nombreuses discussions, pour les encouragements et pour ton soutien.

Régine merci de m’avoir encadré pendant mon stage de maîtrise. Merci pour les nombreux conseils (quasi-quotidiens) tout au long de ma thèse. Merci pour toutes les discussions non scientifiques. J’ai vraiment apprécié de travailler avec toi. Gros bisous à la petite Julia.

Merci à tous les membres de l’équipe Ferrer, Jean-Paul , merci pour vos nombreux conseils (et boites de pétri …), Anthony, merci pour ta bonne humeur et les nombreuses relectures critiques, Annie, Christophe N, Marie, Manu, Simon, Julien. Merci Christophe (Dez) de m’avoir encadré pendant mon DEA, merci pour les nombreuses discussions et les pauses café.

Merci à tous les membres du LBME. Merci à David, Béata, Patou, Cathy Challeux, Valérie, Jacques, Cathy, Safi, Fatima, Vincent pour, entre autre, tous vos conseils

Merci à tous mes amis pour leur soutien et tous les bons moments.

Page 8: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Merci Isa pour tout !

Merci les filles Isa, Noèlle, Coralie, Cathy pour toutes ces belles surprises lors de ma soutenance de thèse. Merci Patou et lolo, entre autre, pour les nombreuses discussions. Un très grand merci à mes parents sans qui cette thèse n’aurait jamais pu se faire. Merci à ma sœur et à toute ma famille. Enfin, merci Sébastien (doudou) pour ton amour, ton soutien, ta gentillesse, merci d’être toi tout simplement et merci de m’avoir comblé en me permettant de devenir maman. Merci ma puce, ma merveilleuse Kéona. Je vous souhaite à tous beaucoup de bonnes choses.

Page 9: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

INTRODUCTION

I. LES COMPLEXES RIBONUCLEOPROTEIQUES ONT DES

ROLES ESSENTIELS DANS TOUT LE MONDE DU VIVANT ................. 2

II. LES RNP H/ACA: DESCRIPTION GENERALE ......................... 4

A. LE COMPOSANT ARN DES RNP H/ACA ............................................................. 4

B. LES COMPOSANTS PROTÉIQUES DES RNP H/ACA............................................... 5

a) La protéine Gar1......................................................................................... 5

b) La protéine Nhp2........................................................................................ 5

c) La protéine Nop10...................................................................................... 6

d) La protéine Cbf5......................................................................................... 6

III. LES DIFFERENTES RNP H/ACA ET LEURS FONCTIONS .... 8

A. LES SNORNP H/ACA: RNP H/ACA IMPLIQUÉES DANS LA BIOGENÈSE DES

RIBOSOMES .......................................................................................................................... 8

1. Les ribosomes: fonction et structure .............................................................. 9

a) Les ribosomes sont les acteurs principaux du processus de traduction...... 9

b) Le processus de traduction ....................................................................... 10

c) La structure des ribosomes....................................................................... 12

d) Bases moléculaires des mécanismes de décodage de l’information

génétique et de synthèse de la liaison peptidique......................................................... 17

2. La biogenèse des ribosomes: synthèse et maturation des constituants des

ribosomes ..................................................................................................................... 21

a) Production et maturation des ARN ribosomiques.................................... 21

b) Production des protéines ribosomiques.................................................... 25

c) Régulation de la synthèse des protéines et des ARN ribosomiques......... 25

3. Mécanisme d’assemblage des constituants des ribosomes .......................... 27

a) Le nucléole: lieu de synthèse du pré-ARNr de 35S et d’assemblage

précoce des ribosomes.................................................................................................. 27

b) La particule pré-ribosomique 90S............................................................ 28

c) La voie de maturation des précurseurs de la sous-unité de 40S............... 36

d) Les particules pré-60S.............................................................................. 39

1

Page 10: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

B. LA TÉLOMÉRASE HUMAINE EST UNE RNP H/ACA ATYPIQUE............................ 41

1. Les télomères sont des structures cruciales protégeant l’extrémité des

chromosomes.................................................................................................................... 41

a) Les télomères, une solution au problème réplicatif.................................. 41

b) Le composant ADN des télomères est synthétisé par la télomérase ........ 42

c) Les composants protéiques des télomères humains ................................. 43

2. La télomérase humaine est une RNP de type H/ACA................................... 44

a) Le composant ARN de la télomérase humaine: hTR............................... 44

b) L’enzyme transcriptase inverse humaine: hTERT................................... 45

c) Les protéines associées à la télomérase.................................................... 46

IV. STRUCTURE DES RNP H/ACA................................................... 48

A. STRUCTURE DES RNP H/ACA CHEZ LES ARCHÉES............................................ 49

1. Reconstitution des particules H/ACA d’archées in vitro ............................. 49

2. Structures cristallographiques des RNP H/ACA d’archées......................... 51

a) Structure des protéines du complexe H/ACA chez les archées ............... 52

b) Les interactions protéine/protéine au sein du complexe .......................... 54

c) Les interactions protéine/ARN au sein du complexe ............................... 55

d) Mécanisme proposé pour le recrutement de l’ARN substrat au sein de la

sRNP H/ACA ............................................................................................................... 57

B. STRUCTURE DES RNP H/ACA CHEZ SACCHAROMYCES CEREVISIAE.................... 57

1. Résultats de « décortication » des RNP H/ACA de levure........................... 58

2. Analyse fine de l’interaction entre Cbf5p et les snoARN H/ACA ................ 60

C. STRUCTURE DES RNP H/ACA CHEZ LES EUCARYOTES SUPÉRIEURS ................. 61

D. EVOLUTION DU MODE D’ASSEMBLAGE DES RNP H/ACA DES ARCHÉES

JUSQU’AUX EUCARYOTES SUPÉRIEURS .................................................................................. 63

-----------------------------------------------------------------------------------------

RESULTATS

I. INTRODUCTION............................................................................ 67

A. DESCRIPTION DE LA PROTÉINE NAF1P ............................................................... 67

2

Page 11: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

B. DONNÉES PRÉLIMINAIRES SUGGÉRANT L’EXISTENCE D’UN LIEN ENTRE LA

PROTÉINE NAF1P ET LES SNORNP H/ACA............................................................................ 67

C. CARACTÉRISATION INITIALE DE LA PROTÉINE NAF1P........................................ 68

D. PROBLÉMATIQUE DE MON SUJET DE THÈSE........................................................ 69

II. RESULTATS OBTENUS AU COURS DE MA THESE ............. 70

A. NAF1P EST IMPLIQUÉE DANS LA FORMATION DE TOUTES LES RNP H/ACA DE LA

LEVURE À L’HOMME .............................................................................................................. 70

1. Introduction/Résumé .................................................................................... 70

2. Publication ................................................................................................... 72

3. Discussion .................................................................................................... 73

B. NAF1P EST REQUISE À UNE ÉTAPE PRÉCOCE DE L’ASSEMBLAGE DES SNORNP

H/ACA 74

1. Introduction/Résumé .................................................................................... 74

2. Publication ................................................................................................... 76

3. Discussion .................................................................................................... 77

C. CARACTÉRISATION AU NIVEAU MOLÉCULAIRE DU MODE D’ACTION DE NAF1P.. 81

1. Caractérisation des différents domaines de la protéine Naf1p.................... 81

2. Naf1p interagit spécifiquement avec les snoARN H/ACA in vitro ............... 82

a) Etude de l’interaction entre la protéine Naf1p et les ARN H/ACA ......... 82

b) Recherche du domaine de liaison à l’ARN de la protéine Naf1p ............ 83

3. Le domaine GAR1 de la protéine Naf1p est impliqué dans l’interaction avec

la protéine Cbf5p.............................................................................................................. 85

a) Publication................................................................................................ 87

b) Discussion ................................................................................................ 88

-----------------------------------------------------------------------------------------

DISCUSSION ET PERSPECTIVES

I. LES RNP H/ACA AU COURS DE L’EVOLUTION................... 90

II. PROCESSUS D’ASSEMBLAGE DES RNP H/ACA................... 92

3

Page 12: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

A. MODÈLE DU MODE D’ASSEMBLAGE DES PARTICULES H/ACA CHEZ LES ARCHÉES

94

B. MODÈLE DU MODE D’ASSEMBLAGE DES PARTICULES H/ACA CHEZ LES

EUCARYOTES......................................................................................................................... 94

III. DEGRADATION DES RNP H/ACA MAL FORMEES.............. 98

--------------------------------------------------------------------------------------------------------

REFERENCES

4

Page 13: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 14: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 15: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

INTRODUCTION

1

Page 16: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

I. Les complexes ribonucléoprotéiques ont des rôles

essentiels dans tout le monde du vivant

Les molécules d’ARN (Acide RiboNucléique) jouent un rôle essentiel dans de très

nombreuses fonctions cellulaires fondamentales. Les ARN dits «messagers» (ARNm)

constituent probablement la classe la plus étudiée des ARN. Ils portent l’information

génétique permettant de produire les protéines correspondant aux gènes dont ils sont issus. Ils

sont communément regroupés sont le terme d’ARN «codant». Par opposition, il existe une

classe d’ARN dits «non codants» (ARNnc). En effet, ces ARN ne portent pas d’information

génétique permettant de produire une protéine. Néanmoins, dans de très nombreux cas, ils

exercent des fonctions absolument cruciales pour la vie de la cellule, telles que, entre autre, la

réplication de l’ADN, la régulation de la transcription, la maturation des ARNm, la

traduction, le transport des protéines…etc (Figure 1) (Spirin 2002), (Storz 2002). La longue

liste des ARNnc et de leurs diverses fonctions ne cesse de s’agrandir ce qui justifie

pleinement l’intérêt qui leur est accordé.

Il est important de noter que, de manière générale, les molécules d’ARN, qu’elles

soient codantes ou non codantes, sont associées à des protéines; on parle de ce fait de

complexes RiboNucléoProtéiques (RNP). Les protéines, au sein de ces complexes, peuvent

avoir plusieurs fonctions. En effet, elles peuvent avoir un rôle dit structural ou chaperon en

permettant à l’ARN d’adopter une conformation correcte. Elles peuvent également jouer un

rôle dans le transport du complexe. Dans d’autres cas, elles peuvent posséder l’activité

catalytique du complexe ou encore être requises pour la reconnaissance du substrat.

Malheureusement, il reste un bon nombre d’exemples pour lesquels la fonction des complexes

RNP, et donc des composants ARN et protéines qui les constituent, n’est pas encore

déterminée.

Dans ce manuscrit de thèse, la grande famille des RNP H/ACA sera très largement

décrite. Ces RNP sont un exemple très intéressant de complexes RNP stables composés de

plusieurs protéines et d’un ARNnc. Elles interviennent dans des fonctions cellulaires

essentielles et variées. En effet, elles sont requises lors de la réplication de l’ADN via un des

membres de la famille nommé télomérase. De plus, elles sont indirectement requises dans les

processus d’épissage des pré-ARNm et de traduction des ARNm car certaines RNP H/ACA

2

Page 17: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 18: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

participent aux processus de maturation des snRNP de l’épissage et à la synthèse des

ribosomes.

Les ribosomes sont des RNP très complexes, notamment de part le nombre important

des constituants ARN et protéiques qui les composent. Ils feront également l’objet d’une large

description dans ce manuscrit de thèse.

3

Page 19: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

II. Les RNP H/ACA: description générale

Les membres de la famille des RNP H/ACA sont des complexes ribonucléoprotéiques

résultant de l’association stable entre 4 protéines (Gar1p, Nhp2p, Nop10p et Cbf5p) et un

ARN non codant.

A. Le composant ARN des RNP H/ACA

Chaque RNP H/ACA présente un ARN non codant spécifique, dont la taille n’excède

que très rarement les 200 Nt. Chacun de ces ARN possède une séquence qui lui est propre

mais néanmoins ils contiennent tous des éléments de structure et de séquence conservés

communs. L’étude d’un grand nombre de ces ARN a permis de déterminer une structure

générale du composant ARN des RNP H/ACA; celle-ci est présentée dans la figure 2. Les

ARN H/ACA sont caractérisés par la présence de deux tiges boucles imparfaites séparées et

suivies par une région simple brin. La région simple brin dite «charnière» (séparant les deux

tiges boucles) contient une boite conservée nommée H (pour «hinge»). La séquence

consensus de la boite H est 5’-AnAnnA-3’. La région simple brin dite «queue», positionnée en

aval de la 2e tige, contient quant à elle une boite conservée nommée ACA toujours située à 3

nucléotides de l’extrémité 3’ de l’ARN H/ACA mature. La boite ACA a pour séquence

consensus, comme son nom l’indique, 5’-ACA-3’. Néanmoins, dans certains cas elle peut avoir

pour séquence 5’-AUA-3’ ou encore 5’-AAA-3’. Les RNP H/ACA tirent donc leur nom du fait

de la présence au sein du composant ARN de deux boites conservées, H et ACA (Balakin,

Smith et al. 1996), (Ganot, Caizergues-Ferrer et al. 1997). Les ARN H/ACA sont conservés

des archées jusqu’à l’homme. Néanmoins, il est à noter que chez certains organismes, tels que

le trypanosome ou les archées, ils peuvent présenter une structure simplifiée et n’être alors

constitués que d’une seule tige suivie d’une boite ACA.

4

Page 20: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

ANANNA ACA NNNBoite H Boite ACA

ARNsubstrat

poche de pseudouridylation

3'5'

5'

N N

3'

Page 21: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

B. Les composants protéiques des RNP H/ACA

Les composants protéiques des RNP H/ACA sont: Cbf5p/Nap57/Dyskérine (noms

respectivement donnés aux orthologues de levure, de rongeurs et humains), Gar1, Nhp2/L7Ae

(noms respectivement donnés aux homologues eucaryotes et d’archées) et Nop10. Ces quatre

protéines forment un cœur protéique stable très solidement associé aux différents ARN

H/ACA.

a) La protéine Gar1

Gar1 est la première protéine à avoir été identifiée comme étant associée aux ARN

H/ACA ((Balakin, Smith et al. 1996), (Ganot, Caizergues-Ferrer et al. 1997)). Elle est

essentielle et a tout d’abord été caractérisée chez la levure Saccharomyces cerevisiae. C’est

une petite protéine basique (point isoélectrique = 12) constituée de 205 acides aminés (ce qui

donne une masse moléculaire d’environ 21.5 kDa) ((Girard, Lehtonen et al. 1992), (Girard,

Bagni et al. 1994)). Elle présente à ses extrémités amino- et carboxy-terminales deux

domaines non essentiels riches en résidus glycines et arginines, les domaines «GAR». Ils

encadrent une région centrale de la protéine Gar1p communément désignée sous le nom «core

GAR1» (figure 3). Gar1 est conservée des archées jusqu'à l’homme. Il est toute fois important

de noter que chez les archées, elle est dépourvue des domaines GAR. Gar1, comme les autres

protéines des RNP H/ACA (présentées dans les sous parties b, c et d) est concentrée dans le

nucléole chez la levure Saccharomyces cerevisiae. Elle est également retrouvée, chez les

eucaryotes supérieurs, au sein des d’organelles nucléoplasmiques nommées corpuscules de

Cajal. Gar1 est le seul composant des RNP H/ACA qui ne soit pas requis pour la stabilité du

complexe.

b) La protéine Nhp2

Nhp2 est une petite protéine basique (point isoélectrique d’environ 10.5) de 156 acides

aminés, ce qui donne une masse moléculaire d’environ 17 kDa. Elle appartient à la famille

5

Page 22: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 23: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

des protéines HMG-like (High Mobility Group-like). Ces protéines sont regroupées sur la

base de leur composition particulière en acides aminés, à la fois très acide et très basique, et

des conditions dans lesquelles elles sont extraites: 350mM NaCl ou 5% d’acide perchlorique

(Nhp2p de Saccharomyces cerevisiae est 20% acide et 22% basique). Nhp2 a été caractérisée

chez la levure Saccharomyces cerevisiae comme protéine essentielle présentant des

homologies avec les protéines ribosomiques S6 d’archée (H. marismorium), L32 de levure et

L7A de rat (Kolodrubetz and Burgum 1991; Koonin, Bork et al. 1994). Elle a ensuite été

identifiée comme composant des RNP H/ACA suite à une recherche des protéines associées

aux ARN H/ACA snR30 et snR42 (Watkins, Gottschalk et al. 1998) ou à la protéine Gar1

(Henras, Henry et al. 1998). Dans sa région centrale, Nhp2p présente un domaine conservé

ayant de l’affinité pour les molécules d’ARN formant des tiges boucles irrégulières. Il a été

montré que l’intégrité de ce domaine est absolument requise pour l’accumulation des RNP

H/ACA chez la levure Saccharomyces cerevisae (Henras, Dez et al. 2001). La protéine Nhp2p

présente 43% d’homologie avec la protéine Snu13p associée aux RNP de type C/D. Toutes

les deux présentent un ancêtre commun chez les archées nommé L7Ae. Il est important de

noter que Nhp2p est la seule protéine des RNP H/ACA dont l’accumulation n’est pas

modifiée en absence des autres membres du complexe.

c) La protéine Nop10

Nop10 est une petite protéine (58 acides aminés, 6.6 kDa) conservée (figure 3). Elle

est essentielle et il a été montré qu’elle fait partie du cœur des particules H/ACA de levure

suite à une recherche par des expériences de co-immunoprécipitation des partenaires de la

protéine Gar1 (Henras, Henry et al. 1998). Les orthologues humains de Nhp2 et de Nop10 et

leur association avec les ARN H/ACA ont ensuite été étudiés par le groupe de W. Filipowicz

(Pogacic, Dragon et al. 2000).

d) La protéine Cbf5

Cbf5 est la protéine des RNP H/ACA la mieux caractérisée (figure 3). C’est une

protéine essentielle très conservée composée de 483 acides aminés (ce qui donne une masse

6

Page 24: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

moléculaire d’environ 55 kDa) et comme les autres protéines des RNP H/ACA, elle est de

nature basique, son point isoélectrique se situant aux alentours de 9.5. De façon surprenante,

elle a tout d’abord été identifiée chez la levure Saccharomyces cerevisiae comme facteur

associé in vitro aux centromères et aux microtubules (Jiang, Middleton et al. 1993).

Néanmoins, l’étude de la signification de cette interaction n’a pas été poursuivie.

La structure de la protéine Cbf5 est présentée dans la figure 3. Elle possède un

domaine central homologue à la protéine TruB, une enzyme bactérienne responsable de la

pseudouridylation du résidu U55 des ARNt. Cbf5 a de ce fait été classée dans la famille des

pseudouridines synthases de type TruB (Koonin 1996) (Hoang and Ferre-D'Amare 2001).

Cbf5 possède d’autre part plusieurs régions riches en résidus lysine aux extrémités amino- et

carboxy-terminales ainsi qu’un domaine nommé PUA en aval du domaine catalytique. Ce

domaine est également retrouvé dans l’archaeosine transglycosylase (Aravind and Koonin

1999). Le domaine PUA, au sein de la protéine Cbf5, est impliqué dans l’interaction avec le

composant ARN des ARN H/ACA. Les détails de cette interaction sont donnés dans la revue

« Box H/ACA RNPs: from ribosome formation to telomere maintenance » présentée dans ce

manuscrit.

La présence de Cbf5 dans le cœur protéique des RNP H/ACA a tout d’abord été mise

en évidence chez la levure Saccharomyces cerevisae (Lafontaine, Bousquet-Antonelli et al.

1998). Cbf5, de façon identique aux protéines Nhp2 et Nop10, est absolument requise pour la

stabilité des RNP H/ACA.

La protéine Cbf5 a également été largement étudiée de part son implication dans une

pathologie humaine, la dyskératose congénitale. En effet, elle est mutée dans certaines formes

graves de cette maladie (Heiss, Knight et al. 1998). D’où le nom donné à la protéine humaine:

dyskérine. Cette pathologie ainsi que les mutations associées sont largement décrites dans la

revue « La Dyskératose Congénitale, une maladie méconnue due à un déficit de télomérase »

présentée dans ce manuscrit.

7

Page 25: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

III. Les différentes RNP H/ACA et leurs fonctions

Comme nous l’avons vu dans le chapitre précédant, les RNP H/ACA sont constituées

de 4 protéines, Cbf5, Gar1, Nhp2 et Nop10, formant un cœur invariable stable associé à un

petit ARN non codant, l’ARN H/ACA. On dénombre plus d’une centaine d’ARN H/ACA

différents à travers tout le règne du vivant. L’étude de leur localisation et de leurs fonctions

spécifiques a permis d’établir qu’il existe au moins 4 grandes classes d’ARN H/ACA, et donc

4 grandes classes de RNP H/ACA:

-Les snoRNP H/ACA

-Les scaRNP H/ACA

-La télomérase

-Les RNP H/ACA orphelines et les RNP H/ACA atypiques

A. Les snoRNP H/ACA: RNP H/ACA impliquées dans la

biogenèse des ribosomes

Les snoARN H/ACA, pour “Small NucleOlar ARN H/ACA”, sont les premiers ARN

H/ACA à avoir été caractérisés. Ils présentent une localisation strictement nucléolaire (d’où

leur nom) et sont impliqués dans la biogenèse des ribosomes.

Afin de mieux appréhender la fonction des snoARN H/ACA, il est tout d’abord

important de décrire précisément ce que sont les ribosomes.

8

Page 26: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

1. Les ribosomes: fonction et structure

a) Les ribosomes sont les acteurs principaux du

processus de traduction

Le ribosome est la RNP cellulaire la plus complexe jamais étudiée (Figure 4). Elle

résulte de l’association entre plusieurs ARN non codants et plusieurs dizaines de protéines. Le

ribosome constitue l’un des acteurs principaux de l’expression de gènes. En effet, il permet de

décoder l’information génétique au sein des molécules d’ARNm et de la transformer en

protéine. C’est le processus de traduction.

Le ribosome est constitué de deux sous-unités, nommées sur la base de leur coefficient

de sédimentation. Une grande sous-unité de 60S chez les eucaryotes ou 50S chez les

procaryotes et une petite sous-unité de 40S chez les eucaryotes ou 30S chez les procaryotes.

L’assemblage des 2 sous-unités donne un ribosome de 80S chez les eucaryotes et 70S chez les

procaryotes. Les différentes informations relatives à ces 2 sous-unités, en terme de

composition en ARN et en protéines, sont récapitulées dans le tableau 1.

Chaque sous-unité a des fonctions bien précises dans le processus de traduction. En

effet, la grande sous-unité est responsable de la catalyse de la formation de la liaison

peptidique. Cette réaction a lieu au sein d’une région cruciale de la grande sous-unité appelée

« Centre Peptidyl-Tranférase » (PTC). La petite sous-unité quant à elle interagit avec l’ARNm

à traduire et est responsable du contrôle de la fidélité du processus de traduction en assurant

un appariement de base parfait entre le codon de l’ARNm et l’anticodon de l’ARNt

aminoacylé (c'est-à-dire l’ARN de Transfert portant un acide aminé). Cela a lieu au niveau du

« centre de décodage » au sein de la petite sous-unité.

La figure 4 présente un schéma simplifié d’un ribosome en cours de traduction. Il est

associé à l’ARNm et aux ARNt. Ces derniers peuvent être positionnés au niveau de 3 sites

bien particuliers au sein du ribosome:

-Le site A (Aminoacyl) dans lequel se positionne l’ARNt aminoacylé entrant

dans le ribosome.

-Le site P (Peptidyl) dans lequel se trouve l’ARNt portant la chaîne peptidique

en cours de synthèse.

9

Page 27: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

coefficient de sédimentation taille nombre d'ARN nombre de

protéines

grande sous unité 50 S 1,5 MDa2

l'ARNr de 23S (2904 nt) l'ARNr de 5S (122 nt)

34

petite sous unité 30S 0,8MDa 1 l'ARNr de 16 S (1542 nt)

21

grande sous unité 60S 2,9 MDa3

l'ARNr de 25S (3392 nt) l'ARNr de 5S (121 nt)

l'ARNr de 5,8S (158 nt)

46

petite sous unité 40S 1,4 MDa 1 l'ARNr de 18 S (1798 nt)

32

Ribosome procaryote:

Escherichia coli

Ribosome eucaryote:

Saccharomyces cerevisae

Page 28: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

-Le site E (Exit) dans lequel se trouve l’ARNt déacylé juste avant qu’il ne se

dissocie de l’ARNm et du ribosome.

Le déroulement des différentes étapes du processus de traduction est décrit dans le

chapitre ci-après. Les différences existant entre les mécanismes eucaryotes et procaryotes y

seront mentionnées.

b) Le processus de traduction

La traduction est une réaction qui se déroule en 4 grandes étapes: l’initiation,

l’élongation, la terminaison et le recyclage (pour revue: (Ramakrishnan 2002), (Kapp and

Lorsch 2004)).

(1) L’initiation de la traduction

L’initiation constitue l’étape cruciale au cours de laquelle a lieu l’association

entre la petite sous-unité, l’ARNt initiateur portant l’acide aminé méthionine (ARNt-met) et

l’ARNm. Cette étape nécessite des Facteurs d’Initiation de la traduction: IF (chez les

procaryotes) et eIF (chez les Eucaryotes). L’association entre la petite sous-unité et l’ARNm

ainsi que la reconnaissance du codon initiateur de la traduction se fait selon 2 processus très

différents chez les procaryotes et chez les eucaryotes :

-Chez les eucaryotes, la petite sous-unité, préalablement associée à l’ARNt-

met, est recrutée sur l’ARNm au niveau de la structure 5’CAP. Cette association nécessite

l’intervention à la fois de facteurs eIF mais également de la queue polyA et des facteurs

associés. La petite sous-unité va ensuite scanner l’ARNm en se déplaçant sur ce dernier dans

le sens 5’ vers 3’ à la recherche du codon initiateur (AUG) situé dans le bon contexte, c’est à

dire au sein d’une séquence nommée «Kozak». Lorsque la petite sous-unité atteint cette

séquence, un appariement peut alors avoir lieu entre l’ARNt-met et le codon AUG. Ce

processus induit l’hydrolyse d’une molécule de GTP par l’un des facteurs eIF permettant le

positionnement de l’ARNt-met dans le site P de la petite sous-unité. La grande sous-unité

rejoint alors le complexe 40S/ARNt-met/ARNm.

-Chez les procaryotes, le mécanisme d’association entre la petite sous unité et

l’ARNm est différent. En effet, elle se fait directement via un appariement entre l’ARNr de

10

Page 29: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

16S au sein de la petite sous-unité et l’ARNm. Pour cela l’ARNr de 16S porte une séquence

(proche de son extrémité 3’) complémentaire à une séquence nommée Shine-Dalgarno

présente sur l’ARNm environ 10 nt en amont du codon initiateur. La petite sous-unité est

alors correctement positionnée sur le codon AUG et peut être rejointe par la grande sous-

unité.

(2) L’élongation de la traduction

Le processus d’élongation, à la différence de l’initiation, a été conservé au cours de

l’évolution et ne diffère globalement pas entre les procaryotes et les eucaryotes. La figure 5

illustre le processus d’élongation et de terminaison de la traduction chez les procaryotes.

L’élongation débute par le positionnement d’un ARNt aminoacylé dans le site A

vacant du ribosome. Cet ARNt aminoacylé est préalablement complexé à un Facteur

d’Elongation de la traduction, EF-Tu (chez les bactéries), associé lui-même à une molécule de

GTP. Différentes étapes, mettant en jeu un appariement entre le codon de l’ARNm et

l’anticodon de l’ARNt ainsi que différents changements de conformation du centre de

décodage de la petite sous-unité, assurent le contrôle de la fidélité de la traduction. Si l’ARNt

entrant dans le site A est correct alors la molécule de GTP est hydrolysée par EF-Tu. Celui-ci

se dissocie alors du ribosome. Le centre peptidyl-transférase de la grande sous-unité catalyse

ensuite la formation de la liaison peptidique entre la chaîne peptidique naissante (associée à

l’ARNt du site P) et l’acide aminé porté par l’ARNt du site A. Un second Facteur

d’Elongation, EF-G, intervient alors et hydrolyse une molécule de GTP afin de permettre la

translocation du ribosome par rapport au complexe ARNm/ARNt. Ce décalage d’un codon

exactement libère le site A et positionne l’ARNt portant le peptide dans le site P et l’ARNt

déacylé dans le site E. L’hydrolyse de GTP induit la dissociation de EF-G du ribosome. Le

ribosome est alors dans une bonne configuration pour la réalisation d’un nouveau cycle

d’élongation de la chaîne peptidique.

11

Page 30: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 31: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

(3) La terminaison de la traduction

Le processus de terminaison de la traduction intervient lorsqu’un codon STOP au sein

de l’ARNm se positionne au niveau du site A du ribosome. Aucun ARNt ne contient un anti-

codon correspondant à un codon STOP. Les facteurs RF1/2 (class I Release Factor) se

positionnent alors dans le site A et induisent l’hydrolyse par le ribosome de la liaison ester

entre l’ARNt et la chaîne peptidique dans le site P. Ceci permet la libération de la protéine. Le

rôle exact de RF1/RF2 dans le processus d’hydrolyse n’est pas complètement compris. La

GTPase RF3 (class II Release Factor) interagit ensuite avec RF1/2 et conduit à leur

dissociation du ribosome, puis à sa propre dissociation suite à l’hydrolyse d’une molécule de

GTP.

(4) Le recyclage du ribosome

Le recyclage est la dernière étape du processus de traduction. Elle permet la

dissociation des complexes ribosome/ARNt/ARNm et l’utilisation du ribosome dans un

nouveau cycle d’initiation. Le processus de recyclage nécessite l’intervention de facteurs RRF

(Ribosome Release Factor) assistés par les facteurs IF3 et EF-G. Le rôle de ces différents

facteurs n’est malheureusement pas encore complètement compris. Il est probable qu’ils

induisent via l’hydrolyse de GTP de grands changements de conformation permettant la

dissociation des 2 sous-unités ribosomiques, de l’ARNt déacylé et de l’ARNm.

c) La structure des ribosomes

La compréhension des mécanismes de traduction a, en partie, beaucoup avancé grâce à

la détermination de la structure des ribosomes. La Microscopie Electronique (EM) puis la

cryo-EM ont permis d’établir les premiers modèles de structure. Néanmoins, les détails de la

structure des ribosomes à une très haute résolution, c’est-à-dire à une échelle atomique, n’ont

pu être obtenus que grâce à l’utilisation de techniques d’analyse de structure

cristallographique par diffraction de rayons X. Ces techniques ont été appliquées dans un

12

Page 32: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

premier temps à des sous-unités ribosomiques isolées (Structure la petite sous-unité:

(Wimberly, Brodersen et al. 2000), (Schluenzen, Tocilj et al. 2000)) (Structure de la grande

sous-unité: (Ban, Nissen et al. 2000), (Harms, Schluenzen et al. 2001)) puis, par la suite, à des

ribosomes complets complexés aux ARNt et à une molécule d’ARNm. Les ribosomes

procaryotes ont fait l’objet de la majeure partie de ces études (Yusupov, Yusupova et al.

2001), (Schuwirth, Borovinskaya et al. 2005), (Korostelev, Trakhanov et al. 2006), (Selmer,

Dunham et al. 2006).

Par convention, lors de la description des structures tertiaires de la grande ou de la

petite sous-unité, la face dite «avant» sera la face en interaction avec l’autre sous-unité au sein

d’un ribosome complet. Les autres parties de la molécule (face arrière, haut, bas) seront donc

positionnées par rapport à cette première face, la face avant.

(1) Structure de la petite sous-unité ribosomique

procaryote

La petite sous-unité ribosomique procaryote est composée de l’ARNr de 16S et d’une

vingtaine de protéines. La structure cristallographique de cette petite sous-unité a été résolue

par plusieurs groupes et laisse apparaître une structure globale très proche des images

obtenues en microscopie électronique (Wimberly, Brodersen et al. 2000), (Schluenzen, Tocilj

et al. 2000). La structure présentée dans la figure 6b révèle que la petite sous-unité peut être

divisée en plusieurs domaines dont une tête (H: head) avec un bec (Be: beak), une plateforme

(P: platform) et un corps (Bo: body) avec une épaule (Sh: shoulder) et un éperon (Sp: spur).

Le corps est relié à la tête par le cou (N: neck). Les figures 6a et 6b représentent les

structures secondaires et tertiaires respectivement de la molécule d’ARNr de 16 S («face

avant»). Dans les figures 6c et 6d, les protéines ont été ajoutées sur la structure tertiaire de

l’ARN. La comparaison des figures 6b et 6c montre que c’est la molécule d’ARNr qui donne

la forme globale de la petite sous-unité. La structure secondaire de l’ARNr 16S révèle 4

domaines se rejoignant tous en un point central au niveau de la région fonctionnelle la plus

importante de la petite sous-unité, le cou. Ces domaines sont:

-Le domaine 3’ correspondant à la tête

-Le domaine central correspondant à la plateforme

-Le domaine 5’ correspondant au corps

13

Page 33: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 34: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

-Le domaine correspondant à une partie de la plateforme et du corps (de couleur bleu

sur la figures 6a).

Les protéines ribosomiques sont concentrées au sommet, sur les côtés et à l’arrière de la petite

sous-unité. La région à l’interface entre les 2 sous-unités est globalement dépourvue de

protéines. Celles-ci contiennent généralement un domaine globulaire associé à de longues

extensions en interaction étroite avec l’ARNr 16S. Chaque extension est en contact avec

plusieurs portions de l’ARNr ce qui permet de rigidifier la structure tertiaire de l’ARNr 16S.

De plus, certaines protéines établissent des interactions entre elles, ce qui a probablement

pour conséquence de consolider la structure globale de la petite sous-unité.

La région de la petite sous-unité impliquée dans le décodage de l’information

génétique (le Centre de Décodage : DC) c'est-à-dire dans la reconnaissance entre le codon de

l’ARNm et l’anticodon de l’ARNt aminoacylé se trouve au niveau de la partie supérieure du

corps et de la partie inférieure de la tête. La séquence de l’ARNs 16S est particulièrement bien

conservée au niveau de cette région ce qui est en parfait accord avec le caractère universel du

processus de décodage. De plus, il est important de noter que la région de la petite sous-unité

en contact avec l’ARNm ainsi qu’avec la boucle anticodon des ARNt positionnés dans le site

A et dans site P est dépourvue de protéine. Il semble donc que seul l’ARNr 16S assure le

décodage de l’information et la fidélité du processus de traduction.

(2) Structure de la grande sous-unité ribosomique

procaryote

La grande sous-unité procaryote (50S) est composée de 2 ARNr, le 23S et le 5S,

associés à plus d’une trentaine de protéines. Elle présente une structure globalement

monolithique (figure 7: face avant) hormis la présence de 2 protubérances latérales portant les

protéines ribosomiques L1 et L7/L12 (Ban, Nissen et al. 2000), (Harms, Schluenzen et al.

2001). Les figures 8A/B et 8C/D présentent respectivement les structures tertiaires et

secondaires des ARNr de la grande sous-unité. La structure secondaire de l’ARNr 23S laisse

apparaître 6 grands domaines distincts (figure 8C: numérotés de I à VI). Ces 6 domaines

interagissent entre eux pour former une masse compacte ne donnant finalement en structure

tertiaire qu’un seul domaine (figures 8A et 8B) alors que la petite sous-unité, elle, en contient

3 (cf figure 6). Cette différence a probablement pour conséquence de conférer une plus grande

14

Page 35: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 36: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

flexibilité à la petite sous-unité.

L’ARNr de 5S représente le 7e domaine de la grande sous-unité. Il est positionné dans

la partie supérieure de la sous-unité 50S. Il interagit avec l’ARNr 23S essentiellement de

façon indirecte via certaines protéines ribosomiques.

Les protéines ribosomiques sont réparties de façon homogène à la surface de la face

arrière de la grande sous-unité (celle qui n’est pas en interaction avec la petite sous-unité)

(figure 9B). En revanche, elles sont quasi-absentes au niveau du site actif (peptidyl-

transférase) ainsi qu’au niveau de la région s’associant à la petite sous-unité (figure 9A). De

nombreuses protéines ribosomiques possèdent un domaine globulaire positionné à la surface

de la grande sous-unité ainsi que des extensions, plus ou moins longues, pénétrant l’intérieur

de la sous-unité. Ces extensions ont probablement pour fonction de stabiliser la structure

compacte des ARNr comme une sorte de ciment au sein de la particule.

(3) Structure du ribosome de 70S procaryote

Plusieurs études ont permis d’établir la structure d’un ribosome complet (petite et

grande sous-unité) parfois associé à une molécule d’ARNm et à des ARNt de transfert

(Yusupov, Yusupova et al. 2001), (Schuwirth, Borovinskaya et al. 2005), (Korostelev,

Trakhanov et al. 2006), (Selmer, Dunham et al. 2006). Ces structures ont permis d’étudier les

interactions existant entre les 2 sous-unités ainsi que de déterminer la conformation et la

position des ARNt et de l’ARNm au sein du ribosome (pour revue: (Ramakrishnan 2002),

(Liljas 2006).

(a) Les zones d’interaction entre les 2 sous-unités

La figure 10 représente les structures de la grande sous-unité (figure 10a) et de la

petite sous-unité (figure 10b) déduites à partir de la structure cristallographique du ribosome

complet obtenue par le groupe de H. Noller en 2001 (Yusupov, Yusupova et al. 2001). Les 3

molécules d’ARNt et en particulier celle située dans le site P constituent une large zone

d’interaction entre les 2 sous-unités. A cela s’ajoutent des interactions entre les composants

même des ribosomes: les portions d’ARNr et de protéines apparaissant en rose et jaune

15

Page 37: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 38: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 39: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

respectivement (figure 10). Il apparaît que ce sont les molécules d’ARNr qui constituent la

plus grande surface d’interaction. Les zones de contact impliquant les ARNr se trouvent

plutôt dans la région centrale très proche des sites fonctionnels des ribosomes alors que celles

impliquant des protéines se situent en périphérie.

L’analyse de la structure d’un ribosome 70S associé à une molécule d’ARNm et à

plusieurs ARNt a permis d’avancer dans la compréhension des mécanismes de décodage de

l’information génétique et de synthèse de la liaison peptidique. De plus, la comparaison des

différentes structures publiées a permis de proposer des hypothèses permettant d’expliquer le

déroulement du mécanisme de translocation au cours duquel le ribosome se «déplace» d’un

codon sur le complexe ARNm-ARNt.

(b) Interactions entre le ribosome, les ARNt et

l’ARNm

La figure 11 représente la structure du ribosome 70S associé à une molécule d’ARNm

et 3 ARNt obtenue par le groupe de H. Noller en 2001 (Yusupov, Yusupova et al. 2001). Elle

met en évidence que les 3 ARNt se situent dans une zone du ribosome contenant

principalement des portions d’ARNr et très peu de protéines ribosomiques. Les 3 ARNt sont

globalement orientés de la même façon par rapport aux deux sous-unités. A savoir, la tige

boucle portant l’anticodon (ASL) interagit avec la petite sous-unité alors que le reste de

l’ARNt (la tige, le coude et le bras accepteur: voir structure ARNt) lie la grande sous-unité.

La portion aminoacylée des ARNt des sites A et P est localisée dans la grande sous-unité au

niveau du site peptidyl-transférase afin de permettre la synthèse de la liaison peptidique. La

figure 12 représente une schématisation très simplifiée du ribosome 70S associé à une

molécule d’ARNm et 3 ARNt. Elle permet de visualiser que la molécule d’ARNm au sein de

la petite sous-unité présente une région courbée (positionnée au niveau du cou de la petite

sous-unité) permettant le positionnement correct des codons reconnus par les ARNt des site A

et P.

16

Page 40: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

(4) Structure du ribosome eucaryote

La grande majorité des données de structure des ribosomes provient d’études réalisées

chez les procaryotes. Ces données ont très largement permis d’avancer dans la compréhension

des mécanismes de base de la traduction. Les études réalisées sur les ribosomes eucaryotes

semblent indiquer que ces mécanismes sont globalement conservés. Néanmoins, il apparaît

que les ribosomes eucaryotes sont plus complexes. En effet, ils présentent des segments

d’ARNr ainsi que des protéines ribosomiques supplémentaires (Attention, l’ARNr de 5.8S ne

fait pas réellement partie de ces nouvelles molécules car il correspond à une portion de

l’ARNr de 23S procaryote). Le rôle des ces éléments ribosomiques spécifiques aux

eucaryotes n’est à ce jour pas encore totalement élucidé mais il semble qu’ils pourraient entre

autre intervenir dans la liaison avec l’ARNm ou encore dans le repliement du polypeptide

naissant. Il est également important de noter que certains de ces facteurs sont impliqués dans

des pathologies humaines.

d) Bases moléculaires des mécanismes de décodage de

l’information génétique et de synthèse de la liaison

peptidique

(1) Le mécanisme de décodage de l’information

génétique

Le décodage de l’information génétique consiste au recrutement d’un ARNt

aminoacylé présentant un anticodon parfaitement complémentaire au codon présenté par la

molécule d’ARNm au sein du site A du ribosome. C’est une étape critique car des

répercussions graves sur le fonctionnement de la protéine en cours de synthèse peuvent être

engendrées par un processus de traduction infidèle c’est-à-dire lors de l’utilisation d’un ARNt

incorrect et donc de l’ajout d’un mauvais acide aminé. La figure 13, extraite de la revue

(Rodnina, Daviter et al. 2002), présente un schéma simplifié des différentes étapes aboutissant

à la sélection d’un ARNt correct par le ribosome. Dans un premier temps, le complexe ARNt

17

Page 41: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 42: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

aminoacylé/EF-Tu(GTP) est recruté au sein du site A. Puis, l’appariement correct entre le

codon et l’anticodon entraîne un changement de conformation du ribosome aboutissant à la

stabilisation du complexe ARNt-ARNm et l’hydrolyse du GTP. Le facteur EF-Tu-GDP se

dissocie alors du ribosome et se produit l’étape «d’accommodation» qui consiste au

basculement de l’ARNt vers le centre peptidyl-transférase. La synthèse de la liaison

peptidique peut alors avoir lieu. Il semble que le processus de sélection de l’ARNt se fasse en

2 étapes: tout d’abord lors de la première interaction entre le codon et l’anticodon puis après

l’hydrolyse du GTP (juste avant l’étape d’accommodation). Le mécanisme de décodage a lieu

au sein de la petite sous-unité ribosomique dans une région composée principalement par des

éléments de l’ARNr de 16S tels que les hélices 18, 27, 34 et 44. Ces hélices sont en contact

avec le complexe ARNt-ARNm et vont participer à la sélection grâce à leur capacité à

distinguer un appariement parfait d’un mésappariement.

(2) Le mécanisme de synthèse de la liaison peptidique

La formation de la liaison peptidique est l’une des étapes clés de la synthèse protéique.

En effet, elle permet le transfert de la chaîne peptidique portée par l’ARNt positionné dans le

site P du ribosome sur l’ARNt aminoacylé du site A. Il y a ainsi ajout d’un acide aminé à

l’extrémité carboxy-terminale du polypeptide en cours de production. Les nombreuses études

réalisées sur le fonctionnement du ribosome ont rapidement permis de conclure que l’activité

de synthèse de la liaison peptidique, c'est-à-dire l’activité peptidyl-transférase, est portée par

la grande sous-unité ribosomique. La figure 14A présente une schématisation de la formation

de la liaison peptidique au sein du ribosome. Le groupement amine de l’ARNt amino-acylé du

site A de la grande sous-unité attaque le carbone du groupement carbonyle de l’ARNt portant

le peptide dans le site P. Cette réaction a pour conséquence d’allonger la chaîne

polypeptidique d’un acide aminé et de la transférer sur l’ARNt situé dans le site A.

Le groupe de Thomas A. Steitz a publié en 2000 la structure cristallographique de la

grande sous-unité de Haloarcula marismortui en présence de molécules analogues aux ARNt

(Nissen, Hansen et al. 2000). Dans cette étude, il a été proposé que le ribosome est un

ribozyme, c’est-à-dire que l’activité catalytique est portée par l’ARNr de 23S et non pas par

une protéine ribosomique. Voici certaines des données présentées dans cette étude permettant

d’arriver à cette conclusion:

18

Page 43: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 44: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

-Les analogues d’ARNt sont positionnés dans la grande sous-unité au niveau d’une région

constituée uniquement par le domaine V de l’ARNr de 23S. Les nucléotides les plus proches

de l’analogue d’ARNt sont situés dans la boucle principale du domaine V.

-Il n’y a pas de domaine globulaire de protéine à proximité de l’analogue d’ARNt. Les plus

proches domaines protéiques sont de longues extensions provenant des protéines

ribosomiques L2, L3, L4 et L10 mais elles se situent au mieux à 18.4 Angstrom de l’analogue

d’ARNt, ce qui ne leur permet pas de réaliser la réaction chimique de synthèse de la liaison

peptidique.

-Les résidus de l’ARNr de 23S entourant les analogues d’ARNt sont conservés à plus de 95%

dans tous le vivant.

-Cette étude a également proposé que l’adénine A2486 au sein du ribosome de Haloarcula

marismortui (correspondant à A2451 chez E.coli) est dans un contexte physico-chimique lui

permettant de catalyser la réaction chimique de synthèse de la liaison peptidique.

Dans cette étude, le groupe de Thomas A. Steitz réalise également une description

détaillée du tunnel de sortie du polypeptide au sein de la grande sous-unité (figure 15).

L’entrée de ce tunnel se situe au niveau du centre peptidyl-transférase et traverse la sous-unité

50S dans une direction globalement rectiligne antéropostérieure (sur une distance de 100

Angstrom) aboutissant à un orifice situé dans la partie postérieure-basse de la sous-unités de

50S. Ce tunnel est constitué à la fois de protéines et de la portion de l’ARNr de 23S. Il est

globalement de nature hydrophile et présente un diamètre allant de 10 à 28 Angstrom.

Dans une étude réalisée par le groupe de Ramakrishnan en 2006 (Selmer et al 2006) la

résolution de la structure cristallographique du ribosome 70S de Thermus thermophilus laisse

apparaître que la queue amino-terminale de la protéine ribosomique L27 est en contact avec

l’extrémité 3’ de l’ARNt du site P. Ceci suggère que L27 pourrait intervenir dans la catalyse.

Cette hypothèse est confortée par le fait que la délétion de 3 acides-aminés au niveau de

l’extrémité amino-terminale de L27 induit un défaut d’activité peptidyl-transférase chez le

ribosome d’E.coli. Néanmoins, la protéine L27 n’est pas universellement conservée et chez

plusieurs organismes la place qu’elle doit occuper au sein du ribosome et exempt de toute

protéine. Il est donc peu probable qu’elle soit l’élément du ribosome catalysant la formation

de la liaison peptique. La disposition et la nature des nucléotides de l’ARNr de 23S présents

au niveau du centre peptidyl-transférase sont très conservées. Néanmoins, plusieurs études ont

mis en évidence qu’aucune mutation de ces nucléotides n’impacte fortement la catalyse. Il est

19

Page 45: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 46: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

donc peu probable qu’ils soient requis lors de la formation de la liaison peptidique. Il a alors

été proposé que les nucléotides du site actif du ribosome permettraient de rapprocher les

groupements réactifs des ARNt et de les positionner correctement les uns par rapport aux

autres. De plus le ribosome formerait un environnement électrostatique favorable à la réaction

chimique sans toute fois y participer directement.

20

Page 47: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

2. La biogenèse des ribosomes: synthèse et maturation des

constituants des ribosomes

Comme nous avons pu le voir dans les paragraphes précédents, les ribosomes sont des

macromolécules de type RNP très complexes. Plusieurs laboratoires se sont concentrés sur

l’étude des mécanismes d’assemblage des ribosomes et dans de très nombreux cas, ces

laboratoires ont choisi la levure Saccharomyces cerevisiae en grande partie car de nombreuses

approches génétiques et biochimiques sont disponibles chez cette levure.

Les données présentées dans ce chapitre concernent les mécanismes d’assemblage des

ribosomes eucaryotes et plus particulièrement ceux de la levure Saccharomyces cerevisiae.

a) Production et maturation des ARN ribosomiques

Les ribosomes chez Saccharomyces cerevisiae contiennent 4 ARNr: le 18S, le 25S, le

5.8S et le 5S. Les gènes codant ces ARNr (ADNr) sont répétés plus de 150 fois dans le

génome de Saccharomyces cerevisiae et sont tous regroupés sur le bras droit du chromosome

XII. Chaque unité répétée d’ADNr contient 2 gènes positionnés en orientation inverse: un

gène codant l’ARNr de 5S et un gène codant le pré-ARNr de 35S (figure 16). Ce dernier est

un long précurseur comportant les séquences matures des ARNr de 18S, 5.8S et 25S

encadrées et séparées respectivement par des Séquences Transcrites Externes (5’ETS et

3’ETS) et Internes (ITS1 et ITS2). L’ARNr de 5S est synthétisé par l’ARN polymérase III et

le pré-ARNr de 35S par l’ARN polymérase I. Dans chaque unité d’ADNr, les gènes codant

les ARNr sont séparés par des séquences Non Transcrites: NTS1 et NTS2 séparant les gènes

5S et 35S. la région NTS1 contient une séquence nommée RFB (Replication Fork Barrier)

alors que la région NTS2 comporte une Séquence de Réplication Autonome (ARS).

Qu’ils soient transcrits par les ARN polymérases I ou III, les ARNr sont synthétisés

sous forme de précurseurs présentant des extensions 3’ et parfois des extensions 5’ et doivent

donc subir des étapes dites de maturation pour aboutir à la libération des espèces matures de

5S, 18S, 5.8S et 25S.

21

Page 48: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE 16: Structure d'une unité d'ADNr

(adaptée de Kim, Y. H., D. Ishikawa, et al. (2006). "Chromosome XII context is important for rDNA functionin yeast." Nucleic Acids Res 34(10): 2914-24.)

FIGURE 17: Position des sites de clivages au sein du précurseur des ARNr de 18S, 5.8S et 25S.

(adaptée de Fatica, A. and D. Tollervey (2002). "Making ribosomes." Curr Opin Cell Biol 14(3): 313-8.)

Page 49: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

(1) Le précurseur de l’ARNr de 5S

L’ARNr de 5S est synthétisé par l’ARN polymérase III sous la forme du pré-ARNr 5S

présentant une extrémité 5’ mature (correspondant au site +1 de transcription) et une

extrémité 3’ immature. Il semble que le pré-ARNr 5S adopte dès sa synthèse une structure

particulière permettant la maturation correcte de l’extrémité 3’ par une activité exonucléase

(Lee and Nazar 1997). L’enzyme responsable de cette digestion exonucléolytique est la

protéine Rex1p (Piper, Patel et al. 1984), (van Hoof, Lennertz et al. 2000).

(2) Les précurseurs des ARNr de 18S, 5.8S et 25S

La maturation du pré-ARNr de 35S est bien plus complexe et fait intervenir un grand

nombre de facteurs et d’étapes de clivage endo- et exonucléolytiques afin de libérer les

espèces matures de 18S, 5.8S et 25S (pour revue (Fromont-Racine, Senger et al. 2003),

(Fatica and Tollervey 2002)) (figure 17).

(a) Les modifications chimiques

Une des premières étapes de maturation que subissent les pré-ARNr sont des

modifications chimiques de certains nucléotides (figure 18A) (pour revue: (Decatur and

Fournier 2002)). Ce sont pour la plupart des modifications de type méthylation du ribose et

pseudouridylation qui sont réalisées par deux types de RNP:

-Les snoRNP C/D: elles réalisent les méthylations en position 2’ du ribose.

-Les snoRNP H/ACA: elles réalisent les modifications de type

pseudouridylation.

La figure 18B présente le positionnement, au sein du ribosome, des différentes

modifications retrouvées chez la levure. Celles-ci ont tout d’abord été positionnées sur les

représentations des ARNr en structure secondaire (figures 18B/a) mais également sur les

représentations en structure 3D des sous unités ribosomiques procaryotes. Les figures 18B/b

et B/c présentent la structure de la petite sous-unité de Thermus thermophilus (Wimberly,

Brodersen et al. 2000) et les figures 18 B/d et B/e celle de la grande sous-unité de Haloarcula

22

Page 50: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

A

B

FIGURE 18: Les modifications chimiques au sein des ARNr ribosomiques (A: les modifications chimiques les plus fréquentes; (a) les méthylations en position 2' du ribose; (b) les pseudo- uridylations; (c) les méthylations de bases, la position du groupement méthyl est indiquée par des flèches.(B: localisation des modifications chimiques au sein des ARNr; représentation: triangles rouges pour les pseudouridines; ronds verts pour les méthylations en position 2' du ribose; carrés oranges pour les mé- thylations de bases. (a) structures secondaires du 18S (gauche) et 25S/5.8S (droite); (b et c) la petite sous- unité ribosomique; (d et e) la grande sous-unité ribosomique.

(Adaptée de Decatur, W. A. and M. J. Fournier (2002). "rRNA modifications and ribosome function." Trends Biochem Sci 27(7): 344-51.)

Page 51: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

marismortui (Ban, Nissen et al. 2000).

Les modifications chimiques au sein des sous-unités ribosomiques ne semblent pas

distribuées au hasard mais plutôt concentrées au niveau de régions conservées

fonctionnellement importantes des ARNr telles que le centre peptidyl-transferase, les sites A,

P et E, le tunnel de sortie du polypeptide et les zones d’interaction entre les deux sous-unités.

Il n’y pas ou peu de modifications au niveau des surfaces externes des sous-unités

ribosomiques ou au niveau des zones d’interaction entre ARNr et protéines ribosomiques.

Le tableau 2 indique le nombre de modifications retrouvées dans chaque région du

ribosome ainsi que les fonctions qu’elles pourraient influencer. Il est probable que, de par leur

nature physico-chimique, les nucléotides modifiés permettent, entre autre, de stabiliser et ou

rigidifier la structure tertiaire des ARNr. Différentes études ont permis de mettre en évidence

qu’aucune modification de type pseudouridylation ou méthylation de ribose, prise

individuellement, n’est essentielle (Decatur and Fournier 2002). Néanmoins, il est fort

probable qu’elles représentent de manière globale, de part leur niveau de conservation au

cours de l’évolution, un avantage certain pour le fonctionnement des ribosomes. En effet,

l’introduction de mutations abolissant l’activité de la méthylase (Nop1p) ou de la

pseudouridyl-synthase (Cbf5p) associées respectivement aux snoRNP C/D et H/ACA induit

des effets négatifs sévères sur la croissance chez la levure (Tollervey, Lehtonen et al. 1993),

(Zebarjadian, King et al. 1999). De plus il est important de noter que dans le cas des

pseudouridylations, il a été montré que l’absence simultanée de plusieurs d’entre elles situées

dans le centre peptidyl-transférase entraîne des défauts notables dans le processus de

traduction (King, Liu et al. 2003).

Des modifications de type méthylation au niveau de différentes positions de la base de

certains nucléotides sont également retrouvées sur les ARNr (figure 18A). Il a été montré que

la protéine Dim1p réalise l’une d’entre elles: la di-méthylation des résidus A1179/80 présents

dans la région 3’ de l’ARNr de 18S. Lorsque l’activité méthylase de Dim1p est abolie, aucun

défaut de croissance n’est observé. En revanche, il semble que les ribosomes issus d’une

souche exprimant cette forme inactive de Dim1p sont inactifs dans des tests de traduction in

vitro (Lafontaine, Vandenhaute et al. 1995), (Lafontaine, Preiss et al. 1998). Ceci suggère

fortement que les modifications réalisées par Dim1p ont un rôle dans le processus de

traduction.

23

Page 52: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 53: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

(b) Les étapes de clivage des pré-ARNr

Les ARNr de 18S, 5.8S et 25S sont synthétisés sous la forme d’un long

transcrit commun (le pré-ARNr de 35S). Celui-ci doit subir un processus complexe de

maturation aboutissant à la libération des séquences matures des ARNr. Le schéma de la

figure 19 présente la structure du pré-ARNr de 35S ainsi que la position des sites de clivage

connus chez la levure S.cerevisae. La figure 19 illustre les différentes voies de maturation du

pré-ARNr. Il est tout d’abord important de noter que le 35S est le premier précurseur

détectable chez Saccharomyces cerevisiae mais il ne constitue pas réellement le transcrit

primaire car il a déjà subit une étape de maturation en 3’. Il s’agit d’un clivage

endonucléolytique réalisé par l’enzyme Rnt1p (l’homologue chez la levure de la RNAse III

bactérienne) (Kufel, Dichtl et al. 1999). Le clivage par Rnt1p se fait de façon spécifique au

niveau d’une structure en tige boucle située dans la région 3’ETS. Le pré-ARNr de 35S ainsi

libéré subit ensuite des clivages aux sites nommés A0 et A1 situés dans le 5’ETS. Cela permet

successivement la production des intermédiaires 33S et 32S. Puis un clivage dans l’ITS1, au

site A2, induit la séparation d’une part du précurseur de l’ARNr de 18S, le 20S, et d’autre part

du précurseur des ARNr de 5.8S et 25S, le 27SA2. A l’heure actuelle, les facteurs induisant

les clivages aux sites A0, A1 et A2 ne sont pas connus. Néanmoins plusieurs particules de

type snoRNP semblent absolument requises lors de ces étapes de maturation.

Suite au clivage au site A2, une coupure au site D (en 3’ du 18S) permet la maturation

du 20S en 18S. La maturation du précurseur des ARNr de 5.8S et 25S quant à elle peut

emprunter 2 voies:

-Une voie majoritaire (80% des cas) impliquant l’activité endonucléase d’une

particule nommée RNase MRP. Celle-ci réalise un clivage au site A3 dans l’ITS1 donnant

l’intermédiaire 27SA3 (Lygerou, Allmang et al. 1996). L’extrémité 5’ est ensuite maturée

jusqu’au site B1S par digestion exonucléolytique (dans le sens 5’ vers 3’) réalisée par les

enzymes Rat1p et Xrn1p (Henry, Wood et al. 1994). Cela donne un intermédiaire nommé

27SBS.

-Une voie minoritaire (20% des cas) impliquant un clivage endonucléolytique

du 27SA2 au site B1L sans coupure préalable au site A3 (Faber, Vos et al. 2006). Cela donne

l’intermédiaire 27SBL.

Quelle que soit la voie empruntée pour la maturation de l’extrémité 5’, celle de

l’extrémité 3’ se fait par digestion exonucléolytique jusqu’au site B2. Cette étape requiert

24

Page 54: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 55: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

l’enzyme Rex1p et aboutit à la production de l’extrémité 3’ mature de l’ARNr 25S (Kempers-

Veenstra, Oliemans et al. 1986). Puis, les intermédiaires 27SBBS et 27SBL sont maturés selon

une voie commune impliquant un clivage au site C2. Ceci a pour conséquence de séparer les

précurseurs du 5.8S de celui du 25S. Ce sont respectivement les 7SS ou 7SL et le 26S. La

production de l’extrémité 3’ mature du 5.8S, à partir de ses précurseurs 7SS et 7SL, nécessite

une série d’étapes de maturation impliquant successivement l’exosome (puis plus

spécifiquement la protéine Rrp6p), les protéines Rex1p/Rex2p et enfin la protéine Ngl2p

(figure 20) (Faber, Van Dijk et al. 2002), (van Hoof, Lennertz et al. 2000), (Briggs, Burkard

et al. 1998), (Mitchell, Petfalski et al. 1996), (Mitchell, Petfalski et al. 1997), (Allmang,

Petfalski et al. 1999), (Allmang, Kufel et al. 1999). La maturation finale du pré-ARNr 26S en

25S se fait par les exonucléases 5’-3’ Rat1p et Xrn1p qui vont digérer l’extrémité 5’ du 26S

jusqu’au site C1.

Les enzymes responsables des clivages A0, A1, A2, C2 et D n’ont pas encore été

identifiées. Néanmoins, un certain nombre de facteurs (protéines et RNP) ne possédant à

priori pas de fonction nucléase, semblent être au moins en partie requis pour le bon

déroulement de ces étapes de maturation. Ces facteurs seront décrits dans les paragraphes

suivants.

b) Production des protéines ribosomiques

Les gènes codant les constituants protéiques des ribosomes sont tous transcrits par

l’ARN polymérase II. Chez la levure Saccharomyces cerevisiae, ces gènes sont repartis dans

tout le génome et sont souvent dupliqués (Planta and Mager 1998). En effet, les ¾ de ces

gènes sont présents en deux exemplaires. De plus, bon nombre d’entre eux possèdent au

moins un intron. Il est important de noter que chez la levure Saccharomyces cerevisiae, à la

différence des eucaryotes supérieurs, la plupart des gènes sont dépourvus d’intron.

c) Régulation de la synthèse des protéines et des ARN

ribosomiques

La synthèse des différents constituants du ribosome représente une dépense d’énergie

25

Page 56: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 57: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

considérable pour la cellule. Il a été estimé que, chez la levure, la synthèse des ARNr

représente 60% de l’activité transcriptionnelle totale. De plus la synthèse des ARNm codant

les protéines ribosomiques constituerait 60% de l’activité de l’ARN polymérase II. Il est donc

facile de comprendre que les cellules aient mis en place des systèmes permettant d’une part de

coordonner précisément les processus de synthèse des différents constituants des ribosomes et

d’autre part de les ajuster en fonction des apports nutritionnels.

Le contrôle de la transcription des ARNr et des gènes codant les protéines

ribosomiques constitue l’un de ces niveaux de régulation. Ce contrôle implique une voie de

signalisation nommée TOR (Target Of Rapamycin) (figure 21 A). La protéine TOR est une

sérine/thréonine kinase jouant un rôle crucial dans la régulation de la croissance cellulaire et

du métabolisme chez tous les eucaryotes. Une des fonctions de cette voie de signalisation est

d’ajuster le taux de synthèse des ribosomes en fonction des nutriments disponibles. Chez la

levure, lorsque la voie TOR est inhibée par un traitement à la rapamycine, il s’en suit une

inhibition générale de l’activité des ARN polymérases I et III ainsi qu’une réduction

spécifique de l’activité de l’ARN polymérase II au niveau des promoteurs des gènes codant

les protéines ribosomiques (Powers and Walter 1999). La rapamycine inhibe également la

transcription des gènes du régulon Ribi (Ribosome Biogenesis) (Jorgensen, Rupes et al.

2004). Ce groupe de gènes dont l’expression est co-régulée code des facteurs non-

ribosomiques impliqués dans la biogenèse des ribosomes.

La voie TOR agit sur la transcription des composants ribosomiques par différents

mécanismes. Il a, par exemple, été montré que la kinase TOR régule la localisation

subcellulaire de facteurs de transcription spécifiques des gènes codant les protéines

ribosomiques. La modulation de l’activité de l’ARN polymérase I semble quant à elle se faire

de façon plus directe via une interaction de la kinase TOR au niveau du promoteur des gènes

codant les pré-ARNr de 35S (Li, Tsang et al. 2006). Le schéma dans la figure 21 B présente

le promoteur d’un gène codant le pré-ARNr de 35S. Il contient deux séquences importantes

nommées UE (Upstream Element) et Core (Core promoter element) qui sont respectivement

reconnues par le facteur de transcription UAF (Upstream Activating Factor) associé à la TBP

(TATA Binding Protein) et le facteur de transcription CF (Core Factor). L’initiation de la

transcription a lieu lorsque ces facteurs recrutent sur le promoteur la protéine Rrn3 en

association avec l’ARN polymérase I. Il a été proposé que la kinase TOR pourrait réguler la

transcription du gène codant le pré-ARNr 35S via une phosphorylation de la protéine Rrn3p

ou de l’une des sous-unités de l’ARN polymérase I. (Li, Tsang et al. 2006).

26

Page 58: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 59: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

3. Mécanisme d’assemblage des constituants des ribosomes

Dans le chapitre précédant, les données disponibles sur les différentes étapes de la

maturation des ARNr ont été présentées. Néanmoins, il est crucial de noter que ces processus

ont lieu au sein de complexes de grande taille dits «particules pré-ribosomiques». Ces

complexes sont de nature très complexe et surtout très dynamique. En effet, en plus du

recrutement des nombreuses protéines ribosomiques sur les pré-ARNr en cours de maturation,

il y a association puis dissociation d’un nombre important de facteurs dits «d’assemblage» de

type protéique ou ribonucléoprotéique. Plus de 170 facteurs d’assemblage sont connus à

l’heure actuelle mais malheureusement leur fonction n’a que très rarement été identifiée. Il est

fort probable que certains d’entre eux soient requis pour la structuration correcte des pré-

ARNr ou encore pour le bon positionnement des protéines ribosomiques. Il a été mis en

évidence que certains de ces facteurs sont spécifiquement associés à différentes particules pré-

ribosomiques, en grande partie grâce à l’émergence d’études protéomiques à large échelle

(pour revue: (Fromont-Racine, Senger et al. 2003)). La figure 22A présente les différentes

particules pré-ribosomiques connues et les différents facteurs d’assemblage avec lesquels

elles sont associées. Cette figure illustre également le fait que ce processus complexe

d’assemblage des ribosomes se déroule dans différents compartiments ou régions cellulaires.

En effet, la synthèse du pré-ARNr 35S et l’assemblage précoce des ribosomes ont lieu dans

une structure très particulière du noyau appelée Nucléole. Puis le processus d’assemblage se

poursuit dans le nucléoplasme et enfin s’achève dans le cytoplasme.

a) Le nucléole: lieu de synthèse du pré-ARNr de 35S et

d’assemblage précoce des ribosomes

Le nucléole est un domaine nucléaire très dynamique dont la fonction la plus connue et

caractérisée est la synthèse des ribosomes. La figure 22B présente un noyau de levure dans

lequel apparaissent nettement plusieurs «structures» (selon des critères morphologiques

distinguables en microscopie électronique):

-NP: le nucléoplasme

-Le nucléole apparaît comme une structure plus dense aux éléctrons que le

27

Page 60: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 61: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

nucléoplasme. Au sein du nucléole, on distingue 3 sous structures:

-F: le centre fibrillaire

-D: le composant fibrillaire dense

-G: le composant granulaire

Le centre fibrillaire est entouré par le composant fibrillaire dense et le composant

granulaire.

L’attribution d’une fonction précise à ces différents compartiments est encore sujette à

débat. Néanmoins, il a été montré que le centre fibrillaire contient des séquences d’ADNr

(l’ADN comportant les séquences codant les ARNr). L’ARN polymérase I et les ARNr de

35S ainsi que Gar1p et Nop1p, deux facteurs de maturation précoce des ribosomes, ont été

quant à eux détectés dans le composant fibrillaire dense (Leger-Silvestre, Trumtel et al. 1999).

Ces données suggèrent que la transcription des ARNr et les étapes d’assemblage précoces se

déroulent dans le composant fibrillaire dense. Les étapes ultérieures d’assemblage auraient

ensuite lieu dans le composant granulaire.

Comme l’illustre la figure 22A, l’assemblage des composants ribosomiques se déroule

au sein de grosses particules pré-ribosomiques. Elles ont été tout d’abord nommées en

fonction de leur coefficient de sédimentation sur gradient de sucrose, puis de nombreuses

études de protéomique à large échelle ont permis de déterminer de façon plus précise la

composition en terme de facteurs d’assemblage et en terme de pré-ARNr des différentes

particules (pour revue: (Dez and Tollervey 2004)).

b) La particule pré-ribosomique 90S

La formation de la particule pré-ribosomique débute dans le nucléole au cours de la

transcription du précurseur 35S des ARNr. Les arbres de Miller présentés dans les figures

22Bc et 22Bd illustrent ce processus d'assemblage co-transcriptionnel (Raska, Shaw et al.

2006). Les arbres de Miller correspondent à un étalement d’une région chromatinienne

contenant des gènes codant les ARNr. Le tronc de l’arbre est constitué d’ADNr alors que les

branches correspondent aux pré-ARNr en cours de synthèse. Des structures en forme de

boules sont visibles à l’extrémité de ces branches et reflètent l’association des facteurs

précoces de maturation avec les pré-ARNr.

Au sein de la particule pré-ribosomique de 90S vont se dérouler les premières étapes

28

Page 62: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

de maturation du pré-ARNr 35S telles que les modifications chimiques de type méthylation et

pseudouridylation, réalisées par les snoRNP C/D et H/ACA, ainsi que les clivages précoces

aux sites A0, A1 et A2. Par conséquent, lorsque l’on parle de particules 90S, on fait référence

à un ensemble de particules dont la nature diffère, entre autre de part leur composition en pré-

ARNr (35S, 33S ou 32S).

(1) Les snoRNP C/D et H/ACA requises pour les

modifications chimiques des pré-ARNr

(a) Les snoRNP C/D guides de méthylation

Les snoRNP C/D (Small NucleOlar RiboNucleoProtein particle C/D) sont des petites

particules localisées dans le nucléole et requises pour les modifications de type méthylation

en position 2’ du ribose de certains nucléotides des ARNr. Ces petites particules résultent de

l’association de 5 composants:

-un petit ARN non codant nommé snoARN C/D

-4 protéines: Nop1p, Snu13p, Nop56p et Nop58p

Les snoARN C/D sont des ARN non codants dont la taille varie de 80 à 150

nucléotides. La figure 23A présente la structure canonique des snoARN C/D. Ces ARN

possèdent des boites conservées nommées C, D, C’ et D’. Les consensus des boites C et D

sont respectivement 5’-PuUGAUGA-3’ (Pu signifie purine) et 5’-CUGA-3’. Les boites C’ et

D’ présentent quant à elles des séquences proches de celles des boites C et D mais souvent

plus dégénérées (Tycowski, Shu et al. 1996), (Kiss-Laszlo, Henry et al. 1998). Bien que les

boites C et D soient positionnées aux deux extrémités de l’ARN, elles sont rapprochées dans

l’espace via un appariement entre les extrémité 5’ et 3’ formant une courte tige. Les snoARN

C/D présentent également, immédiatement en amont des boites D et/ou D’, de longues

séquences complémentaires à différentes portions des ARNr. Ces séquences allant de 10 à 21

nucléotides permettent un appariement de type Watson/Crick entre les snoARN et les ARNr

et le ciblage de manière très spécifique du nucléotide à méthyler; celui-ci étant toujours

apparié au 5ème nucléotide en amont de la boite D/D’ (Cavaille, Nicoloso et al. 1996; Kiss-

Laszlo, Henry et al. 1996; Nicoloso, Qu et al. 1996).

29

Page 63: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

Les snoARN C/D sont associés de façon stable et spécifique à quatre protéines :

-La protéine Nop1p (Fibrillarine chez les eucaryotes supérieurs) a été la

première protéine identifiée comme composant des snoRNP C/D (Schimmang, Tollervey et

al. 1989). Elle est nucléolaire et essentielle pour la viabilité cellulaire chez la levure. De plus,

elle est absolument requise pour la fonction de méthylation (Tollervey, Lehtonen et al. 1993)

et elle possède un domaine de liaison à la S-adénosyl méthionine (donneur universel du

groupement méthyl) ce qui suggère fortement que la protéine Nop1p est la sous-unité

catalytique des snoRNP C/D. De plus, l’équipe d’I.Bozzoni a présenté des résultats de

méthylation in vitro permettant d’affirmer que Nop1p possède l’activité catalytique du

complexe. En effet, les snoRNP C/D de levure purifiées utilisées dans ces expériences ne

présentent une activité méthyl-transférase que lorsqu’elles contiennent une forme sauvage de

la protéine Nop1p (Galardi, Fatica et al. 2002).

-Nop56p et Nop58p sont deux protéines nucléolaires apparentées (45 %

d’identité) essentielles chez la levure. Hormis un domaine riche en résidus basiques KKE/D

(présent chez les protéines de levure), elles ne présentent pas de signatures protéiques

notables. Elles ont tout d’abord été identifiées comme interagissant génétiquement (lors d’un

crible génétique de létalité synthétique) et physiquement avec la protéine Nop1p puis

plusieurs études ont mis en évidence qu’elles sont associées aux snoARN C/D (Gautier,

Berges et al. 1997) (Wu, Brockenbrough et al. 1998) (Lafontaine and Tollervey 1999; Lyman,

Gerace et al. 1999) (Newman, Kuhn et al. 2000) (Lafontaine and Tollervey 2000).

-La protéine Snu13p présente des homologies de séquence avec la

protéine Nhp2p et la protéine ribosomique Rpl32p. Elle a tout d’abord été identifiée en tant

que composant de la particule U4 snRNP de la machinerie d’épissage (Gottschalk, Neubauer

et al. 1999), (Stevens and Abelson 1999). Snu13p a la capacité de lier spécifiquement une

structure d’ARN particulière appelée «motif Kink-turn» au sein du snARN U4 (figure 23B)

(Nottrott, Hartmuth et al. 1999), (Vidovic, Nottrott et al. 2000). Les structures de type Kink-

turn sont également retrouvées au sein des ARNr et des snoARN C/D. Un Kink-turn

canonique (figure 23Ba) contient 2 courtes tiges (stem I et stem II) séparées par une boucle

interne de 3 nucléotides. La tige I est formée par deux paires de bases G-C de type Watson-

Crick (pour les ARN C/D ces nucléotides sont variables) alors que la tige II contient 2 paires

de bases G-A (pour revue: (Henras, Dez et al. 2004)). Il a été montré que Snu13p est un

30

Page 64: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

composant des snRNP C/D et qu’elle est requise pour l’accumulation des snoARN C/D

(Watkins, Segault et al. 2000). De plus, cette étude a mis en évidence que Snu13p interagit de

façon directe avec les snoARN C/D au niveau d’une structure en Kink-turn semblable à celle

retrouvée au sein du snARN U4.

Les particules de type C/D sont également présentes chez les archées. Elle sont alors

nommées sRNP C/D. Elles sont constituées de 4 composants: un petit ARN de type C/D et 3

proteines: aFib (homolgue de la fibrillarine), L7Ae (homologue de Snu13p/15.5 kDa) et Nop5

(ancêtre des protéines Nop56p et Nop58p). Les études chez les archées ont, entre autre,

permis de confirmer l’hypothèse selon laquelle la protéine aFib/Fibrillarine constituerait la

sous-unité catalytique des particules C/D. Ceci a été mis en évidence par des tests d’activité

méthyl-transférase de particules C/D d’archées reconstituées in vitro et contenant des formes

mutées de la protéine aFib (Omer, Ziesche et al. 2002).

(b) Structure des RNP C/D

De nombreuses études ont été réalisées dans le but de déterminer comment sont

agencés les différents composants au sein du complexe. Les approches expérimentales alors

utilisées ont été très variées telles que, entre autres, des tests d’interaction protéines/protéines

et protéines/ARN in vitro, des tests de pontages spécifiques in vivo ainsi que des expériences

de cartographie des sites de liaison des composants protéiques des particules C/D sur un ARN

C/D («Analogue interference mapping»). Ces études ont été réalisées chez le xénope, dans des

extraits de cellules de mammifères ou encore in vitro pour, entre autre, les protéines d’archées

(Szewczak, DeGregorio et al. 2002), (Cahill, Friend et al. 2002), (Omer, Ziesche et al. 2002),

(Bortolin, Bachellerie et al. 2003), (Tran, Zhang et al. 2003), (Rashid, Aittaleb et al. 2003),

(Omer, Zago et al. 2006), (Schultz, Nottrott et al. 2006), (Gagnon, Zhang et al. 2006),

(Aittaleb, Rashid et al. 2003), (Watkins, Dickmanns et al. 2002).

Les conclusions issues de toutes ces études laissent apparaître un certain nombre de

similitudes mais également des différences entre les structures des différentes RNP C/D

proposées.

Les particules C/D chez les archées et chez les eucaryotes supérieurs présentent une

protéine L7Ae/15.5 kDa en association spécifique avec la boucle de la structure Kink-turn

31

Page 65: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

formée par les boites C et D. Les motifs C’ et D’ chez les archées (dont la séquence est

généralement moins dégénérée que ceux des eucaryotes) forment également une structure

Kink-turn capable de recruter L7Ae. En revanche, la protéine 15.5 kDa chez les eucaryotes

supérieurs ne semble pas s’associer avec ces mêmes motifs.

Chez les archées, la liaison de la protéine L7Ae au niveau des motifs C/D et C’/D’ est

indispensable au recrutement des protéines Nop5 et aFib. Ces deux dernières protéines

seraient capables de former un pré-complexe avant leur recrutement au sein du complexe

ARN C/D/L7Ae comme le montre la figure 24A présentant la structure du complexe

Nop5/aFib obtenue par cristallographie aux rayons X. De plus, cet hétérodimère semble

capable de s’homodimériser via une interaction entre les domaines coiled-coil des deux

protéines Nop5. La figure 24B présente le modèle d’assemblage des particules C/D chez les

archées. Ce modèle laisse apparaître une nette symétrie au sein de la particule avec le

positionnement d’un même complexe protéique tripartite (L7Ae/Nop5/aFib) sur les motifs

C/D et C’/D’. De plus, ces deux complexes seraient liés via la dimérisation des protéines

Nop5.

Chez les eucaryotes supérieurs, le modèle d’assemblage proposé pour les particules

C/D est sensiblement différent. En effet, d’une part, la protéine 15.5 kDa n’interagirait

qu’avec les motif C/D; et d’autre part, il a été montré que la protéine Nop58p s’associe au

motif C/D et la protéine Nop56p avec le motif C’/D’. Etant donné l’homologie entre ces deux

protéines et la protéine Nop5, il est possible qu’elles soient capables de s’hétérodimériser via

leur domaine coiled-coil. En conclusion, les particules C/D chez les eucaryotes supérieurs

présentent une structure asymétrique.

Une étude récente (en cours de publication) réalisée sur les particules C/D de levure

par Béatrice Clouet-d’Orval et collaborateurs laisse apparaître une situation intermédiaire

entre les résultats obtenus chez les archées et les eucaryotes supérieurs. En effet, les snoRNP

C/D de levure présenteraient deux copies de la protéine Snu13p (homologue de 15.5

kDa/L7Ae). Ce qui suggère qu’il y aurait une copie de Snu13p sur chacun des motifs C/D et

C’/D’.

32

Page 66: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 67: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 68: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

(c) Les snoRNP H/ACA guides de

pseudouridylation

Les informations relatives aux snoRNP H/ACA guides de pseudouridylation font

l’objet de la revue « Box H/ACA RNPs: from ribosome formation to telomere maintenance »

présentée dans ce manuscrit.

(2) Les snoRNP C/D et H/ACA requises pour les

clivages précoces des pré-ARNr

(a) La snoRNP C/D contenant le petit ARN U3

La particule de type C/D contenant le petit ARN essentiel et conservé U3 joue un rôle

crucial dans les étapes de clivages précoces du pré-ARNr de 35S requis pour la production de

l’ARNr de 18S. Cela a tout d’abord été mis en évidence dans des études réalisées chez les

eucaryotes supérieurs:

-Chez les mammifères: (Kass, Tyc et al. 1990)

-Chez le xénope: (Savino and Gerbi 1990), (Borovjagin and Gerbi 1999).

Chez la levure Saccharomyces cerevisiae, U3 est également présent et impliqué dans

la maturation précoce du pré-ARNr (Hughes and Ares 1991), (Beltrame, Henry et al. 1994),

(Beltrame and Tollervey 1995).

La snoRNP U3 est une particule de type C/D. Néanmoins, aucune fonction de

méthylation ne lui a été attribuée. Il semble qu’elle soit requise pour la maturation du pré-

ARNr de 35S en lui permettant d’adopter une conformation correcte nécessaire à la réalisation

des clivages précoces A0, A1 et A2. Ce rôle de chaperon structural serait réalisé grâce à

plusieurs appariements directs entre le snoARN U3 et le pré-ARNr de 35S. La figure 25

présente la structure de l’ARN U3 en interaction avec le pré-ARNr de 35S. Le snoARN U3

présente plusieurs éléments conservés tels que les boites GAC, A’, A, B, C, C’, D ainsi

33

Page 69: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 70: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

qu’une courte séquence de 10 nucléotides en aval de la boite A parfaitement complémentaire

à une portion du 5’ ETS du pré-ARNr. La figure 25 présente les régions du pré-ARNr (au

sein du 5’ETS et l’ARNr 18S) ayant été identifiées comme interagissant avec le snoARN U3

(Beltrame and Tollervey 1992), (Hughes 1996), (Sharma and Tollervey 1999). De façon

intéressante, la région 5’ du snoARN U3 (contenant les boites CAG, A’ et A) interagit avec

deux portions cruciales de l’ARNr 18S. En effet, celles-ci sont impliquées dans la formation

d’une structure en pseudonœud caractéristique universelle de la petite sous-unité ribosomique.

Il est possible que le snoARN U3 facilite la formation de ce pseudonoeud en rapprochant dans

l’espace les différentes portions de l’ARNr.

Le snoARN U3 est associé, comme tous les snoARN C/D aux protéines Nop1p,

Nop56p, Nop58p et Snu13p auxquelles s’ajoutent de nombreuses autres protéines spécifiques:

Utp1p à Utp18p (Utp pour: U Three Protein), Utp20 à Utp22p, Noc4p, Mpp10p, Sof1p,

Dhr1p, Lcp5p, Rcl1p, Esf2p, Imp3p, Imp4p, Rrp5p, Rrp9p, Emg1p, Krr1p, Rps4p, Rps6p,

Rps7p, Rps9p et Rps14p (Wiederkehr, Pretot et al. 1998), (Billy, Wegierski et al. 2000),

(Dragon, Gallagher et al. 2002), (Bernstein, Gallagher et al. 2004) (Hoang, Peng et al. 2005),

(Venema, Vos et al. 2000), (Dunbar, Wormsley et al. 1997), (Lee and Baserga 1999),

(Venema and Tollervey 1996), (Colley, Beggs et al. 2000) (pour revue: (Granneman and

Baserga 2004)). La plupart de ces protéines sont essentielles et requises pour les étapes

précoces de maturation du pré-ARNr de 35S cruciales pour la production de l’ARNr de 18S.

Ce complexe a ainsi été nommé SSU processome (Small SubUnit processome) (Dragon,

Gallagher et al. 2002). De plus, il semble que ce SSU processome soit, au moins en partie, à

l’origine des structures en forme de boules visibles sur les arbres de Miller et positionnées à

l’extrémité des pré-ARNr en cours de synthèse (Dragon, Gallagher et al. 2002). Le SSU

processome est un des constituants des particules pré-ribosomiques 90S.

La fonction des composants protéiques du SSU processome est encore largement

méconnue. Il a été proposé que certaines d’entre elles soient requises pour un couplage entre

les processus de transcription et de maturation des pré-ARNr car il a été montré que la

suppression de l’expression de certaines protéines Utp (Utp4p, Utp5p, Utp8p, Utp9p, Utp10p,

Utp15p et Utp17p) entraîne une inhibition de la transcription des unités d’ADNr par l’ARN

polymérase I. Ces protéines ont alors été renommées: t-Utp (U Three Protein required for

Transcription). Néanmoins, ces résultats ont récemment été remis en cause. Les protéines t-

Utp sont capables de former un complexe indépendamment du SSU processome. De plus, ce

34

Page 71: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

complexe a la capacité d’être recruté un niveau de la chromatine contenant des ADNr et ceci

de façon indépendante de la transcription par l’ARN polymérase I (Gallagher, Dunbar et al.

2004). Il a été proposé que ces protéines forment en quelque sorte un sous-complexe du SSU

processome permettant un couplage entre la transcription des ADNr et la maturation des pré-

ARNr via le recrutement subséquent des autres composants du SSU processome.

Une fonction probable dans les processus d’appariements entre le snoARN U3 et le

pré-ARNr a été proposée pour les protéines Imp3p et Imp4p. En effet, des tests d’interaction

protéines/ARN et ARN/ARN réalisés in vitro ont mis en évidence que ces deux protéines sont

capables de lier de façon directe et spécifique le snoARN U3. De plus, de façon très

intéressante, elles sont absolument requises pour la formation in vitro du duplexe snoARN

U3/pré-ARNr (Gerczei and Correll 2004).

(b) La snoRNP contenant le petit ARN C/D U14

Le snoARN U14 est absolument requis lors des étapes de maturation précoces du pré-

ARNr requises pour la production de l’ARNr de 18S (Li, Zagorski et al. 1990). La figure 26

présente la structure du snoARN U14. Il possède deux régions nommées A et B présentant

une complémentarité quasi-parfaite avec l’ARNr de 18S. Il a été mis en évidence que le

domaine B du snoARN U14 chez le xénope est requis pour la méthylation en position 2’-O du

ribose du nucléotide 427 de l’ARNr de 18S (Dunbar and Baserga 1998). En revanche, aucune

fonction de méthylation n’a été attribuée au domaine A. L’introduction de mutations au sein

de la boite B a permis de mettre en évidence que la fonction essentielle de U14 n’est pas la

méthylation. En revanche, le domaine A et plus précisément sa capacité à interagir avec une

portion du 18S au sein du pré-ARNr, est essentiel (Jarmolowski, Zagorski et al. 1990).

Néanmoins, la fonction exacte de ce domaine n’est pas encore connue.

(c) Les snoRNP contenant les petits ARN H/ACA

snR30 et snR10

Les informations relatives aux snoRNP H/ACA contenant les petits ARN snR30 et

snR10 sont présentées dans la revue « Box H/ACA RNPs: from ribosome formation to

35

Page 72: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 73: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

telomere maintenance » au sein de ce manuscrit.

Les premières étapes du processus de biogenèse des ribosomes consistent donc à

transcrire le pré-ARNr au sein du nucléole sur lequel vont être recrutés un grand nombre de

facteurs donnant naissance à la particule pré-ribosomique de 90S. Il a été mis en évidence

qu’au sein de cette particule sont essentiellement retrouvés des facteurs requis pour la

maturation de la particule ribosomique de 40S (facteurs pré-40S) et très peu de facteurs

nécessaires à la biogenèse de la sous-unité de 60S (facteurs pré-60S) (Grandi, Rybin et al.

2002). Il est possible que ce phénomène reflète simplement le fait que les sites de liaison des

facteurs pré-40S sont accessibles plus tôt au cours de la synthèse du pré-ARNr et donc

permettent un recrutement plus précoce des facteurs pré-40S. Une autre hypothèse très

intéressante a été formulée par Granneman et Baserga (Granneman and Baserga 2004). Ils ont

proposé que la particule de 90S isolée par Grandi et collaborateurs ne serait pas une particule

pré-ribosomique précoce contenant le pré-ARNr de 35S comme cela a été proposé mais que,

cette particule contiendrait l’ARNr de 23 S un précurseur du 18S. En effet, il a été montré que

beaucoup de composants du SSU processome s’associent de façon préférentielle avec l’ARNr

de 23S (Wehner and Baserga 2002). Cet ARN est issu du clivage de l’ARNr de 35S au site

A3 entraînant la séparation des précurseurs ARN de la grande et de la petite sous-unité

ribosomique. Le fait que le 23S ait été détecté dans un contexte sauvage et qu’il soit capable

de produire de l’ARNr de 18S suggère fortement qu’il n’est pas un intermédiaire de

maturation aberrant. La particule pré-ribosomique de 90S isolée par Grandi et collaborateurs

serait donc un précurseur de la voie 40S ce qui expliquerait le fait qu’elle contienne un grand

nombre de facteurs pré-40S et peu de facteurs pre-60S (figure 27). Il est possible qu’une

durée de vie très courte rende la « vraie particule pré-90S » (c'est-à-dire celle contenant le pré-

ARNr de 35S) très difficile à isoler. Il est probable que cette particule contienne à la fois des

facteurs pré-40S et pré-60S car il a été mis en évidence que certains facteurs pré-60S sont

associés au pré-ARNr de 35S (Fatica, Cronshaw et al. 2002), (Harnpicharnchai, Jakovljevic et

al. 2001; Wehner and Baserga 2002).

36

Page 74: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 75: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

c) La voie de maturation des précurseurs de la sous-

unité de 40S

Un grand nombre de facteurs requis pour la production de la particule ribosomique de

40S sont recrutés de façon très précoce au cours de la biogenèse des ribosomes figure 22A

(Schafer, Strauss et al. 2003) (pour revue (Fromont-Racine, Senger et al. 2003), (Dez and

Tollervey 2004)). Certaines protéines telles que Enp1p, Dim1p, Rrp12p, Dim2p, Hrr25p,

Noc4p et Nop14p présentes dans la pré-90S restent associées aux particules pré-40S et se

dissocient plus tardivement lors du transit de la pré-40S dans le nucléoplasme (Noc4p,

Nop14p) ou lors des étapes finales de maturation dans le cytoplasme.

Le rôle exact de la plupart de ces facteurs n’est souvent pas encore connu. Certaines,

telles que Tsr1p, Enp1p, semblent requises pour le transport de la petite sous-unité

ribosomique vers le cytoplasme ou alors requises lors des étapes de maturation ayant lieu

avant l’exportation (Schafer, Strauss et al. 2003). Alors que d’autres, telles que Rio1p, Rio2p

et Nob1p seraient requises lors d’étapes de maturation plus tardives ayant lieu dans le

cytoplasme et absolument requises pour la conversion de pré-ARNr de 20S en 18S

(Vanrobays, Gleizes et al. 2001), (Vanrobays, Gelugne et al. 2003), (Fatica, Oeffinger et al.

2003).

De façon intéressante, une étude récente réalisée sur la kinase Hrr25p a permis de

proposer qu’elle pouvait réguler la formation d’une partie bien précise de la sous-unité

ribosomique de 40S appelée «bec» (constitué de l’hélice 33 de l’ARNr de 18S). La

stabilisation de cette structure requiert la protéine ribosomique Rps3p. Il a été mis en évidence

que des évènements de phosphorylation puis déphosphorylation de la protéine Rps3p sont

absolument requis pour la structuration correcte du bec. Hrr25p serait la kinase requise pour

la phosphorylation de Rps3p mais également de Enp1p, un proche partenaire de Rps3p. Il a

été proposé que la phosphorylation par Hrr25p permettrait de réguler le positionnement du

futur bec de telle sorte qu’il ne gène pas le passage de la sous-unité pré-40S par le complexe

de pore nucléaire (Schafer, Maco et al. 2006).

La taille importante des particules pré-40S nécessite un système actif (nécessitant de

l’énergie) d’exportation du noyau vers le cytoplasme via le Complexe de Pore Nucléaire

(CPN). Le NPC est un complexe résultant de l’assemblage de plusieurs protéines nommées

nucléoporines. Il est ancré dans l’enveloppe nucléaire et forme une sorte de tunnel laissant

37

Page 76: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

diffuser librement les petites molécules entre les compartiments nucléaire et cytoplasmique.

En revanche, le passage des grosses molécules (que l’on nommera « cargo ») nécessite des

systèmes actifs de transport. En effet, elles doivent tout d’abord présenter des signaux

spécifiques reconnus par des protéines appelées caryophérines. Le complexe

cargo/caryophérine peut alors passer à travers le NPC. L’association entre le cargo et la

caryophérine est régulée par une protéine nommée Ran à activité GTPasique. Cette protéine

est majoritairement présente sous la forme Ran-GTP dans le noyau et sous la forme Ran-GDP

dans le cytoplasme. Le complexe Cargo/exportine (caryophérine requise pour la sortie du

noyau) ne se forme que dans le noyau en présence de la forme Ran-GTP. Suite au passage à

travers le NPC, Ran hydrolyse le GTP en GDP (grâce à la présence dans le cytoplasme de co-

activateur de Ran) et induit ainsi la dissociation du complexe cargo/exportine.

Il a été mis en évidence que l’exportine Crm1p, la GTPase Ran ainsi que certaines

nucléoporines sont requises pour le transport des particules pré-40S du noyau vers le

cytoplasme (Moy and Silver 1999) (Gleizes, Noaillac-Depeyre et al. 2001). La reconnaissance

d’un cargo par l’exportine Crm1p nécessite que ce cargo présente une Séquence

d’Exportation Nucléaire (NES). Il a récemment été mis en évidence que le facteur

d’assemblage ribosomique Ltv1p est requis pour l’exportation de la pré-40S et qu’il possède

une NES fonctionnelle. Il a été alors proposé que Ltv1p pourrait être un des adaptateurs

permettant la reconnaissance de la pré-40S par l’exportine Crm1p (Seiser, Sundberg et al.

2006). Certaines nucléoporines au sein du NPC présentent des répétitions des motifs GLFG

ou FXFG. Il a été proposé que les résidus FG de ces motifs constituent une barrière

hydrophobe obstruant le NPC et par conséquent empêchant la libre diffusion de grosses

molécules hydrophile comme les pré-ribosomes. Un des rôles de caryophérines comme

Crm1p serait d’interagir via des domaines répétés nommés HEAT avec ces motifs FG pour

permettre le passage du cargo à travers le NPC. De façon intéressante, il a été mis en évidence

que la protéine Rrp12p possède des répétitions HEAT et qu’elle interagit d’une part avec les

répétitions FG des nucléoporines et d’autre part avec Ran-GTP. Il a donc été proposé qu’elle

pourrait être comme Crm1p directement requise pour l’exportation de la pré-40S. De plus, il

est possible que la protéine Noc4p exerce une fonction identique car elle présente également

des répétitions HEAT (Dlakic and Tollervey 2004; Oeffinger, Dlakic et al. 2004).

La maturation de la petite sous-unité s’achève dans le cytoplasme où le pré-ARNr de

20S acquiert une diméthylation via Dim1p et subit le clivage au site D. L’enzyme responsable

38

Page 77: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

du clivage au site D n’est pas encore connue. Il a toutefois été proposé que les protéines

Fap7p et Nob1p sont requises lors de cette étape. La protéine Nob1p présente un domaine de

type PIN. La détermination de la structure d’un domaine PIN d’archée a mis en évidence qu’il

présente une homologie de structure avec la RNase H et l’endonucléase flap du phage T4. Sur

la base de cette homologie, Fatica et collaborateurs ont réalisé des mutations sur des résidus

clés. Une des ces mutations a entraîné un défaut de production de l’ARNr de 18S. Il a donc

été proposé que Nob1p pourrait être l’endonucléase responsable du clivage au site D.

d) Les particules pré-60S

La biogenèse de la sous-unité ribosomique de 60S est un processus complexe

requérant un plus grand nombre de facteurs que la maturation des pré-40S. Ceci est dû, au

moins en partie, au fait que la maturation du 27SA2 en 5.8S et 25S matures nécessite

plusieurs étapes de clivages endo- et exonucléolytiques. De plus, l’ARNr de 5S ainsi que de

nombreuses protéines ribosomiques doivent être incorporés au sein des pré-60S.

La fonction précise de la plupart des facteurs ribosomiques pré-60S n’est pas encore

connue. Néanmoins, certains d’entre eux ont fait l’objet d’expériences de purification

permettant de déterminer à quels pré-ARNr et protéines ils sont associés (Saveanu, Bienvenu

et al. 2001), (Harnpicharnchai, Jakovljevic et al. 2001), (Bassler, Grandi et al. 2001),

(Milkereit, Gadal et al. 2001), (Fatica, Cronshaw et al. 2002), (Nissan, Bassler et al. 2002),

(Saveanu, Namane et al. 2003). Ces résultats, ainsi que la détermination de leur localisation

cellulaire, ont permis d’identifier les étapes du processus de maturation dans lesquelles ils

interviennent.

Il semble que l’ARNr de 5S soit incorporé tardivement, dans le nucléoplasme au sein

d’une particule pré-60S contenant, entre autre, les protéines Nug1p et Nug2p/Nog2p

(Harnpicharnchai, Jakovljevic et al. 2001), (Nissan, Bassler et al. 2002).

L’exportation des particules pré-60S du nucléoplasme vers le cytoplasme requiert

comme dans le cas des particules pré-40S l’exportine Crm1p et la GTPase Ran (Hurt, Hannus

et al. 1999). Il semble que la protéine adaptatrice, faisant le lien entre la particule pré-60S et

Crm1p soit la protéine Nmd3p. En effet, il a été mis en évidence que Nmd3p est absolument

requise pour l’exportation des particules pré-60S. Une interaction directe entre Nmd3p et la

protéine Crm1p permettrait le passage des particules pré-60S à travers les complexes de pore

39

Page 78: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

nucléaire (Gadal, Strauss et al. 2001) (Ho, Kallstrom et al. 2000) (West, Hedges et al. 2007).

La protéine Nmd3p présente des liens génétiques ainsi que la capacité de lier directement la

protéine Rpl10p in vitro. Il a donc tout d’abord été proposé que Rpl10p pourrait, via une

interaction directe avec Nmd3p, constituer le point d’ancrage de la machinerie d’exportation

sur les particules pré-60S (Gadal, Strauss et al. 2001). Néanmoins, deux études ultérieures ont

réfuté ce modèle en montrant entre autre que la protéine Nmd3p s’associe avec les particules

pré-60S avant la protéine Rpl10p. De plus, ces études ont démontré que Rpl10p ainsi qu’une

GTPase nommée Lsg1p ne sont pas requises pour le recrutement de Nmd3p mais plutôt pour

sa dissociation des sous-unités ribosomiques de 60S cytoplasmiques (Hedges, West et al.

2005), (West, Hedges et al. 2005).

De façon identique à la situation observée pour l’exportation des pré-40S, il semble

que la protéine Rrp12p, également associée aux pré-60S, pourrait, via ses répétitions HEAT,

participer au processus de transport des sous-unités pré-60S au travers des complexes de

pores nucléaires (Oeffinger, Dlakic et al. 2004).

Suite à leur exportation dans le cytoplasme, les particules pré-60S sont encore

associées à un certain nombre de facteurs de maturation tels que: Nog1p, Rlp24p, Arx1p,

Alb1p et Tif6p. Il a été mis en évidence que le recyclage de ces facteurs requiert différentes

protéines dont Rei1p, une AAA-ATPase (Drg1p) et une protéine-chaperonne (Jjj1p)

s’associant au cours des étapes cytoplasmiques de maturation des pré-60S (Lebreton, Saveanu

et al. 2006), (Demoinet, Jacquier et al. 2007), (Pertschy, Saveanu et al. 2007), (Meyer, Hung

et al. 2007).

40

Page 79: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

B. La télomérase humaine est une RNP H/ACA atypique

Le maintien de l’intégrité et de la stabilité du génome est absolument crucial pour le

bon fonctionnement et la propagation de tout organisme vivant. Les télomères constituent l’un

des éléments absolument requis pour la stabilité des chromosomes linéaires chez les

eucaryotes. Les télomères sont des structures particulières positionnées à chaque extrémité

des chromosomes. Il sont synthétisés par une enzyme nommée télomérase.

1. Les télomères sont des structures cruciales protégeant

l’extrémité des chromosomes

a) Les télomères, une solution au problème réplicatif

Les molécules d’ADN linéaires telles que les chromosomes eucaryotes requièrent des

mécanismes particuliers, en plus des ADN polymérases conventionnelles, pour la réplication

de leurs extrémités. La machinerie de réplication classique procède à la copie de la molécule

d’ADN dite parentale via un mode de réplication semi-conservatif. La molécule d’ADN est

synthétisée dans le sens 5’ vers 3’ et requiert en général une amorce de type ARN. Ces

propriétés intrinsèques aux ADN polymérases classiques conduisent irrémédiablement à une

érosion des extrémités chromosomiques à chaque nouveau cycle cellulaire. La figure 28

illustre, de façon très simplifiée, ce phénomène. Durant la phase S du cycle cellulaire, la

molécule d’ADN parentale est copiée au sein d’une fourche de réplication se déplaçant d’une

position interne vers l’extrémité du chromosome. Dans cette fourche de réplication on

distingue le brin précoce (« Leading) et le brin tardif (« Lagging »). La synthèse du brin

précoce ne nécessite qu’une amorce ARN et se fait de façon continue jusqu’au dernier

nucléotide de la molécule d’ADN. La synthèse du brin tardif est quant à elle discontinue et est

réalisée sous forme de fragments d’Okasaki successifs polymérisés à partir d’amorces d’ARN

synthétisées tous les 200 nucléotides environ. La copie du brin parental est suivie d’une

élimination des amorces d’ARN, l’intervalle alors libéré est comblé par une extension du brin

d’ADN en amont, celui-ci est ensuite ligaturé au fragment d’ADN situé en aval. L’intervalle

41

Page 80: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

libéré suite à l’élimination de l’amorce d’ARN la plus distale sur le brin discontinu ne peut

pas être comblé à cause du caractère unidirectionnel (de 5’ vers 3’) de la synthèse d’ADN par

les ADN polymérases classiques. Par conséquent, le brin discontinu se trouve raccourci par

rapport au brin parental dont il est issu. La perte de matériel génétique engendrée par un tel

raccourcissement pourrait se montrer très délétère pour le devenir de la cellule si elle se

produisait à chaque division mitotique. Les cellules eucaryotes ont mis en place un système

permettant de palier à ce problème: les télomères. Les télomères sont des structures

protectrices, constituées à la fois d’ADN et de protéines positionnées à l’extrémité des

chromosomes. Leur présence permet d’une part d’empêcher le raccourcissement des

chromosomes se produisant à chaque cycle cellulaire et d’autre part de faire en sorte que les

extrémités des chromosomes ne soient pas reconnues par la cellule comme des fragments

issus de cassures d’ADN double brin.

b) Le composant ADN des télomères est synthétisé par

la télomérase

Les télomères sont des structures composées de portions d’ADN répétées reconnues

spécifiquement par des complexes protéiques. Chez la plupart des eucaryotes, le composant

ADN des télomères est constitué de courts motifs simples, riches en G et répétés en tandem

sur plusieurs dizaines de kilobases. Ces motifs répétés, dont la séquence est 5’-TTAGGG-3’

chez les vertébrés, sont ajoutés en 3’ à l’extrémité des chromosomes par un complexe nommé

télomérase (Greider and Blackburn 1985). La télomérase est une particule

ribonucléoprotéique résultant de l’assemblage entre un ARN non codant et plusieurs protéines

(Greider and Blackburn 1987) (Greider and Blackburn 1989). Le composant ARN de la

télomérase, nommé TERC (TElomerase RNA Component) ou TR (Telomerase RNA)

présente une séquence dite «matrice» correspondant à 1,5 fois la séquence complémentaire du

motif télomérique c’est à dire 5’-CAAUCCCAAUC-3’ chez l’homme (Feng, Funk et al.

1995). Cette séquence matrice en s’appariant à un motif télomérique permet la formation d’un

duplexe ADN/ARN qui est alors le substrat de l’une des sous-unités protéiques du complexe

télomérase: la protéine TERT (TElomerase Reverse Transcriptase) (Shippern-lentz et

Blackburn 1990 science). Cette protéine possède une activité transcriptase inverse lui

permettant d’allonger l’extrémité 3’ des chromosomes en copiant la séquence matrice de

42

Page 81: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE 28: Schématisation du phénomène de raccourcissement des extrémités chromosomiques lors de la réplication

sens de déplacement de la fourche de réplication

Page 82: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE 29: Modèle du mode d'action de l'enzyme télomérase

(Adaptée de Autexier, C. and N. F. Lue (2006). "The structure and function of telomerase reversetranscriptase." Annu Rev Biochem 75: 493-517.)

Page 83: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

l’ARN TR (figure 29). L’enzyme TERT utilise comme amorce la molécule d’ADN présente

dans le duplexe ADN/ARN formé suite à l’appariement de TR aux télomères. Par des cycles

de polymérisation puis translocation, TERT est capable d’ajouter successivement plusieurs

copies de répétitions télomériques.

c) Les composants protéiques des télomères humains

Les télomères sont constitués de répétitions d’ADN auxquelles sont associées 6

protéines: TRF1, TRF2, TIN2, Rap1, TPP1 et POT1. Trois d’entre elles, TRF1, TRF2 et

POT1, sont capables de s’associer de façon directe et spécifique aux répétitions télomériques

double brin. De plus, POT1 interagit avec la portion simple brin à l’extrémité 3’ des

télomères. Les protéines TRF1, TRF2 et POT1 sont interconnectées via les protéines TIN2,

TPP1 et Rap1 (figure 30). Le complexe résultant de l’association des ces 6 protéines a été

nommé « complexe shelterin » et a pour fonction d’une part de contrôler la synthèse des

répétitions télomériques par la télomérase et d’autre part de protéger les télomères en

permettant la formation d’une structure bien particulière au niveau des télomères: la structure

en « boucle T » ou « t-loop » (figure 31).

Les structures en boucle T ont un rôle protecteur et sont formées grâce à la présence

d’une longue portion simple brin à l’extrémité 3’ des télomères (« 3’ overhang »). Cette

portion, constituée de répétitions télomériques 5’-TTAGGG-3’ simple brin, a la capacité

d’envahir la partie télomérique double brin située en amont et de s’apparier avec le brin riche

en C (dit « C-strand ») et ainsi déplacer le brin riche en G (dit « G-strand »). La structure

résultante a la forme d’une boucle visualisable en microscopie électronique (Griffith, Comeau

et al. 1999).

Différentes études ont mis en évidence que les protéines associées aux téloméres ont

un effet inhibiteur sur l’activité de la télomérase. Il a été proposé que les longs télomères

permettraient, via un grand nombre de répétitions télomériques, le recrutement d’une quantité

plus importante de complexes shelterin que les télomères courts. La présence de ces

complexes aurait pour conséquence de faciliter la liaison de POT1 à la portion télomérique

simple brin («le 3’ overhang») et de ce fait de diminuer l’accessibilité de cette région pour la

télomérase (figure 32). Néanmoins, il semble que ce modèle soit un peu trop simpliste car

deux études récentes on mis en évidence que les protéines POT1 et TPP1 pouvaient

43

Page 84: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE 30: Les protéines associées aux télomères

(Adaptée de de Lange, T. (2005). "Shelterin: the protein complex that shapes and safeguards humantelomeres." Genes Dev 19(18): 2100-10.)

FIGURE 31: La structure en "boucle T" présente à l'extrémité des chromosomes

((Adaptée de de Lange, T. (2005). "Shelterin: the protein complex that shapes and safeguards humantelomeres." Genes Dev 19(18): 2100-10.)

FIGURE 32: Modèle de régulation de la télomérase par les protéines associées aux télomères

(Adaptée de de Lange, T. (2005). "Shelterin: the protein complex that shapes and safeguards humantelomeres." Genes Dev 19(18): 2100-10.)

Page 85: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

également avoir un effet régulateur positif sur l’activité de la télomérase. De plus, TPP1 serait

capable de lier directement la télomérase et donc pourrait permettre son recrutement aux

télomères (Xin, Liu et al. 2007), (Wang, Podell et al. 2007). Il a donc été proposé que dans un

premier temps, au niveau d’un télomère long, le complexe TOP1/TPP1 aurait effectivement

un effet négatif sur l’activité télomérase en séquestrant le « 3’ overhang ». Puis, au cours des

divisions cellulaires induisant un raccourcissement de ce télomère, un mécanisme encore

inconnu tel qu’une modification post-traductionnelle pourrait induire un changement de

fonction de POT1/TPP1 qui aurait alors un effet stimulateur de l’activité de la télomérase.

2. La télomérase humaine est une RNP de type H/ACA

La télomérase est un complexe ribonucléoprotéique résultant de l’assemblage entre un

ARN non codant et plusieurs protéines.

a) Le composant ARN de la télomérase humaine: hTR

La présence d’un ARN non codant au sein du complexe télomérase a tout d’abord été

mise en évidence chez le cilié Tétrahymena thermophila. Une approche par mutagenèse a

ensuite confirmé que cet ARN est d’une part absolument requis pour l’activité enzymatique

du complexe et d’autre part qu’il possède une séquence matrice. Ceci a permis de mettre en

évidence que la télomérase agit en tant que RNP réalisant une transcription inverse d’une

partie de son propre ARN (Yu, Bradley et al. 1990). L’ARN de la télomérase a ensuite été

identifié chez de nombreux autres organismes. La figure 33 présente quelques uns de ces

ARN. Ils ne présentent pas réellement de ressemblance en terme de taille et de séquence

primaire. En revanche, la comparaison de leur structure secondaire laisse apparaître quelques

similitudes telles que la présence d’une grande boucle contenant la région matrice et une

structure en pseudo-nœud. La large boucle étant refermée par une hélice.

L’ARN de la telomérase chez les vertébrés contient, en plus des structures

précédemment évoquées, deux domaines spécifiques nommés CR7 et H/ACA (Chen, Blasco

et al. 2000), (Mitchell, Cheng et al. 1999). Néanmoins, seuls le pseudo-noeud et les domaines

CR4/CR5 sont requis pour une activité télomérase in vitro (Tesmer, Ford et al. 1999). Il a été

44

Page 86: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 87: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

mis en évidence, chez les mammifères, que ces domaines lient de façon indépendante

l’enzyme TERT (Chen and Greider 2003), (Keppler and Jarstfer 2004).

La caractérisation initiale du domaine H/ACA de l’ARN de la télomérase humaine

(hTR) a mis en évidence qu’il est, comme dans le cas des snoARN H/ACA, requis pour la

stabilité et la maturation de l’extrémité 3’ de hTR. De plus, il est capable de s’associer aux

protéines du cœur des particules H/ACA: dyskérine, hGar1, hNhp2 et hNop10 (Dragon,

Pogacic et al. 2000), (Mitchell, Wood et al. 1999), (Pogacic, Dragon et al. 2000). Il a

également été montré que lorsque l’ARN hTR est exprimé chez la levure Saccharomyces

cerevisiae, il se comporte comme un snoARN H/ACA classique en s’associant aux protéines

Cbf5p, Gar1p, Nhp2p et Nop10p et en étant absolument tributaire de Cbf5p, Nhp2p et

Nop10p pour son accumulation (Dez, Henras et al. 2001). Aucune évidence ne permet, à

l’heure actuelle, de suggérer que le domaine H/ACA de l’ARN de la télomérase, comme la

majorité des snoARN et scaARN H/ACA, guide une modification de type pseudouridylation.

En revanche, plusieurs données suggèrent qu’il est requis pour la localisation de l’ARN hTR.

En effet, il a été mis en évidence que le domaine H/ACA et plus particulièrement une petite

séquence nommée « boite CAB » (CAjal Body localization signal) positionnée au niveau de

la boucle apicale de la tige 3’ du domaine H/ACA permet l’adressage de hTR au sein des

corpuscules de Cajal (CBs) (Jady, Bertrand et al. 2004). Ce sont des petites structures

nucléoplasmiques impliquées, entre autre, dans la maturation et/ou le stockage de divers

complexes tels que les particules snRNP du spliceosome. Il a été proposé que les CBs

permettent de délivrer, au cours de la phase S du cycle cellulaire, l’ARN de la télomérase au

niveau des télomères devant être allongés. En effet, une co-localisation significative entre

certains télomères, l’ARN de la télomérase et la coïline (le marqueur des CBs) a été visualisée

dans des cellules HeLa en phase S (Jady, Richard et al. 2006), (Tomlinson, Ziegler et al.

2006).

b) L’enzyme transcriptase inverse humaine: hTERT

L’enzyme transcriptase inverse, nommée hTERT chez l’homme, est l’un des

composants absolument requis pour l’activité du complexe télomérase. Cette enzyme a tout

d’abord été identifiée chez la levure grâce à un crible génétique recherchant des gènes dont la

mutation engendre un défaut de réplication des télomères, c’est à dire un phénotype est («Ever

45

Page 88: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 89: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

Shorter Telomeres »). Elle a été nommée Est2p (Lendvay, Morris et al. 1996). De façon

concomitante, son homologue chez le cilié Euplotes aediculatus, nommé p123, a été purifié et

identifié (Lingner and Cech 1996). Est2p et p123 présentent des similitudes de séquence avec

les transcriptases inverses (RT) classiques, et plus particulièrement avec les RT des

rétrotransposons non-LTR (Long Terminal Repeat). Les orthologues de ces deux protéines

ont ensuite été identifiés dans de nombreux autres organismes. Elles possèdent toutes, en

position centrale, les sept motifs caractéristiques des enzymes à activité transcriptase inverse:

les motifs 1, 2, A, B', C, D, and E (figure 34). Néanmoins, elles présentent la particularité de

posséder une large insertion entre les motifs A et B’ nommée IFD («Insertion in Fingers

Domain»). De plus, elles présentent des extensions amino- et carboxy-terminales qui leur sont

spécifiques. Ces extensions ont, respectivement, une taille de 400 et 150-200 acides aminés et

sont appelées NTE («N-Terminal Extension») et CTE («C-Terminal Extension»). La région

CTE serait requise pour la processivité et la localisation de l’enzyme. La région NTE contient

des motifs conservés portant des noms variables en fonction de la TERT considérée car ils ont

été mis en évidence dans différentes études. Ils sont, en autre, impliqués dans la liaison à

l’ARN (Autexier and Lue 2006). En effet, la région NTE contient 2 domaines de liaison à

l’ARN TR (nommés RID1 et RID2 pour hTERT) présentant des affinités différentes pour TR.

Dans le cas de hTERT, le domaine RID2 (« RNA Interaction Domain ») est plus affin pour

l’ARN que le domaine RID1. Ils interagissent respectivement avec les domaines CR4/CR5 et

le pseudonoeud de l’ARN hTR (figure 33) (Mitchell and Collins 2000), (Lai, Mitchell et al.

2001), (Bachand and Autexier 2001), (Moriarty, Huard et al. 2002), (Moriarty, Marie-

Egyptienne et al. 2004).

c) Les protéines associées à la télomérase

Les composants essentiels et minimums permettant de reconstituer une activité

télomérase in vitro sont l’ARN hTR et l’enzyme reverse transcriptase. Néanmoins, un certain

nombre de protéines semblent être essentielles, in vivo, pour les étapes d’assemblage, de

maturation et de régulation de la particule télomérase.

Le tableau de la figure 35 présente certaines de ces protéines: c-Abl (Kharbanda,

Kumar et al. 2000), L22 et hStau (Le, Sternglanz et al. 2000), 14.3.3 (Seimiya, Sawada et al.

2000), La (Ford, Shay et al. 2001), PinX1 (Zhou and Lu 2001), hnRNP A1, D, C1/C2, A2-B1

46

Page 90: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

cara

ctér

istiq

ues

et f

onct

ions

de la

pro

téin

eLi

ens

avec

la té

lom

éras

efo

nctio

n pr

opos

ée a

u se

in

de la

télo

mér

ase

autre

s no

ms:

TP1

, TLP

1

cont

ient

16

répé

titio

ns W

D40

con

tient

un

dom

aine

hom

olog

ue à

la p

roté

ine

p80

de la

lom

éras

e ch

ez té

trahy

mén

a

cont

ient

un

dom

aine

de

liais

on à

ATP

/GTP

p23

p23

est u

ne p

roté

ine

acid

e, p

23 e

t Hsp

90 fo

nt p

artie

du

"fol

doso

me"

qui

est

requ

is d

ans

l'ass

embl

age

de

plus

ieur

s co

mpl

exes

pro

téiq

ues,

Hsp

90H

sp90

con

tient

un

site

de

liais

on à

l'AT

P, H

sp90

in

tera

git a

vec

p23

de fa

çon

dépe

ndan

te d

e l'A

TP,

Hsp

70 H

sp70

fait

parti

e du

"fol

doso

me"

qui

est

requ

is d

ans

l'ass

embl

age

de p

lusi

eurs

com

plex

es p

roté

ique

s,

Hsp

70 in

tera

git a

vec

hTER

T, e

n ab

senc

e de

hTR

dan

s de

s ex

traits

de

rétic

uloc

ytes

de

lapi

n, C

ette

as

soci

atio

n es

t abo

lie e

n pr

ésen

ce d

e hT

R,

chap

eron

d'a

ssem

blag

e de

la té

lom

éras

e

c-Ab

lc-

Abl e

st u

ne ty

rosi

ne k

inas

e im

pliq

uée

dans

la

sign

alis

atio

n de

s do

mm

ages

à l'

ADN

c-Ab

l est

ass

ocié

e in

viv

o av

ec l'

enzy

me

hTER

T, D

e pl

us, i

n vi

tro c

-Abl

inte

ragi

t dire

ctem

ent a

vec

une

porti

on d

e hT

ERT

cont

enan

t un

dom

aine

rich

e en

pro

line,

c-

Abl p

hosp

hory

le h

TER

T en

répo

nse

à un

st

ress

gen

otox

ique

et c

eci e

st c

orré

lé a

vec

une

dim

inut

ion

de l'

activ

ité té

lom

éras

e,

Rég

uler

ait n

égat

ivem

ent l

'act

ivité

télo

mér

ase

en

répo

nse

à de

s do

mm

ages

sur

l'AD

N,

L22

La p

roté

ine

L22

a d

e l'a

ffini

té p

our l

'AR

N e

t est

as

soci

ée a

ux ri

boso

mes

hSta

uhS

tau

cont

ient

plu

sieu

rs d

omai

nes

de li

aiso

n à

l'AR

N

doub

le b

rin .

hSta

u es

t loc

alis

ée d

ans

le c

ytop

lasm

e et

da

ns le

s nu

cléo

les

La p

roté

ine

14.3

.3 ré

gule

rait

la lo

calis

atio

n d

e hT

ERT

en e

mpê

chan

t la

prot

éine

C

rm1p

de

se fi

xer s

ur la

séq

uenc

e N

ES d

e hT

ERT

L22

et h

Stau

inte

ragi

ssen

t ave

c hT

R e

t hTE

RT

in v

ivo.

De

plus

elle

s so

nt c

o-pu

rifié

es a

vec

une

activ

ité

télo

mér

ase.

L22

et h

Stau

n'in

tera

giss

ent n

i ent

re e

lles

ni a

vec

la p

roté

ine

TEP1

,

Les

prot

éine

s hS

tau

et L

22 in

terv

iend

raie

nt à

des

st

ades

dis

tinct

s de

la b

ioge

nèse

de

la té

lom

éras

e au

cou

rs d

esqu

els

elle

s se

raie

nt re

quis

es p

our

l'ass

embl

age

et/o

u le

tran

spor

t de

la p

artic

ule

14.3

.3 in

tera

git i

n vi

vo e

t in

vitro

ave

c hT

ERT.

Cet

te in

tera

ctio

n se

fait

via

leur

dom

aine

car

boxy

-te

rmin

al.

14.3

.3 e

st re

quis

e po

ur la

loca

lisat

ion

nucl

éaire

de

hTER

T . l

. 14

.3.3

14.3

.3 e

st u

ne c

hape

ronn

e m

oléc

ulai

re. E

lle e

st

requ

ise

pour

la lo

calis

atio

n de

cer

tain

s de

ces

pa

rtena

ires

p23

inte

ragi

t ave

c le

dom

aine

am

ino

term

inal

de

TER

T en

dou

ble

hybr

ide ,

p23

et H

sp90

inte

ragi

ssen

t av

ec T

ERT

(en

abse

nce

de h

TR) e

t son

t req

uise

s po

ur l'

activ

ité té

lom

éras

e da

ns d

es e

xtra

its d

e ré

ticul

ocyt

es d

e la

pin,

p23

et H

sp90

son

t ass

ocié

es a

vec

un c

ompl

exe

télo

mér

ase

actif

in v

ivo

et s

ont

requ

ises

pou

r son

act

ivité

,

Le c

ompl

exe

min

imum

requ

is p

our u

n as

sem

blag

e et

une

act

ivité

télo

mér

ase

in v

itro

cont

ient

, hTE

RT,

hT

R e

t les

mem

bres

du

fold

osom

e (H

sp90

, p23

, Hsp

70, p

60 e

t hsp

40/y

dj)

chap

eron

s d'

asse

mbl

age

de la

télo

mér

ase,

de

plus

elle

s po

urra

ient

avo

ir un

e fo

nctio

n po

st-

asse

mbl

age

car e

lles

rest

ent a

ssoc

iées

à la

lom

éras

e ac

tive,

TEP1

(T

élom

éras

e pr

otei

n co

mpo

nent

1)

TEP1

inte

ragi

t ave

c l'A

RN

TR

(en

trip

le h

ybrid

e et

IP ),

TEP

1 es

t ass

ocié

e à

un c

ompl

exe

télo

mér

ase

actif

in v

ivo,

T

EP1

n'es

t pas

requ

ise

pour

l'ac

tivité

télo

mér

ase

chez

la s

ouris

(sou

ris T

EP1

-/-),

En re

vanc

he, c

hez

l'hom

me,

une

app

roch

e pa

r AR

Ni,

a m

is e

n év

iden

ce q

ue T

EP1

est r

equi

se

pour

l'ac

tivité

télo

mér

ase

hum

aine

, Ces

var

iatio

ns p

ourr

aien

t être

due

s à

l'util

isat

ion

d'ap

proc

hes

diffé

rent

es o

u bi

en tr

adui

re d

es m

écan

ism

es d

iffér

ents

che

z l'h

omm

e et

che

z la

sou

ris,

TEP1

pou

rrai

t jou

er u

n rô

le d

ans

l'ass

embl

age

et/o

u la

stru

ctur

atio

n de

la té

lom

éras

e

FIG

UR

E 3

5:

Les

pro

téin

es a

sso

ciée

s à

la t

élo

mér

ase

hu

mai

ne

Page 91: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

cara

ctér

istiq

ues

et f

onct

ions

de la

pro

téin

eLi

ens

avec

la té

lom

éras

efo

nctio

n pr

opos

ée a

u se

in

de la

télo

mér

ase

LaLa

pro

téin

e La

est

requ

ise

pour

la m

atur

atio

n, la

gula

tion

et/o

u l'

expr

essi

on d

e di

vers

AR

N. E

lle li

e,

entre

aut

re,

certa

ins

ARN

tran

scrit

s pa

r l'A

RN

po

lym

éras

e III

au

nive

au d

'une

séq

uenc

e po

lyU

.

La p

roté

ine

La in

tera

git d

e fa

çon

dire

cte

avec

l'AR

N h

TR in

vitr

o. In

viv

o el

le e

st a

ssoc

iée

à la

lom

éras

e ac

tive

. La

sure

xpre

ssio

n de

La

dan

s de

s ce

llule

s hu

mai

nes

entra

îne

un ra

ccou

rcis

sem

ent

des

télo

mèr

es

La p

ourr

ait a

voir

un rô

le d

ans

la m

atur

atio

n de

l'A

RN

hTR

et/o

u u

n rô

le ré

gula

teur

de

l'act

ivité

lom

éras

e

PinX

1Pi

nX1

cont

ient

un

dom

aine

rich

e en

gly

cine

à

l'ext

rém

ité a

min

o-te

rmin

ale.

Pi

nX1

inte

ragi

t dire

ctem

ent a

vec

hTER

T in

vitr

o vi

a so

n do

mai

ne c

arbo

xy-te

rmin

al (c

onte

nant

le T

ID:

TRF1

bin

ding

dom

ain

). Pi

nX1

regu

le n

égat

ivem

ent l

' act

ivité

télo

mér

ase

in v

ivo.

PinX

1 se

rait

un ré

gula

teur

nég

atif

de l'

activ

ité

télo

mér

ase

prot

éine

s hn

RN

PLe

s pr

otéi

nes

hnR

NP

ont d

e l'a

ffini

té p

our l

'AR

N e

t son

t re

quis

es ,

entre

aut

re, p

our l

a m

atur

atio

n de

s AR

Nm

hnR

NP

A1, D

et C

1/C

2 in

tera

giss

entt

in v

ivo

avec

la té

lom

éras

e.

hnR

NP

A1, A

2-B1

, D e

t E li

ent

in v

ivo

les

répé

titio

ns té

lom

ériq

ues

sim

ple

brin

. h

nRN

P A1

lie

dire

ctem

ent,

in v

itro,

les

71

prem

iers

nuc

léot

ides

de

l'AR

N h

TR .

hnR

NP

C1-

C2

lient

une

séq

uenc

e ric

he e

n U

de

hTR

.

Les

prot

éine

s hn

RN

P po

urra

ient

per

met

tre le

re

crut

emen

t de

la té

lom

éras

e au

niv

eau

des

télo

mèr

es

SMN

SMN

est

impl

iqué

e da

ns l'

asse

mbl

age

des

snR

NP

de

l'épi

ssag

e

SM

N in

tera

git i

n vi

vo a

vec

la té

lom

éras

e. I

l y a

éga

lem

ent u

ne

asso

ciat

ion

in v

itro

entre

hTE

RT/

hTR

exp

rimés

che

z la

levu

re e

t SM

N p

rove

nant

d'e

xtra

its d

e ré

ticul

ocyt

es d

e la

pin.

L'e

xpre

ssio

n d'

une

form

e do

min

ante

nég

ativ

e de

SM

N m

odifi

e la

loca

lisat

ion

de

hTER

T in

viv

o et

inhi

be i

n vi

tro la

reco

nstit

utio

n de

la té

lom

éras

e . S

MN

inte

ragi

t ave

c la

pro

téin

e G

ar1p

.

SMN

ser

ait r

equi

se p

our l

'ass

embl

age

de la

du

com

plex

e té

lom

éras

e et

plu

s pa

rticu

lière

men

t la

parti

e R

NP

H/A

CA

de la

télo

mér

ase.

Ku

70/8

0K

u es

t un

hete

rodi

mer

con

tena

nt d

eux

sous

-uni

tés

de

70 k

Da

et d

e 80

kD

a. K

u 70

/80

est i

mpl

iqué

e, e

ntre

au

tre, d

ans

la m

aint

enan

ce d

es té

lom

ères

et d

ans

la

reco

mbi

nais

on J

(D)J

des

imm

unog

lobu

lines

Ku

70/8

0 es

t ass

ocié

e à

hTER

T et

à l'

activ

ité té

lom

éras

e in

viv

o. In

vitr

o da

ns d

es e

xtra

its d

e ré

ticul

ocyt

e, K

u 70

/80

inte

ragi

t ave

c hT

ERT

(en

abse

nce

de h

TR e

t d'A

DN

télo

mér

ique

) . L

es s

ouris

Ku

80 -/

- pré

sent

ent d

es p

héno

mèn

es d

e fu

sion

des

ext

rém

ités

chro

mos

omiq

ues.

Ku

70/8

0 d'

une

part

prot

éger

ait l

es té

lom

ères

et

d'au

tre p

art r

égul

erai

t de

faço

n né

gativ

e la

lom

éras

e vi

a un

e in

tera

ctio

n av

ec h

TER

T.

KIP

KIP

con

tient

des

mot

ifs "E

F-H

and"

qui

cor

resp

onde

nt à

de

s do

mai

nes

de li

aiso

n au

cal

cium

KIP

inte

ragi

t in

vitro

et i

n vi

vo a

vec

hTER

T de

plu

s el

le e

st a

ssoc

iée

in v

ivo

avec

l'ac

tivité

télo

mér

ase.

La

sur

pres

sion

de

KIP

, in

vivo

, stim

ule

l'act

ivité

télo

mér

ase

et a

ugm

ente

la ta

ille

des

télo

mèr

es.

KIP

ser

ait u

n ré

gula

teur

pos

itif d

e l'a

ctiv

ité

télo

mér

ase

via

une

inte

ract

ion

dire

cte

avec

hTE

RT

FIG

UR

E 3

5 (s

uit

e):

Les

pro

téin

es a

sso

ciée

s à

la t

élo

mér

ase

hu

mai

ne

Page 92: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

et E (Ford, Wright et al. 2002), SMN (Bachand, Boisvert et al. 2002), Ku 70/80 (Chai, Ford et

al. 2002), KIP (Lee, Yu et al. 2004), p23, Hsp90 et Hsp70 (Holt, Aisner et al. 1999), TEP1

(Harrington, McPhail et al. 1997; Nakayama, Saito et al. 1997; Liu, Snow et al. 2000;

Poderycki, Rome et al. 2005). Elles peuvent être classées en plusieurs catégories: certaines

interagissent avec hTR (ex: La et TEP1), d’autres avec hTERT (ex: p23, Hsp90, Hsp70,

14.3.3 et Ku 70/80); certaines régulent négativement l’activité télomérase (ex: c-Abl, PinX1)

et d’autres positivement (ex: KIP); enfin certaines sont requises pour l’assemblage et/ou le

transport de la particule (ex: 14.3.3, SMN, TEP1) alors que d’autres semblent requises

essentiellement pour la fonction de la télomérase (ex: les hnRNP).

Malheureusement, la fonction exacte que jouent ces protéines dans la vie de la

particule télomérase n’est, pour la plupart, pas encore connue. Un long chemin reste encore à

parcourir jusqu'à la compréhension des modes d’assemblage, de fonctionnement et de

régulation de la particule témolérase.

47

Page 93: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

IV. STRUCTURE DES RNP H/ACA

Dans la première partie de ce manuscrit, j’ai présenté de manière générale les

particules de type H/ACA ainsi que les fonctions qu’elles exercent. Nous avons pu voir

qu’elles sont présentes chez les archées et chez les eucaryotes et qu’elles interviennent dans

diverses fonctions cellulaires fondamentales telles que, entre autre, la biogenèse des

ribosomes via les snoRNP H/ACA, la biogenèse des particules snRNP de la machinerie

d’épissage via les scaRNP H/ACA et le maintien de l’intégrité des chromosomes par la plus

atypique des RNP H/ACA: la télomérase. Une telle diversité de fonction et une telle

conservation au cours de l’évolution traduit probablement le fait que l’acquisition d’un

domaine H/ACA par un ARN non codant est un avantage certain au cours du processus de

sélection naturelle. Quel que soit l’organisme et l’ARN dans lequel le domaine H/ACA est

présent, la RNP H/ACA est formée via une interaction entre un cœur protéique spécifique

comprenant les protéines aCbf5/Cbf5p/Dyskérine, aGar1/Gar1p, L7Ae/Nhp2p et

aNop10/Nop10p avec un domaine ARN de type H/ACA (comprenant une tige suivie d’une

boite ACA ou 2 tiges séparées par une boite H et suivies d’une boite ACA). L’un des défis à

l’heure actuelle consiste à déterminer comment les composants de ce complexe si bien

conservé sont assemblés les uns avec les autres. Les chapitres suivants présentent les données

dont nous disposons sur la biogenèse des particules H/ACA. Les résultats que j’ai obtenus

pendant ma thèse permettant d’apporter des éléments sur le mécanisme d’assemblage des

RNP H/ACA seront ensuite présentés.

Les particules H/ACA ont initialement été découvertes chez la levure Saccharomyces

cerevisiae. Elles ont fait l’objet d’une large étude visant à comprendre leur fonction et leur

mode de synthèse. La levure Saccharomyces cerevisiae, s’est avérée un modèle d’étude très

intéressant pour lequel nous disposons d’un grand nombre d’outils génétiques et

biochimiques. Ces études ont permis d’obtenir de nombreuses données concernant

l’assemblage des particules H/ACA (Ces données seront présentées dans le chapitre IV-B de

la partie introduction). Néanmoins, les difficultés de production de formes recombinantes des

protéines du complexe eucaryote ont empêché les équipes travaillant sur le modèle levure

d’obtenir des informations détaillées sur les interactions protéine/protéine et protéine/ARN ou

encore des données de structures cristallographiques du complexe. Ce genre d’information est

48

Page 94: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

absolument crucial si l’on désire déterminer l’agencement des différents composants au sein

de la RNP. La solution a résidé dans l’étude des particules H/ACA chez les archées pour

lesquelles aucun problème de production de formes recombinantes des membres du complexe

ne s’est posé. Les résultats de ces études seront présentés dans le chapitre IV-A. Enfin dans le

chapitre IV-C seront présentées les données de structure obtenues pour les particules H/ACA

chez les mammifères.

A. Structure des RNP H/ACA chez les archées

1. Reconstitution des particules H/ACA d’archées in vitro

Les particules d’archées ont fait l’objet d’une description au sein de la revue

«Structure and function of box H/ACA RNPs» présentée dans l’introduction de ce manuscrit.

De façon identique à leurs homologues eucaryotes, les RNP H/ACA chez les archées,

nommées sRNP H/ACA (Small RNP H/ACA) résultent de l’association de 4 protéines

spécifiques avec un ARN non codant, les sARN H/ACA (Small ARN H/ACA). La plupart de

ces sARN H/ACA (Small RNA) ne contiennent qu’une tige boucle suivie d’une boite ACA.

Les protéines du complexe sont nommées aCbf5 (orthologue de Cbf5p de levure), aGar1

(orthologue de Gar1p de levure), aNop10 (orthologue de Nop10p de levure) et enfin L7Ae

(orthologue de Nhp2p de levure). L7Ae est également l’orthologue de la protéine Snu13p de

levure et fait donc également partie de sRNP C/D chez les archées. Il a été montré qu’elle

s’associe de façon spécifique à des structures en K-turn présentes au sein des sARN C/D et

H/ACA (Rozhdestvensky, Tang et al. 2003).

L’étude de l’assemblage in vitro des RNP H/ACA chez les archées a été menée

principalement par deux équipes dirigées par Christiane Branlant et Michael Terns. Elles ont

permis, au moins en partie, de déterminer les interactions existant entre les différents

composants au sein du complexe ainsi que les éléments indispensables à la formation de

particules actives dans des tests de pseudouridylation in vitro.

Dans ces deux études, le sARN choisi ne contient qu’une seule tige suivie d’une boite

ACA et arbore un motif de type Kink-turn en position apicale de la boucle permettant la

liaison à la protéine L7Ae. Il s’agit de l’ARN Pab91 de Pyrococcus abyssi (Charpentier,

49

Page 95: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

Muller et al. 2005) et de l’ARN Pf9 de Pyrococcus furiosus (Baker, Youssef et al. 2005). Ils

permettent, respectivement, de guider la modification de l’uridine U2685 de l’ARNr de 23S et

de l’uridine U910 de l’ARNr de 16S. Les protéines aCbf5, aGar1, aNop10 et L7Ae utilisées

ont été produites chez E.coli et purifiées en conditions natives via une étiquette GST

(Charpentier, Muller et al. 2005) ou histidine (Baker, Youssef et al. 2005).

Ces études ont mis en évidence que les protéines aGar1 et aNop10 sont capables

d’interagir de façon directe avec la protéine aCbf5. La protéine L7Ae, quant à elle, n’interagit

avec aucune des protéines du complexe. Les résultats des tests d’interaction protéines-ARN

réalisés par gel retard indiquent que seules les protéines aCbf5 et L7Ae lient directement les

sARN H/ACA. Les déterminants ARN nécessaires pour ces interactions étant: d’une part le

motif Kink-turn au niveau de la partie apicale de la tige-boucle pour la protéine L7Ae et

d’autre part la boite ACA, la poche de pseudouridylation et la base de la tige pour la protéine

aCbf5. De façon surprenante, Baker et collaborateurs ont mis en évidence que la boucle

apicale de la tige est également nécessaire pour une interaction forte avec la protéine aCbf5.

Néanmoins, il est possible que la modification de cette partie de la tige, réalisée lors de ces

tests, altère la conformation globale de l’ARN et entraîne donc indirectement une perte

d’affinité pour aCbf5. Il s’agit malheureusement de l’un des inconvénients majeurs de ce type

d’approche.

Les protéines aGar1 et aNop10 quant à elles n’interagissent pas seules avec le sARN

H/ACA. Elles sont néanmoins recrutées en présence de la protéine aCbf5. Le modèle de la

figure 36 présente une structure probable des particules H/ACA d’archées sur la base des

résultats d’interaction in vitro. La conclusion des deux études convergent vers le même

modèle. Néanmoins, un certain nombre de différences ont été mises en évidence: un complexe

aCbf5/aGar1/aNop10 en absence d’ARN n’a été obtenu que par Baker et collaborateurs; La

protéine aGar1 a un effet inhibiteur sur la formation du complexe aCbf5/aNop10/sARN

H/ACA dans l’étude de Charpentier et collaborateurs; Enfin, la protéine aCbf5 interagit certes

de façon spécifique mais avec une affinité plutôt faible avec le sARN H/ACA, cette

interaction semble être stabilisée par les protéines aNop10 et L7Ae (Charpentier, Muller et al.

2005). Il est probable que ces discordances soient le fait de l’utilisation de protéines

présentant des étiquettes différentes, GST ou Histidine, pouvant altérer de façon variable les

propriétés du complexe.

Lors de ces deux études, l’activité de pseudouridylation des complexes formés a

également été testée. Pour cela, les complexes ont été incubés avec des petits ARN substrats

50

Page 96: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 97: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

comportant une séquence identique à l’ARN cible naturel. C'est-à-dire une uridine encadrée

par des petites séquences complémentaires à la partie haute de la poche de pseudouridylation.

Baker et collaborateurs n’ont obtenu de pseudouridylation que dans le cas où tous les

composants du complexe étaient présents: le sARN H/ACA, aCbf5, aGar1, aNop10 et L7Ae.

En revanche, l’étude de Charpentier et collaborateurs laisse apparaître, peut être grâce à un

test d’une sensibilité plus grande, que le complexe minimum comportant une activité contient:

le sARN H/ACA, aCbf5 et aNop10. Toutefois, l’addition de la protéine aGar1 et dans une

plus grande mesure de L7Ae, augmente de façon considérable l’activité du complexe.

Malgré quelques divergences, ces deux études ont permis, grâce à l’utilisation du

modèle archée, d’avancer de façon considérable dans la compréhension de la structure des

RNP H/ACA. Un grand pas supplémentaire a été fait par la récente publication des structures

cristallographiques de composants des RNP H/ACA ou de RNP H/ACA complètes d’archées.

Ces données sont présentées dans le chapitre suivant.

2. Structures cristallographiques des RNP H/ACA

d’archées

L’utilisation de techniques de RMN et de cristallographie aux rayons X a permis de

révéler la structure des RNP H/ACA d’archées. Ces approches ont été employées lors de

plusieurs études pour tout d’abord le complexe aCbf5/aNop10 (Hamma, Reichow et al. 2005;

Manival, Charron et al. 2006) puis aCbf5/aNop10/aGar1 (Rashid, Liang et al. 2006) et enfin

une particule complète contenant aCbf5/aNop10/aGar1/L7Ae et un sARN H/ACA (Li and Ye

2006). Ces résultats ont permis de déterminer comment les différents composants sont

agencés dans le complexe et de proposer des rôles pour chacun d’entre eux dans la fonction

de la RNP complète. Il apparaît qu’un certain nombre d’hypothèses, formulées suite aux

analyses biochimiques concernant des interactions ayant lieu au sein du complexe, s’avèrent

justes. La figure 37 présente la structure de la particule complète de l’archée Pyrococcus

furiosus. Le sARN H/ACA utilisé, nommé Afu46, ne contient qu’une seule tige boucle et une

boite ACA totalisant 65 nucléotides.

Les composants protéiques du complexe forment une sorte de triangle équilatéral dont

51

Page 98: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

la taille des cotés est comprise entre 80 et 90 angströms. La protéine aCbf5 occupe un des

coins ainsi que la plus grande partie au centre. aGar1 et L7Ae sont positionnées aux deux

autres coins et aNop10 est en quelque sorte « prise en sandwich » entre aCbf5 et L7Ae.

a) Structure des protéines du complexe H/ACA chez les

archées

(1) Structure de aCbf5

aCbf5 est constituée de deux grands domaines: le domaine PUA (PseudoUridine

synthase and Archeosine transglycosylase) et le domaine catalytique, lui même divisé en deux

domaines D1 et D2 (figure 37).

Le domaine catalytique contient un feuillet beta de six brins dont l’une des faces

arbore plusieurs boucles et des hélices alpha jouxtant le site actif. Le domaine PUA ainsi que

plusieurs hélices alpha supplémentaires forment des sortes de protubérances émergeant du

domaine catalytique.

La superposition de la structure de l’enzyme pseudouridylsynthase TruB avec celle de

aCbf5 montre une similarité de structure très forte (figure 38a). Néanmoins, un certain

nombre de différences existent entre ces deux protéines et peuvent provenir du fait que

l’enzyme TruB, contrairement à aCbf5, ne nécessite pas d’ARN guide pour réaliser la

modification de son substrat, l’uridine 55 des ARNt. Voici les 2 variations majeures

observées entre aCbf5 et TruB:

-Deux segments importants pour la reconnaissance du substrat: 5/ 6 et 8/ 9/ 4

chez TruB sont absents chez aCbf5 qui, à la place, présente une petite boucle non

structurée. Cela laisse une large poche juste au-dessus du site d’interaction avec l’uridine

cible. On peut imaginer que cet espace libéré permet l’interaction avec le duplexe ARN

H/ACA-ARN substrat.

-Le domaine PUA de aCbf5 est bien plus grand que celui de TruB. De plus, ce

domaine chez aCbf5 est entouré par une extension amino-terminale du domaine

catalytique. Cette extension est absente chez l’enzyme TruB. Cette structure a pour

52

Page 99: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE 37: Structure cristallographique d'une particule H/ACA complète d'archées (a): séquence et structure secondaire du sARN H/ACA Afu46 (b): structure cristallographique de la particule, les codes couleurs correspondent entre (a) et (b) (Adaptée de Ye, K. (2007). "H/ACA guide RNAs, proteins and complexes." Curr Opin Struct Biol 17(3): 287-92.)

D1

D2

a

b

Page 100: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE 38: La protéine aCbf5 adopte une structure très proche de celle de l'enzyme TruB (a): superposition entre les structures de aCbf5 (vert) et TruB (gris), les aspartates catalytiques sont indiqués en rouge pour TruB et magenta pour aCbf5 (Adaptée de Rashid, R., B. Liang, et al. (2006). "Crystal structure of a Cbf5-Nop10-Gar1 complex and implications in RNA-guided pseudouridylation and dyskeratosis congenita." Mol Cell 21(2): 249-60.) (b): superposition entre les résidus des sites actifs de aCbf5 et TruB, les résidus de TruB sont en gris; tous les autres sont des résidus de aCbf5 (Adaptée de Hamma, T., S. L. Reichow, et al. (2005). "The Cbf5-Nop10 complex is a molecular bracket that organizes box H/ACA RNPs." Nat Struct Mol Biol 12(12): 1101-7.)

a

b

les 2 segments spécifiques à TruB

extension amino-terminale spécifique à Cbf5

Page 101: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

conséquence de stabiliser le domaine PUA par rapport au domaine catalytique et pourrait

alors restreindre sa spécificité aux sARN H/ACA.

Les sites actifs de TruB et de aCbf5 se superposent très bien, y compris les trois

résidus conservés chez toutes les pseudouridylsynthases: un aspartate, une arginine et une

tyrosine. Ceci suggère fortement que la catalyse est réalisée de la même façon chez TruB et

aCbf5 (figure 38b).

(2) Structure de aNop10

aNop10 contient deux domaines distincts (figure 39). Un domaine à l’extrémité

amino-terminale comprenant quatre brins (dont deux très rapprochés). Quatre cystéines

au sein des ces brins , conservées chez les archées et absentes chez les eucaryotes,

permettent la liaison à un atome de zinc (Manival, Charron et al. 2006). L’extrémité

carboxy-terminale de aNop10 contient une hélice . Elle est reliée au domaine amino-

terminal via un long segment conservé, le « linker », d’une taille d’environ 20 angströms.

(3) Structure de aGar1

aGar1 forme un tonneau de six brins qui appartient à la famille

« reductase/isomerase/elongation factor » (figure 40a). Il a été mis en évidence que ce type de

domaine peut être impliqué dans des interactions protéine/protéine et protéine/ARN. Au sein

de la protéine EF-Tu, ce domaine (domaine 2), est requis pour la liaison à l’ARN. Toutefois,

la comparaison de aGar1 liée à aCbf5 avec le domaine 2 de EF-Tu en interaction avec un

ARNt indique que les résidus utilisés par EF-Tu pour lier l’ARN sont, dans le cas de aGar1,

impliqués dans l’interaction avec aCbf5. Il n’est donc pas possible, dans cette configuration,

que aGar1 interagisse à la fois avec l’ARN et avec aCbf5.

53

Page 102: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

(4) Structure de L7Ae

La structure de la protéine L7Ae d’archées consiste en un domaine globulaire

comprenant un feuillet pris en sandwich par des hélices (figure 41) (Hamma and Ferre-

D'Amare 2004) (Suryadi, Tran et al. 2005) (Charron, Manival et al. 2004). Les hélices 1, 4

et 5 sont parallèles entre elles ainsi que les hélices 2, 310 et 3. Ces deux groupes d’hélices

étant positionnés perpendiculairement l’un par rapport à l’autre. Le feuillet est constitué de

3 brins parallèles, 1- 3 et d’un brin anti-parallèle, 4.

b) Les interactions protéine/protéine au sein du

complexe

Le premier complexe étudié en cristallographie contient les protéines aCbf5 et aNop10

(Hamma, Reichow et al. 2005; Manival, Charron et al. 2006). Il a été mis en évidence que ces

deux protéines ont un impact important l’une sur l’autre. En effet, d’une part la protéine

aNop10 est globalement non structurée en absence de aCbf5 et d’autre part aCbf5 est inactive

en absence de aNop10.

aNop10 lie aCbf5 du côté opposé au domaine PUA. A l’échelle de aNop10, cette

interaction est considérable car elle implique environ 46% de sa surface totale; les trois

domaines de aNop10, le « linker » ainsi que les domaines amino et carboxy-terminaux sont

engagés dans la liaison à aCbf5. L’hélice et le tonneau de aNop10 interagissent

respectivement avec l’hélice 6 et le feuillet central (formé par 10- 12 et en partie par 3

et 4) de aCbf5. L’interface entre les deux protéines implique de nombreux résidus très

conservés et est formée par un réseau dense de liaisons hydrogènes, d’interactions de van der

Waals et de ponts salins.

Il semble que aNop10 soit requise pour l’activité catalytique de aCbf5 en permettant le

positionnement correct, via de liaisons hydrogènes, de plusieurs résidus absolument cruciaux

au niveau du site actif de aCbf5 (Hamma, Reichow et al. 2005; Manival, Charron et al. 2006)

Si l’on considère que, dans le complexe, aNop10 se trouve au Nord de aCbf5 alors

aGar1 se trouve à l’Est. La liaison de aGar1 à aCbf5 implique là encore des résidus conservés.

aGar1 interagit essentiellement via les boucles formées par 1- 2 et 4- 5 et avec le « coin »

54

Page 103: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

de aCbf5 formé par le brin 7 et les hélices 3 et 5 (figure 42).

Il a été proposé que aGar1 pourrait moduler la position de la boucle comprise entre les

brins 7 et 10 (figure 43) (Li and Ye 2006). Cette boucle pourrait basculer d’une position

dite « fermée » c'est-à-dire en interaction avec le substrat vers une position dite « ouverte » où

elle serait alors en interaction avec aGar1 (via des liaisons hydrophobes). Cela libèrerait un

espace pouvant faciliter l’entrée et/ou la sortie du substrat. Cette hypothèse a été formulée car

il a été mis en évidence que cette boucle adopte deux positions différentes: dans la structure

des complexes aCbf5/aGar1/aNop10 où elle est en position dite « fermée » (Rashid, Liang et

al. 2006) alors qu’au sein de la particule complète (Li and Ye 2006) elle est en position dite

« ouverte ».

Bien que lors des tests biochimiques aucune interaction protéine/protéine n’a pu être

mis en évidence pour la protéine L7Ae, il apparaît que dans la particule complète elle est en

interaction avec la protéine aNop10 (figure 44). En effet, l’hélice 3 de L7ae contacte

l’hélice 1 de aNop10 qui elle-même est en contact avec l’hélice 6 de aCbf5. De plus, une

boucle à l’extrémité amino-terminale de l’hélice 3 de L7ae interagit avec le « linker » de

aNop10. La surface totale d’interaction entre ces deux protéines est relativement faible ce qui

peut expliquer le fait qu’elle n’est pas été visualisée lors des tests biochimiques.

c) Les interactions protéine/ARN au sein du complexe

Lors de la détermination de la structure d’une RNP H/ACA d’archées complète (Li

and Ye 2006), il a été mis en évidence que le composant ARN adopte une conformation

proche de celle proposée lors des prédictions de structures secondaires (figure 45). En effet,

la tige du sARN H/ACA adopte une structure quasi-linéaire consistant en une tige supérieure,

nommée P2, et une tige inférieure, P1, suivie de la boite ACA. Les deux tiges étant reliées par

la poche de pseudouridylation. Cet ARN occupe une surface d’une longueur de 80 angströms.

Il n’y a qu’une « face » de l’ARN en contact avec les protéines du complexe. La boite ACA

ainsi que la tige P1 interagissent avec le domaine PUA de aCbf5 alors que la poche de

pseudourydilation lie le domaine catalytique. Le domaine D1 et plus particulièrement le site

actif est positionné au centre de la séquence guide de l’ARN, c'est-à-dire la portion du sARN

s’hybridant au substrat et permettant de sélectionner l’uridine à modifier. La tige P2 quant à

55

Page 104: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

aNop10

FIGURE 39: Structure de la protéine aNop10 (Adaptée de Hamma, T., S. L. Reichow, et al. (2005). "The Cbf5-Nop10 complex is a molecular bracket that organizes box H/ACA RNPs." Nat Struct Mol Biol 12(12): 1101-7.)

Page 105: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE 40: Structure de la protéine aGar1 (a): structure de la protéine aGar1 en bleu en interaction avec aCbf5 en vert (b): structure du domaine 2 de EF-Tu en interaction avec un ARNt (Adaptée de Rashid, R., B. Liang, et al. (2006). "Crystal structure of a Cbf5-Nop10-Gar1 complex and implications in RNA-guided pseudouridylation and dyskeratosis congenita." Mol Cell 21(2): 249-60.)

a

b

FIGURE 41: Structure de la protéine L7Ae (Adaptée de Suryadi, J., E. J. Tran, et al. (2005). "The crystal structure of the Methanocaldococcus jannaschii multifunctional L7Ae RNA-binding protein reveals an induced-fit interaction with the box C/D RNAs." Biochemistry 44(28): 9657-72.

Page 106: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE 43: La protéine aGar1 permettrait de moduler la position de la boucle joignant les brins 7 et 10 (Adaptée de Li, L. and K. Ye (2006). "Crystal structure of an H/ACA box ribonucleoprotein particle." Nature 443(7109): 302-7.)

FIGURE 42: Interaction entre les protéines aGar1 et aCbf5 (Adaptée de Rashid, R., B. Liang, et al. (2006). "Crystal structure of a Cbf5-Nop10-Gar1 complex and implications in RNA-guided pseudouridylation and dyskeratosis congenita." Mol Cell 21(2): 249-60.)

boucle de jonction entre les brins

Page 107: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 108: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

elle est associée, si l’on se déplace de la partie basale vers la partie apicale de la tige, à aCbf5

puis aNop10 et enfin L7Ae au niveau du motif Kink-turn. Si l’on regarde la conformation de

l’ARN dans sa globalité (figure 45c) on observe une courbure de 50° environ entre les axes

des tiges P1 et P2. D’autre part, la boite ACA et la tige P1 adoptent une structure en forme de

« L ». Le domaine PUA semble interagir de façon spécifique avec la boite ACA et plus

particulièrement avec les deux adénines du motif. Ceci permet d’expliquer le rôle crucial joué

par cette boite dans la formation du complexe et pour l’accumulation des sARN H/ACA in

vivo (Ganot, Caizergues-Ferrer et al. 1997).

La protéine aNop10 semble jouer un rôle crucial dans la structuration de la tige P2 du

sARN. Elle permet de faire le lien entre les différents éléments du complexe en interagissant à

la fois avec L7Ae, le sARN et aCbf5. L’existence d’une interaction avec le sARN peut

paraître surprenante car dans les tests biochimiques il a été montré que aNop10 ne lie pas

l’ARN de façon directe (en gel retard) (Baker, Youssef et al. 2005), (Charpentier, Muller et al.

2005). Toutefois, il est possible que aNop10 requiert la présence de aCbf5 afin d’acquérir une

conformation correcte lui permettant d’interagir avec l’ARN. Il est important de noter que des

tests d’interaction entre des formes raccourcies du snoARN H/ACA humain U65 et la

protéine Nop10p de levure ont mis en évidence une interaction directe possible entre Nop10p

et U65 (Khanna, Wu et al. 2006). Cependant, dans cette étude, le domaine montrant une

affinité pour l’ARN au sein de Nop10p semblait être les brins (à l’extrémité amino-

terminale) alors que dans la structure de la RNP complète aNop10 interagit avec l’ARN via

des résidus de l’extrémité carboxy-terminale.

Comme le montre la structure de la particule H/ACA complète (figure 45), aGar1 est

la seule protéine qui ne soit pas en contact direct avec l’ARN. Ce résultat est en accord avec

ceux obtenus par les tests biochimiques indiquant que aGar1 en gel retard ne lie pas le sARN

H/ACA (Baker, Youssef et al. 2005), (Charpentier, Muller et al. 2005). Une telle position de

aGar1 au sein du complexe peut expliquer le fait qu’in vivo elle soit la seule protéine qui ne

soit pas requise pour l’accumulation des ARN H/ACA (Girard, Lehtonen et al. 1992).

56

Page 109: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

d) Mécanisme proposé pour le recrutement de l’ARN

substrat au sein de la sRNP H/ACA

Li et Ye ont proposé, sur la base des informations connues pour l’enzyme TruB

(Hoang and Ferre-D'Amare 2001), un modèle permettant de placer le substrat au sein du

complexe (Li and Ye 2006). La figure 46 présente ce modèle: le substrat au sein du site

catalytique adopte une structure en forme de U et est orienté de façon verticale par rapport au

plan formé par la protéine aCbf5. Les hélices PS2 et P1 (figure 46) sont sur le même axe et

forment une pseudo-hélice continue avec, à une extrémité, la boite ACA et, à l’autre

extrémité, l’uridine à modifier. La boite ACA étant en contact avec le domaine PUA de

aCbf5, le positionnement correct de l’uridine au sein du site actif nécessite une distance

d’environ 14 nucléotides entre la boite ACA et le début de la 2e portion de la séquence guide

(c'est-à-dire le début de la tige PS2). Ce qui explique, que dans tous les ARN H/ACA, cette

distance soit demeurée fixe au cours de l’évolution (entre 14 et 16 nucléotides chez les

eucaryotes) (Ganot, Caizergues-Ferrer et al. 1997).

Comme précédemment évoqué, la protéine aCbf5 présente une boucle dans le domaine

D2 dont l’orientation est variable. Cette boucle pourrait être soit en interaction avec l’ARN

substrat et ainsi le stabiliser dans le site actif, ou bien être en interaction avec aGar1 et dans ce

cas faciliter l’entrée et/ou la sortie du substrat. Ces deux positions pourraient être modulées

par la protéine aGar1. Ce modèle est conforté par le fait que des particules dépourvues de la

protéine Gar1p chez la levure semblent ne pas pouvoir s’associer à l’ ARNr substrat

(Bousquet-Antonelli, Henry et al. 1997).

B. Structure des RNP H/ACA chez Saccharomyces

cerevisiae

La découverte et la caractérisation initiale des snoRNP H/ACA ont été réalisées chez

la levure Saccharomyces cerevisae. Malheureusement, aucune structure cristallographique

n’est disponible pour ces RNP car il n’a pas été jusqu'à présent possible de produire des

formes recombinantes solubles des protéines Cbf5p et Gar1p en quantité suffisante.

Néanmoins, un certain nombre de données biochimiques nous permettent de pointer le doigt

57

Page 110: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE 46: Modèle proposé pour l'intégration de l'ARN substrat au sein de la particule H/ACA (b): sont représentés: les ARN H/ACA en absence de substrat en gris, aGar1 en turquoise, aCbf5 en vert, les codes couleurs pour l'ARN sont les mêmes que dans la figure (a) (Adaptée de Li, L. and K. Ye (2006). "Crystal structure of an H/ACA box ribonucleoprotein particle." Nature 443(7109): 302-7.)

a b

Page 111: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

sur les similitudes et différences entre les modèles d’archées et de levure.

1. Résultats de « décortication » des RNP H/ACA de levure

Les expériences d’assemblage in vitro n’ayant pas pu être réalisées pour les RNP de

levure, l’équipe de Michèle Caizergues-Ferrer a entrepris des tests de « décortication »

(Henras, Capeyrou et al. 2004). Le principe de ces expériences consistait à exprimer une

forme étiquetée (ZZ ou TAP) de l’une des protéines du complexe. Des purifications étaient

alors réalisées, via l’étiquette, dans différentes conditions afin de tester la force des

interactions au sein du complexe et éventuellement de séparer des sous-complexes. Dans un

premier temps, les complexes associés à la protéine Cbf5p étiquetée ZZ ont été purifiés en

présence de concentrations croissantes en sels (KCl ou MgCl2). Il a été mis en évidence que

les snoRNP H/ACA résistent à une concentration de 1,2 M de KCl. Puis à des concentrations

allant de 1,5M à 3M de KCl, les snoARN H/ACA snR42 et snR10 se détachent

progressivement des particules contenant Cbf5p-ZZ. Néanmoins, il est important de noter que

la particule contenant l’ARN snR30 semble être plus résistante. En effet, snR30 ne commence

à se décrocher de Cbf5p-ZZ qu’à partir d’une concentration de 3M de KCl. Cela suggère que

toutes les RNP H/ACA ne sont pas strictement équivalentes. Ce point important sera plus

longuement développé dans la partie discussion de ce manuscrit. Les protéines Cbf5p, Nhp2p,

Gar1p et Nop10p sont associées très fortement les unes aux autres (le complexe résiste à 3M

KCl) même en absence des composants ARN qui, pour la plupart, se décrochent vers 1,5M de

KCl.

La résistance des RNP H/ACA au MgCl2 a également été testée et laisse apparaître

que les composants ARN ainsi que la protéine Nhp2p se décrochent des complexes liés à

Cbf5p dés la concentration de 0,5 M de MgCl2 alors que les protéines Nop10p et Gar1p

restent très fortement associées à Cbf5p jusqu’à 2M de MgCl2. Ceci suggère que ces protéines

interagissent entre elles via des liaisons hydrophobes. Les forces d’interactions qui unissent

ces protéines sont considérables, de l’ordre de la liaison antigène-anticorps.

Le même type d’expérience a été réalisé à partir d’une souche présentant une forme

thermosensible de la protéine Gar1p. Il a été mis en évidence que la protéine Gar1p n’est pas

58

Page 112: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

strictement requise pour l’assemblage des particules car à température non permissive,

température à laquelle elle est déstabilisée, il y a tout de même formation de complexes

contenant les protéines Cbf5p, Nhp2p, Nop10p ainsi que les snoARN H/ACA. Au sein de ces

complexes, l’interaction entre Cbf5p et Nop10p demeure forte et résiste à une concentration

de 2M de MgCl2.

Les résultats des tests de « décortication » ont permis de proposer qu’au sein du

complexe d’une part Cbf5p interagit directement avec Nop10p et d’autre part que Gar1p

interagit soit avec Cbf5p soit avec Nop10p pour former un complexe Cbf5p/Gar1p/Nop10p en

absence de Nhp2p et des snoARN H/ACA. Enfin, il semble qu’il ait été possible d’obtenir

une sous-population de complexes contenant les quatre protéines en absence de snoARN

H/ACA ce qui suggère que la protéine Nhp2p serait capable d’interagir de façon relativement

forte (l’interaction résiste à 2M de KCl) avec au moins une des protéines du complexe.

Bien que ces résultats ne permettent d’avoir qu’une vue partielle de ce que peut être

l’agencement des différents composants au sein du complexe, ils ont permis d’identifier

quelques similitudes et différences entre les particules d’archées et de levure.

Les similitudes sont les suivantes: Cbf5p et Nop10p interagissent directement l’une

avec l’autre. Il est possible de former un hétéro-trimère Cbf5p/Gar1p/Nop10p.

La différence majeure mise en évidence concerne la protéine Nhp2p. Il semble qu’elle

soit capable d’établir une interaction protéine/protéine forte avec le complexe

Cbf5p/Gar1/Nop10p. Ce résultat n’est pas vraiment surprenant dans la mesure où Anthony

Henras et ses collaborateurs avaient précédemment mis en évidence que Nhp2p a certes de

l’affinité pour l’ARN mais ne semble pas présenter de spécificité particulière pour les

snoARN H/ACA in vitro (Henras, Dez et al. 2001). Il avait alors été suggéré que son

recrutement au sein du complexe devait se faire via l’interaction avec une des protéines et non

pas uniquement avec le composant ARN (comme c’est probablement le cas pour la protéine

L7Ae).

59

Page 113: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

2. Analyse fine de l’interaction entre Cbf5p et les snoARN

H/ACA

L’interaction entre la protéine Cbf5p avec les snoARN H/ACA a pu être réalisée au

laboratoire de Michèle Caizergues-Ferrer grâce à une collaboration avec Sophie Chéruel dans

le groupe de H. van Tilbeurgh à l’Université d’Orsay. En effet, Sophie a mis au point un

protocole de production puis de purification de la protéine Cbf5p en conditions dénaturantes

suivie d’une étape de renaturation sur colonne. Régine Capeyrou a également contribué à la

mise au point de ce protocole (Normand, Capeyrou et al. 2006). Malheureusement, seule une

forme de Cbf5p tronquée à l’extrémité carboxy-terminale, nommée Cbf5 p, a pu être produite

en quantité suffisante pour réaliser les tests d’interaction avec l’ARN (figure 47). La protéine

Cbf5 p comprend le domaine catalytique et le domaine PUA intacts. En revanche, il a fallu

éliminer d’une part le domaine riche en résidus lysine à l’extrémité carboxy-terminale et

d’autre part les cinq derniers acides aminés de la région centrale strictement conservée chez

tous les orthologues de Cbf5p. Il est fort probable que le domaine riche en lysine ne soit pas

strictement requis pour l’assemblage des particules car il est spécifique aux eucaryotes. Cette

hypothèse est confortée par le fait que des expériences de complémentation chez

Kluyveromyces lactis ont mis en évidence que ce domaine n’est pas essentiel (Winkler, Bobok

et al. 1998). Christophe Normand et Régine Capeyrou dans notre laboratoire ont donc testé

l’interaction entre la protéine Cbf5 p et les snoARN H/ACA in vitro via l’utilisation de deux

techniques: le gel retard et le footprint. Ils ont mis en évidence que Cbf5 p interagit de façon

spécifique avec les snoARN H/ACA snR5, snR37 et snR42. La figure 48 présente un modèle

d’interaction basé sur les résultats obtenus lors des tests en gel retard et footprint. Cbf5 p se

fixerait sur l’ARN H/ACA snR5 au niveau de la partie basale des deux tiges boucles, en

interaction avec les poches de pseudouridylation et les boites conservées H et ACA. Il y aurait

sans doute au moins deux exemplaires de Cbf5p par RNP. Cette hypothèse est confortée par

les résultats de Baker et collaborateurs montrant que la protéine aCbf5 d’archées s’assemble

sous forme de deux complexes sur les snoARN eucaryotes présentant deux tige-boucles. Ceci

suggère qu’il y aurait une protéine aCbf5 par tige (Baker, Youssef et al. 2005).

En conclusion, ces résultats d’interaction protéine/ARN concernant les particules de

levure sont en total accord avec la structure cristallographique d’une RNP H/ACA d’archées

60

Page 114: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 115: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

publiée au cours de la même année. En effet, dans les deux cas, la protéine Cbf5p interagit

avec la boite ACA, la partie basale de la tige ainsi qu’avec la poche de pseudouridylation. Il y

aurait donc conservation au cours de l’évolution du mode de liaison de la protéine Cbf5p sur

les ARN H/ACA.

C. Structure des RNP H/ACA chez les eucaryotes

supérieurs

La plupart des études réalisées sur l’assemblage des RNP H/ACA chez les eucaryotes

supérieurs et plus particulièrement chez les mammifères ont été conduites par le groupe de

Tomas Meier. Les modèles d’étude utilisés étant les RNP H/ACA chez les mammifères. Ces

études ont tout d’abord été menées sur des particules H/ACA purifiées par

immunoprécipitation de la protéine Nap57 (homologue chez les rongeurs de la protéine

Cbf5p). Grâce à un test ingénieux (présenté dans la figure 49), il a été mis en évidence que les

protéines Nap57 et Gar1 pouvaient être pontées à l’ARN substrat et plus particulièrement à

l’uridine ciblée lors de la réaction de pseudouridylation. Ces résultats suggèrent que ces deux

protéines se trouvent, dans le complexe, à proximité de l’ARN substrat (Wang, Query et al.

2002), (Wang and Meier 2004).

Cette observation n’est pas en accord avec les données de structure obtenues pour les

particules H/ACA d’archées car ces derniers suggéraient que la protéine aGar1, dûe à sa

position dans le complexe, ne semblait pas pouvoir interagir avec l’ARN substrat. Toutefois,

il est important de noter que la protéine Gar1 présente des domaines supplémentaires chez les

eucaryotes, placés à chaque extrémité: les domaines GAR (riches en résidus glycine et

arginine). Il est possible que ces domaines, chez les eucaryotes, permettent la liaison de Gar1p

au substrat.

Les protéines des RNP H/ACA chez les eucaryotes supérieurs n’ont pas pu être

produites sous forme soluble chez la bactérie. En revanche, l’utilisation d’extraits de

réticulocytes de lapin a permis au groupe de T. Meier de produire chacune des protéines

(marquées radioactivement grâce à l’utilisation de méthionine S35) et ils ont ainsi pu réaliser

des tests d’interaction protéine/protéine et protéine/ARN (Wang and Meier 2004). Ces

résultats sont décrits dans les paragraphes suivants. Il est toutefois important de garder en tête

61

Page 116: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

-Incubation with immupurified H/ACA RNPs -UV irradiation

*

*

* Proteins which are closed to the substrate are crosslinked to the 4-thiouridine residue and become radioactive

RNase A treatment SDS-PAGE

Autoradiography

4-thiouridine

FIGURE 49: Test permettant d'identifier les protéines des RNP H/ACA en conctact avec l'uridine à modifier au sein du substrat (Adaptée de Wang, C., C. C. Query, et al. (2002). "Immunopurified small nucleolar ribonucleoprotein particles pseudouridylate rRNA independently of their association with phosphorylated Nopp140." Mol Cell Biol 22(24): 8457-66.)

FIGURE 50: Modèle d'assemblage des particules H/ACA chez les eucaryotes supérieurs (Adaptée de Wang, C. and U. T. Meier (2004). "Architecture and assembly of mammalian H/ACA small nucleolar and telomerase ribonucleoproteins." Embo J 23(8): 1857-67.)

Page 117: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

que les résultats obtenus via ce genre d’approche peuvent être faussés dans la mesure où les

protéines utilisées ne sont pas purifiées. Il est donc possible que des éléments présents dans

les extraits de réticulocytes modifient la réalité des interactions. Il est donc important de ne

jamais parler d’interaction directe avec ce genre d’approche.

Lorsque les 4 protéines (Nap57, Nhp2, Nop10 et Gar1) ont été co-produites dans le

même extrait de réticulocytes de lapin puis soumises à une immunoprécipitation via des

anticorps anti-Nap57, Wang et collaborateurs ont mis en évidence une co-purification de

Nhp2 et Nop10 avec la protéine Nap57. Différentes combinaisons ont ensuite été réalisées et

ont révélé que Nop10 est bien co-purifiée avec Nap57. En revanche, la protéine Nhp2, dans

ces conditions, semble ne pouvoir s’associer à Nap57 qu’en présence de Nop10.

Le même type d’expérience d’interaction a ensuite été réalisé avec une forme de

Nop10 présentant une étiquette HA. L’immunoprécipitation de cette protéine (via des

anticorps anti-HA) a révélé qu’elle est capable d’interagir avec Nap57. La protéine Nhp2

quant à elle semble immunoprécipitée de façon efficace que lorsque Nap57 et Nop10-HA sont

toutes les deux présentes.

En ce qui concerne Gar1, les résultats des tests d’interaction avec Nap57 ne sont pas

d’une grande qualité. Néanmoins, ils semblent suggérer qu’il y a une interaction entre Nap57

et Gar1 en absence de Nhp2 et Nop10.

En conclusion, il y aurait des interactions directes entre Nap57 et Nop10 d’une part et

entre Nop10 et Nhp2 d’autre part. Toutefois, pour que Nop10p interagisse fortement avec

Nhp2 il faut que Nap57 soit présente (voir modèle figure 50). Ces résultats sont donc en

parfait accord avec les données de structure des particules d’archées laissant apparaître que

aCbf5 est requise pour la structuration correcte de la protéine Nop10. Néanmoins, Nhp2p

semble présenter une affinité plus grande pour Nop10 que son orthologue d’archées. Cela

peut s’expliquer par le fait que Nhp2, au cours de l’évolution, a perdu sa faculté à interagir de

façon spécifique avec l’ARN. Pour compenser cette perte, il a donc fallu augmenter la surface

ou/et la force d’interaction entre Nhp2 et Nop10 afin de maintenir la stabilité du complexe au

même niveau. Le fait que Nhp2 n’interagisse pas de façon spécifique avec les ARN H/ACA

seule in vitro a été mis en évidence chez la levure (voir paragraphe précédant) (Henras, Dez et

al. 2001) mais également chez les rongeurs (Wang and Meier 2004).

Wang et collaborateurs ont également testé, par le même type d’approche, l’association

des différentes protéines avec un ARN H/ACA. Ils ont mis en évidence que les ARN H/ACA

testés ne sont immunoprécipités avec Nap57 qu’en présence de Nop10 et de Nhp2. Ces

62

Page 118: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

résultats ne sont pas en accord avec ceux obtenus chez les archées et la levure montrant une

interaction directe entre Cbf5 et l’ARN. Ceci peut traduire une réelle différence entre les

particules de ces différents organismes ou bien tout simplement traduire un problème

technique (quantité insuffisante de protéine).

D. Evolution du mode d’assemblage des RNP H/ACA des

archées jusqu’aux eucaryotes supérieurs

Dans les chapitres précédents, nous avons pu apprécier les similitudes et différences

existant entre les structures des particules H/ACA chez les archées, la levure et les

mammifères. En conclusion, nous pouvons proposer que, de manière générale, la structure des

ces particules n’a pas énormément évolué. Toutefois, il est important de noter que les résultats

permettant d’arriver à cette conclusion ont été obtenus via des expériences réalisées in vitro.

Ils ne prennent donc pas en considération le fait que les différents constituants des RNP

H/ACA sont synthétisés séparément. Chez les eucaryotes, l’existence de deux compartiments

séparés, cytoplasme et noyau dans lesquels sont respectivement synthétisés les protéines et

ARN H/ACA rend probablement le processus d’assemblage bien plus complexe que chez les

archées où la synthèse, l’assemblage et l’action des RNP H/ACA ont lieu dans un seul et

unique compartiment.

Chez les eucaryotes est apparue une machinerie d’assemblage des RNP H/ACA

permettant l’importation des protéines du complexe au sein du noyau, leur assemblage sur

l’ARN H/ACA en cours de synthèse et le transport des particules ainsi formées vers leurs

lieux d’action: le nucléole, les corpuscules de Cajal, les télomères et peut être d’autres lieux

d’action non encore identifiés.

La protéine Naf1p est sans aucun doute un des composants absolument cruciaux de la

machinerie d’assemblage des RNP H/ACA chez les eucaryotes. Elle a fait l’objet de mon

travail de thèse. Les résultats que j’ai obtenus sont présentés dans le chapitre suivant.

63

Page 119: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

« The box H/ACA RNPs, from ribosome biogenesis to telomere

maintenance.”

Coralie Hoareau-Aveilla, Yves Henry

Sous presse dans “RNA binding proteins in Development and Disease”, R. Denman Ed, Research Signpost publishers.

64

Page 120: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 121: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Box H/ACA RNPs: from ribosome formation to telomere maintenance

Coralie Hoareau-Aveilla and Yves Henry

Laboratoire de Biologie Moléculaire Eucaryote, CNRS, Université de Toulouse, UPS, Toulouse, France, European Union

Running title: Structure and function of box H/ACA RNPs

1

Page 122: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

ABSTRACT: Box H/ACA ribonucleoprotein particles (box H/ACA RNPs) are found from archaea to humans and play diverse and essential functions in the maintenance of genome integrity and the regulation of gene expression. All particles of this family comprise four proteins, including the pseudouridine synthase Cbf5/dyskerin, and an RNA component featuring the conserved ACA box and in most cases the H box. Three sub-classes of box H/ACA RNPs can be distinguished. Box H/ACA small nucleolar (sno)RNPs accumulate in the nucleolus and are involved in ribosome synthesis; box H/ACA small Cajal body-specific (sca)RNPs accumulate within nucleoplasmic Cajal bodies where they introduce pseudouridines within the spliceosomal snRNAs that carry out pre-mRNA splicing; lastly, the telomerase holoenzyme in vertebrates is a special type of box H/ACA RNP that utilizes its box H/ACA RNP domain for stabilization and localization within Cajal bodies. Recent in vitro reconstitution of an active archaeal box H/ACA RNP and the determination of its crystal structure have provided crucial insight into the mechanism of RNA-guided pseudouridylation. Work in eukaryotic systems meanwhile is slowly unravelling the surprisingly complex pathways that are used for in vivo assembly and proper sub-cellular localization of box H/ACA RNPs. These ongoing studies on box H/ACA RNP structure, function and mode of assembly will no doubt prove crucial to fully comprehend the basis for X-linked dyskeratosis congenita, an often fatal human disease caused by mutations of the dyskerin protein. INTRODUCTION:

Stable complexes of non-coding RNAs and proteins, so-called ribonucleoprotein particles or RNPs, are found in all kingdoms of life and play fundamental roles in the maintenance of genome integrity and the regulation of its expression. Non-coding RNAs have aroused increasing interest over the past years, particularly with the discovery of the mechanism of RNA interference and of microRNAs, and have been the subject of many recent excellent reviews (see for example [1-6]). In this chapter, we will focus on one class of RNPs, box H/ACA RNPs, that comprises particles identified from archaea to humans and involved in a surprisingly vast spectrum of crucial biological phenomena, including ribosome biogenesis, spliceosomal snRNA modification and telomere synthesis [7]. Moreover, the discovery of box H/ACA RNAs in mammals with no identified target raises the possibility that the array of functions fulfilled by box H/ACA RNPs may be wider still. The study of box H/ACA RNPs is also of medical interest since some mutations in the dyskerin gene encoding one protein component of these particles are one cause of dyskeratosis congenita [8], an inherited disorder characterized by skin and mucous membrane abnormalities, bone marrow failure and a propensity to develop certain cancers [9]. In our review, we will attempt to give a fairly broad, yet detailed, overview of the field, with particular emphasis on recent exciting developments concerning the structure of box H/ACA RNPs and the implications for their mode of catalysis. We will also present what is currently known concerning the mode of formation of these particles in vivo, that emerges as surprisingly complex. We will end with a discussion of the possible molecular defects underlying X-linked dyskeratosis congenita, a human disease caused by mutations within dyskerin, a protein component of all human box H/ACA RNPs. 1. Box H/ACA RNPs: particles found from archaea to humans playing diverse and essential functions:

In all instances, these RNPs are composed of one RNA molecule, the box H/ACA small RNA, tightly associated with at least four common proteins [7]. Box H/ACA RNAs, first identified in yeast by the group of M. Fournier [10] and in humans by the group of T. Kiss [11], derive their name from the presence of conserved H (consensus 5’AnAnnA 3’) and

2

Page 123: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

5’ACA3’ boxes. It was later recognized that archaea also possess related small RNAs [12-14], that however usually lack a H box. In archaea and eukaryotes, box H/ACA RNAs associate with three conserved proteins, Gar1 [10,11,15], Nop10 [16,17], and Cbf5 [18,19] (also named Nap57 in rodents [20] and dyskerin in humans [8]). In addition, archaeal H/ACA RNPs contain the ribosomal protein L7Ae [13], which in eukaryotic RNPs is replaced by the related Nhp2 protein [16,17,19]. Genetic experiments in yeast have demonstrated that all four proteins are essential for viability.

As detailed below, the functions played by box H/ACA particles is crucially determined by the precise nature of their RNA component [7]. Indeed, this RNA component contains sequence elements that will direct specific interactions with given RNA substrate(s) and allow targeting/retention of the particles in nuclear domains in which these substrates are found [21]. 1.1. Most box H/ACA RNPs catalyze uridine to pseudouridine conversions:

Most known box H/ACA RNPs convert specific uridines into pseudouridines in a variety of RNA substrates. As discussed below, these substrates include not only ribosomal RNAs, the best documented case, but also spliceosomal snRNAs and spliced leader RNAs. It is very likely that this list is far from complete and that other substrates will be found, such as (pre)-mRNAs. 1.1.a. Box H/ACA RNPs involved in pseudouridylation of rRNAs:

The first box H/ACA RNAs identified are eukaryotic and accumulate in the nucleolus. They were therefore termed box H/ACA small nucleolar (sno)RNAs. The vast majority of eukaryotic box H/ACA snoRNAs display a conserved structure featuring two irregular stems containing internal loops (Figure 1A) [11]. These stems are separated by a single-stranded so-called “hinge” region containing the H box [11] and followed by a single-stranded tail containing the ACA box, always positioned 3 nucleotides upstream from the 3’ end of the mature RNA [10]. Both boxes are essential for the stability and activity of box H/ACA snoRNAs [10,11,22]. Due to their site of accumulation, it was correctly assumed that they play a role in ribosome biogenesis. As it turns out, most box H/ACA snoRNAs are necessary for site-specific conversions of numerous uridine residues of ribosomal RNAs into pseudouridines [23,24]. The selection of the target uridines is performed by box H/ACA snoRNAs using an elegant mechanism first described by Ganot and colleagues [23]. As the uridine to pseudouridine conversion involves rotation of the cycle of the uridine base (Figure 1B), the selection process must avoid trapping this cycle in a Watson-Crick base-pairing interaction. Thus Ganot et al. proposed that two sequences on both sides of the internal loops (so-called “pseudouridylation pockets”) within the stems of box H/ACA snoRNAs establish two distinct Watson-Crick base-pairing interactions with sequences flanking the targeted uridine (Figure 1A). In the resulting snoRNA-rRNA hybrid, the targeted uridine is left unpaired and exposed at the centre of a three way RNA junction. The actual isomerisation reaction is performed by the pseudouridine synthase Cbf5p, one protein component of the box H/ACA snoRNPs [18,25]. Hence rather than synthesizing a different protein enzyme for each pseudouridine of ribosomal RNAs, nature has evolved a more versatile system whereby the same pseudouridine synthase is directed to tens of different uridine substrates by an RNA guided mechanism. This mechanism is of ancient origin, presumably pre-dating the split between eukaryotic and archaeal lineages. This assumption stems from the discovery of archaeal “H/ACA like” small RNAs (sRNAs), often featuring a single stem structure followed by an ACA box, or multimers of that basic unit [13,14], that are predicted to direct pseudouridylation of rRNAs in vivo and do so in vitro (see below).

3

Page 124: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

1.1.b. Box H/ACA RNPs involved in pseudouridylation of spliceosomal snRNAs: Remarkably, the same mechanism seems to be used to introduce pseudouridines

within eukaryotic small RNAs involved in pre-mRNA splicing, the so-called spliceosomal snRNAs [26]. Box H/ACA snoRNAs have been identified in HeLa cells that have the potential to direct pseudouridylation of uridines within the U6 snRNA [27], unusual in being transcribed by RNA polymerase III. Pseudouridylation of some uridine residues within U6 is thought to be RNA-guided and to occur within the nucleolus [27,28]. Spliceosomal snRNAs transcribed by RNA polymerase II are also subjected to RNA-guided pseudouridylation. In this case, however, the selection of target uridines is performed by small RNAs, that, although featuring most of the conserved characteristics of box H/ACA snoRNAs, accumulate in nucleoplasmic bodies termed Cajal bodies [29] rather than in the nucleolus. Hence these RNAs were termed “small Cajal body-specific” (sca)RNAs [30]. These scaRNAs associate with proteins common to box H/ACA snoRNPs as well as with the SmB and SmD3 proteinsto form so-called scaRNPs [31,32]. Surprisingly, box H/ACA scaRNAs often display complex modular structures. In higher eukaryotes, a box H/ACA scaRNA has been found that consists of two tandem repeats of a “canonical” box H/ACA RNA domain [33]. Most scaRNAs identified so far are “hybrid RNAs” comprising a box H/ACA domain grafted onto a so-called “box C/D” domain [30,32], characteristic of another class of small RNAs involved in ribose methylation [21,34,35]. Retention of box H/ACA scaRNAs within Cajal bodies requires a small sequence of consensus 5’UGAG3’ termed the CAB box [36]. Most box H/ACA scaRNAs contain two CAB boxes, located in the apical loops of the 5’ and 3’ hairpins, that function in an additive manner (Figure 1A). Since both box H/ACA scaRNPs and their target Pol II-transcribed spliceosomal snRNAs are found within Cajal bodies [29,37], it is assumed that these bodies constitute the cellular domain where RNA-guided pseudouridylation of these spliceosomal snRNAs takes place. 1.1.c. Roles of pseudouridines in ribosome function and activity of spliceosmal snRNAs:

We have so far discussed the way pseudouridines are introduced within ribosomal RNAs and spliceosomal snRNAs. What about the functions of the modifications themselves? In fact, the functions played by pseudouridine residues in ribosome structure and activity are still poorly understood. Since most pseudouridine residues are conserved and clustered in functionally important regions of eukaryotic rRNAs, in particular in the peptidyl-transferase centre (PTC) and the decoding centre [38-40], it is believed that, collectively, they are crucial for ribosome activity. This is borne out by the finding that impairment of rRNA pseudouridylation obtained in a yeast strain expressing a catalytically inactive form of Cbf5p induces severe growth defects [25]. In model RNAs, pseudouridine residues can improve local base stacking and stabilize double-stranded base-pairing interactions [41-43]. Thus, it is probable that pseudouridines contribute to the stabilization of structural domains within ribosomal RNAs. In that respect, it is interesting to note that the absence of 6 pseudouridine residues in the PTC affect the local rRNA structure [44]. In addition, lack of some of these pseudouridines leads to severe translational defects [44], underscoring the importance of pseudouridines for ribosome function.

Modified nucleotides of spliceosomal snRNAs are also conserved and clustered in functionally important regions of these RNAs [45]. The U2 snRNA contains the most post-transcriptional modifications and these are essential for the splicing process both in Xenopus oocytes [46,47] and HeLa nuclear extracts [48]. The 3 5’-most pseudouridines of U2 snRNA are essential for early steps of spliceosome assembly in HeLa extracts [49]. Furthermore, pseudouridines in the branch-site recognition region of U2 snRNA seem to be required for assembly of the functional 17S U2 snRNP in Xenopus oocytes [50], although this appears not to be the case in HeLa extracts [49].

4

Page 125: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

1.1.d. Trypanosomal spliced-leader associated RNP: a member of the box H/ACA RNP family introducing a pseudouridine within the spliced leader RNA: One of the most peculiar RNAs subjected to RNA-guided pseudouridylation is the 39 nucleotide long spliced leader sequence added to trypanosomal pre-mRNAs from the spliced leader (SL) RNA during a process known as trans-splicing [51]. This SL RNA associates with another RNA termed the spliced leader-associated RNA (SLA1) originally thought to be the trypanosome U5 snRNA [52]. However, it was later realised that SLA1 can adopt a stem-internal loop-stem-apical loop structure followed by an AGA box, highly reminiscent of archaeal single-stem pseudouridylation guide RNAs [53]. Moreover, SLA1 has the potential to select, by base-pairing interactions at the level of its internal loop, one uridine residue pseudouridylated in SL and this proposed interaction is confirmed by cross-linking experiments [52,53]. Disruption of the base-paring interactions predicted to guide SL pseudouridylation abolishes it [53]. Finally, inhibition of trypanosomal Cbf5p production prevents SLA1 accumulation as well as SL pseudouridylation [54]. All these data strongly suggest that SLA1 associates with box H/ACA RNP proteins to elicit pseudouridylation of SL. As SLA1 is present both in the nucleoplasm and the nucleolus [53], the site of SL modification remains unclear. 1.2. Box H/ACA snoRNPs snR10 and snR30/U17 are required for 18S rRNA production:

In eukaryotes, three of the four ribosomal RNAs (18S, 5.8S and 25S/28S rRNAs) are produced from a common precursor transcribed in the nucleolus by RNA polymerase I. In the course of the biogenesis of ribosomal subunits, this precursor (pre-rRNA) will undergo a series of cleavage reactions to release the mature rRNAs [55,56]. Two box H/ACA snoRNPs in the yeast Saccharomyces cerevisiae, containing the snR10 [57] or snR30 [58] snoRNAs, are required for the cleavage steps leading to mature 18S rRNA production. In the absence of snR30, which is essential for viability, 18S rRNA production is essentially blocked, while lack of snR10, which leads to a cold sensitive phenotype [59], severely impairs this production. The intervention of snR10 and snR30 snoRNPs in pre-rRNA cleavage does not seem to involve a pseudouridylation event. No target uridine has yet been identified for snR30. Although snR10 snoRNP modifies a uridine within 25S rRNA, a variant of snR10 has been generated that is incapable of modifying that uridine but nevertheless supports normal pre-rRNA cleavage [44]. The reason why snR10 and snR30 snoRNPs are required for pre-rRNA cleavage remains essentially unknown. The first breakthrough towards elucidating snR30 mode of action was obtained from phylogenetic comparisons [60-62]. These studies established that U17 snoRNA is the mammalian orthologue of yeast snR30 and identified two perfectly conserved sequence elements present in all known orthologues of snR30, but absent from pseudouridylation guides [60,62]. These highly conserved sequence motifs, termed the m1 (5’AUAUUCCUA3’) and m2 (5’AAACCAU3’) boxes, are positioned on opposite strands of an internal loop within the 3’most stem structure of snR30/U17 molecules (Figure 2). Although this arrangement first appears as somewhat akin to the position of antisense sequences within pseudouridylation pockets, there are two major differences: firstly, the m1 and m2 boxes occupy the lower part of the internal loop, while antisense sequences directing pseudouridylation are placed at the top of the pseudouridylation pocket; secondly, the 3’most nucleotide of the m2 box is always positioned 7 nucleotides upstream from the ACA box, a phenomenon not observed for sequences guiding pseudouridylation. Genetic experiments in yeast demonstrate that the m1 and m2 boxes are not required for the stability of snR30 but are essential for its activity [60]. What could be the functions of the m1 and m2 boxes? They could constitute protein-binding sites. Alternatively, since the snR30 snoRNA has been shown to directly base-pair to yeast 35S pre-rRNA [58], the conserved boxes could act as antisense

5

Page 126: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

sequences mediating snR30/U17-pre-rRNA interactions. If so, for what purpose? Many possibilities can be envisaged, including promoting proper folding of the pre-rRNA and/or anchoring the snR30/U17 snoRNP to pre-rRNAs for subsequent delivery of associated protein co-factors to pre-ribosomal particles.

1.3. Vertebrate telomerase RNP: an atypical box H/ACA scaRNP:

Telomerase is a RNP functioning as a specialised reverse transcriptase, dedicated to the addition of simple repeat sequences at the ends of chromosomes, the telomeres [63-65]. The RNA component of telomerase provides a so-called “template” sequence that is reverse-transcribed into telomeric DNA by a protein enzyme also part of the telomerase RNP. One of the biggest surprises in the box H/ACA RNP field was the discovery by Mitchell and collaborators that the RNA component of mammalian telomerase contains a box H/ACA domain at its 3’ end [66] (Figure 3). As is the case for “canonical” box H/ACA snoRNAs, integrity of box H and box ACA sequences of mammalian telomerase RNA is necessary for its proper processing and accumulation [66]. Later phylogenetic studies then demonstrated that a box H/ACA domain is present at the end of the telomerase RNA of all vertebrates considered [67]. Moreover, human telomerase RNA (and presumably telomerase RNAs from all vertebrates) associates with the four core proteins common to all box H/ACA RNPs [17,68-70]. Human telomerase is in fact an atypical member of the box H/ACA scaRNP sub-family. Telomerase RNA accumulates in Cajal bodies of HeLa cells and this accumulation results from the presence of a CAB box within the box H/ACA domain of the RNA [71]. Recent exciting results suggest that Cajal bodies might “deliver” telomerase to telomeres during S phase [72,73]. 1.4.“Orphan” and tissue-specific box H/ACA RNPs:

Large scale experimental or in silico screening methods aimed at identifying the repertoire of mammalian small non-coding RNAs have yielded the sequence of more than one hundred box H/ACA RNAs [27,74-78]. One striking conclusion from these studies was that about 20 box H/ACA RNAs fail to display base-pairing potential at the level of their putative pseudouridylation pockets with rRNAs, snRNAs or tRNAs. These RNAs have therefore been termed “orphan” RNAs. With the exception of two cases, U87 and U88, which are composite box H/ACA-C/D scaRNAs [30], the localization of the remaining orphan box H/ACA RNAs has not been determined, knowledge of which might help narrow down their possible functions. Since they display the canonical two stem-loop structures of pseudouridylation guide snoRNAs, they could direct pseudouridylation of unidentified targets, such as small RNAs or (pre)-mRNAs. Other roles, such as promoting proper folding of RNA, cannot be excluded. One particularly interesting orphan box H/ACA RNA is human HBI-36. All known mammalian box H/ACA RNAs are expressed in all tissues, with the exception of HBI-36, which is only detectable in the brain. Moreover, its mouse orthologue, MBI-36, mainly accumulates in a specific region of the brain, the choriod plexus, and it is likely the case for HBI-36 also [79]. HBI-36 is encoded in the second intron of the serotonin receptor 2C gene which is predominantly expressed in the choriod plexus. It is thus tempting to speculate that HBI-36 is involved in a function specific to the choriod plexus. 1.5. Do “box H/ACA mRNPs ” exist ? One unexpected finding from a systematic search for RNAs associated with the yeast box H/ACA snoRNP proteins Nhp2p and Gar1p [80] was the discovery that these proteins are specifically associated with the RPS28A mRNA, one of the two mRNAs encoding ribosomal protein Rps28p. Two models could account for this finding [80]. The RPS28A mRNA could be pseudouridylated by an unknown box H/ACA RNP. Alternatively, box H/ACA proteins

6

Page 127: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

could directly associate with the (pre)-mRNA, forming particles that could be coined “box H/ACA mRNPs ”. The purpose of such interactions might be to sequester the RPS28A mRNA within the nucleolus to prevent its translation under certain conditions. 2. In vitro assembly, structure and activity of box H/ACA RNPs: In order to decipher the molecular details of box H/ACA RNP mode of action, there was clearly a need to develop in vitro assays based on particles reconstituted from recombinant components. Although components of box H/ACA RNPs were first characterized in the yeast Saccharomyces cerevisiae [15,16,18,19], attempts to develop such in vitro assays using yeast proteins were greatly hampered by the failure to obtain recombinant yeast Cbf5p [81]. This deadlock was removed by the discovery of H/ACA RNP proteins in archaea [13,82], that can readily be purified from E. coli. Thus most of our information concerning box H/ACA RNP structure and mode of catalysis stems from work with archaeal proteins. However, more preliminary studies performed with yeast or mammalian proteins suggest that conclusions drawn from the archaeal work are broadly speaking of general relevance. 2.1. In vitro assembly of box H/ACA RNPs:

Box H/ACA RNPs displaying site-specific pseudouridylation activity have been assembled in vitro from archaeal proteins purified from E. coli and in vitro transcribed single-stem box ACA archaeal RNAs [83,84]. These studies provided crucial information concerning the interactions between the protein and RNA components of the particles and their respective contributions to the isomerisation reaction. Information gained from these studies can be summarized as follows. Only two proteins of the RNPs, L7Ae and the pseudouridine synthase aCbf5, can directly and specifically bind to box H/ACA RNAs on their own. L7Ae binds to a so-called K-loop motif, located in the apical loop and stem above the pseudouridylation pocket, that features two non-canonical sheared A.G and G.A pairs. aCbf5 binding requires an intact ACA box and the presence of a pseudouridylation pocket. aNop10 and aGar1 integration within the particles is dependent on aCbf5, to which both aNop10 and aGar1 can directly and independently bind. The situation in eukaryotes seems essentially similar, with a few differences. The largest truncated derivative of yeast Cbf5p that could be purified from E. coli binds directly to a single stem box ACA RNA and this binding is reduced, but not abolished, when the ACA box is removed [81]. Both yeast and mammalian Gar1 and Nop10 can independently directly bind to Cbf5p/Nap57 [85,86]. The eukaryotic counterpart of L7Ae, Nhp2, is an RNA-binding protein belonging to the same family as L7Ae. Contrary to L7Ae, however, eukaryotic Nhp2 displays little RNA-binding specificity in vitro [86,87]. Its specific integration within eukaryotic box H/ACA RNPs could be mediated via interactions with the Nap57/Nop10 complex [86].

Concerning the catalytic process as such, in vitro pseudouridylation assays performed with archaeal components indicate that the four proteins are needed for full activity [83,84]. Interestingly, the pseudouridine synthase aCbf5/guide RNA complex is completely inactive. The aCbf5/aNop10/guide RNA complex is the minimum combination displaying activity, albeit a very low one [84]. The addition of Gar1 and even more so of L7Ae increases the kinetics of the reaction [84]. We conclude that integration of the aCbf5 enzyme within the RNP is needed not only for specificity but also for activity.

2.2. Crystal structure of archaeal box H/ACA RNP:

The determination of the crystal structure of L7Ae [88,89], yeast Nop10p [90], of the aCbf5/aNop10 complex [91,92], the aCbf5/aNop10/aGar1 complex [93] and more recently that of an entire archaeal box H/ACA RNP [94] have not only confirmed the conclusions

7

Page 128: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

drawn from the biochemical studies but have also provided invaluable insights into the possible functions played by each protein component in the formation of the RNP and the catalytic process. The structure of the entire archaeal RNP is shown in Figure 4. We shall describe in the following paragraph the most salient features of this structure [94].

Most of the RNA hairpin adopts a near-linear structure, only the ACA box lying at right angle to the overall RNA axis. Protein binding occurs on one face of the hairpin only and this binding induces a slight bend towards the proteins in the overall helical axis of the hairpin. In accordance with the biochemical studies, L7Ae and aCbf5 are found in direct contact with the RNA. As expected, L7Ae interacts with the K-loop motif at the tip of the hairpin. aCbf5 displays overall structural homology to the E. coli tRNA pseudouridine synthase TruB [95] (for a comparison between aCbf5 and TruB, see the excellent recent review by Reichow and collaborators [35]). aCbf5 interacts via its catalytic domain with the pseudouridylation pocket, and via its so-called PUA (PseudoUridine synthase and Archaeosine transglycosylase) domain with the lower (P1) stem and the ACA box. Consistent with this, the PUA domain has proven essential for aCbf5 binding to guide RNAs in band retardation assays [92]. aCbf5 also features a N-terminal extension not present in TruB that encircles the entire PUA domain and may limit its flexibility. Most interestingly, the determination of the RNP structure reveals that the PUA domain interacts with the adenines of the ACA box in a sequence-specific manner involving hydrogen bonds. In particular, the first adenine inserts into a hybrid pocket composed of both RNA and protein. The structure therefore provides for the first time a detailed molecular explanation for the observations that these adenines are highly conserved, crucial for Cbf5 binding to box H/ACA RNAs in vitro [81,83,84] and for the stability of these RNAs in vivo [10,11,22] .

Also revealed by the RNP structure and unforeseen from biochemical studies is the fact that aNop10, once integrated into the RNP via interactions with aCbf5, also contacts both L7Ae and the guide RNA. Nevertheless, by far the most extensive interactions of aNop10 are established with aCbf5. aNop10, which features two N-terminal hairpins and a C-terminal helix connected by a highly conserved extended random coil, binds aCbf5 along its entire length via both hydrophobic and ionic interactions. In particular, the conserved extended linker of aNop10 interacts with a region of aCbf5 conserved in pseudouridine synthases called motif I. The interactions between the conserved linker of aNop10 and motif I of aCbf5 may lead to reciprocal stabilization of this aCbf5 motif and of the aNop10 linker, allowing the latter to adopt a conformation suitable for binding to the upper (P2) stem of the guide RNA.

The only protein component of the RNP not in direct contact with RNA is aGar1. In fact, aGar1 is placed at the periphery of the RNP, interacting only with the D2 sub-domain of aCbf5 catalytic region. Provided that this is also true for eukaryotic RNPs, which is most likely the case, this would explain why the absence of Gar1p in yeast does not prevent partial RNP formation and guide RNA stability [85,96], contrary to the lack of the other protein components [16,18]. What could the role of aGar1 be? Li and Ye have proposed a particularly elegant answer to this question [94]. While comparing the structure of the aCbf5/aNop10/aGar1 complex [93] with their entire RNP structure, Li and Ye noticed that a loop in the D2 sub-domain of aCbf5 adopts markedly different conformations in the two structures (Figure 5). The position of this aCbf5 loop seen in the RNA-free complex, once transposed in a model structure a box H/ACA RNP with a bound substrate RNA, would place the loop in direct contact with the substrate such that it would stabilize its interaction with the RNP. Li and Ye refer to this loop conformation as the ‘closed-state’. In their RNP-only structure, in contrast, the loop is flipped by 15 Å to dock on a hydrophobic patch of aGar1. This loop conformation, which would facilitate substrate entry into the aCbf5 catalytic cleft or substrate departure, is referred to as the “open state”. Li and Ye envisage that by stabilizing the “open state” conformation of the loop, aGar1 promotes substrate binding and/or release.

8

Page 129: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Consistent with this proposal, yeast box H/ACA snoRNPs lacking Gar1p seem unable to associate with pre-rRNAs [96].

In conclusion, the archaeal RNP structure reveals that extensive protein/protein and protein/RNA interactions properly position the active site cleft of aCbf5 with respect to the pseudouridylation pocket of the guide RNA, ready for productive interactions with a substrate RNA. Moreover, by direct interactions with the catalytic domain of aCbf5, aNop10 and aGar1 are likely to modulate catalysis. In particular, aGar1 is proposed to play a crucial role in substrate binding and/or release.

3. In vivo formation and trafficking of eukaryotic box H/ACA RNPs:

In vivo formation and trafficking of eukaryotic box H/ACA RNPs is emerging as a complex process, probably almost as complex as the one described for spliceosomal snRNP formation [97-99]. Several steps are involved, including translation and nuclear import of box H/ACA RNP core proteins, transcription of box H/ACA RNA precursors, maturation of these precursors and their assembly with the box H/ACA RNP core proteins, and targeting/retention of the mature particles to/within their sites of action. Some of these steps, in particular box H/ACA RNA transcription, protein assembly and RNA processing, are probably closely interconnected. Apart from protein translation, all of these steps are believed to take place within the nucleus. 3.1. Intronic and non-intronic modes of box H/ACA RNA transcription; RNA processing events:

In several instances, genes encoding box H/ACA RNAs display peculiar modes of organization (Figure 6). In vertebrates, the vast majority of box H/ACA RNA genes are embedded within introns of protein-coding genes. In some cases, the host pre-mRNA exons feature no open reading frame and the pre-mRNA seems to be expressed only for the production of the intronic box H/ACA RNA [100]. Most intriguingly, it has recently been discovered that some mammalian box H/ACA sno/scaRNAs are mobile genetic elements that can retrotranspose to novel intronic locations [101]. Such gene amplification mechanism followed by genetic drift could be a means to generate new guide RNAs targeting novel substrates. In some plants, box H/ACA RNA genes are sometimes part of a polycistronic cluster [102,103]. In that situation, several closely spaced small RNA genes are co-transcribed from a shared upstream promoter to produce a unique precursor from which individual small RNAs are released by endonucleolytic activities. In plants and Drosophila melanogaster, a mix of the two genomic organizations described above is even encountered: polycistronic clusters of small RNA genes located within introns of protein-coding genes [102,104-106]. Finally, in the budding yeast, box H/ACA snoRNAs are mainly produced from independent genes containing their own promoter and transcription terminator [102]. 3.1.a. Transcription of box H/ACA RNAs encoded by independent genes:

Whatever the mode of expression used (intronic or non-intronic), the transcription of box H/ACA RNAs is carried out by the classical RNA polymerase II complex (pol II). However, the termination of box H/ACA RNA transcription occurring from independent genes requires some specific components different from those used for pre-mRNAs. Indeed, the use of the classical pre-mRNA transcription termination process which consists of a site-specific RNA cleavage followed by a polyadenylation step must be avoided in the case of snoRNAs because such polyadenylation is deleterious for subsequent RNP assembly and function [107]. The first proteins identified as specific factors involved in snoRNA transcription termination are Nrd1p, Nab3p and the helicase Sen1p. In yeast strains expressing altered versions of these proteins, the RNA polymerase II machinery is unable to stop at the

9

Page 130: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

end of the snoRNA gene and continues unabated to transcribe the downstream intergenic region and sometimes even the adjacent gene [108]. The modes of action of Nrd1p, Nab3p and Sen1p are not well understood. They seem to be recruited onto chromatin via different components of the pol II machinery, including the carboxy-terminal domain (CTD) of the largest subunit of pol II [109] and the Paf1p complex [110]. Nrd1p and Nab3p recognize specific sequences located in the 3’ part of the pre-snoRNA (downstream of the snoRNA coding sequence) [108,111]. These specific interactions are probably a key step of the transcription termination process. However, it is not clear if a cleavage reaction is needed for the release of the pre-snoRNA from the pol II complex, as is the case for pre-mRNAs. Indeed, opposite conclusions have been reported about the requirement for cleavage factors in snoRNA transcription termination. One group has observed the production of read-through RNAs in yeast strains expressing altered versions of the cleavage factors Rna15p and Rna14p (components of the cleavage factor IA, CFIA) [107,112] while recently, another group has published that the cleavage activity of the CFIA complex is not required for snoRNA transcription termination. However, they demonstrated that the CTD pol II binding ability of another component of the CFIA complex, Pcf11p, is essential for this process [113].

Several other proteins have also been shown to be involved in the termination of transcription from independent snoRNA genes, including CTDK-1 (CTD kinase I) [108], Ssu72p [114,115], the APT complex [116,117]. The exact roles of these factors have not been elucidated. 3.1.b. Processing of box H/ACA small RNA precursors:

Whatever their origin, box H/ACA RNAs are produced in a precursor form containing extended 3’ ends and often extended 5’ ends also. Probably very rapidly after their release from the transcription site, these extensions are eliminated by exonucleases, the exosome at the 3’end [118] and probably by Rat1p/Xrn1p at the 5’end [119,120] (Figure 6). In some cases, additional enzymatic activities are required for the generation of accessible ends prior to the action of the exonucleases. For instance, Rnt1p, the yeast homologue of bacterial RNAse III, produces endonucleolytic cleavages within the 5’ extensions of some independently transcribed box H/ACA pre-snoRNAs [121]. This cleavage eliminates a protecting cap structure, probably a methyl-2,2,7-guanosine cap [122]. For intronic box H/ACA RNAs, the release of the mature sequences involves most of the time the action of the spliceosome. The splicing reaction generates a lariat form of the box H/ACA RNA-containing intron which is subsequently debranched by the enzyme Dbr1p [123] and digested by the exonucleases (Figure 6).

It is not yet known how the activity of processing exonucleases is controlled such that only extensions and not mature sequences are eliminated. The binding of some core box H/ACA proteins may protect mature box H/ACA RNA sequences from exonucleolytic digestion. Such hypothesis implies that these box H/ACA proteins associate with box H/ACA RNA precursors at a very early stage, for example while they are being transcribed. This is supported by the fact that Cbf5p and Nhp2p in yeast and Nap57, Nhp2 and Nop10 in mammals are detected in close proximity to box H/ACA RNA genes [124-126]. It has also been demonstrated that dyskerin (the Cbf5p orthologue in humans) is recruited onto pre-mRNAs hosting an intronic box H/ACA RNA before the splicing reaction [127,128].

3.2. Co-transcriptional initial RNP assembly: role of Naf1p:

The likely co-transcriptional assembly of Cbf5p/Nap57/dyskerin, Nhp2 and, at least in mammals, Nop10, onto nascent box H/ACA RNA precursors is probably assisted by Naf1, an essential protein conserved from yeast to man. Such assertion is based on the following data. Naf1 is specifically required for the accumulation of box H/ACA RNP proteins, except Nhp2,

10

Page 131: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

and all types of box H/ACA RNAs (snoRNAs in yeast and snoRNAs, scaRNAs and telomerase RNA in HeLa cells) [125,129-132]. Naf1 also displays a weak but specific association with box H/ACA RNP components [125,129-132]. In addition, yeast Naf1p is an RNA-binding protein that interacts with the phosphorylated form of CTD pol II [130] and with Spt16p, Tfg1p and Sub1p, which are associated with the RNA polymerase II machinery [126]. Furthermore, Naf1 is present in the cell close to the chromatin containing box H/ACA RNA genes [124-126]. The fact that this association with chromatin requires active transcription and the presence of a box H/ACA RNA coding sequence strongly suggests that Naf1 is associated with chromatin via the nascent RNA. A model of Naf1 mode of action, based on these results, is presented in figure 7. This model proposes that Naf1, bound to Cbf5p/Nap57/dyskerin, Nhp2 and Nop10, is recruited onto a box H/ACA RNA precursor during its transcription via interactions with the RNA PolII machinery and the nascent RNA. Following recruitment, Naf1 would deliver its cargo box H/ACA proteins onto the box H/ACA RNA precursor, thus initiating RNP assembly. During the routing of the maturing box H/ACA RNP within the nucleoplasm from the box H/ACA RNA transcription site to a Cajal body or the nucleolus, Naf1 would be replaced by Gar1, leading to the production of a mature particle. Indeed, Naf1 possesses a domain highly related to Gar1, which has the potential to directly interact with the Cbf5 surface to which Gar1 binds [93]. Hence the Cbf5-Naf1 and Cbf5-Gar1 interactions are thought to be mutually exclusive and to occur sequentially, a notion that is supported by in vitro protein/protein interaction studies showing that human Naf1 and Gar1 bind Nap57 competitively [125]. Thus, in addition to its role in promoting initial RNP assembly, Naf1 may also prevent premature catalytic activation of the particles by inhibiting Cbf5-Gar1 interactions.

3.3. Role of other trans-acting factors potentially involved in box H/ACA RNP assembly and/or transport:

Other factors in addition to Naf1, namely Shq1, the SMN complex, Srp40p/Nopp140, and the Rvb2p helicase are likely involved in box H/ACA RNP assembly and/or transport. The best candidate is yeast Shq1p, an essential nucleoplasmic protein which interacts in vitro with Naf1p and Nhp2p, and which, like Naf1p, is specifically required for box H/ACA snoRNP accumulation [132]. Shq1p has not been detected close to box H/ACA snoRNA genes [126] and thus could intervene prior to or after box H/ACA RNA transcription.

A possible role of the SMN complex, which intervenes in spliceosomal snRNP assembly, in box H/ACA RNP biogenesis has also been proposed, since the SMN protein (a component of the SMN complex) interacts in vitro and in vivo with the human box H/ACA RNP protein Gar1 [133]. Furthermore, an association of SMN with the human telomerase complex has been identified [134]. The role of the SMN complex in snRNP biogenesis has been extensively studied (for review see [99,135,136]). Briefly, the SMN complex is required for the recruitment of Sm proteins onto spliceosomal snRNAs. In contrast, the precise role of SMN in box H/ACA RNP biogenesis is not known and may not be universal since no counterpart of the SMN complex has yet been found in budding yeast.

The mammalian Nopp140 protein and its yeast counterpart Srp40p could also play a role in box H/ACA RNP biogenesis and/or transport. Nopp140 interacts with box H/ACA RNP components [137]. Furthermore, Srp40p in some yeast genetic backgrounds is necessary for the accumulation of box H/ACA snoRNAs [137]. The yeast helicase Rvb2p is likewise required for the accumulation of box H/ACA snoRNAs but is not specific of this RNA class because a loss of box C/D snoRNA accumulation is also observed in the absence of Rvb2p [138].

11

Page 132: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

4. Dyskerin and dyskeratosis congenita:Dyskeratosis congenita (DC) is a rare inherited disorder characterized by abnormal

pigmentation of the skin, nail dystrophy and mucosal leukoplakia [9,139]. Affected individuals tend to develop more serious symptoms including liver cirrhosis, strictures of the esophagus, pulmonary fibrosis, pancytopenia due to bone marrow failure and various types of cancers. These complications, above all bone marrow failure, cause death usually in the third decade. Three modes of transmission of the disease have been identified, an X-linked form and autosomal forms, dominant or recessive [9,139]. The most common form of DC is X-linked, due to mutations within the gene coding dyskerin [8,140], the human orthologue of the pseudouridine synthase Cbf5p. Based on that information alone and given the presence of dyskerin in all types of box H/ACA RNPs including telomerase, three possible causes of the disease can be envisaged: a defect in ribosome biogenesis, a splicing defect or a telomerase deficiency. Strong arguments in favour of the latter possibility are the observations that in cultured cell lines or uncultured blood mononuclear cells from X-linked DC male patients, as compared to similar control cells from unaffected parental female carriers, levels of telomerase RNA are strongly reduced while levels of the tested box H/ACA snoRNAs and scaRNAs are essentially unaffected [70,141,142]. Even more compelling arguments supporting the idea that DC is above all the result of defective telomerase activity are the following: (i) all patients with DC have very short telomeres [143] (ii) the autosomal dominant form of the disease is caused by mutations within the gene encoding the RNA component of human telomerase [144]. In the latter case, clearly no ribosome biogenesis or splicing defect can be invoked. Nevertheless, it is probable that dyskerin mutations causing X-linked DC (a more severe form of the disease than autosomal dominant DC), also induce some ribosome biogenesis defects and hence translational problems that increase the severity of the symptoms. Indeed, it has recently been reported that cells from X-linked DC patients exhibit a specific defect in translation initiated from internal ribosome entry sites (IRES) [145]. Such defects could result in decreased levels of antiapoptotic factors such as XIAP and Bcl-xL and contribute to bone marrow failure [145].

Two fundamental issues remain unresolved: (i) What is the impact of the dyskerin mutations causing DC on dyskerin function? and (ii) why do at least some of these mutations seem to specifically affect steady-state levels of telomerase RNA while having only a limited impact on the accumulation of other types of box H/ACA RNAs ? Fitting X-linked DC mutations on a dyskerin model structure, constructed using archaeal Cbf5 structure as a basis, reveals that the majority of these mutations cluster within the PUA domain of dyskerin [93]. Since the PUA domain of archaeal Cbf5 interacts with the lower stem and the ACA box of the archaeal guide RNA [94], a seemingly likely hypothesis was that these X-linked DC mutations affect dyskerin binding to the corresponding elements of human telomerase RNA. However, the corresponding residues of the archaeal Cbf5 PUA domain are not in contact with RNA in the archaeal box H/ACA RNP structure [94]. Thus the impact, if any, of X-linked DC mutations on the ability of dyskerin to interact with RNA remains an open question. CONCLUSION and PERSPECTIVES:

The study of box H/ACA RNPs, initiated by the teams of M. Fournier and T. Kiss [10,11,23,24], is entering a second decade. In the past ten years, we have come to appreciate how large and important the spectrum of functions carried out by box H/ACA RNPs is. Thanks to the work in archaeal systems, we now have knowledge at atomic level of how certain box H/ACA RNPs guiding pseudouridylation are organised. Work in eukaryotic systems has revealed that in vivo assembly and trafficking of box H/ACA RNPs requires a surprisingly large number of accessory factors. In the second decade, we can expect that at

12

Page 133: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

least some the following issues will be clarified. The precise roles of Gar1, L7Ae/Nhp2 and Nop10 in the pseudouridylation process need to be established, a goal that will require structural characterization of a complete box H/ACA RNP bound to its substrate RNA. The functions played by the pseudouridines themselves in ribosome and spliceosome activity need to be clarified. Much remains to be done to fully understand how the various eukaryotic box H/ACA RNPs are assembled in vivo and targeted to their sites of action, the precise molecular roles of factors such as Naf1 and Shq1 in these processes, and to what extent assembly/targeting pathways are shared between the different sub-classes of box H/ACA RNPs [146]. The mode of action of snR30/U17 RNPs in 18S rRNA biosynthesis remains unresolved. Even more mysterious are the roles of the orphan box H/ACA RNPs. We need to understand the functional implications of the interactions of box H/ACA RNP proteins with ribosomal protein mRNAs and assess how widespread the phenomenon is. Finally, the molecular consequences of the amino-acid substitutions in the dyskerin protein causing DC have to be determined. The number of researchers with diverse expertise joining the box H/ACA RNP field is steadily increasing and we can expect to obtain answers to some of these questions in the not too distant future. Acknowledgements: We thank David Villa for figures 1 and 3, Anthony Henras, Michèle Caizergues-Ferrer for critical reading of the manuscript. Coralie Hoareau is recipient of a graduate fellowship from the Association pour la Recherche sur le Cancer. Our research is supported by the CNRS, the Ligue Nationale Contre le Cancer (équipe labellisée), the Agence Nationale de la Recherche and the Université Paul Sabatier.

REFERENCES: 1. Carthew, R. W. 2006, Curr. Opin. Genet. Dev., 16, 203. 2. Du, T., and Zamore, P. D. 2005, Development, 132, 4645. 3. Filipowicz, W. 2005, Cell, 122, 17. 4. Filipowicz, W., Jaskiewicz, L., Kolb, F. A., and Pillai, R. S. 2005, Curr. Opin. Struct.

Biol., 15, 331. 5. Sen, G. L., and Blau, H. M. 2006, FASEB J., 20, 1293. 6. Wang, Y., Stricker, H. M., Gou, D., and Liu, L. 2007, Front. Biosci., 12, 2316. 7. Meier, U. T. 2005, Chromosoma, 114, 1. 8. Heiss, N. S., Knight, S. W., Vulliamy, T. J., Klauck, S. M., Wiemann, S., Mason, P. J.,

Poustka, A., and Dokal, I. 1998, Nat. Genet., 19, 32. 9. Mason, P. J., Wilson, D. B., and Bessler, M. 2005, Curr. Mol. Med., 5, 159. 10. Balakin, A. G., Smith, L., and Fournier, M. J. 1996, Cell, 86, 823. 11. Ganot, P., Caizergues-Ferrer, M., and Kiss, T. 1997, Genes Dev., 11, 941. 12. Omer, A. D., Ziesche, S., Decatur, W. A., Fournier, M. J., and Dennis, P. P. 2003,

Mol. Microbiol., 48, 617. 13. Rozhdestvensky, T. S., Tang, T. H., Tchirkova, I. V., Brosius, J., Bachellerie, J. P.,

and Hüttenhofer, A. 2003, Nucleic Acids Res., 31, 869. 14. Tang, T. H., Bachellerie, J. P., Rozhdestvensky, T., Bortolin, M. L., Huber, H.,

Drungowski, M., Elge, T., Brosius, J., and Hüttenhofer, A. 2002, Proc. Natl Acad. Sci. U S A, 99, 7536.

15. Girard, J. P., Lehtonen, H., Caizergues-Ferrer, M., Amalric, F., Tollervey, D., and Lapeyre, B. 1992, EMBO J., 11, 673.

16. Henras, A., Henry, Y., Bousquet-Antonelli, C., Noaillac-Depeyre, J., Gélugne, J. P., and Caizergues-Ferrer, M. 1998, EMBO J., 17, 7078.

17. Poga i , V., Dragon, F., and Filipowicz, W. 2000, Mol. Cell. Biol., 20, 9028.

13

Page 134: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

18. Lafontaine, D. L., Bousquet-Antonelli, C., Henry, Y., Caizergues-Ferrer, M., and Tollervey, D. 1998, Genes Dev., 12, 527.

19. Watkins, N. J., Gottschalk, A., Neubauer, G., Kastner, B., Fabrizio, P., Mann, M., and Lührmann, R. 1998, RNA, 4, 1549.

20. Meier, U. T., and Blobel, G. 1994, J. Cell Biol., 127, 1505. 21. Henras, A. K., Dez, C., and Henry, Y. 2004, Curr. Opin. Struct. Biol., 14, 335. 22. Bortolin, M. L., Ganot, P., and Kiss, T. 1999, EMBO J., 18, 457. 23. Ganot, P., Bortolin, M. L., and Kiss, T. 1997, Cell, 89, 799. 24. Ni, J., Tien, A. L., and Fournier, M. J. 1997, Cell, 89, 565. 25. Zebarjadian, Y., King, T., Fournier, M. J., Clarke, L., and Carbon, J. 1999, Mol. Cell.

Biol., 19, 7461. 26. Valadkhan, S. 2005, Curr. Opin. Chem. Biol., 9, 603. 27. Kiss, A. M., Jády, B. E., Bertrand, E., and Kiss, T. 2004, Mol. Cell. Biol., 24, 5797. 28. Ganot, P., Jády, B. E., Bortolin, M. L., Darzacq, X., and Kiss, T. 1999, Mol. Cell.

Biol., 19, 6906. 29. Matera, A. G., and Shpargel, K. B. 2006, Curr. Opin. Cell Biol., 18, 317. 30. Darzacq, X., Jády, B. E., Verheggen, C., Kiss, A. M., Bertrand, E., and Kiss, T. 2002,

EMBO J., 21, 2746. 31. Fu, D., and Collins, K. 2006, Genes Dev., 20, 531. 32. Jády, B. E., and Kiss, T. 2001, EMBO J., 20, 541. 33. Kiss, A. M., Jády, B. E., Darzacq, X., Verheggen, C., Bertrand, E., and Kiss, T. 2002,

Nucleic Acids Res., 30, 4643. 34. Kiss, T. 2002, Cell, 109, 145. 35. Reichow, S. L., Hamma, T., Ferré-D'Amaré, A. R., and Varani, G. 2007, Nucleic

Acids Res., in press. 36. Richard, P., Darzacq, X., Bertrand, E., Jády, B. E., Verheggen, C., and Kiss, T. 2003,

EMBO J., 22, 4283. 37. Stanek, D., and Neugebauer, K. M. 2006, Chromosoma, 115, 343. 38. Charette, M., and Gray, M. W. 2000, IUBMB Life, 49, 341. 39. Decatur, W. A., and Fournier, M. J. 2002, Trends Biochem. Sci., 27, 344. 40. Ofengand, J., and Fournier, M. J. 1998, Modification and Editing of RNA, H.

Grosjean and R. Benne (Eds), ASM Press, Washington, D.C., 229. 41. Davis, D. R. 1995, Nucleic Acids Res., 23, 5020. 42. Davis, D. R. 1998, Modification and Editing of RNA, H. Grosjean and R. Benne

(Eds), ASM press, Washington, D.C., 85. 43. Meroueh, M., Grohar, P. J., Qiu, J., SantaLucia, J., Jr., Scaringe, S. A., and Chow, C.

S. 2000, Nucleic Acids Res., 28, 2075. 44. King, T. H., Liu, B., McCully, R. R., and Fournier, M. J. 2003, Mol. Cell, 11, 425. 45. Gu, J., Patton, J. R., Shimba, S., and Reddy, R. 1996, RNA, 2, 909. 46. Pan, Z. Q., and Prives, C. 1989, Genes Dev., 3, 1887. 47. Yu, Y. T., Shu, M. D., and Steitz, J. A. 1998, EMBO J., 17, 5783. 48. Ségault, V., Will, C. L., Sproat, B. S., and Lührmann, R. 1995, EMBO J., 14, 4010. 49. Dönmez, G., Hartmuth, K., and Lührmann, R. 2004, RNA, 10, 1925. 50. Zhao, X., and Yu, Y. T. 2004, RNA, 10, 681. 51. Bonen, L. 1993, FASEB J., 7, 40. 52. Watkins, K. P., Dungan, J. M., and Agabian, N. 1994, Cell, T6, 171. 53. Liang, X. H., Xu, Y. X., and Michaeli, S. 2002, RNA, 8, 237. 54. Barth, S., Hury, A., Liang, X. H., and Michaeli, S. 2005, J. Biol. Chem., 280, 34558. 55. Fromont-Racine, M., Senger, B., Saveanu, C., and Fasiolo, F. 2003, Gene, 313, 17. 56. Venema, J., and Tollervey, D. 1999, Annu. Rev. Genet., 33, 261.

14

Page 135: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

57. Tollervey, D. 1987, EMBO J. 6, 4169. 58. Morrissey, J. P., and Tollervey, D. 1993, Mol. Cell. Biol., 13, 2469. 59. Tollervey, D., and Guthrie, C. 1985, EMBO J., 4, 3873. 60. Atzorn, V., Fragapane, P., and Kiss, T. 2004, Mol. Cell. Biol., 24, 1769. 61. Cervelli, M., Cecconi, F., Giorgi, M., Annesi, F., Oliverio, M., and Mariottini, P.

2002, J. Mol. Evol., 54, 166. 62. Cervelli, M., Oliverio, M., Bellini, A., Bologna, M., Cecconi, F., and Mariottini, P.

2003, J. Mol. Evol., 57, 73. 63. Autexier, C., and Lue, N. F. 2006, Annu. Rev. Biochem., 75, 493. 64. Collins, K. 2006, Nat. Rev. Mol. Cell. Biol., 7, 484. 65. Theimer, C. A., and Feigon, J. 2006, Curr. Opin. Struct. Biol., 16, 307. 66. Mitchell, J. R., Cheng, J., and Collins, K. 1999, Mol. Cell. Biol., 19, 567. 67. Chen, J. L., Blasco, M. A., and Greider, C. W. 2000, Cell, 100, 503. 68. Dez, C., Henras, A., Faucon, B., Lafontaine, D., Caizergues-Ferrer, M., and Henry, Y.

2001, Nucleic Acids Res., 29, 598. 69. Dragon, F., Poga i , V., and Filipowicz, W. 2000, Mol. Cell. Biol., 20, 3037. 70. Mitchell, J. R., Wood, E., and Collins, K. 1999, Nature, 402, 551. 71. Jády, B. E., Bertrand, E., and Kiss, T. 2004, J. Cell Biol., 164, 647. 72. Jády, B. E., Richard, P., Bertrand, E., and Kiss, T. 2006, Mol. Biol. Cell, 17, 944. 73. Tomlinson, R. L., Ziegler, T. D., Supakorndej, T., Terns, R. M., and Terns, M. P.

2006, Mol. Biol. Cell, 17, 955. 74. Gu, A. D., Zhou, H., Yu, C. H., and Qu, L. H. 2005, Nucleic Acids Res., 33, e194. 75. Hüttenhofer, A., Kiefmann, M., Meier-Ewert, S., O'Brien, J., Lehrach, H., Bachellerie,

J. P., and Brosius, J. 2001, EMBO J., 20, 2943. 76. Vitali, P., Royo, H., Seitz, H., Bachellerie, J. P., Hüttenhofer, A., and Cavaillé, J.

2003, Nucleic Acids Res., 31, 6543. 77. Yang, J. H., Zhang, X. C., Huang, Z. P., Zhou, H., Huang, M. B., Zhang, S., Chen, Y.

Q., and Qu, L. H. 2006, Nucleic Acids Res., 34, 5112. 78. Lestrade, L., and Weber, M. J. 2006, Nucleic Acids Res., 34, D158. 79. Cavaillé, J., Buiting, K., Kiefmann, M., Lalande, M., Brannan, C. I., Horsthemke, B.,

Bachellerie, J. P., Brosius, J., and Hüttenhofer, A. 2000, Proc. Natl Acad. Sci. U S A, 97, 14311.

80. Torchet, C., Badis, G., Devaux, F., Costanzo, G., Werner, M., and Jacquier, A. 2005, RNA, 11, 928.

81. Normand, C., Capeyrou, R., Quevillon-Chéruel, S., Mougin, A., Henry, Y., and Caizergues-Ferrer, M. 2006, RNA, 12, 1868.

82. Watanabe, Y., and Gray, M. W. 2000, Nucleic Acids Res., 28, 2342. 83. Baker, D. L., Youssef, O. A., Chastkofsky, M. I., Dy, D. A., Terns, R. M., and Terns,

M. P. 2005, Genes Dev., 19, 1238. 84. Charpentier, B., Muller, S., and Branlant, C. 2005, Nucleic Acids Res., 33, 3133. 85. Henras, A. K., Capeyrou, R., Henry, Y., and Caizergues-Ferrer, M. 2004, RNA, 10,

1704. 86. Wang, C., and Meier, U. T. 2004, EMBO J., 23, 1857. 87. Henras, A., Dez, C., Noaillac-Depeyre, J., Henry, Y., and Caizergues-Ferrer, M. 2001,

Nucleic Acids Res., 29, 2733. 88. Charron, C., Manival, X., Cléry, A., Senty-Ségault, V., Charpentier, B., Marmier-

Gourrier, N., Branlant, C., and Aubry, A. 2004, J. Mol. Biol., 342, 757. 89. Hamma, T., and Ferré-D'Amaré, A. R. 2004, Structure, 12, 893. 90. Khanna, M., Wu, H., Johansson, C., Caizergues-Ferrer, M., and Feigon, J. 2006, RNA,

12, 40.

15

Page 136: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

91. Hamma, T., Reichow, S. L., Varani, G., and Ferré-D'Amaré, A. R. 2005, Nat. Struct. Mol. Biol., 12, 1101.

92. Manival, X., Charron, C., Fourmann, J. B., Godard, F., Charpentier, B., and Branlant, C. 2006, Nucleic Acids Res., 34, 826.

93. Rashid, R., Liang, B., Baker, D. L., Youssef, O. A., He, Y., Phipps, K., Terns, R. M., Terns, M. P., and Li, H. 2006, Mol. Cell, 21, 249.

94. Li, L., and Ye, K. 2006, Nature, 443, 302. 95. Hoang, C., and Ferré-D'Amaré, A. R. 2001, Cell, 107, 929. 96. Bousquet-Antonelli, C., Henry, Y., Gélugne J. P., Caizergues-Ferrer, M., and Kiss, T.

1997, EMBO J., 16, 4770. 97. Bertrand, E., and Bordonné, R. 2004, Prog. Mol. Subcell. Biol., 35, 79. 98. Matera, A. G., Terns, R. M., and Terns, M. P. 2007, Nat. Rev. Mol. Cell Biol., 8, 209. 99. Yong, J., Wan, L., and Dreyfuss, G. 2004, Trends Cell Biol., 14, 226. 100. Pelczar, P., and Filipowicz, W. 1998, Mol. Cell. Biol., 18, 4509. 101. Weber, M. J. 2006, PLoS Genet. 2, e205. 102. Brown, J. W., Echeverria, M., and Qu, L. H. 2003, Trends Plant Sci., 8, 42. 103. Leader, D. J., Clark, G. P., Watters, J., Beven, A. F., Shaw, P. J., and Brown, J. W.

1997, EMBO J., 16, 5742. 104. Huang, Z. P., Zhou, H., He, H. L., Chen, C. L., Liang, D., and Qu, L. H. 2005, RNA,

11, 1303. 105. Huang, Z. P., Zhou, H., Liang, D., and Qu, L. H. 2004, J. Mol. Biol., 341, 669. 106. Liang, D., Zhou, H., Zhang, P., Chen, Y. Q., Chen, X., Chen, C. L., and Qu, L. H.

2002, Nucleic Acids Res., 30, 3262. 107. Fatica, A., Morlando, M., and Bozzoni, I. 2000, EMBO J., 19, 6218. 108. Steinmetz, E. J., Conrad, N. K., Brow, D. A., and Corden, J. L. 2001, Nature, 413,

327. 109. Yuryev, A., Patturajan, M., Litingtung, Y., Joshi, R. V., Gentile, C., Gebara, M., and

Corden, J. L. 1996, Proc. Natl Acad. Sci. U S A, 93, 6975. 110. Sheldon, K. E., Mauger, D. M., and Arndt, K. M. 2005, Mol. Cell, 20, 225. 111. Carroll, K. L., Pradhan, D. A., Granek, J. A., Clarke, N. D., and Corden, J. L. 2004,

Mol. Cell. Biol., 24, 6241. 112. Morlando, M., Greco, P., Dichtl, B., Fatica, A., Keller, W., and Bozzoni, I. 2002, Mol.

Cell. Biol., 22, 1379. 113. Kim, M., Vasiljeva, L., Rando, O. J., Zhelkovsky, A., Moore, C., and Buratowski, S.

2006, Mol. Cell, 24, 723. 114. Ganem, C., Devaux, F., Torchet, C., Jacq, C., Quevillon-Chéruel, S., Labesse, G.,

Facca, C., and Faye, G. 2003, EMBO J., 22, 1588. 115. Steinmetz, E. J., and Brow, D. A. 2003, Mol. Cell. Biol., 23, 6339. 116. Dheur, S., Vo, L. T. A., Voisinet-Hakil, F., Minet, M., Schmitter, J. M., Lacroute, F.,

Wyers, F., and Minvielle-Sebastia, L. 2003, EMBO J., 22, 2831. 117. Nedea, E., He, X., Kim, M., Pootoolal, J., Zhong, G., Canadien, V., Hughes, T.,

Buratowski, S., Moore, C. L., and Greenblatt, J. 2003, J. Biol. Chem., 278, 33000. 118. van Hoof, A., Lennertz, P., and Parker, R. 2000, Mol. Cell. Biol., 20, 441. 119. Kiss, T., and Filipowicz, W. 1995, Genes Dev., 9, 1411. 120. Petfalski, E., Dandekar, T., Henry, Y., and Tollervey, D. 1998, Mol. Cell. Biol., 18,

1181. 121. Chanfreau, G., Legrain, P., and Jacquier, A. 1998, J. Mol. Biol., 284, 975. 122. Mouaikel, J., Verheggen, C., Bertrand, E., Tazi, J., and Bordonné, R. 2002, Mol. Cell,

9, 891. 123. Ooi, S. L., Samarsky, D. A., Fournier, M. J., and Boeke, J. D. 1998, RNA, 4, 1096.

16

Page 137: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

124. Ballarino, M., Morlando, M., Pagano, F., Fatica, A., and Bozzoni, I. 2005, Mol. Cell. Biol., 25, 5396.

125. Darzacq, X., Kittur, N., Roy, S., Shav-Tal, Y., Singer, R. H., and Meier, U. T. 2006, J. Cell Biol., 173, 207.

126. Yang, P. K., Hoareau, C., Froment, C., Monsarrat, B., Henry, Y., and Chanfreau, G. 2005, Mol. Cell. Biol., 25, 3295.

127. Richard, P., Kiss, A. M., Darzacq, X., and Kiss, T. 2006, Mol. Cell. Biol., 26, 2540. 128. Richard, P., and Kiss, T. 2006, EMBO Rep., 7, 590. 129. Dez, C., Noaillac-Depeyre, J., Caizergues-Ferrer, M., and Henry, Y. 2002, Mol. Cell.

Biol., 22, 7053. 130. Fatica, A., Dlaki , M., and Tollervey, D. 2002, RNA, 8, 1502. 131. Hoareau-Aveilla, C., Bonoli, M., Caizergues-Ferrer, M., and Henry, Y. 2006, RNA,

12, 832. 132. Yang, P. K., Rotondo, G., Porras, T., Legrain, P., and Chanfreau, G. 2002, J. Biol.

Chem., 277, 45235. 133. Pellizzoni, L., Baccon, J., Charroux, B., and Dreyfuss, G. 2001, Curr. Biol., 11, 1079. 134. Bachand, F., Boisvert, F. M., Côté, J., Richard, S., and Autexier, C. 2002, Mol. Biol.

Cell, 13, 3192. 135. Gubitz, A. K., Feng, W., and Dreyfuss, G. 2004, Exp. Cell Res., 296, 51. 136. Terns, M. P., and Terns, R. M. 2001, Curr. Biol., 11, R862. 137. Yang, Y., Isaac, C., Wang, C., Dragon, F., Poga i , V., and Meier, U. T. 2000, Mol.

Biol. Cell, 11, 567. 138. King, T. H., Decatur, W. A., Bertrand, E., Maxwell, E. S., and Fournier, M. J. 2001,

Mol. Cell. Biol., 21, 7731. 139. Vulliamy, T., and Dokal, I. 2006, Semin. Hematol., 43, 157. 140. Knight, S. W., Heiss, N. S., Vulliamy, T. J., Greschner, S., Stavrides, G., Pai, G. S.,

Lestringant, G., Varma, N., Mason, P. J., Dokal, I., and Poustka, A. 1999, Am. J. Hum. Genet., 65, 50.

141. Wong, J. M., and Collins, K. 2006, Genes Dev., 20, 2848. 142. Wong, J. M., Kyasa, M. J., Hutchins, L., and Collins, K. 2004, Hum. Genet., 115, 448. 143. Vulliamy, T. J., Knight, S. W., Mason, P. J., and Dokal, I. 2001, Blood Cells Mol.

Dis., 27, 353. 144. Vulliamy, T., Marrone, A., Goldman, F., Dearlove, A., Bessler, M., Mason, P. J., and

Dokal, I. 2001, Nature, 413, 432. 145. Yoon, A., Peng, G., Brandenburger, Y., Zollo, O., Xu, W., Rego, E., and Ruggero, D.

2006, Science, 312, 902. 146. Fu, D., and Collins, K. 2003, Mol. Cell, 11, 1361.

17

Page 138: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE LEGENDS : Figure 1 : A. Schematic representation of a box H/ACA sno/scaRNA guiding pseudouridylation bound to its substrate RNA. Positions of conserved boxes and pseudouridylatyion pockets are indicated. B. Schematic structure of uridine and pseudouridine residues. Figure 2: Secondary structures of the 3’ hairpins of S. cerevisiae snR30 and U17 snoRNAs from human and S. pombe. Red lettering: conserved m1 and m2 sequences. The 3’ end of the m2 sequence is always positioned 7 nucleotides upstream from the ACA box. Figure 3: Consensus secondary structure of vertebrate telomerase RNA. Figure 4: Crystal structure of an entire box H/ACA RNP from Pyrococcus furiosus (right) and schematic representation of the corresponding guide RNA secondary structure (left). Reprinted by permission from Macmillan Publishers Ltd: Nature (Li and Ye, “Crystal structure of an H/ACA box ribonucleoprotein particle”, 443, 302-307), copyright 2006. Figure 5: “Open” and “closed” conformations adopted by the 140-155 loop region of the aCbf5 D2 subdomain that may favour substrate entry into and substrate release from aCbf5 active site cleft, respectively. Reprinted by permission from Macmillan Publishers Ltd: Nature (Li and Ye, “Crystal structure of an H/ACA box ribonucleoprotein particle”, 443, 302-307), copyright 2006. Figure 6: Schematic representations of the various organizations of box H/ACA RNA genes and of the processing pathways of box H/ACA RNA precursors. Note that processing of polycistronic box H/ACA RNA transcripts by RNase III is hypothetical. Figure 7: Model of Naf1 mode of action during box H/ACA RNP assembly.

18

Page 139: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

PseudouridylationO

O H

NC

C C

C

N

H

H

H

O

O1

2

34

5

6

O

O H

N

C

C C

C

NH

H

H

O

O5

4

32

1

6

ANANNA ACA NNNH Box ACA Box

RNASubstrate

Pseudouridylationpocket

3'5'

5'

N N

CAB Box

UG

AGA

B

CAB Box

UG

AG

3'

Uridine Pseudouridine

FIGURE 1

Page 140: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

C G-U A-U G-

C G-C G-U A-G C-C G-A U-U A-AUU

CCUAC

AG A

AA

AC

C

U A-

A U-G C- AA U-G U-

C G-C G-C G-

CCGACAAA OH

C

CCU

G U C GAC

A

m1 m2

Human

C G-A U-

U

A U-U G-C G-

A U-C G-U A-G C-U A-A U-U A-A

UU

CC

UA

A AA

AA

CC

A U-

U

C G-U A-A CC G-

U C

U G-G U-

C UG

UUUACA OH

UUC

U

G C-A U-U A-C G-

m1 m2

S . pombe

G C-U

U A-G C-A U-C AC G-C UU A-A C

A U-C G-U G-A U-A U-A U-

G C-C G-A U-G C-U A-A U-U A-AUU

CCUAA

AC AA

AA

CC

GUGA

U G GU

UCUACAGA OH

m1 m2

S . c erevis iae

C G-U A-U G-

C G-C G-U A-G C-C G-A U-U A-AUU

CCUAC

AG A

AA

AC

C

U A-

A U-G C- AA U-G U-

C G-C G-C G-

CCGACAAA OH

C

CCU

G U C GAC

A

m1 m2

Human

C G-U A-U G-

C G-C G-U A-G C-C G-A U-U A-AUU

CCUAC

AG A

AA

AC

C

U A-

A U-G C- AA U-G U-

C G-C G-C G-

CCGACAAA OH

C

CCU

G U C GAC

A

m1 m2

C G-U A-U G-

C G-C G-U A-G C-C G-A U-U A-AUU

CCUAC

AG A

AA

AC

C

U A-

A U-G C- AA U-G U-

C G-C G-C G-

CCGACAAA OH

C

CCU

G U C GAC

A

C G-C G-U A-U A-U G-

C G-C G-C G-C G-U A-U A-G C-G C-C G-C GC G-A U-A UA U-U A-U AU A-AUU

CCUCUAC

AG A

AA

AC

C

U A-

A U-A U-G C-G C- AA U-A UA U-G U-G UG U-

C G-C GC G-C G-C GC G-C G-C GC G-

CCGACAAA OH

C

CCU

G U CU C GAC

A

m1 m2

Human

C G-A U-

U

A U-U G-C G-

A U-C G-U A-G C-U A-A U-U A-A

UU

CC

UA

A AA

AA

CC

A U-

U

C G-U A-A CC G-

U C

U G-G U-

C UG

UUUACA OH

UUC

U

G C-A U-U A-C G-

m1 m2

S . pombe

C G-A U-

U

A U-U G-C G-

A U-C G-U A-G C-U A-A U-U A-A

UU

CC

UA

A AA

AA

CC

A U-

U

C G-U A-A CC G-

U C

U G-G U-

C UG

UUUACA OH

UUC

U

G C-A U-U A-C G-

m1 m2

C G-A U-

U

A U-U G-C G-

A U-C G-U A-G C-U A-A U-U A-A

UU

CC

UA

A AA

AA

CC

A U-

U

C G-U A-A CC G-

U C

U G-G U-

C UG

UUUACA OH

UUC

U

G C-A U-U A-C G-

C G-C GC G-A U-A UA U-

U

A U-A U-U G-U G-C G-

A U-A U-C G-C G-U A-U A-G C-G C-U A-U AU A-A U-A UA U-U A-U AU A-A

UU

CC

UA

A AA

AAAA

CC

A U-

U

C G-C G-U A-U A-A CC G-C GC G-

U C

U G-U GU G-G U-G UG U-

C UG

UUUACA OH

UUC

U

G C-G C-A U-A U-U A-U A-C G-C G-

m1 m2

S . pombe

G C-U

U A-G C-A U-C AC G-C UU A-A C

A U-C G-U G-A U-A U-A U-

G C-C G-A U-G C-U A-A U-U A-AUU

CCUAA

AC AA

AA

CC

GUGA

U G GU

UCUACAGA OH

m1 m2

S . c erevis iae

G C-U

U A-G C-A U-C AC G-C UU A-A C

A U-C G-U G-A U-A U-A U-

G C-C G-A U-G C-U A-A U-U A-AUU

CCUAA

AC AA

AA

CC

GUGA

U G GU

UCUACAGA OH

m1 m2

G C-U

U A-G C-A U-C AC G-C UU A-A C

A U-C G-U G-A U-A U-A U-

G C-C G-A U-G C-U A-A U-U A-AUU

CCUAA

AC AA

AA

CC

GUGA

U G GU

UCUACAGA OH

G C-U

U A-U A-G C-G C-A U-A U-C AC G-C GC G-C UU A-U AU A-A C

A U-A U-C G-C G-U G-A U-A UA U-A U-A UA U-A U-A UA U-

G C-G C-C G-C G-A U-A U-G C-G C-U A-U AU A-A U-A UA U-U A-U AU A-AUU

CCUCUAA

AC AA

AAAA

CC

GUGAGA

U G GU

UCUACAGA OH

m1 m2

S . c erevis iae

7 nt7 nt

7 nt

FIGURE 2

Page 141: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

3'

5'

Template

Box H/ACA domain

CAB box

Pseudoknot domain

ANANNA

UCCCAAUC

H box ACA boxACA

U G

AG

FIGURE 3

Page 142: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Cbf5-D2

Cbf5-D1Cbf5-D1

3'3' 5'5'

H/ACA RNA

ACAACA

oo9090

Gar1 ZnZnCC

Nop10Nop10

k-turnk-turn

Cbf5-PUACbf5-PUA

L7ae

guidesguides

P2P2

P1P1

P2

50

60

A

U

A

UG U

U

U

A UG

G C

G

C

G

U

C

G

C

G

A

C

G

A

CG

A

C

G

A

C

G

U

A

C

G

A

A

C

G

G

A

C

G

U

A

C

G

U

AC

G

U

G

G

G

U

C

G

UC

C

30

40

20

10

5'G

3'

A

Pseudouridylationpocket

PS1

k-turn

P1

PS2

-5'3'

10'

1'AUA

UA

UA

A

CU

AC

G

CC

NN

C

NNN

CN

A B C

FIGURE 4

Page 143: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

V44

L145

L153

P143

Cbf5

I140

P144

V48

V23

L26

Gar1

openclosed-like

FIGURE 5

Page 144: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Tran

scri

pti

on

sta

rtTr

ansc

rip

tio

n s

top

box

H/A

CA

dom

ain

Tran

scri

pti

on

sta

rtTr

ansc

rip

tio

n s

top

Tran

scri

pti

on

sta

rtTr

ansc

rip

tio

n s

top

box

H/A

CA

dom

ain

exon

Intr

onic

box

H/A

CA

RN

A g

ene

Non

-intr

onic

box

H/A

CA

RN

A ge

nes

Inde

pend

ent

box

H/A

CA

RN

A ge

neP

olyc

istro

nic

box

H/A

CA

RN

A g

enes

Tran

scrip

tion

by R

NA

poly

mer

ase

II S

peci

fic m

ode

of tr

ansc

riptio

n te

rmin

atio

n re

quiri

ng N

rd1p

, Sen

1p, N

ab3p

, Ssu

72p,

the

AP

T co

mpl

ex a

nd C

TDK

-1

box

H/A

CA

dom

ain

AA

AA

An

box

H/A

CA

dom

ain

box

H/A

CA

dom

ain

End

onuc

leol

ytic

cl

eava

ge b

y R

Nas

e III

Spl

icin

g re

actio

n

Lar

iat

debr

anch

ing

by D

br1p

box

H/A

CA

dom

ain

Fin

al m

atur

atio

n by

5'

-3' a

nd 3

'-5'

exon

ucle

olyt

ic d

iges

tion

box

H/A

CA

RN

A

exon

ex

on

exon

exon

exon

A

AA

AA

n

box

H/A

CA

dom

ain

box

H/A

CA

dom

ain

box

H/A

CA

dom

ain

box

H/A

CA

dom

ain

exon

FIG

URE

6

Page 145: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Gar1

CTD

RNA polymerase II

machinery

Box H/ACA RNA coding gene

Naf1

Cbf5

Nop10

Nhp2

Co-transciptional recruitment of a complex pre-formed in the cytoplasm

Maturation of the box H/ACA particle: -processing of the 3' end and sometimes the 5' end of the box H/ACA RNA precursor -exchange between Naf1 and Gar1 -transport of the particle to a Cajal body or to the nucleolus

Naf1p

Mature box H/ACA particle

Synthesis of box H/ACA RNA precursor

Gar1

Box H/ACA

domain

RNA polymerase II

machinery

RNA polymerase II

machinery

Naf1

Naf1

Cbf5

Nop10

Nhp2

Cbf5

Nop10

Nhp2

FIGURE 7

Page 146: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 147: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Introduction

« La Dyskératose Congénitale, une maladie méconnue due à un déficit de

télomérase»

Coralie Hoareau-Aveilla, Yves Henry et Thierry Leblanc

Soumis à Médecine et Science

65

Page 148: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 149: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

La Dyskératose Congénitale, une maladie méconnue due à un déficit de télomérase

Coralie Hoareau-Aveilla, Yves Henry et Thierry Leblanc

C. Hoareau-Aveilla, Y. Henry : Laboratoire de Biologie Moléculaire Eucaryote du CNRS, Université de Toulouse, UPS,118 route de Narbonne, 31062 Toulouse cedex 09, France. T. Leblanc : Service d'oncologie-pédiatrie, Hôpital Saint-Louis, 1 avenue Claude Vellefaux, 75010 Paris, France.

[email protected]@sls.ap-hop-paris.fr

Résumé : La dyskératose congénitale (DC), ou syndrome de Zinsser-Cole-Engman, est une

maladie héréditaire, trop souvent létale, décrite pour la première fois sur le plan dermatologique par Zinsser en 1906 [1]. Il s’agit d’une maladie très polymorphe sur le plan clinique et qui est également variable dans son mode de transmission ; ceci, ajouté au fait que les symptômes cliniques sont d’apparition retardée, rend son diagnostic clinique difficile. A cette hétérogénéité clinique est associée une hétérogénéité génétique et on sait que plusieurs gènes, 4 étant identifiés à ce jour, sont impliqués ; néanmoins, pour la majorité des patients, le gène en cause n’est pas connu et on peut donc s’attendre à la découverte de nouveaux gènes dans les années à venir. Le point remarquable est que les 4 gènes connus (DKC1, hTERC,hTERT et NOP10), codent des composants de la télomérase tous impliqués dans le maintien de la longueur des télomères, faisant de la DC un modèle clinique unique pour la compréhension du rôle et de l’importance de la télomérase et des télomères.

Summary : Dyskeratosis congenita, a disease caused by telomerase deficiency Dyskeratosis congenita (DC), also called Zinsser-Cole-Engman syndrome, is a rare, often fatal, inherited disease described for the first time at the dermatological level by Zinsser in 1906 [1]. It is a very polymorphous disease at the clinical level, with several modes of inheritance. Several clinical symptoms of the disease can appear with delay. These features render DC a particularly difficult disease to diagnose. Mutations of several genes can cause DC, four of them having been identified so far. However, for a majority of patients, the affected gene has not been found. Remarkably, all identified genes (DKC1, hTERC, hTERT,and NOP10) encode components of telomerase, all required for telomere length maintenance. DC is thus a unique clinical model to study the roles of telomerase and telomeres.

1. Phénotype clinique :

Il est très variable d’un patient à l’autre et, pour un patient donné, évolutif au cours du temps. La description précise du phénotype a été grandement facilitée par la mise en place en 1995 par l’équipe d’Inderjet DOKAL à Londres d’un registre international de la DC [2] associant des données cliniques détaillées et des prélèvements sanguins des membres malades ou asymptomatiques de 270 familles (Dyskeratosis Congenita Registry -DCR-, The Royal London Hospital).

Page 150: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

- La forme typique de la DC est caractérisée par des atteintes cutanées, phanériennes et muqueuses, et a pour cette raison été décrite par des dermatologues : aspect réticulé et hyperpigmentation (mélanodermie) de la peau associé à des zones d’atrophie, affectant surtout le cou, le haut du thorax et les extrémités des membres, dystrophie des ongles (présence de stries, de déformations, de réduction de taille voire d’absence totale des ongles ; l’aspect peut être celui d’une mycose unguéale) et leucoplasies des muqueuses, en particulier au niveau de la cavité buccale [3-6]. Les signes cutanés apparaissent en général avant l’âge de 10 ans.

- Les patients peuvent aussi développer, au cours de l’évolution, de nombreux autres symptômes (Tableau 1), en particulier un retard statural, une perte précoce de cheveux ou une apparition prématurée de cheveux blancs, un larmoiement anormal (épiphora), des anomalies dentaires, une ostéoporose précoce, une cirrhose du foie, des sténoses de l’œsophage, des atteintes neurologiques (retard de développement, microcéphalie, atteinte cérébelleuse), une fibrose pulmonaire et un déficit immunitaire global [3, 6].

- La grande majorité (au moins 80%) des patients vont évoluer vers une pancytopénie secondaire à une aplasie médullaire (la DC est, après l’anémie de Fanconi, la 2ème

cause en fréquence des aplasies médullaires constitutionnelles). Cette aplasie médullaire apparaît le plus souvent lors de la 2ème décade de la vie mais des formes très précoces ont aussi été rapportées ; le diagnostic étiologique est alors difficile car les signes cutanés et phanériens ne sont pas encore apparus et la DC peut être prise à tort pour une aplasie médullaire idiopathique.

- Enfin, près de 10% des patients vont développer des cancers ou des hémopathies malignes de type variés : principalement des cancers de la peau, des muqueuses, de l’œsophage ainsi que des leucémies ou des lymphomes.

- Les principales causes des décès précoces sont l’insuffisance médullaire, le déficit immunitaire, la fibrose pulmonaire et les néoplasies [7].

Des formes particulières de DC sont également rapportées :

- Le syndrome de Hoyeraal-Hreidarsson (HH) a été décrit pour la première fois par Hoyeraal en 1970 [8]. On sait actuellement qu’il s’agit d’une forme très sévère de DC. Il est défini par la présence de 4 critères cliniques parmi les 6 suivants : RCIU, retard psychomoteur, microcéphalie, hypoplasie du cervelet (responsable d’une ataxie), aplasie médullaire précoce et déficit immunitaire sévère. Ces symptômes apparaissent chez le petit enfant. La transmission peut être soit liée au sexe, soit autosomique récessive (Tableau 2).

- On a rapporté chez certains patients, diagnostiqués comme atteints d’aplasie médullaire idiopathique, des mutations dans les gènes codant hTERC ou hTERT [7, 9-13] (cf infra); ceci souligne la difficulté du diagnostic et incite à la recherche systématique d’une atteinte constitutionnelle devant toute aplasie médullaire de l’enfant, en particulier si elle se révèle réfractaire à un traitement immunosuppresseur.

- Plus récemment, il a été décrit des mutations hétérozygotes des gènes hTERT et hTRchez 8% des patients atteints de fibrose pulmonaire idiopathique ; ces patients ne présentaient aucun des autres signes classiques de la DC mais avaient des télomères raccourcis par rapport aux témoins ; dans une des familles, 3 sujets apparentés étaient décédés d’une aplasie médullaire [14].

Le diagnostic, difficile, repose essentiellement sur un faisceau d’arguments cliniques. Il n’y a pas de test biologique spécifique disponible en routine. Au sein de certains groupes de patients, l’étude de la longueur des télomères (cf infra) pourrait être un apport utile au

Page 151: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

diagnostic mais ce test n’est pas disponible dans la majorité des centres. Pour un tiers des patients, l’étude moléculaire permettra de démontrer la présence d’une mutation dans un des gènes impliqués (cf. infra).

2. Phénotype cellulaire :

La DC a une incidence principalement sur des tissus nécessitant un renouvellement cellulaire rapide et constant (peau, muqueuses, système digestif, système hématopoïétique). Les cellules de ces tissus issus de patients atteints de DC présentent deux caractéristiques : (i) elles ont une propension à produire des réarrangements chromosomiques [4, 15] et (ii) les télomères (structures particulières présentes aux extrémités des chromosomes) sont plus courts que dans les cellules identiques d’individus sains d’âge équivalent [16]. En ce qui concerne le système hématopoïétique, on note une réduction (variable selon les patients) du nombre de précurseurs hématopoïétiques.

3. Modes de transmission et anomalies génétiques responsables de la maladie :

L’incidence précise de la DC n’est pas connue mais il s’agit d’une maladie rare et on estime que seule une personne sur 1.000.000 est atteinte. Trois modes distincts de transmission de la maladie ont été identifiés [17] (Tableau 2): transmission liée au sexe (MIM 305 000), transmission autosomique dominante (MIM 127 550), et transmission autosomique récessive (MIM 224 230).

3.1. La forme liée au chromosome X est due à des mutations dans le gène codant la protéine dyskérine :

La forme la plus classique, qui est aussi la plus sévère, est de transmission liée au sexe. Des études de génétique humaine et de biologie moléculaire, rendues possibles grâce à la constitution du registre international, ont conduit à l’identification du gène en cause. L’étude d’une famille très nombreuse dont seuls les hommes étaient atteints a permis de localiser en 1986 le gène muté responsable de la maladie à une des extrémités du chromosome X (locus Xq28) [18]. Il a fallu attendre 1998 pour que le gène responsable, DKC1, codant la protéine dyskérine, soit identifié [19]. Dans une étude récente, les patients atteints de DC pour lesquels on identifie une mutation de DKC1 représentent 31% des cas [20].

La protéine dyskérine est une enzyme, capable de catalyser la conversion d’uridines en pseudouridines (voir Figure 1.A). L’uridine est un constituant de base de l’ARN (acide ribonucléique). L’uridine est fréquemment convertie en pseudouridine, un dérivé très proche, qui permet une stabilisation des molécules d’ARN [21, 22]. La protéine dyskérine n’agit jamais seule mais est toujours associée à trois protéines, nommées Gar1, Nhp2 et Nop10, et à une petite molécule d’ARN contenant des motifs caractéristiques désignés « boîte H » et boîte « ACA » [23, 24] (voir Figure 1.B). Il existe des centaines de petits ARN à boîtes H et ACA, auxquels s’associent les protéines dyskérine, Gar1, Nhp2 et Nop10, pour former autant de particules dites « ribonucléoprotéiques » ou « RNP » (chaque particule contient les quatre protéines et un seul petit ARN H/ACA). Selon la nature exacte du composant ARN qu’elles contiennent, ces particules jouent des rôles divers [25] (voir Figure 2):

- Certaines RNP H/ACA sont requises lors de la synthèse des ribosomes ; les ribosomes sont des assemblages complexes de protéines et de plusieurs molécules d’ARN qui synthétisent les protéines dans tout type de cellule. Ces ribosomes sont essentiels à la survie cellulaire ; plus une cellule se divise rapidement, plus son taux de production de

Page 152: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

ribosomes doit être élevé. Les RNP H/ACA intervenant dans la synthèse des ribosomes soit introduisent des pseudouridines au sein des ARN ribosomiques, soit participent à l’ « extraction », à partir d’une molécule précurseur, des ARN ribosomiques matures [26].

- D’autres RNP H/ACA introduisent des pseudouridines au sein des petits ARN du « complexe d’épissage » [26]. Le complexe d’épissage joue un rôle crucial dans l’expression des gènes [27]. Toute cellule procède à la synthèse de répliques éphémères des gènes, constituées d’ARN et dénommées pré-ARN messagers. Ces pré-ARN messagers contiennent des régions internes qui les rendent inactifs. Ces régions doivent être « excisées », par le complexe d’épissage, pour produire des ARN messagers matures qui pourront être scannés par les ribosomes pour produire les protéines qui leur correspondent. L’activité du complexe d’épissage est absolument tributaire de l’introduction par des RNP H/ACA de pseudouridines dans certains petits ARN du complexe [28].

- Enfin, la famille des RNP H/ACA comporte un membre atypique : la télomérase de vertébrés [29-31]. Il est donc nécessaire à ce stade de résumer brièvement ce que sont et font télomérase et télomères. La télomérase permet l’ajout aux extrémités des chromosomes, les télomères, de séquences répétées de nucléotides (chez l’homme, le motif répété a pour séquence TTAGGG) lors de la duplication des chromosomes précédant la division cellulaire [32, 33]. Les télomères participent de manière cruciale à la sauvegarde de l’intégrité des chromosomes en empêchant par exemple des fusions de chromosomes. Les cellules « somatiques » saines (toutes les cellules d’un individu à l’exception des cellules produisant les gamètes et les gamètes eux-mêmes) expriment de manière transitoire une forme active de la télomérase à des taux variables selon les types cellulaires. Cette expression transitoire de la télomérase n’est pas suffisante pour empêcher le raccourcissement des télomères à chaque division cellulaire. Néanmoins, elle est essentielle pour assurer le potentiel prolifératif des cellules. Par exemple en effet, l’inhibition de la télomérase dans des fibroblastes (cellules présentes dans le tissu conjonctif) en culture, ralentit leur prolifération et induit leur entrée prématurée dans un état quiescent, non-prolifératif, dit de « sénescence réplicative » [34]. Le cellules souches à l’origine du renouvellement du sang et de tissus tels que la peau et les muqueuses doivent avoir une capacité proliférative élevée, certainement tributaire de l’expression d’une forme active de la télomérase. L’activité catalytique proprement dite de la télomérase est apportée par une protéine à activité « transcriptase inverse » (nommée hTERT chez l’humain) qui se sert de la région dite « matrice » du composant ARN de la télomérase (ARN nommé hTERC chez l’humain) pour synthétiser des répétions télomériques. L’ARN de la télomérase (voir Figure 3) contient en outre un domaine apparenté aux ARN H/ACA « classiques », qui comporte les boîtes H et ACA caractéristiques et qui s’associe aux protéines dyskérine, Gar1, Nhp2 et Nop10 [29-31, 35]. La partie de la télomérase constituée du domaine H/ACA de l’ARN associé à dyskérine, Gar1, Nhp2 et Nop10 joue un rôle essentiel dans la stabilisation du complexe télomérase et dans sa localisation correcte au sein du noyau des cellules.

Dans tous les cas décrits ci-dessus, dyskérine joue un rôle crucial lors de l’assemblage des particules RNP H/ACA et dans le maintien de leur intégrité. Ces rôles découlent de la capacité supposée de dyskérine à se fixer directement sur les ARN H/ACA (ceci a été démontré formellement dans le cas de l’équivalent de dyskérine chez la levure, nommé Cbf5p [36]). Elle est aussi directement responsable de l’activité de peudouridylation des particules qui ont cette fonction. Dyskérine est une protéine « modulaire », composée de domaines ayant

Page 153: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

des rôles distincts (Figure 4). Le domaine « PUA » de dyskérine fixe directement selon toute vraisemblance certaines « tiges » des ARN H/ACA, alors que le domaine « TRUB » est le domaine catalytique en tant que tel qui interagit le cas échéant avec l’ARN substrat pour catalyser la conversion d’uridines en pseudouridines.

Les mutations du gène codant dyskérine responsables de la DC sont très variables, le plus souvent de type privé. Elles se regroupent pour l’essentiel dans la séquence du gène codant le domaine PUA et dans une séquence codant un domaine de fonction mal définie en amont du domaine PUA (voir Figure 4). Il s’agit presque toujours de mutations qui aboutissent à la substitution d’un acide aminé [20]. L’étude du phénotype clinique en fonction des mutations de DKC1 a apporté les éléments suivants :

- Il n’y a pas de corrélation évidente entre le type de mutation observée et le phénotype clinique. Vullimay a proposé une classification clinique en fonction de la gravité du phénotype : (1) : patients se présentant avec des signes de DC à un âge de plus de 15 ans mais sans aplasie médullaire, (2) : patients se présentant avec des signes de DC à moins de 15 ans mais sans aplasie médullaire, (3) : patients atteints de DC et ayant une aplasie médullaire (4) : syndrome de HH. En utilisant cette classification, il n’a pas été mis en évidence de corrélation génotype/phénotype y compris pour la seule mutation récurrente, A353V [20].

- Cette absence de corrélation est également illustrée par la découverte que certains patients atteints du syndrome de HH avaient aussi des mutations de DKC1 [37-39] et qu’une des mutations de DKC1 identifiée chez un patient atteint du syndrome de HH était également responsable chez d’autres patients d’une forme beaucoup plus « classique » de la DC [5].

Les facteurs génétiques ou environnementaux qui modulent l’impact des mutations de DKC1 restent pour le moment inconnus.

3.2. La forme de transmission autosomique dominante peut être due à des mutations dans le gène codant l’ARN de la télomérase (hTERC) ou celui codant la transcriptase inverse de la télomérase (hTERT) :

En 2001, il a été démontré que dans plusieurs familles, la forme autosomique dominante de la dyskératose est due à des mutations dans le gène codant l’ARN de la télomérase [40]. Les altérations de cet ARN qui causent la DC sont localisées avant tout dans la région dite « pseudo-nœud » qui jouxte la région matrice de l’ARN, et dans le domaine « H/ACA » (voir Figure 3). Certaines altérations du domaine H/ACA ont pour conséquence de déstabiliser l’ARN de la télomérase. Dans ce cas, les cellules souches des patients n’expriment que la forme normale de l’ARN de la télomérase, produite à partir de la copie saine du gène codant hTERC. La maladie est donc ici liée à un phénomène d’haplo-insuffisance. D’autres mutations affectant le domaine pseudo-nœud conduisent à la production de télomérase dont l’activité est fortement réduite, ce qui est responsable, ici aussi d’une haplo-insuffisance [41-43].

Un autre gène qui semble responsable chez une famille de la forme autosomique dominante de la DC a été identifié en 2005 : il s’agit du gène codant la transcriptase inverse de la télomérase (hTERT) [44]. Dans ce cas également, la maladie est causée par un phénomène d’haploinsuffisance. Des mutations dans le gène codant hTERT ont également été identifiées dans des familles de patients atteints de DC, mais ces mutations ne ségrègent pas nécessairement avec la maladie [20]. Il est donc difficile de conclure quant à l’implication de ces mutations dans la maladie.

Page 154: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Les familles atteintes par la forme autosomique dominante de la DC, quelle soit due à des mutations dans le gène codant hTERC ou dans celui codant hTERT, présentent un phénomène d’anticipation génétique [43]. Ce phénomène, qui n’est pas observé dans la forme de DC due à des mutations du gène codant la dyskérine, désigne l’apparition plus précoce et l’accroissement de la sévérité des symptômes de la maladie au fur et à mesure des générations. Ceci est corrélé avec un raccourcissement des télomères d’une génération à l’autre. Il est envisagé que des individus ayant hérité de la mutation et de télomères anormalement courts sont incapables de restaurer une taille normale de leurs télomères à cause d’une activité de la télomérase insuffisante; dans cette hypothèse, plus les télomères des chromosomes hérités du parent porteur de la mutation sont courts, plus les symptômes de la maladie se déclareront tôt.

3.3. La forme autosomique récessive de la DC peut être causée par une mutation du gène codant la protéine Nop10 :

Une étude récente a apporté des éclaircissements concernant les bases génétiques de la forme autosomique récessive de la DC [45]. Cette étude a conclu que plusieurs gènes étaient impliqués dans cette forme de la maladie. Elle a surtout permis d’identifier un de ces gènes : il s’agit du gène codant la protéine Nop10 qui est muté pour une des familles étudiées. Les cellules des individus malades présentent des télomères très courts et une forte diminution de la quantité de l’ARN de la télomérase. Il est envisageable que la protéine Nop10 joue un rôle dans l’assemblage et/ou la stabilisation des RNP H/ACA et de la télomérase, mais ceci reste à démontrer.

4. La DC, un syndrome causé par une maintenance défectueuse des télomères :

La découverte que la forme de DC liée au chromosome X est due à des mutations du gène codant dyskérine suggéra initialement que la DC résulte d’un défaut de synthèse des ribosomes [19]. La mise en évidence peu après que dyskérine fait partie, non seulement des RNP H/ACA participant à la synthèse des ribosomes, mais également de la télomerase conduisit à l’hypothèse que la DC résulte en fait d’une déficience d’activité télomerase, particulièrement délétère pour les cellules souches [31]. Cette dernière hypothèse apparaît maintenant comme la plus valide, puisque la forme autosomique dominante de la DC résulte de mutations dans les gènes codant hTERC et hTERT, composants spécifiques de la télomérase qui ne sont à priori pas impliqués dans la synthèse des ribosomes. Néanmoins, il est possible que les modifications de dyskérine qui causent une forme souvent sévère de la DC induisent également des défauts de synthèse des ribosomes, et donc de synthèse protéique, qui accroissent les symptômes. De fait, il a récemment été démontré que des cellules issues de patients atteints de DC du à des altérations de dyskérine présentent un défaut très spécifique de la traduction (processus de synthèse des protéines) initiée à partir de sites d’entrée interne des ribosomes sur les ARN messagers [46]. Ces défauts pourraient résulter en une baisse de facteurs antiapoptotiques (qui contrecarrent la mort cellulaire) comme XIAP et Bcl-xL et contribuer à la dégénérescence de la moelle.

Il peut sembler paradoxal que les patients atteints de DC, un syndrome du à un déficit d’activité télomérase, développent avec une fréquence élevée certains types de cancers, alors que la grande majorité des cancers humains sont associés à une réactivation de la télomérase [47]. Une des hypothèses plausibles est que la présence de télomères très courts dans certaines cellules induit une instabilité chromosomique propice à la transformation maligne.

5. Prise en charge et traitement :

Page 155: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

La DC est une pathologie lourde, évolutive, qui nécessite une prise en charge pluridisciplinaire. Les atteintes les plus sévères sont l’insuffisance médullaire et le déficit immunitaire. Le traitement symptomatique va associer : - Les androgènes, qui peuvent parfois améliorer le fonctionnement de la moelle pendant une

période plus ou moins longue [3, 4] ; ils sont néanmoins ici moins régulièrement actifs que dans l’anémie de Fanconi.

- Un support transfusionnel, nécessaire quand les cytopénies sont sévères. - Des facteurs de croissance hématopoïétiques, G-CSF en particulier, en traitement

d’appoint d’une infection ; les facteurs de croissance hématopoïétiques n’ont sinon pas démontré leur intérêt en tant que traitement de fond.

- Des traitements anti-infectieux curatifs et préventifs pour contrôler les infections favorisées par la neutropénie et l’immunosuppression.

Le seul traitement réellement curatif de l’insuffisance médullaire et du déficit immunitaire, est l'allogreffe de cellules souches hématopoïétiques [3, 4]. Malheureusement les résultats de la greffe sont mauvais pour cette pathologie avec un risque de décès important lié à des complications pulmonaires et vasculaires survenant après la greffe [2, 48-50]. La forte incidence de complications pulmonaires pourrait être liée au fait que les patients atteints de DC ont intrinsèquement un risque d’évolution vers une fibrose pulmonaire. Pour cette raison il est logique d’exclure les agents associés à une toxicité pulmonaire (busulphan), de même que l’irradiation des poumons lors du conditionnement des patients avant greffe. L’espoir actuel est lié à l’utilisation de conditionnements utilisant le cyclophosphamide et le serum antilymphocytaire [51] ou la fludarabine [37, 52] qui semblent donner des résultats encourageants.

La thérapie génique reste à ce jour un objectif théorique et il n’y a pas à ce jour de projet avancé en la matière. Les difficultés sont ici majorées par : - la multiplicité des gènes en cause. - le fait que la maladie est multisystémique et qu’il ne suffira pas de traiter l’atteinte

médullaire ou immunitaire pour guérir les patients.

6. Perspectives :

La dyskératose congénitale reste une maladie trop peu connue, de diagnostic difficile, et souvent fatale. Pour améliorer le soutien aux familles et la prise en charge thérapeutique des malades, les actions suivantes doivent être poursuivies et développées :

- Poursuite de la collaboration internationale, remarquable, coordonnée par l’équipe Londonienne qui gère le registre des patients.

- Permettre une meilleure diffusion des connaissances cliniques sur cette maladie au sein de la communauté médicale et du public.

- Aider la recherche, afin de permettre tout à la fois l’identification de nouveaux gènes (actuellement la majorité des malades atteints de formes autosomiques de DC ou de HH ne présentent pas de mutation dans les gènes connus) et une meilleure compréhension de la physiopathologie de la maladie, en particulier l’identification de facteurs modificateurs du phénotype en fonction d’un même génotype.

- Améliorer les résultats des allogreffes de cellules souches hématopoïétiques par la mise au point de nouveaux conditionnements et la prévention, si possible, des complications tardives.

Page 156: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

- Poursuivre la recherche en matière de thérapie génique. L’idée serait donc de procéder à une correction génique ex vivo (c'est-à-dire hors du corps humain) de cellules souches hématopoïétiques des patients puis de les réinjecter dans la moelle, que ces cellules « corrigées » seraient susceptibles de coloniser. Ce pari est basé sur l’observation que dans le sang de femmes porteuses d’un gène DKC1 muté sur l’un des deux chromosomes X, c’est le chromosome X porteur de la mutation hérité d’un des deux parents qui est inactivé dans la grande majorité des cellules [53, 54]. Or, chez des femmes possédant deux copies saines du gène DKC1, la moitié des cellules présentent un chromosome X maternel inactivé, et dans l’autre moitié, c’est le chromosome paternel qui est inactif. Ces données suggèrent fortement que les cellules exprimant le gène DKC1 sain ont un avantage de croissance et/ou de survie par rapport aux cellules exprimant le gène muté, ce qui amène les cellules du premier type à totalement coloniser le système hématopoïétique.

Remerciements : Nous remercions David Villa pour l’aide dans la composition des figures et Anthony

Henras et Michèle Caizergues-Ferrer pour leur relecture critique de l’article. Coralie Hoareau-Aveilla était financée par une bourse de l’Association pour la Recherche sur le Cancer (ARC). Les travaux de l’équipe d’Yves Henry sont financés par le CNRS, l’Université Paul Sabatier, la Ligue Nationale contre le Cancer (équipe labellisée) et l’Agence Nationale de la Recherche.

REFERENCES

Page 157: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Tableau et Figures

Tableau 1 : Fréquence de différents symptômes chez des patients atteints de DC

Symptômes : Pourcentage des patients affectés : Atteintes cutanées 89%Dystrophie des ongles 88%Aplasie médullaire 85%Leucokératose 78%Larmoiement anormal 30%Atteintes neurologiques (retard de développement)

20%

Maladies pulmonaires 20%Retard statural 19,5%Anomalies dentaires 17%Sténoses de l’œsophage 17%Perte de cheveux/cheveux blancs prématurés 16%Cancers 10%Cirrhose du foie 7%Microcéphalie 6%Ostéoporose précoce 5%

Tableau 2 : incidence des mutations identifiées chez les patients en fonction du mode de transmission établi cliniquement par l’étude familiale

DKC1 TERC ? Total

Transmission liée à l’X 21 (4) 0 (0) 1 (1) 22 (5)2 sujets masculins atteints 11 (3) 1 (0) 7 (1) 19 (4)1 sujet masculin atteint 40 (8) 3 (0) 80 (15) 123 (23)Transmission AD 0 7 (0) 4 (0) 11 (0)Transmission AR 0 0 18 (9) 18 (9)Cas sporadique 0 0 35 (7) 35 (7)Total 72 11 145 228

Sont indiqués le nombre de cas et, entre parenthèses, le nombre de cas dont la présentation clinique est celle d’un syndrome de Hoyeraal-Hreidarsson. Dans cette étude, aucune mutation n’était identifiée chez 63% des patients.

NB : les mutations du gène TERT n’avaient pas été recherchées chez l’ensemble des patients et ne figurent pas dans ce tableau.

Page 158: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

1. Zinsser, F., Atropha cutis reticularis cum pigmentatione, dystrophia ungiumet leukoplakia oris. Ikonogr Dermatol, 1906. 5: p. 219-223.

2. Knight, S., et al., Dyskeratosis Congenita (DC) Registry: identification of new features of DC. Br J Haematol, 1998. 103(4): p. 990-6.

3. Dokal, I., Dyskeratosis congenita in all its forms. Br J Haematol, 2000. 110(4): p. 768-79.

4. Dokal, I., Fanconi's anaemia and related bone marrow failure syndromes. Br Med Bull, 2006. 77-78: p. 37-53.

5. Mason, P.J., Stem cells, telomerase and dyskeratosis congenita. Bioessays, 2003. 25(2): p. 126-33.

6. Mason, P.J., D.B. Wilson, and M. Bessler, Dyskeratosis congenita -- a disease of dysfunctional telomere maintenance. Curr Mol Med, 2005. 5(2): p. 159-70.

7. Dokal, I. and T. Vulliamy, Dyskeratosis congenita: its link to telomerase and aplastic anaemia. Blood Rev, 2003. 17(4): p. 217-25.

8. Hoyeraal, H.M., J. Lamvik, and P.J. Moe, Congenital hypoplastic thrombocytopenia and cerebral malformations in two brothers. Acta Paediatr Scand, 1970. 59(2): p. 185-91.

9. Fogarty, P.F., et al., Late presentation of dyskeratosis congenita as apparently acquired aplastic anaemia due to mutations in telomerase RNA. Lancet, 2003. 362(9396): p. 1628-30.

10. Vulliamy, T., et al., Association between aplastic anaemia and mutations in telomerase RNA. Lancet, 2002. 359(9324): p. 2168-70.

11. Vulliamy, T.J., et al., Mutations in the reverse transcriptase component of telomerase (TERT) in patients with bone marrow failure. Blood Cells Mol Dis, 2005. 34(3): p. 257-63.

12. Yamaguchi, H., et al., Mutations of the human telomerase RNA gene (TERC) in aplastic anemia and myelodysplastic syndrome. Blood, 2003. 102(3): p. 916-8.

13. Yamaguchi, H., et al., Mutations in TERT, the gene for telomerase reverse transcriptase, in aplastic anemia. N Engl J Med, 2005. 352(14): p. 1413-24.

14. Armanios, M.Y., et al., Telomerase mutations in families with idiopathic pulmonary fibrosis. N Engl J Med, 2007. 356(13): p. 1317-26.

15. Dokal, I., et al., Dyskeratosis congenita fibroblasts are abnormal and have unbalanced chromosomal rearrangements. Blood, 1992. 80(12): p. 3090-6.

16. Vulliamy, T.J., et al., Very short telomeres in the peripheral blood of patients with X-linked and autosomal dyskeratosis congenita. Blood Cells Mol Dis, 2001. 27(2): p. 353-7.

17. Drachtman, R.A. and B.P. Alter, Dyskeratosis congenita: clinical and genetic heterogeneity. Report of a new case and review of the literature. Am J Pediatr Hematol Oncol, 1992. 14(4): p. 297-304.

18. Connor, J.M., et al., Assignment of the gene for dyskeratosis congenita to Xq28. Hum Genet, 1986. 72(4): p. 348-51.

19. Heiss, N.S., et al., X-linked dyskeratosis congenita is caused by mutations in a highly conserved gene with putative nucleolar functions. Nat Genet, 1998. 19(1): p. 32-8.

20. Vulliamy, T.J., et al., Mutations in dyskeratosis congenita: their impact on telomere length and the diversity of clinical presentation. Blood, 2006. 107(7): p. 2680-5.

21. Davis, D.R., Stabilization of RNA stacking by pseudouridine. Nucleic Acids Res, 1995. 23(24): p. 5020-6.

22. Meroueh, M., et al., Unique structural and stabilizing roles for the individual pseudouridine residues in the 1920 region of Escherichia coli 23S rRNA. Nucleic Acids Res, 2000. 28(10): p. 2075-83.

Page 159: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

23. Henras, A., et al., Nhp2p and Nop10p are essential for the function of H/ACA snoRNPs. Embo J, 1998. 17(23): p. 7078-90.

24. Reichow, S.L., et al., The structure and function of small nucleolar ribonucleoproteins. Nucleic Acids Res, 2007. 35(5): p. 1452-64.

25. Meier, U.T., The many facets of H/ACA ribonucleoproteins. Chromosoma, 2005. 114(1): p. 1-14.

26. Henras, A.K., C. Dez, and Y. Henry, RNA structure and function in C/D and H/ACA s(no)RNPs. Curr Opin Struct Biol, 2004. 14(3): p. 335-43.

27. Valadkhan, S., snRNAs as the catalysts of pre-mRNA splicing. Curr Opin Chem Biol, 2005. 9(6): p. 603-8.

28. Donmez, G., K. Hartmuth, and R. Luhrmann, Modified nucleotides at the 5' end of human U2 snRNA are required for spliceosomal E-complex formation. Rna, 2004. 10(12): p. 1925-33.

29. Chen, J.L., M.A. Blasco, and C.W. Greider, Secondary structure of vertebrate telomerase RNA. Cell, 2000. 100(5): p. 503-14.

30. Mitchell, J.R., J. Cheng, and K. Collins, A box H/ACA small nucleolar RNA-like domain at the human telomerase RNA 3' end. Mol Cell Biol, 1999. 19(1): p. 567-76.

31. Mitchell, J.R., E. Wood, and K. Collins, A telomerase component is defective in the human disease dyskeratosis congenita. Nature, 1999. 402(6761): p. 551-5.

32. Autexier, C. and N.F. Lue, The Structure and Function of Telomerase Reverse Transcriptase. Annu Rev Biochem, 2006.

33. Moon, I.K. and M.B. Jarstfer, The human telomere and its relationship to human disease, therapy, and tissue engineering. Front Biosci, 2007. 12: p. 4595-620.

34. Masutomi, K., et al., Telomerase maintains telomere structure in normal human cells.Cell, 2003. 114(2): p. 241-53.

35. Pogacic, V., F. Dragon, and W. Filipowicz, Human H/ACA small nucleolar RNPs and telomerase share evolutionarily conserved proteins NHP2 and NOP10. Mol Cell Biol, 2000. 20(23): p. 9028-40.

36. Normand, C., et al., Analysis of the binding of the N-terminal conserved domain of yeast Cbf5p to a box H/ACA snoRNA. Rna, 2006. 12(10): p. 1868-82.

37. Cossu, F., et al., A novel DKC1 mutation, severe combined immunodeficiency (T+B-NK- SCID) and bone marrow transplantation in an infant with Hoyeraal-Hreidarsson syndrome. Br J Haematol, 2002. 119(3): p. 765-8.

38. Knight, S.W., et al., Unexplained aplastic anaemia, immunodeficiency, and cerebellar hypoplasia (Hoyeraal-Hreidarsson syndrome) due to mutations in the dyskeratosis congenita gene, DKC1. Br J Haematol, 1999. 107(2): p. 335-9.

39. Sznajer, Y., et al., Further delineation of the congenital form of X-linked dyskeratosis congenita (Hoyeraal-Hreidarsson syndrome). Eur J Pediatr, 2003. 162(12): p. 863-7.

40. Vulliamy, T., et al., The RNA component of telomerase is mutated in autosomal dominant dyskeratosis congenita. Nature, 2001. 413(6854): p. 432-5.

41. Fu, D. and K. Collins, Distinct biogenesis pathways for human telomerase RNA and H/ACA small nucleolar RNAs. Mol Cell, 2003. 11(5): p. 1361-72.

42. Marrone, A., et al., Heterozygous telomerase RNA mutations found in dyskeratosis congenita and aplastic anemia reduce telomerase activity via haploinsufficiency.Blood, 2004. 104(13): p. 3936-42.

43. Marrone, A., A. Walne, and I. Dokal, Dyskeratosis congenita: telomerase, telomeres and anticipation. Curr Opin Genet Dev, 2005. 15(3): p. 249-57.

44. Armanios, M., et al., Haploinsufficiency of telomerase reverse transcriptase leads to anticipation in autosomal dominant dyskeratosis congenita. Proc Natl Acad Sci U S A, 2005. 102(44): p. 15960-4.

Page 160: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

45. Walne, A.J., et al., Genetic heterogeneity in autosomal recessive dyskeratosis congenita with one subtype due to mutations in the telomerase-associated protein NOP10. Hum Mol Genet, 2007. 16(13): p. 1619-29.

46. Yoon, A., et al., Impaired control of IRES-mediated translation in X-linked dyskeratosis congenita. Science, 2006. 312(5775): p. 902-6.

47. Kim, N.W., et al., Specific association of human telomerase activity with immortal cells and cancer. Science, 1994. 266(5193): p. 2011-5.

48. Langston, A.A., et al., Allogeneic marrow transplantation for aplastic anaemia associated with dyskeratosis congenita. Br J Haematol, 1996. 92(3): p. 758-65.

49. Rocha, V., et al., Unusual complications after bone marrow transplantation for dyskeratosis congenita. Br J Haematol, 1998. 103(1): p. 243-8.

50. Yabe, M., et al., Fatal interstitial pulmonary disease in a patient with dyskeratosis congenita after allogeneic bone marrow transplantation. Bone Marrow Transplant, 1997. 19(4): p. 389-92.

51. Lau, Y.L., et al., Bone marrow transplant for dyskeratosis congenita. Br J Haematol, 1999. 105(2): p. 571.

52. Nobili, B., et al., Successful umbilical cord blood transplantation in a child with dyskeratosis congenita after a fludarabine-based reduced-intensity conditioning regimen. Br J Haematol, 2002. 119(2): p. 573-4.

53. Devriendt, K., et al., Skewed X-chromosome inactivation in female carriers of dyskeratosis congenita. Am J Hum Genet, 1997. 60(3): p. 581-7.

54. Vulliamy, T.J., et al., Skewed X-inactivation in carriers of X-linked dyskeratosis congenita. Blood, 1997. 90(6): p. 2213-6.

Page 161: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

ANANNA ACA NNNBoite H Boite ACA

ARN substrat

Poche de pseudouridylation

3'5'

5'

N N

3'AC

NNNNN

AN

NNNNN

Page 162: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

ANANNA ACA NNN

Boite H Boite ACA

ARN ribosomiques

Poche de pseudouridylation

3'5'

5'

N N

3'

ANANNA ACA NNN

Boite H Boite ACA

snARN de la machinerie d'épissage

Poche de pseudouridylation

3'5'

5'

N N

Boi

te CAB

UG

AG

Boi

te CAB

UG

AG

3'

3'

5'

Matrice

Domaine H/ACA

Boite CAB

Domaine Pseudonoeud

ANANNA

UCCCAAUC

Boite H Boite ACA

ACA

Page 163: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

3'

5'Matrice Domaine H/ACA

Boite CAB

Domaine Pseudonoeud

ANANNA

UCCCAAUC

Boite H Boite ACA ACA

Page 164: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 165: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 166: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 167: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

RESULTATS

66

Page 168: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 169: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

Lorsque j’ai débuté ma thèse en octobre 2003, la protéine Naf1p venait de faire l’objet

de 3 articles dont les données suggéreraient très fortement que cette protéine est requise lors

de l’assemblage des particules H/ACA chez la levure Saccharomyces cerevisiae. Dans les

chapitres qui suivent, je présente tout d’abord les éléments qui ont conduits trois laboratoires

à étudier Naf1p ainsi que les résultats qu’ils ont obtenus. Enfin, dans la partie II, je présente

les résultats que j’ai obtenus durant ma thèse concernant l’étude de la protéine Naf1p.

I. Introduction

A. Description de la protéine Naf1p

La protéine Naf1p chez la levure Saccharomyces cerevisiae est codée par le gène

YNL124w porté par le chromosome XIV. C’est une protéine très acide, point isoélectrique de

4,51, d’une masse moléculaire de 54,94 kDa contenant 492 acides aminés (figure 51). Naf1p

possède à l’extrémité carboxy-terminale un domaine riche en résidus proline et glutamine.

L’extrémité amino-terminale présente un domaine riche en sérine contenant plusieurs sites

potentiels de phosphorylation par la caséine kinase II. Dans la région centrale de Naf1p se

trouvent un Signal de Localisation Nucléaire (NLS) ainsi qu’un domaine présentant une forte

homologie avec le domaine central de la protéine Gar1p (composant des particules H/ACA).

La protéine Naf1p n’est pas très abondante chez la levure, son niveau d’expression serait 10

fois inférieur à ceux des protéines des particules H/ACA (Ghaemmaghami, Huh et al. 2003).

B. Données préliminaires suggérant l’existence d’un lien

entre la protéine Naf1p et les snoRNP H/ACA

La protéine Naf1p a tout d’abord été identifiée chez la levure Saccharomyces

cerevisiae lors d’un crible double hybride à large échelle (Ito, Chiba et al. 2001) ainsi que

dans une étude visant à identifier de façon systématique les composants d’un grand nombre de

complexes chez la levure par chromatographie d’affinité sur colonne retenant des protéines

67

Page 170: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

1

259 343

516

Serine rich region

NLS Gar1

domain

176 202

Naf1p Schizosaccharomyces pombe

1

244 269 381 456 773

801

Serine rich region

Gar1 domain

314 333

Aspartaterich region

Glycine and arginine rich region

Naf1p Arabidopsis thaliana NLS

785 796 797

377 383

1

55 81 136 220 264 276 361 419 456 489

492

Serine rich region

Proline rich region

Glutamine rich region

Gar1 domain

Naf1p Saccharomyces cerevisiae

226 268

NLS

1

114 148 197 282 324 336 435 492

494

Serine rich region

Proline rich region

Gar1 domain

Naf1p Homo sapiens

286 328

NLS

507 466

337 379

FIGURE 51: Les homologues de la protéine Naf1p

UCDN

UCDN

UCDN

UCDN

Page 171: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

portant l’étiquette (Ho, Gruhler et al. 2002).

Naf1p a été identifiée dans les complexes associés à Cbf5p-Flag ainsi qu’en double-

hybride en tant que protéine interagissant avec Cbf5p et Nhp2p. L’existence de ces

interactions a conduit Christophe Dez dans le laboratoire ainsi que Pok Kwan Yang

(laboratoire de Guillaume Chanfreau) et Alessandro Fatica (laboratoire de David Tollervey) à

investiguer le rôle de Naf1p dans la formation et le fonctionnement des RNP H/ACA (Dez,

Noaillac-Depeyre et al. 2002), (Yang, Rotondo et al. 2002), (Fatica, Dlakic et al. 2002).

C. Caractérisation initiale de la protéine Naf1p

Dans un premier temps, l’effet sur les RNP H/ACA de la répression de l’expression de

la protéine Naf1p a été testé. La protéine Naf1p étant essentielle, la stratégie a consisté à

placer le gène NAF1 sous le contrôle du promoteur inductible pGAL1-10 qui est activé en

présence de galactose et réprimé en présence de glucose. Il a ainsi été mis en évidence que,

lorsque la protéine Naf1p est absente, tous les composants des snoRNP H/ACA, hormis

Nhp2p, présentent un défaut d’accumulation sévère. L’hypothèse d’un éventuel rôle de Naf1p

au niveau transcriptionnel a été écarté dans la mesure où, en absence de Naf1p,

l’accumulation des ARNm codant les protéines H/ACA n’est pas modifiée. Des tests

d’immunoprécipitation de la protéine Naf1p portant l’étiquette ZZ ont révélé qu’elle est

associée de façon spécifique aux composants des particules H/ACA. Néanmoins, cette

association est relativement faible ce qui suggère que Naf1p s’associe de façon transitoire

avec ces particules. L’hypothèse selon laquelle Naf1p ne serait pas un composant stable des

RNP H/ACA est confortée par le fait qu’elle est localisée majoritairement dans le

nucléoplasme alors que les snoRNP H/ACA exercent leurs fonctions au sein du nucléole. De

plus, dans un gradient de glycérol seule une faible fraction de Naf1p co-sédimente avec les

substrats des snoRNP H/ACA, les particules pré-ribosomiques.

Toutes ces données ont permis de proposer que Naf1p pourrait être requise lors des

étapes d’assemblage et/ou de transport des particules H/ACA. Des tests d’interaction in vitro

ont révélé que Naf1p interagit de façon directe avec les protéines Nhp2p et Cbf5p et qu’elle

présente de l’affinité pour l’ARN (Fatica, Dlakic et al. 2002). Elle pourrait donc avoir un rôle

de « chaperon » en permettant par exemple l’association de Nhp2p et Cbf5p avec les snoARN

H/ACA.

68

Page 172: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

De façon très intéressante, Alessandro Fatica et ses collaborateurs on mis en évidence

une interaction en double hybride entre Naf1p et le domaine carboxy-terminal (CTD) de la

grande sous-unité de l’ARN polymérase II. Ce résultat a été confirmé par des tests

d’immunoprécipitation dans lesquels le domaine CTD étiqueté GST (produit chez la bactérie)

a été incubé avec un extrait de levure exprimant Naf1p. Il a été mis en évidence que

l’interaction entre CTD-GST et Naf1p requièrt la phosphorylation du domaine CTD, ce qui

correspond à la forme du CTD retrouvée au sein du complexe actif de transcription. Ce

résultat suggère que Naf1p pourrait interagir in vivo avec la machinerie de transcription afin

d’initier de manière très précoce l’assemblage des RNP H/ACA en recrutant les protéines

Nhp2p et Cbf5p sur les précurseurs des snoARN H/ACA en cours de transcription.

D. Problématique de mon sujet de thèse

Mon projet de thèse a consisté à poursuivre la caractérisation de la protéine Naf1p dans

le but de comprendre le rôle qu’elle exerce dans le processus de biogenèse des RNP H/ACA.

Dans un premier temps, nous nous sommes intéressés au modèle humain chez lequel il existe

des snoRNP H/ACA, comme chez la levure, mais également deux autres types de particules

H/ACA, les scaRNP H/ACA et la télomérase. Sur la base d’une homologie significative avec

la protéine Naf1p de levure, Fatica et collaborateurs ont proposé que la protéine Q96HR8

pourrait être l’orthologue chez l’homme de Naf1p. Nous avons caractérisé cette protéine et

investigué son éventuelle implication dans le processus d’assemblage des différents types de

RNP H/ACA chez l’homme.

Le travaux menés par Fatica et collaborateurs ont mis en évidence une interaction in

vitro entre Naf1p et l’ARN polymérase II suggérant que Naf1p pourrait avoir un rôle très

précoce au cours de l’assemblage des RNP H/ACA. Le deuxième axe de mon sujet de thèse a

consisté à identifier les partenaires spécifiques de la protéine Naf1p pouvant nous donner des

indications sur les étapes au cours desquelles Naf1p est requise.

Afin, afin de déterminer le mode d’action de la protéine Naf1p au niveau moléculaire,

nous avons entrepris l’étude in vitro des interactions entre Naf1p et les composants des RNP

H/ACA.

69

Page 173: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

II. Résultats obtenus au cours de ma thèse

A. Naf1p est impliquée dans la formation de toutes les

RNP H/ACA de la levure à l’homme

1. Introduction/Résumé

Chez les eucaryotes supérieurs, et plus particulièrement chez les vertébrés, il existe

trois types de particules H/ACA: les snoRNP H/ACA, les scaRNP H/ACA et la télomérase

(voir introduction), qui sont impliquées respectivement dans la biogenèse des ribosomes, des

snRNP de l’épissage et dans la synthèse des télomères. Les fonctions et la localisation de ces

particules diffèrent mais elles ont toutes en commun le fait de posséder un ARN non-codant

présentant un domaine de type H/ACA associé aux protéines dyskérine (orthologue de

Cbf5p), Gar1, Nhp2 et Nop10. Dans le but de déterminer si les mécanismes d’assemblage de

ces différentes RNP sont similaires, nous avons entrepris la recherche d’un éventuel

orthologue de la protéine Naf1p chez l’homme.

Le groupe de David Tollervey avait précédemment proposé que la protéine humaine

Q96HR8 pourrait être l’orthologue de Naf1p, sur la base d’une homologie de séquence

significative avec Naf1p de levure (Fatica, Dlakic et al. 2002). La figure 51 présente les

différents domaines que nous avons identifiés au sein des séquences des différents

homologues de la protéine Naf1p. Un certain nombre de caractéristiques sont conservées telle

que la présence d’un domaine riche en sérine, de domaines riches en proline et glutamine,

d’un domaine central présentant une forte homologie avec la protéine Gar1p et d’un domaine

très conservé que nous avons nommé UCDN «Ultra Conserved Domain of Naf1p ».

Afin de tester si la protéine Q96HR8 est bien l’orthologue de Naf1p de levure, nous

avons réalisé des tests de complémentation. Pour cela, nous avons construit une souche

exprimant l’allèle chromosomique de NAF1 sous le contrôle du promoteur inductible pGal1-

10, induit par le galactose et réprimé par le glucose. Nous avons mis en évidence que la

présence de la protéine Q96HR8 permet de compenser l’absence de Naf1p de levure (lorsque

70

Page 174: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

la souche est cultivée en présence de glucose) en terme de croissance et d’accumulation des

composants des snoRNP H/ACA. Nous avons alors renommé la protéine Q96HR8, hNaf1.

Lorsqu’elle est exprimée chez la levure, la protéine hNaf1 est capable d’interagir avec les

protéines Cbf5p, Nhp2p et Nop10p. Nous avons mis en évidence qu’au sein des cellules

humaines (HeLa), elle interagit avec les orthologues de Cbf5p, Nhp2p et Nop10p. De plus,

hNaf1 est associée aux trois types d’ARN H/ACA humains: les snoARN H/ACA, les scaARN

H/ACA et l’ARN de la télomérase. Dans les cellules HeLa, hNaf1 est localisée

principalement dans le nucléoplasme et semble être exclue des corpuscules de Cajal et des

nucléoles. Une approche par ARN interférence nous a permis de montrer que hNaf1 est,

comme son orthologue de levure, requise pour l’accumulation des composants des snoRNP

H/ACA. De plus, elle est requise pour l’accumulation des scaARN H/ACA et de l’ARN de la

télomérase.

71

Page 175: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

2. Publication

« hNaf1is required for accumulation of human box H/ACA snoRNPs,

scaRNPs, and telomerase»

Coralie Hoareau-Aveilla, Mattia Bonoli, Michel Caizergues-Ferrer and Yves Henry

RNA (2006), 12:832-840

72

Page 176: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 177: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

hNaf1 is required for accumulation of human box

H/ACA snoRNPs, scaRNPs, and telomerase

CORALIE HOAREAU-AVEILLA,1 MATTIA BONOLI,1,2 MICHELE CAIZERGUES-FERRER,1 and YVES HENRY1

1Equipe Labellisee Ligue Nationale contre le Cancer, Laboratoire de Biologie Moleculaire Eucaryote, UMR5099CNRS-Universite Paul Sabatier, IFR 109, Toulouse, France, European Union2Department of Industrial Chemistry, University of Bologna, 40136 Bologna, Italy, European Union

ABSTRACT

The human telomerase ribonucleoprotein particle (RNP) shares with box H/ACA small Cajal body (sca)RNPs and smallnucleolar (sno)RNPs the proteins dyskerin, hGar1, hNhp2, and hNop10. How dyskerin, hGar1, hNhp2, and hNop10 assemblewith box H/ACA scaRNAs, snoRNAs, and the RNA component of telomerase (hTR) in vivo remains unknown. In yeast, Naf1pinteracts with H/ACA snoRNP proteins and may promote assembly of Cbf5p (the yeast ortholog of dyskerin) with nascent pre-snoRNAs. Here we show that the human HsQ96HR8 protein, thereafter termed hNaf1, can functionally replace endogenousNaf1p in yeast. HeLa hNaf1 associates with dyskerin and hNop10 as well as box H/ACA scaRNAs, snoRNAs, and hTR. Reductionof hNaf1 steady-state levels by RNAi significantly lowers accumulation of these components of box H/ACA scaRNP, snoRNP,and telomerase. hNaf1 is found predominantly in numerous discrete foci in the nucleoplasm and fails to accumulate withinCajal bodies or nucleoli. Altogether, these results suggest that hNaf1 intervenes in early assembly steps of human box H/ACARNPs, including telomerase.

Keywords: H/ACA RNAs; RNPs; telomerase; nucleolus; Cajal bodies

INTRODUCTION

The telomerase holoenzyme catalyzes the addition ofsimple repeat sequences at telomeres, the ends of chromo-somes. In all organisms in which it has been characterized,telomerase is a ribonucleoprotein particle (RNP), consti-tuted of an RNA component associated with severalproteins, some of which are species-specific (Cech 2004).The catalytic core of telomerase comprises a protein reversetranscriptase, termed hTERT in humans, and the so-calledtemplate sequence of telomerase RNA. This sequence isreverse-transcribed by the telomerase reverse transcriptaseusing telomere 39 protruding ends as primers. In addition,the telomerase holoenzyme contains a domain organizedaround the 39 terminal part its RNA moiety, which isimplicated in the formation, trafficking, and stability of theholoenzyme (Chen and Greider 2004). In human telome-rase, this domain is highly related to box H/ACA small

RNPs (Mitchell et al. 1999a; Chen et al. 2000; Chen andGreider 2004; Jady et al. 2004). These RNPs function inRNA modification. The first box H/ACA RNPs to bediscovered, the box H/ACA small nucleolar (sno)RNPs,accumulate in the nucleolus and are involved in modifica-tion of rRNAs and spliceosomal U6 snRNA (Kiss 2002).The box H/ACA small-Cajal-body specific (sca)RNPs, onthe other hand, accumulate within Cajal bodies and areinvolved in nucleotide modification of spliceosomalsnRNAs transcribed by RNA polymerase II (Darzacqet al. 2002). Box H/ACA snoRNPs and scaRNPs share fourconserved proteins, dyskerin (also called Cbf5p in yeast andNap57 in rodents), hGar1, hNhp2, and hNop10; and theirRNA components contain two conserved box elements,termed the H-box and the ACA-box (Meier 2005). Inaddition, the RNA components of scaRNPs, scaRNAs,contain the so-called CAB-box that functions in the re-tention of scaRNPs within Cajal bodies (Richard et al.2003). The human telomerase holoenzyme also possessesthe proteins dyskerin, hGar1, hNhp2, and hNop10 (Conget al. 2002; Chen and Greider 2004); and its RNA com-ponent (called hTR) features the conserved H-, ACA-, andCAB-boxes at its 39-end (Mitchell et al. 1999a; Chen et al.2000; Jady et al. 2004). Integrity of the H-box or ACA-box

Reprint requests to: Yves Henry, Laboratoire de Biologie MoleculaireEucaryote, UMR5099 CNRS-Universite Paul Sabatier, IFR 109, 118 routede Narbonne, 31062 Toulouse cedex 09, France, European Union; e-mail:[email protected]; fax: (33) 5 61 33 58 86.

Article published online ahead of print. Article and publication date areat http://www.rnajournal.org/cgi/doi/10.1261/rna.2344106.

832 RNA (2006), 12:832–840. Published by Cold Spring Harbor Laboratory Press. Copyright � 2006 RNA Society.

Page 178: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

is necessary for normal processing and accumulation ofhTR (Mitchell et al. 1999a). Likewise, modifications ofdyskerin that cause dyskeratosis congenita induce a drasticdrop in hTR levels (Mitchell et al. 1999b). Consistent withit possessing a CAB-box, hTR accumulates within Cajalbodies (Jady et al. 2004, 2006; Tomlinson et al. 2006). Thushuman telomerase contains a bona fide box H/ACA RNPdomain that is critical for the accumulation and localiza-tion of the holoenzyme.

How eukaryotic box H/ACA small RNPs and telomeraseare assembled in vivo still remains little understood,although it has recently been shown that a Nap57/Nop10/Nhp2 complex could specifically bind to in vitro synthesizedbox H/ACA snoRNAs and hTR (Wang and Meier 2004) andthat yeast Nop10p may directly contact RNA (Khanna et al.2006). It has also been recently demonstrated that archaealaCbf5 can directly and specifically bind in vitro to archaealbox H/ACA small RNAs (Baker et al. 2005; Charpentieret al. 2005). Moreover, recombinant archaeal H/ACA RNPproteins aCbf5, aGar1, L7Ae, and aNop10 can assembleonto the H/ACA domain of telomerase RNA (Hamma et al.2005). Thus, it is tempting to speculate that dyskerin/Cbf5palso plays a pivotal role in the assembly of eukaryotic boxH/ACA snoRNPs, scaRNPs, and telomerase. In yeast, theNaf1p protein might intervene in early steps of yeast boxH/ACA snoRNP assembly. Yeast Naf1p is a nucleoplasmicprotein that associates with RNA and protein componentsof box H/ACA snoRNPs (Dez et al. 2002; Fatica et al.2002; Yang et al. 2002). Yeast Naf1p also interacts with theC-terminal domain of the large subunit of RNA polymeraseII (Fatica et al. 2002). Moreover, both Naf1p and Cbf5p arefound in close proximity to genes encoding snoRNAs, andsuch proximity depends on ongoing transcription (Ballarinoet al. 2005; Yang et al. 2005). Thus, it is envisaged thatCbf5p is cotranscriptionally delivered by Naf1p to nascentbox H/ACA pre-snoRNAs to initiate box H/ACA snoRNPassembly. We wondered whether human cells possess anortholog of Naf1p and if so, whether it would be requiredfor the accumulation of all RNPs containing a box H/ACAdomain, including telomerase. We report here the charac-terization of human Naf1, hNaf1, and demonstrate that itis, indeed, required for accumulation of all types of boxH/ACA RNPs, including telomerase.

RESULTS AND DISCUSSION

HsQ96HR8 is the human ortholog of yeast Naf1p

The hypothetical protein HsQ96HR8 was predicted byFatica and colleagues (Fatica et al. 2002) to be the orthologof yeast Naf1p. To check whether HsQ96HR8 couldpartially fulfill the functions of endogenous Naf1p, thegene encoding HsQ96HR8 was expressed constitutivelyfrom a plasmid in a yeast strain in which the NAF1 geneis transcribed from the GAL1-10 promoter (Dez et al.

2002); hence, in this strain, Naf1p expression can be turnedoff by switching cells from a medium containing galactoseto one containing glucose as carbon source. As controls, thesame strain was transformed with an empty plasmid, or thesame plasmid containing the yeast NAF1 gene transcribedfrom the GAR1 promoter. Expression of HsQ96HR8corrected to a significant degree the growth defect causedby depletion of endogenous Naf1p (Fig. 1A). Naf1p de-pletion leads to a drop in the steady-state levels of Cbf5p,Gar1p, Nop10p, and H/ACA snoRNAs (Fig. 1B,C, lanes 1–4;Dez et al. 2002). Expression of HsQ96HR8 significantlyreduced the drop in the levels of these proteins and RNAsfollowing depletion of endogenous Naf1p (Fig. 1B, lanes 5–8;Fig. 1C, lanes 9–12), and these effects were correlated withthe ability of HsQ96HR8 to interact with yeast H/ACAsnoRNP proteins (Fig. 1D). Finally, we showed by plasmidshuffling that haploid yeast cells devoid of the NAF1 geneare viable when they express human HsQ96HR8 froma plasmid (data not shown) and that steady-state levels ofH/ACA snoRNAs in these cells range from z30% to 85%of wild-type levels (Fig. 1E). From these data, we concludethat HsQ96HR8 is, indeed, the ortholog of yeast Naf1p andis hence thereafter referred to as hNaf1.

hNaf1 interacts with protein and RNA components ofHeLa box H/ACA snoRNPs, scaRNPs, and telomerase

The human family of box H/ACA RNPs includes not onlysnoRNPs that accumulate in the nucleolus as in Saccharo-myces cerevisiae, but also scaRNPs, which accumulate inCajal bodies, and telomerase. We wondered whether hNaf1does interact with protein and RNA components of alltypes of box H/ACA RNPs. Such hypothetical interactionswere evaluated by precipitation experiments carried out usingpurified anti-hNaf1 antibodies (raised in rabbit against hNaf1peptides) and HeLa cell extracts. hNaf1 interacts with dyskerinand hNop10 but not with fibrillarin (Fig. 2A), consistentwith results obtained with yeast cells. Interaction withhGar1 and hNhp2 could not be evaluated for lack of suit-able antibodies able to detect these proteins in the Westernblot procedure. In addition, not only box H/ACA snoRNAs,but also box H/ACA scaRNAs and hTR were precipitatedwith anti-hNaf1 antibodies from total HeLa cell extracts(Fig. 2B). In contrast, we could not detect an interactionbetween hNaf1 and box C/D U3 snoRNA or spliceosomalU6 snRNA (Fig. 2B). We conclude that hNaf1 is specificallyassociated with protein and RNA components of boxH/ACA snoRNPs, scaRNPs, and telomerase in HeLa cells.

hNaf1 is required to maintain normal cellular levels ofbox H/ACA RNP and human telomerase components

We next sought to determine if hNaf1 is required tomaintain normal levels of the box H/ACA RNP and

hNaf1 and human H/ACA RNP accumulation

www.rnajournal.org 833

Page 179: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

telomerase components with which it interacts. To addressthis question, we reduced the levels of hNaf1, dyskerin, orfibrillarin as control, by inducing turn-over of the corre-sponding mRNAs using specific siRNAs (Fig. 3A,B). Re-duction of the quantities of hNaf1 induced a mild drop inthe levels of dyskerin and hNop10, while levels of fibrillarinremained unchanged (Fig. 3A). Conversely, treatment withsiRNAs targeting dyskerin mRNAs reduced the levels ofhNaf1 (Fig. 3A,B). In addition, reduction of the quantitiesof hNaf1 or dyskerin was correlated with a decrease in thesteady-state levels of box H/ACA snoRNAs, scaRNAs, andhTR (Fig. 3C). In contrast, levels of box C/D snoRNAs U3

and U13 were unaffected by a reduction in the amounts ofhNaf1.

hNaf1 is located in numerous discrete nucleoplasmicfoci and fails to accumulate in nucleoli orCajal bodies

To investigate where hNaf1 might function in the cell, itsintracellular distribution was assessed by fluorescence insitu immunodetection using purified anti-hNaf1 antibodies(Fig. 4). hNaf1 is detected primarily in a large number ofdiscrete foci throughout the nucleoplasm that often coincide

FIGURE 1. (Legend on next page)

Hoareau-Aveilla et al.

834 RNA, Vol. 12, No. 5

Page 180: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

with, but are less numerous than, nucleoplasmic focicontaining the large subunit of RNA polymerase II. Faintdiffuse labeling of the cytoplasm with anti-hNaf1 anti-bodies can also be observed. The same distribution isobserved in mammary tumor cells (MCF7), osteocarci-noma cells (U2OS), and in mouse cells (NIH3T3) (data notshown). We failed to detect any hNaf1 within nucleoli, here

labeled with anti-fibrillarin antibodies. Likewise, althoughhNaf1-containing foci are sometimes juxtaposed to Cajalbodies, most of these seem devoid of hNaf1. HA-taggedhNaf1 transiently expressed in transfected HeLa cells is alsopredominantly detected in the nucleoplasm and seemsabsent from nucleoli (data not shown). These data dem-onstrate that hNaf1 is not part of mature box H/ACAsnoRNPs and scaRNPs and suggest that it intervenes inearly steps of assembly of these particles, as has beenproposed for yeast Naf1p (Fatica et al. 2002; Ballarino et al.2005; Yang et al. 2005).

Conclusions and perspectives

Our results establish that hNaf1 is the human ortholog ofyeast Naf1p and is required for the accumulation of severalbox H/ACA snoRNP, scaRNP, and telomerase componentswith which it physically, directly or indirectly, interacts.The finding that hNaf1 can salvage growth of a yeast strainlacking an NAF1 gene is remarkable given the moderateoverall identity between yeast and human Naf1 (28%identity, 59% similarity). This emphasizes the notion thatnot only the composition and function of mature boxH/ACA RNPs have been conserved between lower and highereukaryotes (Pogaci�c et al. 2000; Yang et al. 2000), but alsoat least some aspects of the biogenesis of these particles.Our data also provide further evidence for a kinshipbetween box H/ACA RNPs and telomerase.

Dyskerin has recently been found associated with anunspliced pre-mRNA hosting a box H/ACA snoRNA(Richard et al. 2006). Thus, assembly of human boxH/ACA snoRNPs is initiated very early, either immediatelyfollowing or during transcription of pre-mRNAs hostingbox H/ACA snoRNAs. The fact that endogenous hNaf1 is

FIGURE 2. hNaf1 interacts with components of box H/ACAsnoRNPs, box H/ACA scaRNPs, and telomerase. Immunoprecipita-tions were carried out using purified anti-hNaf1 antibodies (ahNaf1)or non-immune serum (NIS) and HeLa cell extracts. (A) Westernanalysis of hNaf1-associated proteins. After precipitation and wash-ing, protein A-agarose beads were resuspended in protein denaturingbuffer. Aliquots of the resulting supernatants (lanes 2,3) or 3% of thecorresponding input extract (Input, lane 1) were submitted to SDS-PAGE and Western analysis as described in Figure 1B. The strongbands labeled ‘‘IgG’’ correspond to immunoglobulins detached fromthe beads during pellet resuspension after the precipitation. (B)Detection of small RNAs associated with hNaf1. RNAs extracted fromthe pellets obtained following precipitation (lanes 2,3) or from anamount of input extract (Input) corresponding to 3% of that used forprecipitations were analyzed by Northern blot (to detect snRNAs,snoRNAs, and scaRNAs) as described in the legend of Figure 1C, orRNase protection to detect hTR.

FIGURE 1. HsQ96HR8 (hNaf1) is the human ortholog of yeast Naf1p. (A) Expression of HsQ96HR8 improves growth of yeast following Naf1pdepletion. Yeast strain GAL::naf1, in which the NAF1 gene is transcribed from the GAL1-10 promoter, was transformed with an empty expressionvector (line empty vector) or derivatives thereof containing wild-type yeast NAF1 (line scNaf1p) or the human HsQ96HR8 gene (line hNaf1)transcribed from the GAR1 promoter and tagged with the ZZ sequence encoding two IgG-binding domains. The resulting transformed strainswere grown in galactose-containing medium, washed, and grown for a further 24 h in glucose-containing medium. Serial dilutions of samplesfrom galactose- or glucose-grown cultures were plated on galactose- or glucose-containing plates, respectively. (B) Expression of HsQ96HR8increases steady-state levels of yeast H/ACA proteins Cbf5p, Gar1p, and Nop10p or (C) steady-state levels of yeast H/ACA snoRNAs, followingdepletion of endogenous yeast Naf1p. The transformed GAL::naf1 strains described in A were grown in galactose-containing medium, washed,and transferred to glucose-containing medium to repress transcription of chromosomal NAF1. Samples from galactose-grown cultures (GAL,lanes 1,5,9) or from cultures grown for 24 h (lanes 2,6,10), 48 h (lanes 3,7,11), or 72 h (lanes 4,8,12) were collected, from which total proteins (B)or RNAs (C) were extracted. In panel B, total proteins were subjected to SDS-polyacrylamide gel electrophoresis and transferred to a cellulosemembrane. Specific proteins were detected by enhanced chemiluminescence using antibodies listed in the ‘‘Materials and Methods’’ section. Inpanel C, total RNAs were separated by denaturing acrylamide gel electrophoresis and transferred to nylon membranes. Specific RNAs weredetected by hybridization with antisense oligonucleotide probes. Signal intensities were measured by PhosphorImager scanning. Values (indicatedbelow each lane) are expressed as percentages of the intensities obtained in the case of galactose-grown samples. (D) HsQ96HR8 interacts withyeast box H/ACA snoRNP proteins. Transformed GAL::naf1 strains expressing the ZZ tag alone (lanes 1,2), tagged yeast Naf1p (lanes 3,4), ortagged human HsQ96HR8 expressed from the TDH3 promoter (lanes 5,6) were grown in galactose-containing medium, washed, and transferredto glucose-containing medium for 24 h. Total extracts were prepared and immunoprecipitation experiments were carried out using IgG-Sepharose beads. After precipitation and washing, beads were resuspended in protein denaturing buffer. Aliquots of the resulting supernatants(IP, lanes 2,4,6) and 1/20th of the corresponding input extract (Input, lanes 1,3,5) were submitted to SDS-PAGE and Western analysis asdescribed in B. The upper band detected in lane 4, anti-Nhp2p Western, probably corresponds to a breakdown product of ZZ-tagged yeast Naf1p.(E) H/ACA snoRNA levels in naf1D cells expressing wild-type yeast Naf1p (lane 1) or human HsQ96HR8 (lane 2) from a plasmid. RNAs wereanalyzed as described for panel C.

hNaf1 and human H/ACA RNP accumulation

www.rnajournal.org 835

Page 181: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

predominantly found in discrete nucleoplasmic foci isconsistent with the idea that hNaf1, as was proposed foryeast Naf1p, is involved in early assembly steps of boxH/ACA RNPs. Whether hNaf1 acts while box H/ACA RNAsare being transcribed remains an open question: ourattempts to assess by chromatin immunoprecipitationassays whether hNaf1, like yeast Naf1p (Ballarino et al.2005; Yang et al. 2005), is present in the immediate vicinityof box H/ACA snoRNA genes have repeatedly failed,

perhaps for trivial technical reasons. The immunoprecipi-tation experiments presented in Figure 2 demonstrate thathNaf1 interacts with box H/ACA snoRNAs and scaRNAsthat have been trimmed to their mature or nearly maturesize, as judged from their mobility on acrylamide gels.Hence, we surmise that hNaf1 remains associated with boxH/ACA RNAs during most processing steps. At what stagehNaf1 dissociates from maturing particles remains unclear.Box H/ACA scaRNAs and hTR accumulate in Cajal bodies

FIGURE 3. hNaf1 is required for normal accumulation of box H/ACA RNP and telomerase components. (A) Western analysis of theconsequences of the reduction of fibrillarin, hNaf1, or dyskerin levels obtained by RNA interference. HeLa cells were mock-transfected (NosiRNA) or transfected with double-stranded siRNAs targeting fibrillarin, hNaf1, or dyskerin mRNAs and grown for 60 h. Total proteins were thenextracted, separated, and analyzed by the Western blot procedure as described in the legend of Figure 1. (B) Fluorescence in situ immunodetectionof hNaf1 (red) and fibrillarin (green) in HeLa cells mock-transfected (No siRNA) or transfected with double-stranded siRNAs targeting hNaf1 ordyskerin mRNAs. Bar, 10 mm. (C) Analysis of small RNA levels following siRNA treatment. HeLa cells were transfected with siRNAs as describedin A. After 60 h of incubation, total RNAs were extracted. U17, U19, U92, U3, and U6 (acting as an internal control) were then separated andanalyzed by Northern blot, while U13 and hTR were analyzed by RNase protection. U17, U19, and U3, on the one hand, and U92, on the other,were analyzed on different blots. For both procedures, equal amounts of total RNA were used for all samples. Signal intensities were measured byPhosphorImager scanning. Values (indicated below each lane) are expressed as percentages of the intensities obtained in the case of mock-transfected samples (No siRNA).

Hoareau-Aveilla et al.

836 RNA, Vol. 12, No. 5

Page 182: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

(Darzacq et al. 2002; Jady et al. 2004), and some canonicalbox H/ACA snoRNAs may transit through Cajal bodies ontheir way to the nucleolus (Richard et al. 2003). It ispossible that hNaf1 dissociates from the particles before

they enter Cajal bodies, since we failed to obtain anyconvincing evidence for the presence of hNaf1 in thesenucleoplasmic entities. However, the presence of hNaf1within Cajal bodies may be too transient to be clearly

FIGURE 4. hNaf1 is located in numerous discrete nucleoplasmic foci. Subcellular localization of hNaf1 in HeLa cells. Bar, 10 mm.

hNaf1 and human H/ACA RNP accumulation

www.rnajournal.org 837

Page 183: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

detectable under our experimental conditions. In thatrespect, it is interesting to note that only traces of theendogenous PHAX protein, which is required for routingbox C/D snoRNPs to Cajal bodies, can be detected in theseand only when the box C/D U3 snoRNA is overexpresseddoes PHAX become concentrated in Cajal bodies (Boulonet al. 2004). hNaf1 could not be seen in nucleoli either. Inthis case again, we are reluctant to conclude that hNaf1 istotally excluded from nucleoli, given that some yeast Naf1pcould be detected in the nucleolus by electron microscopy(Dez et al. 2002). In any case, the observation that hNaf1fails to accumulate within Cajal bodies or nucleoli is astrong indication that it is not a permanent component ofmature box H/ACA scaRNPs and snoRNPs.

The biogenesis of human box H/ACA RNPs and telo-merase is likely to be complex, as has recently been shownfor the mammalian box C/D U3 snoRNP (Boulon et al.2004; Watkins et al. 2004). In addition to hNaf1, theNopp140 protein, which shuttles between cytoplasm, Cajalbodies, and nucleoli, has been shown to transiently interactwith box H/ACA RNP components (Meier and Blobel1992; Isaac et al. 1998; Yang et al. 2000). Moreover, theSMN protein, required for assembly of spliceosomalsnRNPs (Yong et al. 2004) and probably box C/D snoRNPsalso (Watkins et al. 2004) interacts with hGar1 (Pellizzoniet al. 2001; Whitehead et al. 2002) and with the humantelomerase RNP (Bachand et al. 2002). Surprisingly, a recentreport has shown that the transport adaptor PHAXinteracts with hTR (Boulon et al. 2004). Finally, the Rvb2pand Shq1p proteins are required for box H/ACA snoRNAaccumulation in yeast (King et al. 2001; Yang et al. 2002),and both proteins have likely orthologs in human cells. Allof these factors are most probably involved in the assemblyand/or trafficking of human box H/ACA RNPs andtelomerase. Deciphering their roles and determining howhNaf1 fits in the overall picture is the next challenge in thefield.

MATERIALS AND METHODS

Strains, media, plasmids, and siRNAs

To assess the ability of hNaf1 to complement growth of a yeaststrain depleted of endogenous yeast Naf1p, the GAL::naf1 strain(Dez et al. 2002) was transformed with plasmids pCH32 (Lebaronet al. 2005), pCH31, or pCH32-hNaf1, which constitutivelyexpress from the GAR1 promoter the ZZ tag alone or S. cerevisiaeNaf1p or hNaf1, respectively. To obtain pCH31, the S. cerevisiaeNAF1 open reading frame was PCR-amplified using oligonucleo-tides NterNaf1p (59-CCCCCCAGATCTTATGAGCGATGACTTGTTTTCTAAG-39) and CterNaf1p (59-CCCCCCAGATCTGCGGTTCTTGGATCTTGCTGATGCTGA-39). The PCR product wasdigested with BglII and inserted into BamHI-cut pCH32, creatingpCH31. pCH32-hNaf1 was obtained as follows: The open readingframe of hNaf1 was PCR-amplified from the 3,447,276 IMAGE

clone (purchased from the Mammalian Gene Collection) usingoligonucleotides 59hNaf1pHA113 (59-CCCCCCGGATCCTATGGAGGTAGTGGAGGCCG-39) and 39hNaf1pHA113 (59-CCCCCCGGATCCGCATAGTAAGGTCCAAAATGA-39). The PCR productwas digested with BamHI and inserted into BamHI-cut pCH32,creating pCH32-hNaf1. To assess whether hNaf1 can interact withyeast snoRNP proteins, the GAL::naf1 strain was transformed withplasmid pFH144, which directs expression of the open readingframe of hNaf1 from the strong TDH3 promoter. pFH144 wasproduced in two steps as follows. The GAR1 promoter in pCH32was removed by BamHI/EcoRI digestion and replaced by theTDH3 promoter, digested by the same enzymes, that was obtainedby PCR amplification performed with plasmid pBS2585 (agenerous gift of B. Seraphin) and oligonucleotides 59TDH3pr1(59-GGGGGGAATTCAGATTCCTTGATTACGTAAGGGAGTTAGAATC-39) and 39TDH3pr (59-GGGGGGGATCCTTTGTTTGTTTATGTGTGTTTATTCGAAACTAAG-39). This procedure gener-ated plasmid pFH143. In a second step, the open reading frame ofhNaf1, obtained as described above, was digested with BamHI andinserted into pFH143 digested with the same enzyme, generatingpFH144. To assess whether hNaf1 could salvage growth of a yeaststrain totally devoid of endogenous yeast Naf1p, we proceeded asfollows. An naf1::kanMX4 strain possessing a centromeric plasmidcontaining a URA3 marker gene and the wild-type S. cerevisiaeNAF1 gene was transformed with TRP1-containing plasmidspCH9 or pFH146, directing expression of ZZ-tagged S. cerevisiaeNaf1p or hNaf1, respectively. pCH9 was produced by amplifyingthe S. cerevisiae NAF1 open reading frame as described above andcloning the BglII-digested PCR product into the BamHI site ofpHA113 (Henras et al. 2001). To produce pFH146, the TRP1-containing 1977-bp HindIII/PciI fragment from pHA113 wasligated to the 5732-bp HindIII/PciI fragment from pFH144. Toselect cells able to survive in the absence of the URA3-containingplasmid, the transformed naf1::kanMX4 strains were streaked onminimal medium containing fluoroorotic acid.S. cerevisiae strains were grown either in YP medium (1% yeast

extract, 1% peptone) supplemented with either 2% galactose and2% sucrose or 2% glucose as carbon sources. G418 was addedwhen required at 0.2 mg/mL final concentration. Fluoroorotate-resistant clones were selected on supplemented yeast nitrogen baseproline medium containing 0.6 g/L fluoroorotic acid (McCuskerand Davis 1991). HeLa cells were grown in DMEM supplementedwith antibiotics, 1% sodium pyruvate, and 10% FCS (all fromInvitrogen). Transfection of double-stranded siRNAs was per-formed by electroporation as described in Rouquette et al. (2005).The sequences of the siRNAs (manufactured by Eurogentec) usedto target hNaf1 or dyskerin mRNAs are the following: SiRNA-hNaf1-1, 59-GGAAAGAUAUUCGAGAUAU-39; SiRNA-hNaf1-2,59-UGAACUGCCUUCUGUUGAA-39; SiRNA-hNaf1-3, 59-ACAGAUUCAGAUAGUUCAA-39; SiRNA-Dyskerin-1, 59-GGACAGGUUUCAUUAAUCU-39; SiRNA-Dyskerin-2, 59-CCACAAGGAUGAGAGUUAC-39; SiRNA-Dyskerin-3, 59-UCAAACCUGAAUCCAAAGU-39. The siRNA used to target fibrillarin mRNA wasdescribed in Watkins et al. (2004).

Immunoprecipitations

Immunoprecipitations of ZZ-tagged proteins from yeast extractswere performed as described in Lebaron et al. (2005), except forthe following modifications: After precipitation, immunoglobulin

Hoareau-Aveilla et al.

838 RNA, Vol. 12, No. 5

Page 184: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

G (IgG)-Sepharose beads (Amersham Pharmacia Biotech) andassociated complexes were washed five times with 1 mL of 20 mMTris-HCl (pH 8), 5 mM MgAc, 0.2% Triton X-100, 200 mM KCl,and 1 mM dithiothreitol (DTT) and then twice with 1 mL of 20 mMTris-HCl (pH 8), 5 mM MgAc, 0.2% Triton X-100, 200 mMNaCl, and 1 mM DTT. After washing, the beads were resuspendedin 50 mL of 100 mM Tris-HCl (pH 8), 4% SDS, 20% glycerol,0.04% bromophenol blue, and 200 mM DTT. Immunoprecipita-tion of human proteins was performed as follows: About 202 32106 HeLa cells previously washed twice with ice-cold PBS weresonicated in 50 mM Tris-HCl (pH 7.4), 200 mM NaCl, 0.05%Nonidet P-40 (NET-2 buffer) containing 0.5 unit/mL RNasin(Promega), and protease inhibitors (Roche). The extract was thenclarified by centrifugation at 10,000g for 10 min. The supernatantwas incubated for 2 h with protein A agarose beads (Sigma) or IPbeads (Rabbit TrueBlot Set from eBioscience) previously saturatedfor 2 h with anti-hNaf1 antibodies or non-immune serum. Afterimmunoprecipitation, the beads were washed seven times with20 volumes of NET-2 buffer. For protein analysis, beads wereresuspended in an appropriate volume of 100 mM Tris-HCl (pH 8),4% SDS, 20% glycerol, 0.04% bromophenol blue, and 200 mMDTT. For RNA analysis, beads were resuspended in 50 mL of 300 mMNaCl, 40 mM Tris-HCl (pH 8), and 1.7% SDS containing 60 mg ofproteinase K (Promega). After 30 min at 37°C, RNAs were extractedwith phenol/chloroform and precipitated.

Western analysis

Proteins from total extracts or extracted from immunoprecipi-tated fractions were separated on 8% or 13% polyacrylamide/SDSgels and transferred to Hybond-C extra membranes (AmershamPharmacia Biotech). Yeast Gar1p, Nhp2p, Nop10p, Nop1p,ZZ-tagged proteins, and hNop10 were detected as described inBousquet-Antonelli et al. (2000), Henras et al. (2001), and Dezet al. (2002). Yeast Cbf5p was detected using purified antibodies,diluted 500-fold, raised in rabbits (by Eurogentec) against therecombinant protein lacking the C-terminal KKE repeats. hNaf1was detected using purified antibodies diluted 1000-fold that hadbeen raised in rabbits (by Eurogentec) against the following hNaf1peptides: H2N-REFTRGFSRARYPRSC-CONH2 and H2N-CPPSSGDSNSHFGPYY-CONH2. Dyskerin was detected using purifiedantibodies diluted 1000-fold that had been raised in rabbits(by Eurogentec) against the following dyskerin peptide: H2N-CERDTYPRKWGLGPKASQ-COOH. Fibrillarin was detectedusing rabbit polyclonal antibodies raised against the protein fromXenopus laevis diluted 200-fold, actin using a mouse monoclonalantibody (Chemicon) diluted 10,000-fold, and CTD Pol IIusing the CTD4H8 mouse monoclonal antibody (Upstate) diluted500-fold.

RNA extractions, Northern hybridizations, and RNaseprotection assay

RNA extractions from yeast cells were performed as described byTollervey and Mattaj (1987). RNA fractionations by polyacryl-amide gel electrophoresis were performed as described by Henraset al. (1998). Small RNAs, except hTR and U13, were analyzed byNorthern hybridization using 32P-labeled oligodeoxynucleotideprobes. Sequences of antisense oligonucleotides used to detectyeast small RNAs have been reported in Henras et al. (1998, 2001)

and Dez et al. (2002) and to detect human small RNAs in Kiss et al.(2002) and Jady et al. (2004). Blots were hybridized with 59-end-labeled oligodeoxynucleotide probes and washed as described byHenras et al. (1998). hTR and U13 were detected by RNase A/T1protection assay as described in Goodall et al. (1990).

Fluorescence in situ immunodetection

Cells grown on coverslips were fixed for 15 min at 4°C with 4%paraformaldehyde in PBS, washed with PBS, and permeabilizedwith 0.4% Triton X-100 in PBS. After two washes with PBS, cellswere incubated for 1 h with 1% BSA in PBS, then for 1 h withprimary antibodies in PBS containing 1% BSA. Fibrillarin wasdetected using 72B9 mouse monoclonal antibody diluted 200-fold(provided by J. Steitz), human p80-coilin using a polyclonal rabbitanti-coilin antibody diluted 400-fold (provided by A. Lamond),and hNaf1 and CTD Pol II were detected using the antibodieslisted in the ‘‘Western Analysis’’ section above. After three washeswith PBS, cells were incubated for 1 h with anti-rabbit IgG TRITCconjugates diluted 2000-fold and anti-mouse IgG FITC conjugatesdiluted 1000-fold (Sigma). The coverslips were then washed threetimes with 13 PBS and then mounted in mowiol/DAPI (0.1 mg/mL).Images were captured with a 12-bit CoolSnap ES camera (RoperScientifics) mounted on a DMRB microscope (Leica) using theMetavue software (Universal Imaging).

ACKNOWLEDGMENTS

We thank S. Aveilla and A. Hochkoeppler for constant supportand T. Meier for communicating results prior to publication.We are grateful to A. Lamond, B. Seraphin, and J. Steitz for re-agents and C. Chailleux, V. Choesmel, B. Jady, P. Richard, andJ. Rouquette for reagents and advice. We are thankful to membersof the Ferrer lab for help and numerous discussions. We thankY. de Preval for synthesis of oligonucleotides, D. Villa for art work,and A. Rivals for expert technical assistance. C.H.-A. is a recipientof a post-graduate fellowship from the Ministere de l9EducationNationale et de la Recherche. M.B. is a recipient of a ‘‘Marco Polo’’fellowship from the University of Bologna. This work wassupported by the CNRS, the Universite Paul Sabatier, and a grantfrom La Ligue Nationale contre le Cancer (‘‘Equipe Labellisee’’).

Received December 23, 2005; accepted February 14, 2006.

REFERENCES

Bachand, F., Boisvert, F.M., Cote, J., Richard, S., and Autexier, C.2002. The product of the survival of motor neuron (SMN) gene isa human telomerase-associated protein. Mol. Biol. Cell 13: 3192–3202.

Baker, D.L., Youssef, O.A., Chastkofsky, M.I., Dy, D.A., Terns, R.M.,and Terns, M.P. 2005. RNA-guided RNA modification: Functionalorganization of the archaeal H/ACA RNP. Genes & Dev. 19: 1238–1248.

Ballarino, M., Morlando, M., Pagano, F., Fatica, A., and Bozzoni, I.2005. The cotranscriptional assembly of snoRNPs controls thebiosynthesis of H/ACA snoRNAs in Saccharomyces cerevisiae. Mol.Cell. Biol. 25: 5396–5403.

Boulon, S., Verheggen, C., Jady, B.E., Girard, C., Pescia, C., Paul, C.,Ospina, J.K., Kiss, T., Matera, A.G., Bordonne, R., et al. 2004.

hNaf1 and human H/ACA RNP accumulation

www.rnajournal.org 839

Page 185: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

PHAX and CRM1 are required sequentially to transport U3snoRNA to nucleoli. Mol. Cell 16: 777–787.

Bousquet-Antonelli, C., Vanrobays, E., Gelugne, J.-P., Caizergues-Ferrer, M., and Henry, Y. 2000. Rrp8p is a yeast nucleolar proteinfunctionally linked to Gar1p and involved in pre-rRNA cleavage atsite A2. RNA 6: 826–843.

Cech, T.R. 2004. Beginning to understand the end of the chromo-some. Cell 116: 273–279.

Charpentier, B., Muller, S., and Branlant, C. 2005. Reconstitution ofarchaeal H/ACA small ribonucleoprotein complexes active inpseudouridylation. Nucleic Acids Res. 33: 3133–3144.

Chen, J.L. and Greider, C.W. 2004. Telomerase RNA structure andfunction: Implications for dyskeratosis congenita. Trends Biochem.Sci. 29: 183–192.

Chen, J.L., Blasco, M.A., and Greider, C.W. 2000. Secondary structureof vertebrate telomerase RNA. Cell 100: 503–514.

Cong, Y.S., Wright, W.E., and Shay, J.W. 2002. Human telomeraseand its regulation. Microbiol. Mol. Biol. Rev. 66: 407–425.

Darzacq, X., Jady, B.E., Verheggen, C., Kiss, A.M., Bertrand, E., andKiss, T. 2002. Cajal body-specific small nuclear RNAs: A novelclass of 29-O-methylation and pseudouridylation guide RNAs.EMBO J. 21: 2746–2756.

Dez, C., Noaillac-Depeyre, J., Caizergues-Ferrer, M., and Henry, Y.2002. Naf1p, an essential nucleoplasmic factor specifically requiredfor accumulation of box H/ACA small nucleolar RNPs. Mol. Cell.Biol. 22: 7053–7065.

Fatica, A., Dlaki�c, M., and Tollervey, D. 2002. Naf1 p is a box H/ACAsnoRNP assembly factor. RNA 8: 1502–1514.

Goodall, G.J., Wiebauer, K., and Filipowicz, W. 1990. Analysis ofpre-mRNA processing in transfected plant protoplasts. MethodsEnzymol. 181: 148–161.

Hamma, T., Reichow, S.L., Varani, G., and Ferre-D’Amare, A.R. 2005.The Cbf5-Nop10 complex is a molecular bracket that organizesbox H/ACA RNPs. Nat. Struct. Mol. Biol. 12: 1101–1107.

Henras, A., Henry, Y., Bousquet-Antonelli, C., Noaillac-Depeyre, J.,Gelugne, J.-P., and Caizergues-Ferrer, M. 1998. Nhp2p andNop10p are essential for the function of H/ACA snoRNPs. EMBOJ. 17: 7078–7090.

Henras, A., Dez, C., Noaillac-Depeyre, J., Henry, Y., and Caizergues-Ferrer, M. 2001. Accumulation of H/ACA snoRNPs depends onthe integrity of the conserved central domain of the RNA-bindingprotein Nhp2p. Nucleic Acids Res. 29: 2733–2746.

Isaac, C., Yang, Y., and Meier, U.T. 1998. Nopp140 functions asa molecular link between the nucleolus and the coiled bodies.J. Cell Biol. 142: 319–329.

Jady, B.E., Bertrand, E., and Kiss, T. 2004. Human telomerase RNAand box H/ACA scaRNAs share a common Cajal body-specificlocalization signal. J. Cell Biol. 164: 647–652.

Jady, B.E., Richard, P., Bertrand, E., and Kiss, T. 2006. Cell cycle-dependent recruitment of telomerase RNA and Cajal bodies tohuman telomeres. Mol. Biol. Cell 17: 944–954.

Khanna, M., Wu, H., Johansson, C., Caizergues-Ferrer, M., andFeigon, J. 2006. Structural study of the H/ACA snoRNP compo-nents Nop10p and the 39 hairpin of U65 snoRNA. RNA 12:40–52.

King, T.H., Decatur, W.A., Bertrand, E., Maxwell, E.S., andFournier, M.J. 2001. A well-connected and conserved nucleoplas-mic helicase is required for production of box C/D and H/ACAsnoRNAs and localization of snoRNP proteins. Mol. Cell. Biol. 21:7731–7746.

Kiss, T. 2002. Small nucleolar RNAs: An abundant group of non-coding RNAs with diverse cellular functions. Cell 109: 145–148.

Kiss, A.M., Jady, B.E., Darzacq, X., Verheggen, C., Bertrand, E., andKiss, T. 2002. A Cajal body-specific pseudouridylation guide RNAis composed of two box H/ACA snoRNA-like domains. NucleicAcids Res. 30: 4643–4649.

Lebaron, S., Froment, C., Fromont-Racine, M., Rain, J.-C., Monsarrat, B.,Caizergues-Ferrer, M., and Henry, Y. 2005. The splicing ATPaseprp43p is a component of multiple preribosomal particles. Mol. Cell.Biol. 25: 9269–9282.

McCusker, J.H. and Davis, R.W. 1991. The use of proline as a nitrogensource causes hypersensitivity to, and allows more economical useof 5FOA in Saccharomyces cerevisiae. Yeast 7: 607–608.

Meier, U.T. 2005. The many facets of H/ACA ribonucleoproteins.Chromosoma 114: 1–14.

Meier, U.T. and Blobel, G. 1992. Nopp140 shuttles on tracks betweennucleolus and cytoplasm. Cell 70: 127–138.

Mitchell, J.R., Cheng, J., and Collins, K. 1999a. A box H/ACA smallnucleolar RNA-like domain at the human telomerase RNA 39 end.Mol. Cell. Biol. 19: 567–576.

Mitchell, J.R., Wood, E., and Collins, K. 1999b. A telomerasecomponent is defective in the human disease dyskeratosis con-genita. Nature 402: 551–555.

Pellizzoni, L., Baccon, J., Charroux, B., and Dreyfuss, G. 2001. Thesurvival of motor neurons (SMN) protein interacts with thesnoRNP proteins fibrillarin and GAR1. Curr. Biol. 11: 1079–1088.

Pogaci�c, V., Dragon, F., and Filipowicz, W. 2000. Human H/ACAsmall nucleolar RNPs and telomerase share evolutionarily con-served proteins NHP2 and NOP10. Mol. Cell. Biol. 20: 9028–9040.

Richard, P., Darzacq, X., Bertrand, E., Jady, B.E., Verheggen, C., andKiss, T. 2003. A common sequence motif determines the Cajalbody-specific localization of box H/ACA scaRNAs. EMBO J. 22:4283–4293.

Richard, P., Kiss, A.M., Darzacq, X., and Kiss, T. 2006. Cotranscrip-tional recognition of human intronic box H/ACA snoRNAs occursin a splicing-independent manner. Mol. Cell. Biol. (in press).

Rouquette, J., Choesmel, V., and Gleizes, P.-E. 2005. Nuclear exportand cytoplasmic processing of precursors to the 40S ribosomalsubunits in mammalian cells. EMBO J. 24: 2862–2872.

Tollervey, D. and Mattaj, I.W. 1987. Fungal small nuclear ribonu-cleoproteins share properties with plant and vertebrate U-snRNPs.EMBO J. 6: 469–476.

Tomlinson, R.L., Ziegler, T.D., Supakorndej, T., Terns, R.M., andTerns, M.P. 2006. Cell cycle-regulated trafficking of humantelomerase to telomeres. Mol. Biol. Cell 17: 955–965.

Wang, C. and Meier, U.T. 2004. Architecture and assembly ofmammalian H/ACA small nucleolar and telomerase ribonucleo-proteins. EMBO J. 23: 1857–1867.

Watkins, N.J., Lemm, I., Ingelfinger, D., Schneider, C., Hossbach, M.,Urlaub, H., and Luhrmann, R. 2004. Assembly and maturation ofthe U3 snoRNP in the nucleoplasm in a large dynamic multi-protein complex. Mol. Cell 16: 789–798.

Whitehead, S.E., Jones, K.W., Zhang, X., Cheng, X., Terns, R.M., andTerns, M.P. 2002. Determinants of the interaction of the spinalmuscular atrophy disease protein SMN with the dimethylarginine-modified box H/ACA small nucleolar ribonucleoprotein GAR1.J. Biol. Chem. 277: 48087–48093.

Yang, Y., Isaac, C., Wang, C., Dragon, F., Pogaci�c, V., and Meier, U.T.2000. Conserved composition of mammalian box H/ACA and boxC/D small nucleolar ribonucleoprotein particles and their interac-tion with the common factor Nopp140. Mol. Biol. Cell 11: 567–577.

Yang, P.K., Rotondo, G., Porras, T., Legrain, P., and Chanfreau, G.2002. The Shq1p.Naf1p complex is required for box H/ACA smallnucleolar ribonucleoprotein particle biogenesis. J. Biol. Chem. 277:45235–45242.

Yang, P.K., Hoareau, C., Froment, C., Monsarrat, B., Henry, Y., andChanfreau, G. 2005. Cotranscriptional recruitment of the pseu-douridylsynthetase Cbf5p and of the RNA binding protein Naf1pduring H/ACA snoRNP assembly. Mol. Cell. Biol. 25: 3295–3304.

Yong, J., Wan, L., and Dreyfuss, G. 2004. Why do cells need anassembly machine for RNA–protein complexes? Trends Cell Biol.14: 226–232.

Hoareau-Aveilla et al.

840 RNA, Vol. 12, No. 5

Page 186: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

3. Discussion

Nous avons identifié l’orthologue humain de la protéine Naf1p. Sa caractérisation nous

a permis de mettre en évidence que son mode de fonctionnement est suffisamment proche de

celui de Naf1p de levure (scNaf1p) pour lui permettre de remplacer scNaf1p dans des tests de

complémentation.

Nous avons également mis en évidence que la protéine hNaf1 est requise pour la

biogenèse de tous les types de RNP H/ACA chez l’homme. Ceci suggère fortement que

Naf1p intervient à un stade très précoce de la formation de ces particules: à un stade où elles

n’ont pas encore acquis leur spécificité propre. hNaf1 ne semble pas présente au sein des

corpuscules de Cajal et des nucléoles ce qui suggère qu’elle se dissocie des particules en

cours de formation avant leur adressage vers leurs lieux d’action.

Le groupe de Tomas Meier a également entrepris l’étude de Naf1 chez les

mammifères. Les résultats qu’ils ont obtenus sont en parfait accord avec les nôtres (Darzacq,

Kittur et al. 2006). De plus, ils ont mis en évidence que la protéine Naf1 est capable de

réaliser la navette entre noyau et cytoplasme. Ils ont mis en évidence, au sein de la protéine

Naf1, un signal de localisation nucléaire (NLS) fonctionnel compris entre les résidus 324-338

(Kittur, Darzacq et al. 2006). Il a été proposé que Naf1 s’associe dès le cytoplasme avec ses

partenaires protéiques, par exemple Cbf5p et Nhp2p. Le complexe résultant serait ensuite

importé dans le noyau afin de s’associer aux ARN H/ACA. L’assemblage de la particule

achevé, la protéine Naf1 pourrait retourner dans le cytoplasme afin de participer à

l’assemblage d’un nouveau complexe.

73

Page 187: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

B. Naf1p est requise à une étape précoce de l’assemblage

des snoRNP H/ACA

1. Introduction/Résumé

Les résultats d’Alessandro Fatica montrant une interaction in vitro entre Naf1p et le

domaine carboxy-terminal de la grande sous-unité de l’ARN polymérase II suggéraient que

Naf1p pouvait être présente au niveau des sites de transcription des snoARN H/ACA et ainsi

interagir in vivo avec la machinerie associée à l’ARN polymérase II.

Nous avons choisi d’explorer cet aspect de la protéine Naf1p en recherchant dans un

premier temps toutes les protéines complexées à Naf1p in vivo. La méthode que nous avons

choisi d’adopter est la purification de type TAP « Tandem Affinity Purification ». Nous avons

pour cela construit une souche exprimant une forme étiquetée de Naf1p à partir du locus

chromosomique endogène. Cette protéine Naf1p porte, à l’extrémité carboxy-terminale,

l’étiquette CBP-tev-ZZ où CBP correspond au peptide de liaison à la calmoduline, Tev à un

site de clivage par la protéase Tev et enfin ZZ correspond à deux sites de liaison aux IgG de la

protéine A de Staphylococcus aureus. Nous avons purifié les complexes associés à Naf1p-

CBP-tev-ZZ sur une colonne d’IgG-sépharose puis sur une colonne de calmoduline. Les

complexes ainsi purifiés ont été séparés sur SDS-PAGE puis leurs composants identifiés par

spectrométrie de masse en collaboration avec Carine Froment du laboratoire de Bernard

Monsarrat (IPBS, Toulouse). De façon intéressante, nous avons mis en évidence que Naf1p

est associée, entre autre, avec 3 facteurs du complexe de transcription polymérase II: Spt16p,

Sub1p et Tfg1p. En revanche, nous n’avons pas retrouvé l’ARN polymérase II.

Afin de tester l’hypothèse selon laquelle l’interaction entre Naf1p et la machinerie

associée à l’ARN polymérase II traduirait le fait que Naf1p est présente au niveau des sites de

transcription des snoARN H/ACA, nous avons entrepris de tester par immunoprecipitation de

chromatine (ChIP, «Chromatine ImmunoPrecipitation») l’association de Naf1p avec la

chromatine, en collaboration avec Pok Kwan Yang de l’équipe de Guillaume Chanfreau

(UCLA, Los Angeles). Nous avons mis en évidence que Naf1p est spécifiquement localisée à

proximité de la chromatine contenant des gènes codant les snoARN H/ACA. Cette

74

Page 188: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

localisation de Naf1p nécessite absolument une transcription active et la présence d’un

domaine H/ACA au sein de la région transcrite. De plus, nous avons montré que Cbf5p est

également recrutée au niveau de ces gènes.

75

Page 189: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

2. Publication

« Cotranscriptional Recruitment of the Peudouridylsynthetase Cbf5p and

the RNA Binding Protein Naf1p during H/ACA snoRNP Assembly »

Pok Kwan Yang, Coralie Hoareau, Carine Froment, Bernard Monsarrat, Yves Henry,

and Guillaume Chanfreau

MOLECULAR AND CELLULAR BIOLOGY, Apr. 2005, p. 3295–3304 Vol. 25, No. 8

76

Page 190: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 191: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

MOLECULAR AND CELLULAR BIOLOGY, Apr. 2005, p. 3295–3304 Vol. 25, No. 80270-7306/05/$08.00�0 doi:10.1128/MCB.25.8.3295–3304.2005Copyright © 2005, American Society for Microbiology. All Rights Reserved.

Cotranscriptional Recruitment of the Pseudouridylsynthetase Cbf5pand of the RNA Binding Protein Naf1p during H/ACA

snoRNP AssemblyPok Kwan Yang,1 Coralie Hoareau,2 Carine Froment,3 Bernard Monsarrat,3 Yves Henry,2

and Guillaume Chanfreau1*Department of Chemistry and Biochemistry and Molecular Biology Institute, UCLA, Los Angeles, California,1 and

Laboratoire de Biologie Moleculaire Eucaryote, UMR5099 CNRS-Universite Paul Sabatier,2 and Plate-formeproteomique, Institut de Pharmacologie et de Biologie Structurale (CNRS UMR 5089),3 Toulouse, France

Received 13 December 2004/Returned for modification 14 January 2005/Accepted 19 January 2005

H/ACA small nucleolar ribonucleoprotein particles (snoRNPs) are essential for the maturation andpseudouridylation of the precursor of rRNAs and other stable RNAs. Although the RNA and protein compo-nents of these RNPs have been identified, the mechanisms by which they are assembled in vivo are poorlyunderstood. Here we show that the RNA binding protein Naf1p, which is required for H/ACA snoRNPsstability, associates with RNA polymerase II-associated proteins Spt16p, Tfg1p, and Sub1p and with H/ACAsnoRNP proteins. Chromatin immunoprecipitation experiments show that Naf1p and the pseudouridylsyn-thetase Cbf5p cross-link specifically with the chromatin of H/ACA small nucleolar RNA (snoRNA) genes.Naf1p and Cbf5p cross-link predominantly with the 3� end of these genes, in a pattern similar to that observedfor transcription elongation factor Spt16p. Cross-linking of Naf1p to H/ACA snoRNA genes requires activetranscription and intact H/ACA snoRNA sequences but does not require the RNA polymerase II CTD kinaseCtk1p. These results suggest that Naf1p and Cbf5p are recruited in a cotranscriptional manner during H/ACAsnoRNP assembly, possibly by binding to the nascent H/ACA snoRNA transcript during elongation or termi-nation of transcription of H/ACA snoRNA genes.

Small nucleolar ribonucleoprotein particles (snoRNPs) haveessential functions in many gene expression pathways. Most ofthese particles are required either for rRNA processing or forsite-specific modification of nucleotides of the 35S pre-rRNAprecursor and of other noncoding RNAs (4, 9, 27). A fewsnoRNPs are necessary for cleavage of the 35S, but the ma-jority of them guide modifications of the bases or of the sugarphosphate backbone within the 35S (49). snoRNPs are madeof the association of a small nucleolar RNA (snoRNA) withseveral snoRNP proteins. These particles are classified intotwo major structural families, according to the specific RNAmotifs present in the snoRNA. These two families of snoRNPsperform different cellular functions. Box C/D motifs arepresent in snoRNAs that guide the methylation of the 2�-hydroxyl groups of the ribose moiety of some nucleotides in the35S rRNA precursor (20). The box H and ACA motifs arefound in snoRNAs that guide the pseudouridylation of nucle-otides of the rRNA precursor or of other transcripts and inother stable RNAs such as the RNA component of vertebratetelomerase (20).

Box H/ACA snoRNPs contain four core proteins, Gar1p,Nhp2p, Nop10p, and Cbf5p, which is likely to be responsiblefor the pseudouridylsynthetase catalytic activity (4, 6, 18, 34).These proteins are strongly conserved from yeast to mammals(12) and have the same names, with the exception of rat Nap57and human dyskerin, which are the mammalian homologues of

Cbf5p (37). Dyskerin has been the focus of intense geneticinvestigation, as mutations in the human gene encoding thisprotein have been linked to dyskeratosis congenita, an X-linked genetic disease with a predisposition to gastrointestinalcancers (16, 38, 39, 45).

The biogenesis of box H/ACA snoRNPs begins with thetranscription and processing of the H/ACA snoRNAs. Mostyeast H/ACA snoRNAs are generated from independent tran-scription units, while metazoan H/ACA snoRNAs are presentwithin the introns of mRNA genes and are processed from theexcised introns after splicing (5, 28, 29). Most independentlytranscribed yeast box H/ACA snoRNAs are processed at the 3�end by a complex that includes the Nrd1p and Sen1p proteins,presumably associated with RNA polymerase II (46). Thepackaging of box H/ACA snoRNAs into snoRNPs possiblyoccurs at an early stage of biogenesis, since 5�-unprocessedsnoRNA precursors accumulation requires the presence of boxH/ACA snoRNP proteins (18). However, it is not known whenthese proteins bind to the RNA during the biogenesis process.After or during the course of their maturation, the snoRNAsare targeted to the Cajal bodies, also named coiled bodies,where it is thought that some of the snoRNP assembly pro-cesses will occur (reviewed in reference 14). snoRNPs are thentargeted to the nucleolus to function in rRNA processingand/or modification. Some RNPs remain in the Cajal bodies toguide the modifications of small nuclear RNAs (24, 43).

In an effort to understand the biogenesis pathway of boxH/ACA snoRNPs, several studies have investigated the recon-stitution of these particles in vitro or the RNA binding prop-erties of their constituent proteins (12, 17, 19, 50). These stud-ies have partially identified the RNA motifs and protein

* Corresponding author. Mailing address: Department of Chemistryand Biochemistry and Molecular Biology Institute, UCLA, Box951569, Los Angeles, CA 90095-1569. Phone: (310) 825-4399. Fax:(310) 206-4038. E-mail: [email protected].

3295

Page 192: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

domains or amino acids required for the association of thesnoRNP proteins with the box H/ACA snoRNAs in vitro.However, little is known about the process by which the RNAand the protein components become assembled into maturesnoRNPs in vivo. While reconstitution assays provide valuabletools to understand the molecular details of RNA-protein andprotein-protein interactions, these studies do not provide anunderstanding of the dynamics of the association betweenRNA and proteins in vivo in the context of other cellularprocesses such as transcription and nuclear import and export.

Some trans-acting factors have been identified as putativeH/ACA snoRNP assembly factors in vivo. A predicted RNAhelicase was identified as important for biogenesis of both boxC/D and H/ACA yeast snoRNAs (26). The Naf1p and Shq1pproteins have been suggested to function as yeast H/ACAsnoRNP assembly factors (11, 13, 51). These essential proteinsare connected to H/ACA snoRNP proteins Nhp2p and Cbf5pby a network of interactions on the basis of genomic two-hybridstudies (23) and proteomics studies, which showed that bothNaf1p and Shq1p copurify with overexpressed Flag-taggedCbf5p (22). Depletion of Naf1p or Shq1p leads to the desta-bilization of all H/ACA snoRNAs, and the absence of Naf1palso results in the depletion of some of the H/ACA snoRNPproteins, including Cbf5p (11, 13, 51). Shq1p and Naf1p arenot integral components of mature box H/ACA snoRNPs,even though Naf1p shows a weak association with matureH/ACA snoRNAs in vivo (11, 13, 51). Shq1p and Naf1p arenucleoplasmic proteins (51), with Naf1p showing a minor nu-cleolar localization (11). Sequence analysis of Naf1p yielded afew clues regarding its potential functions. Naf1p contains aputative RNA binding domain (RBD) similar to that of the boxH/ACA snoRNP protein Gar1p (3) and several regions ofhomology with the snoRNA 3�-processing factor–terminationfactor Nrd1p (46). Consistent with the presence of the RBD,Naf1p displays RNA binding activity in vitro (13). This activityis somehow specific to H/ACA snoRNAs; although Naf1pbinds to a variety of RNA molecules in vitro, Naf1p-H/ACARNA complexes cannot be competed away by U6 snRNA orother, unrelated molecules (13; C. Hoareau and Y. Henry,unpublished data). Naf1p is linked to the polymerase II tran-scriptional machinery, as shown by an interaction with thecarboxy-terminal domain of RNA polymerase II (CTD) bytwo-hybrid analysis and in vitro pull-down experiments fromyeast extracts (13). Interestingly, the in vitro interaction be-tween Naf1p and the CTD is observed when the CTD has beenphosphorylated (13). Both Shq1p and Naf1p have putativeorthologs in higher eukaryotes (11, 13, 51), suggesting thattheir function might be conserved across eukaryotes. Despitethese observations, the precise function of Naf1p and Shq1p inthe biogenesis process of H/ACA snoRNPs is unknown. In thisstudy, we have investigated the role of Naf1p in H/ACAsnoRNP assembly in vivo. We found that Naf1p interacts withRNA polymerase II components and with snoRNP proteinsand that it associates specifically with H/ACA snoRNA genes.The pseudouridylsynthetase Cbf5p is also found associatedwith H/ACA snoRNA genes. Our results suggest a functionalmodel of snoRNP assembly in which the early stages of assem-bly are cotranscriptional and begin with the recruitment ofCbf5p and RNA binding protein Naf1p by the snoRNA sub-strate.

MATERIALS AND METHODS

Yeast strains. Tandem affinity purification (TAP)-tagged strains were pur-chased from Open Biosystems or constructed by homologous recombination(44). All of the strains used for chromatin immunoprecipitation (ChIP) experi-ments were TAP tagged at the C terminus of the corresponding proteins, exceptfor Nhp2p, for which an Nhp2p-ZZ-tagged strain was used (17). The ctk1� strainwas purchased from Open Biosystems, and a TAP tag was introduced into thisstrain as previously described (44). Insertion of a galactose-driven promoter infront of the SNR32 snoRNA sequence was performed by homologous recombi-nation with the cassette described in reference 35. Deletion of the SNR44sequence within the chromosomal RPS22B gene in the Naf1-TAP-tagged strainwas performed by a two-step homologous recombination method known as thedelitto perfetto method (47).

TAP tag purification. Naf1p-TAP and associated proteins were purified fromextracts prepared from 4 liters of yeast cells grown in YPD medium (1% yeastextract, 1% peptone, 2% glucose) to an optical density at 600 nm of 0.6. Cellsfrozen in liquid nitrogen were broken with dry ice in a kitchen blender (Oster-izer). The broken cell powder was resuspended in 10 ml of A200 buffer (20 mMTris-HCl [pH 8.0], 5 mM MgCl2, 0.2% Triton X-100, 200 mM KCl, 1 mMdithiothreitol) containing 0.5 U of RNasin (Promega) per �l and protease andphosphatase inhibitors. Extracts were clarified by centrifugation in a BeckmanTi-50.2 rotor at 4°C for 15 min at 25,000 rpm. The supernatant was mixed for 2 hat 4°C on a shaking table with 200 �l of immunoglobulin G (IgG)-Sepharosebeads (Pharmacia) previously equilibrated with A200 buffer. After binding, IgG-Sepharose beads were washed with 80 ml of A200 buffer, followed by 30 ml ofTEV protease cleavage buffer (10 mM Tris-HCl [pH 8.0], 1 mM dithiothreitol,0.1% NP-40, 150 mM NaCl, 0.5 mM EDTA). The beads were then incubated for2 h at 16°C with 100 U of TEV protease (Invitrogen) in 1 ml of TEV cleavagebuffer. Eluted material was mixed with 6 �l of 1 M CaCl2, 1.2 �l of 1 M Mgacetate (MgAc), and 1.2 �l of 1 M imidazole and incubated for 1 h at 4°C with200 �l of calmodulin beads (Pharmacia) previously equilibrated with calmodulinbinding buffer (10 mM Tris-HCl [pH 8.0], 10 mM �-mercaptoethanol, 0.1%NP-40, 150 mM NaCl, 1 mM MgAc, 2 mM CaCl2, 1 mM imidazole). The beadswere then washed with 40 ml of calmodulin binding buffer. The purified proteincomplexes were eluted from the calmodulin beads with six 200-�l aliquots ofcalmodulin elution buffer (10 mM Tris-HCl [pH 8.0], 0.1% NP-40, 150 mMNaCl, 1 mM MgAc, 2 mM EGTA, 1 mM imidazole). The eluted proteins wereprecipitated with trichloroacetic acid, separated by sodium dodecyl sulfate(SDS)-polyacrylamide gel electrophoresis, and identified by mass spectrometryas previously described (10).

ChIPs. ChIPs were performed as previously described (31), with minor mod-ifications. The buffers used are described in reference 31. A 100-ml volume ofcells was grown to an optical density of 0.4 to 0.5. Formaldehyde was added to afinal concentration of 1%, and cells were cross-linked for 20 min at 25°C withshaking. The cross-linking reaction was quenched with glycine for 5 min at 25°C.Cells were then washed twice with Tris-buffered saline and once with FA150 lysisbuffer. Cell extract was prepared by breaking the cells with glass beads in lysisbuffer for 40 min. Extract was collected and centrifuged at 200,000 � g with aBeckman SW50.1 rotor. The pellet was resuspended in 800 �l of lysis buffer andsonicated to obtain DNA fragments of around 100 to 1,000 bp as analyzed withethidium-stained agarose gel. Immunoprecipitation of TAP-tagged or ZZ-taggedprotein was done overnight at 4°C with IgG beads. The reverse cross-linkingprocedure was carried out at 65°C overnight. Isolation of chromatin was done byphenol-chloroform extraction and ethanol precipitation. A list of the primersused for snoRNA gene amplification is available upon request. For each ChIPexperiment, PCR samples were taken at various cycles from the input extracts orthe immunoprecipitates to ensure that PCR samples were in the linear range.32P-labeled PCR products were loaded onto acrylamide gels, and the productswere quantitated with a PhosphorImager.

RESULTS

H/ACA snoRNP proteins and RNA polymerase II-associatedproteins copurify with Naf1p. To gain further insights into thefunctions of Naf1p in box H/ACA snoRNP biogenesis, wepurified Naf1p from whole-cell extracts by the TAP method(44). Extracts were prepared from a yeast strain expressingNaf1p-TAP from the endogenous locus. Naf1p-TAP and asso-ciated proteins were purified, fractionated by SDS-polyacryl-amide gel electrophoresis, and stained with Coomassie blue

3296 YANG ET AL. MOL. CELL. BIOL.

Page 193: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

(Fig. 1). Proteins present in stained bands were then identifiedby mass spectrometry (Fig. 1). The predominant bands ob-served on this gel contained Naf1p (Fig. 1, band 8) and adegradation product of Naf1p (contained in band 9). Severalminor bands correspond to factors very frequently found inlarge-scale TAPs, such as ribosomal proteins, protein chaper-ones, and translation factors (14a). Hence, their detection maynot reflect a specific association with Naf1p. More interest-ingly, we identified all four H/ACA snoRNP proteins in thepurified fractions, as well as several components of preriboso-mal particles. Cbf5p, the H/ACA snoRNP pseudouridylsyn-thetase, was identified in band 9 in a mixture with degradationproducts of Naf1p. While previous results suggest that Naf1pand Shq1p interact in vivo (23, 51), we did not find Shq1p inthe Naf1p purification result. This negative result may be dueto a lack of detection of Shq1p by mass spectrometry or to thefact that the Naf1p-Shq1p interaction may not resist the TAPtag purification procedure. To our surprise, three RNA poly-merase II-associated proteins were also found in the purifiedfractions, namely, Spt16p, Sub1p, and Tfg1p. Unlike many ofthe less abundant proteins pulled down with Naf1p-TAP,Spt16p, Sub1p, and Tfg1p do not feature among the frequentlyobserved “contaminant” proteins in large-scale TAP experi-ments. Spt16p is part of the yeast homologue of the humanFACT complex and is important for linking transcriptionalinitiation to elongation (25, 32, 36). The Sub1p protein hasbeen involved in linking transcription initiation, 3�-end pro-cessing, and termination (2, 7, 15, 30). Tfg1p is part of thegeneral transcription factor TFIIF, which is involved in tran-scriptional initiation and elongation (32, 48). The associationof Naf1p and H/ACA snoRNP-related proteins with the RNApolymerase II machinery, while surprising, is in agreement withrecent observations linking Cbf5p and the transcriptional ma-

chinery. Cbf5p was found associated with Rtf1p, a member ofthe Paf1 complex involved in transcriptional elongation, whichitself interacts with Spt16p (33). Furthermore, Cbf5p was re-cently shown to interact with the phosphorylated RNA poly-merase II CTD (42). It is possible that the interaction amongNaf1p, Cbf5p, and these transcription factors detected by ourTAP tag purification is indirect, through multiple protein com-plexes. However, our proteomic approach reveals that H/ACAsnoRNP proteins copurify with Naf1p and, taken together withrecent results from other studies, suggest functional linksamong Naf1p, Cbf5p, and the actively transcribed chromatin.

Naf1p and Cbf5p cross-link specifically with H/ACAsnoRNA genes. The copurification of RNA polymerase II fac-tors with Naf1p and the requirement of Naf1p for the stabilityof H/ACA snoRNAs suggested that Naf1p might be associatedwith transcriptional complexes at H/ACA snoRNA genes. Thishypothesis is consistent with previous results suggesting anassociation between Naf1p and the phosphorylated CTD ofRNA polymerase II (13). The association of Cbf5p with thephosphorylated polymerase II CTD (42) and its associationwith the Paf1 complex (33) also suggested a link betweenCbf5p and the actively transcribed chromatin at H/ACAsnoRNA genes. To test whether Naf1p and/or Cbf5p are as-sociated with the chromatin of snoRNA genes, we performedChIP with Naf1-TAP- or Cbf5-TAP-tagged strains and testedthe association of Naf1p and Cbf5p with various regions of anH/ACA snoRNA gene, SNR32. The sequence encoding theTAP tags is present at the 3� ends of the chromosomal lociencoding these proteins. Therefore, the genes coding for theseproteins are expressed from their natural promoters in a nor-mal chromosomal context. ChIP, followed by PCR amplifica-tion, showed that Naf1p and Cbf5p are enriched at the chro-matin of the snR32 gene (Fig. 2A and B). This association isspecific, as it was not observed with the untagged strain. Sur-prisingly, Naf1p and Cbf5p cross-linked more efficiently to themiddle and downstream regions of the SNR32 gene (Fig. 2,regions B and C) than to the promoter region (Fig. 2, regionA). This result suggests that Naf1p and Cbf5p associate withthe SNR32 gene during or immediately after transcriptionelongation rather than during transcription initiation. We per-formed similar ChIP experiments with the other core boxH/ACA snoRNP proteins Gar1p, Nhp2p, and Nop10p; theH/ACA assembly factor Shq1p; and the three proteins identi-fied by our TAP tag purification, Spt16p, Tfg1p, and Sub1p. Incontrast to Naf1p and Cbf5p, Shq1p does not show a significantassociation with SNR32. Thus, it is likely that the describedinteraction between Naf1p and Shq1p does not occur whenNaf1p is associated with the chromatin. Gar1p, Nhp2p, andNop10p showed a weak association with this locus, only two-fold above the background. Given the low enrichment ob-served for these proteins, we do not know whether they aresignificantly present at the chromatin of the SNR32 gene. Thislow enrichment cannot be attributed to inefficient immunopre-cipitation of the corresponding proteins, as we consistentlyobserved immunoprecipitation efficiencies for these proteinscomparable to or better than the efficiency observed for Cbf5p(data not shown). We note, however, that the same gradient ofassociation toward the 3� end of the gene can be observed forthe core snoRNP proteins. Spt16p was highly enrichedthroughout the SNR32 gene, while Sub1p and Tfg1p showed a

FIG. 1. Copurification of Naf1p with H/ACA snoRNP proteins andRNA polymerase II-associated proteins. Shown is a Coomassie-stainedSDS gel obtained after two-step TAP tag purification from a Naf1-TAP-tagged strain or from an untagged strain. Proteins identified bymass spectrometry are indicated. Also shown are the eluate obtainedfrom an untagged strain and mass markers.

VOL. 25, 2005 COTRANSCRIPTIONAL RECRUITMENT OF Cbf5p AND Naf1p 3297

Page 194: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

higher enrichment toward the promoter regions (probe A).The enrichment profile observed for these proteins in variousregions of the SNR32 H/ACA snoRNA gene is consistent withpreviously published studies on mRNA genes (15, 25, 32).

To ensure that the association of Naf1p and Cbf5p with thechromatin is not restricted to the SNR32 snoRNA gene, we

performed ChIP experiments and probed for the presence ofNaf1p, Cbf5p, Nhp2p, Nop10p, Gar1p, Shq1p, Spt16p, Tfg1p,and Sub1p on four additional H/ACA snoRNA genes, SNR3,SNR30, SNR37, and SNR42 (Fig. 3). To control for the spec-ificity of the association of Naf1p and Cbf5p with H/ACAsnoRNA genes, we also investigated the presence of these

FIG. 2. Naf1p, Cbf5p, and transcription factors Spt16p, Sub1p, and Tfg1p cross-link in vivo with SNR32, a box H/ACA snoRNA gene.(A) Schematic diagram of box H/ACA snoRNA gene SNR32 and ChIP analysis of Untagged (a wild-type strain with no tagged proteins; UT);H/ACA-related proteins Shq1p, Naf1p, Cbf5p, Nhp2p, Gar1p, and Nop10p; and the transcription factors Spt16p, Sub1p, and Tfg1p on the SNR32gene. The mature sequence of the gene is represented by a gray box. Bars above the gene show the positions of the PCR products used in the ChIPexperiments. Numbers above the bars indicate the exact positions of the PCR products relative to the mature sequence of the snoRNA gene. Thelower part of the panel represents PCR products obtained from the precipitated chromatins, while the upper part of the panel represents the PCRproducts obtained from the total input chromatin prior to precipitation. The upper band in each lane is the PCR product for SNR32, with thepositions of the amplified region indicated by letters corresponding to those in the diagram at the top. The lower band (marked by an asterisk)is the PCR product for a telomeric (nontranscribed) region that acts as a negative control for the background. IP, immunoprecipitation.(B) Quantification of the ChIP experiments for SNR32. The y axis represents the level of enrichment for each region of the SNR32 gene for eachprotein and relative to the telomeric region. A ratio of 1 indicates the signal for background association observed in the untagged strain. The levelof enrichment of Naf1, Cbf5, Nhp2, Gar1, and Nop10 to various regions of SNR32 is the average of three independent experiments. The level ofenrichment of Spt16, Sub1p, and Tfg1 is the average of two independent experiments.

3298 YANG ET AL. MOL. CELL. BIOL.

Page 195: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIG. 3. Naf1p and Cbf5p cross-link to the chromatin of H/ACA snoRNA genes and are enriched in their 3� regions. Shown are quantificationsof the ChIP results obtained with H/ACA snoRNA genes. On the left side are schematic diagrams of the box H/ACA snoRNA gene analyzed, withthe bars (lettered A, B, and C) above the gene indicating the regions chosen for PCR amplification. On the right is the quantification of the ChIPresults for each protein in various regions of each gene. The level of enrichment of Naf1p, Cbf5p, Nhp2p, Gar1p, and Nop10p is the average ofthree independent experiments. The level of enrichment of Spt16p, Sub1p, and Tfg1p is the average of two independent experiments. UT,untagged.

VOL. 25, 2005 COTRANSCRIPTIONAL RECRUITMENT OF Cbf5p AND Naf1p 3299

Page 196: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

proteins at the chromatin of four box C/D snoRNA genes,SNR39, SNR45, SNR50, and SNR63 (Fig. 4). Because of spacelimitation, only the quantifications of the ChIP assays areshown. These experiments revealed that Naf1p and Cbf5p are

present in the vicinity of all of the H/ACA snoRNA genestested and that the same gradient of enrichment can be ob-served toward the 3� end of all H/ACA snoRNA genes. Incontrast, no strong enrichment was observed for most of thebox C/D snoRNA genes tested (Fig. 4). A slightly higher en-richment was observed for SNR39 (Fig. 4), but for most C/DsnoRNA genes, the enrichments observed were close to back-ground levels, suggesting that Naf1p and Cbf5p associate spe-cifically with H/ACA snoRNA genes. As observed previouslyfor the SNR32 gene, Nhp2p, Gar1p, and Nop10p showed onlymarginal or no enrichment, which could not be attributed to alow immunoprecipitation efficiency (see above). In contrast,Spt16p, Tfg1p, and Sub1p were found associated with all of theH/ACA and C/D snoRNA genes tested (Fig. 3 and 4). Spt16pwas found sometimes enriched toward the 3� end (SNR37,SNR42), in a pattern similar to that of Naf1p and Cbf5p, whileSub1p and Tfg1p were predominantly associated with the pro-moter regions. The pattern of cross-linking of these RNApolymerase II-associated proteins with both types of snoRNAgenes is consistent with previously published ChIP profiles formRNA genes and supports a general role for these factors inRNA polymerase II transcription. Overall, these results dem-onstrate that Naf1p and the H/ACA pseudouridylsynthetaseCbf5p are present near the chromatin of box H/ACA snoRNAgenes, particularly at the 3� end. This suggests that the assem-bly of the snoRNP begins during transcription elongation ortranscription termination of the snoRNA genes.

Cross-linking of Naf1p to the chromatin of H/ACA snoRNAgenes requires active transcription but is independent ofCtk1p. To test whether transcription is required for Naf1passociation with H/ACA snoRNA genes, we replaced the en-dogenous SNR32 gene promoter with a galactose-induciblepromoter (GAL::SNR32) by homologous recombination (35).We then tested the association of Naf1p with the SNR32 geneby ChIP in the GAL::SNR32/NAF1-TAP strain. ChIP experi-ments were performed on this strain grown in the presence ofgalactose, when transcription of SNR32 is active, and thenshifted to a medium containing glucose to repress transcriptionof the SNR32 gene. The same experiment was performed in thecontext of the SNR32 endogenous promoter (SNR32 on Fig.5A) in order to monitor the effects of the carbon source on theassociation of Naf1p with the normal gene. This experimentshowed that the association of Naf1p with the GAL::SNR32gene was reduced to background levels when the cells wereshifted from galactose to glucose (Fig. 5A), indicating thattranscription is required for Naf1p recruitment. We also notethat the association of Naf1p with box H/ACA snoRNA genes(SNR3 and SNR32) under the control of their natural promot-ers is weaker in the presence of galactose than in the presenceof glucose. This suggests that H/ACA snoRNA genes are moreactively transcribed in glucose than in galactose and that thelevel of association of Naf1p as monitored by ChIP reflects thelevels of transcription. Overall, these experiments demonstratethat the association of Naf1p with the H/ACA snoRNA genesrequires active transcription.

Previous reports have shown that Naf1p associates prefer-entially with the phosphorylated CTD in vitro (13), suggestingthat Naf1p may associate with the phosphorylated CTD invivo. Ctk1p is the protein kinase involved in phosphorylatingthe C-terminal domain of RNA polymerase II at serine 2 of the

FIG. 4. Naf1p and Cbf5p do not cross-link to the chromatin of C/DsnoRNA genes. Shown are quantifications of the ChIP of C/DsnoRNA genes and the schematic diagram of each box C/D snoRNAgene with the various regions tested by ChIP. The number of inde-pendent experiments is the same as in Fig. 3. UT, untagged.

3300 YANG ET AL. MOL. CELL. BIOL.

Page 197: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

CTD repeats, and this phosphorylation event is a hallmark oflate transcriptional elongation (31). The requirement for activetranscription and the gradient of association of Naf1p with thedownstream regions of H/ACA snoRNA genes suggested thatNaf1p associates with H/ACA snoRNA genes in the context ofthe elongating RNA polymerase. To investigate if Naf1p asso-ciation with H/ACA snoRNA genes requires phosphorylationof the CTD at serine 2, we performed ChIP experiments onNaf1p in a ctk1� strain. Deletion of the gene encoding Ctk1p

has been shown to abolish recruitment of mRNA 3�-end pro-cessing factors (1). If Naf1p associates with the phosphorylatedCTD during transcriptional elongation similarly to mRNA 3�-end processing factors, one might expect that depletion ofCtk1p would inhibit recruitment of Naf1p. ChIP experimentsin a ctk1� deletion background showed that Ctk1p is not re-quired for Naf1p association with H/ACA snoRNA genes (Fig.5B), suggesting that phosphorylation of the CTD at serine 2 isnot a prerequisite for association of Naf1p. This result is rem-iniscent of data obtained with some RNA polymerase II elon-gation factors, in particular Spt16p, which are not dependentupon Ctk1p for their association with the chromatin of mRNAgenes (1).

Association of Naf1p with box H/ACA snoRNA genes re-quires an intact H/ACA snoRNA sequence. The previous re-sults showed that transcription is required for association ofNaf1p with the H/ACA snoRNA genes. This requirementcould be explained either by the recruitment of Naf1p to thetranscribed snoRNA genes through an interaction with thetranscribing RNA polymerase II machinery or by a recruitmentof Naf1p through a direct interaction with the nascent H/ACAsnoRNA transcript. The former hypothesis is consistent withthe interaction between Naf1p and the CTD of RNA polymer-ase II observed in vivo by two-hybrid analysis and in vitro byglutathione S-transferase pull-down assays (13). It is also con-sistent with the observed copurification of Spt16p with Naf1p(Fig. 1). The latter model is consistent with the RNA bindingproperties of Naf1p (13). If Naf1p was recruited by the RNAtranscript, one would expect that deletion of the H/ACAsnoRNA sequence would inhibit the recruitment of Naf1p tothe chromatin. However, such an experiment is problematic. Inthe case of independently transcribed snoRNA genes, deletionof the H/ACA snoRNA sequence would result in the deletionof almost the entire transcription unit, prohibiting any conclu-sion with respect to the role of the RNA. To circumvent thisproblem, we decided to investigate the association of Naf1pwith the gene encoding the snR44 H/ACA snoRNA. In con-trast to independently transcribed snoRNAs, snR44 is encodedwithin the second intron of the RPS22B gene (Fig. 6A) (8).Therefore, deletion of the snR44 snoRNA sequence in theRPS22B long transcription unit is not expected to affect tran-scription. We deleted the SNR44 sequence from the chromo-somal RPS22B locus in the Naf1-TAP-tagged strain by delittoperfetto (Fig. 6A) (47). Northern analysis showed that thesteady-state levels of the RPS22B mRNA were similar in awild-type strain and in the snr44 deletion strains (data notshown), suggesting that deletion of the SNR44 sequence doesnot perturb the levels of transcription of the RPS22B gene. Wethen investigated the association of Naf1p with the RPS22Btranscription unit by ChIP in strains containing the normalRPS22B gene or containing the RPS22B gene lacking theSNR44 intronic snoRNA sequence (�44). This experimentshowed that Naf1p is associated with the chromatin of theRPS22B wild-type gene and that a 5� 3 3� gradient of enrich-ment can be observed, with the strongest enrichment observedimmediately after the SNR44 snoRNA sequence (Fig. 6B).This cross-linking profile is consistent with the results that weobtained for independently transcribed snoRNA genes (Fig. 2and 3). This result shows that Naf1p associates with H/ACAsnoRNA genes, regardless of whether the snoRNAs are inde-

FIG. 5. Cross-linking of Naf1p to H/ACA snoRNA genes requiresactive transcription but does not require the CTD kinase Ctk1p.(A) Quantification of the ChIP results upon transcriptional repressionof the SNR32 gene. Expression of SNR32 was placed under the controlof a galactose-inducible promoter (Gal promoter) 30 bp upstream ofthe mature sequence, as indicated in the schematic diagram. Naf1p-TAP SNR32 (SNR32 under the control of it endogenous promoter),and Naf1p-TAP GAL::SNR32 strains were grown in galactose-contain-ing medium (Gal) and then shifted to glucose-containing medium(Glu). For Naf1p-TAP SNR32, ChIP experiments were done with cellsgrown in galactose-containing medium 6 h after a shift to glucose-containing medium. For Naf1p-TAP GAL::SNR32, ChIP experimentswere done with cells grown in galactose-containing medium and cellsshifted to glucose-containing medium for 2 and 6 h. The left bar graphindicates the enrichment level of Naf1p for the SNR32 gene in the twostrains in various media. The right bar graph indicates the enrichmentlevel of Naf1p for the SNR3 gene, which is under the control of itsendogenous promoter. (B) Quantification of the ChIP results ofNaf1p-TAP strains containing (CTK1) or lacking (ctk1�) Ctk1p. Thegraph indicates the level of enrichment for various regions of three boxH/ACA snoRNA genes, SNR3, SNR30, and SNR32.

VOL. 25, 2005 COTRANSCRIPTIONAL RECRUITMENT OF Cbf5p AND Naf1p 3301

Page 198: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

pendently transcribed or intron encoded. In contrast, the cross-linking of Naf1p with the RPS22B gene was reduced to back-ground levels when the SNR44 sequence was deleted (Fig. 6B).This result strongly suggests that the binding of the RNA byNaf1p mediates the association of Naf1p with the chromatin ofH/ACA snoRNA genes and that the H/ACA RNA plays amajor role in the cotranscriptional recruitment of Naf1p. Tofurther investigate this finding, we performed ChIP assays andtreated the extract after cross-linking but prior to immunopre-cipitation with RNase A. RNase treatment had no effect onNaf1p association with H/ACA snoRNA genes (data notshown). However, this negative result does not show that thesnoRNAs are not responsible for the recruitment of Naf1p.

Formaldehyde addition results in the formation of protein-protein and protein-DNA cross-links. Therefore, recruitmentof Naf1p to the chromatin by the nascent snoRNAs couldresult in covalent cross-linking of Naf1p to chromatin proteinsand to the DNA that cannot be removed by RNase treatment.

DISCUSSION

In this study, we have shown that Naf1p and the H/ACAsnoRNP pseudouridylsynthetase Cbf5p can be cross-linked tothe 3� region of H/ACA snoRNA genes (Fig. 2 and 3). More-over, H/ACA snoRNP proteins and the RNA polymerase IIfactors Spt16p, Tfg1p, and Sub1p copurify with Naf1p (Fig. 1).These data support a model of cotranscriptional assembly ofH/ACA snoRNPs. Given the ChIP data obtained for Cbf5pand the interaction between Naf1p and Cbf5p, Naf1p may beresponsible for recruiting Cbf5p to the vicinity of the nascentH/ACA snoRNA transcripts. We could not test a direct rolefor Naf1p in Cbf5p recruitment to the chromatin, since deple-tion of Naf1p results in codepletion of Cbf5p (11). Alterna-tively, interaction of Cbf5p with the Paf1 complex (33) or withthe phosphorylated RNA polymerase II CTD (42) may beresponsible for recruiting Cbf5p. Whatever the details of themechanisms of the recruitment of Cbf5p, the results obtainedin this study are consistent with a model in which the nascentRNA is bound by Naf1p and Cbf5p. We were unable to deter-mine the exact sequence of the interactions among Naf1p,Cbf5p, and the nascent snoRNA. Naf1p could interact withCbf5p before interacting with the nascent snoRNA or alterna-tively bind the nascent RNA and then recruit Cbf5p. Directbinding of the nascent snoRNA by Naf1p is consistent with theRNA binding properties of Naf1p (13) and with the resultsshowing that deletion of the snR44 snoRNA sequence in theRPS22B transcription unit abolishes Naf1p recruitment (Fig.6). The association of Naf1p and RNA polymerase II-associ-ated proteins, in particular Spt16p, could be due to the bindingof Naf1p to the nascent transcript in the context of the elon-gating RNA polymerase. In this respect, it is worth noting thatthe ChIP profile of Spt16p on H/ACA snoRNA genes is some-times similar to those of Naf1p and Cbf5p (Fig. 2 and 3).Binding of Cbf5p to the nascent RNA, possibly recruited byNaf1p, would nucleate the assembly of the snoRNP. Binding ofthe other H/ACA snoRNP proteins may occur at a later stage,as the chromatin enrichment observed for these proteins isoften marginal. However, it is also possible that some of theseproteins join Cbf5p early during transcriptional elongation butthat the epitopes used for the ChIP assays for these otherproteins are masked when the proteins are cross-linked to thechromatin, resulting in only marginal enrichment. The gradientof enrichment observed for these proteins is consistent withearly recruitment, but in the absence of higher values, it isimpossible for us to draw conclusions about their actual pres-ence at the chromatin of H/ACA snoRNA genes.

The enrichment profiles of Naf1p and Cbf5p for H/ACAsnoRNA genes show a strong cross-linking gradient toward the3� ends of these genes. This suggests that Naf1p and Cbf5p arerecruited only when most of the transcript has been produced,possibly during the late stages of transcription elongation ortranscription termination. Because of the low resolution of theChIP technique, it is impossible to tell whether the gradient of

FIG. 6. Cross-linking of Naf1p to the SNR44 H/ACA snoRNAgene requires an intact H/ACA snoRNA sequence. (A) Genomic or-ganization of the chromosomal RPS22B gene and of the RPS22B genelacking the SNR44 sequence. Also shown are the PCR products cor-responding to the primer pairs used in the ChIP assays. (B) Quantifi-cation of the ChIP results for Naf1p on the RPS22B transcription unit.ChIP experiments were carried out with strains with the RPS22B genecontaining or lacking the SNR44 sequence. Various regions ofRPS22B, shown as bars (lettered A, B, C or C�, and D) above the genediagram, were analyzed by ChIP for Untagged (UT), Naf1p-TAP, orNaf1p-TAP with or without SNR44 (Naf1p-TAP/�44). Region C� pro-duces a PCR product that starts 69 bp upstream and ends 104 bpdownstream of the mature SNR44 sequence. The levels of enrichmentof Naf1p-TAP and Naf1p-TAP/�44 to various regions of the gene arederived from three independent experiments.

3302 YANG ET AL. MOL. CELL. BIOL.

Page 199: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

enrichment observed toward the 3� ends of the genes is repre-sentative of progressive loading of the Naf1p and Cbf5p pro-teins during elongation or whether loading of Naf1p and Cbf5poccurs only at the very termini of the snoRNA genes.

Recent results have shown that mammalian and yeastH/ACA snoRNP proteins can form a stable complex in theabsence of a snoRNA (19, 50). These results have suggestedthat a preformed cytoplasmic snoRNP protein complex di-rectly binds the snoRNAs. The results presented here showthat yeast H/ACA snoRNP assembly occurs cotranscriptionallyand that at least one of the H/ACA core snoRNP proteins,Cbf5p, associates with the H/ACA snoRNA gene during tran-scription elongation or termination. We do not know whetherthis mode of assembly is also conserved in the case of mam-malian H/ACA snoRNPs. Although their protein componentsare conserved, the mechanisms of snoRNP assembly may differsignificantly between yeast and metazoan cells, consistent witha difference in their modes of expression. While most yeastH/ACA snoRNAs are independently transcribed, mammaliansnoRNAs are generated from excised lariat introns by de-branching and exonucleolytic digestion or by endonucleolyticcleavage. While we detected significant enrichment of Naf1p inthe vicinity of an intronic yeast snoRNA sequence (Fig. 5), thebinding of biogenesis factors and/or mammalian H/ACAsnoRNP proteins may occur only after some of the splicingsteps have occurred, and not necessarily in a cotranscriptionalmanner. This hypothesis is supported by the observation thatbinding of another class of mammalian C/D snoRNP proteinsto the snoRNA transcript occurs only at a late stage of spli-ceosome assembly (21).

Overall, our results strongly suggest that the yeast H/ACAsnoRNP assembly process begins cotranscriptionally. Previousstudies have demonstrated a functional linkage between tran-scription and yeast C/D snoRNP formation. Mutations in theconserved D box perturb C/D snoRNA gene transcription (40).In addition, the box C/D snoRNP protein Nop1p interacts withthe chromatin of C/D snoRNA genes (40), suggesting thatyeast C/D snoRNP assembly also begins cotranscriptionally. Inthe case of C/D snoRNPs, a good candidate for a factor whoserole is similar to that of Naf1p is Bcd1p, which is not a corecomponent of box C/D snoRNPs, but whose depletion leads toa specific decrease in the levels of yeast C/D snoRNAs (41).Interestingly, Nop1p is thought to carry the methyltransferaseactivity of C/D snoRNPs. Our results obtained with Cbf5p andthose described for Nop1p (40) suggest that the enzyme re-sponsible for the catalytic activity of the snoRNPs is involved inthe earliest steps of snoRNP assembly in vivo. The enzymes arelikely loaded onto the guide RNA cotranscriptionally, with thepossible assistance of assembly factors such as Naf1p. Whetheror not other snoRNP subunits are also assembled at this stageremains to be determined.

ACKNOWLEDGMENTS

We thank A. Henras, D. Robyr, and S. Buratowski for advice onChIP experiments; K. Sakurai for help and support; and A. Henras forcritical reading of the manuscript. We thank Michele Caizergues-Ferrer for fruitful discussion and Christophe Dez for assistance withTAP tag purification.

P.K.Y. was supported by a UCLA dissertation year fellowship, C.H.was supported by a Ph.D. fellowship from the Ministere Delegue a laRecherche et aux Nouvelles Technologies. This research was sup-

ported by NIH grant GM61518 (G.C.); the CNRS, Universite PaulSabatier, and La Ligue Nationale contre le Cancer (Equipe Labelisee)(Y.H.); and the Region Midi-Pyrenees and the Genopole ToulouseMidi-Pyrenees (B.M.).

REFERENCES

1. Ahn, S. H., M. Kim, and S. Buratowski. 2004. Phosphorylation of serine 2within the RNA polymerase II C-terminal domain couples transcription and3� end processing. Mol. Cell 13:67–76.

2. Archambault, J., R. S. Chambers, M. S. Kobor, Y. Ho, M. Cartier, D.Bolotin, B. Andrews, C. M. Kane, and J. Greenblatt. 1997. An essentialcomponent of a C-terminal domain phosphatase that interacts with tran-scription factor IIF in Saccharomyces cerevisiae. Proc. Natl. Acad. Sci. USA94:14300–14305.

3. Bagni, C., and B. Lapeyre. 1998. Gar1p binds to the small nucleolar RNAssnR10 and snR30 in vitro through a nontypical RNA binding element.J. Biol. Chem. 273:10868–10873.

4. Balakin, A. G., L. Smith, and M. J. Fournier. 1996. The RNA world of thenucleolus: two major families of small RNAs defined by different box ele-ments with related functions. Cell 86:823–834.

5. Bortolin, M. L., and T. Kiss. 1998. Human U19 intron-encoded snoRNA isprocessed from a long primary transcript that possesses little potential forprotein coding. RNA 4:445–454.

6. Bousquet-Antonelli, C., Y. Henry, P. G’Elugne, J., M. Caizergues-Ferrer,and T. Kiss. 1997. A small nucleolar RNP protein is required for pseudouri-dylation of eukaryotic ribosomal RNAs. EMBO J. 16:4770–4776.

7. Calvo, O., and J. L. Manley. 2001. Evolutionarily conserved interactionbetween CstF-64 and PC4 links transcription, polyadenylation, and termina-tion. Mol. Cell 7:1013–1023.

8. Danin-Kreiselman, M., C. Y. Lee, and G. Chanfreau. 2003. RNAse III-mediated degradation of unspliced pre-mRNAs and lariat introns. Mol. Cell11:1279–1289.

9. Decatur, W. A., and M. J. Fournier. 2002. rRNA modifications and ribosomefunction. Trends Biochem. Sci. 27:344–351.

10. Dez, C., C. Froment, J. Noaillac-Depeyre, B. Monsarrat, M. Caizergues-Ferrer, and Y. Henry. 2004. Npa1p, a component of very early pre-60Sribosomal particles, associates with a subset of small nucleolar RNPs re-quired for peptidyl transferase center modification. Mol. Cell. Biol. 24:6324–6337.

11. Dez, C., J. Noaillac-Depeyre, M. Caizergues-Ferrer, and Y. Henry. 2002.Naf1p, an essential nucleoplasmic factor specifically required for accumula-tion of box H/ACA small nucleolar RNPs. Mol. Cell. Biol. 22:7053–7065.

12. Dragon, F., V. Pogacic, and W. Filipowicz. 2000. In vitro assembly of humanH/ACA small nucleolar RNPs reveals unique features of U17 and telomer-ase RNAs. Mol. Cell. Biol. 20:3037–3048.

13. Fatica, A., M. Dlakic, and D. Tollervey. 2002. Naf1p is a box H/ACA snoRNPassembly factor. RNA 8:1502–1514.

14. Filipowicz, W., and V. Pogacic. 2002. Biogenesis of small nucleolar ribo-nucleoproteins. Curr. Opin. Cell Biol. 14:319–327.

14a.Gavin, A. C., et al. 2002. Functional organization of the yeast proteome bysystematic analysis of protein complexes. Nature 415:141–187.

15. He, X., A. U. Khan, H. Cheng, D. L. Pappas, Jr., M. Hampsey, and C. L.Moore. 2003. Functional interactions between the transcription and mRNA3� end processing machineries mediated by Ssu72 and Sub1. Genes Dev.17:1030–1042.

16. Heiss, N. S., S. W. Knight, T. J. Vulliamy, S. M. Klauck, S. Wiemann, P. J.Mason, A. Poustka, and I. Dokal. 1998. X-linked dyskeratosis congenita iscaused by mutations in a highly conserved gene with putative nucleolarfunctions. Nat. Genet. 19:32–38.

17. Henras, A., C. Dez, J. Noaillac-Depeyre, Y. Henry, and M. Caizergues-Ferrer. 2001. Accumulation of H/ACA snoRNPs depends on the integrity ofthe conserved central domain of the RNA-binding protein Nhp2p. NucleicAcids Res. 29:2733–2746.

18. Henras, A., Y. Henry, C. Bousquet-Antonelli, J. Noaillac-Depeyre, J. P.Gelugne, and M. Caizergues-Ferrer. 1998. Nhp2p and Nop10p are essentialfor the function of H/ACA snoRNPs. EMBO J. 17:7078–7090.

19. Henras, A. K., R. Capeyrou, Y. Henry, and M. Caizergues-Ferrer. 2004.Cbf5p, the putative pseudouridine synthase of H/ACA-type snoRNPs, canform a complex with Gar1p and Nop10p in absence of Nhp2p and boxH/ACA snoRNAs. RNA 10:1704–1712.

20. Henras, A. K., C. Dez, and Y. Henry. 2004. RNA structure and function inC/D and H/ACA s(no)RNPs. Curr. Opin. Struct. Biol. 14:335–343.

21. Hirose, T., M. D. Shu, and J. A. Steitz. 2003. Splicing-dependent and -inde-pendent modes of assembly for intron-encoded box C/D snoRNPs in mam-malian cells. Mol. Cell 12:113–123.

22. Ho, Y., A. Gruhler, A. Heilbut, G. D. Bader, L. Moore, S. L. Adams, A.Millar, P. Taylor, K. Bennett, K. Boutilier, L. Yang, C. Wolting, I. Donald-son, S. Schandorff, J. Shewnarane, M. Vo, J. Taggart, M. Goudreault, B.Muskat, C. Alfarano, D. Dewar, Z. Lin, K. Michalickova, A. R. Willems, H.Sassi, P. A. Nielsen, K. J. Rasmussen, J. R. Andersen, L. E. Johansen, L. H.Hansen, H. Jespersen, A. Podtelejnikov, E. Nielsen, J. Crawford, V. Poulsen,

VOL. 25, 2005 COTRANSCRIPTIONAL RECRUITMENT OF Cbf5p AND Naf1p 3303

Page 200: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

B. D. Sorensen, J. Matthiesen, R. C. Hendrickson, F. Gleeson, T. Pawson,M. F. Moran, D. Durocher, M. Mann, C. W. Hogue, D. Figeys, and M. Tyers.2002. Systemaitic identification of protein complexes in Saccharomyces cer-evisiae by mass spectrometry. Nature 415:180–183.

23. Ito, T., T. Chiba, R. Ozawa, M. Yoshida, M. Hattori, and Y. Sakaki. 2001. Acomprehensive two-hybrid analysis to explore the yeast protein interactome.Proc. Natl. Acad. Sci. USA 98:4569–4574.

24. Jady, B. E., E. Bertrand, and T. Kiss. 2004. Human telomerase RNA and boxH/ACA scaRNAs share a common Cajal body-specific localization signal.J. Cell Biol. 164:647–652.

25. Kim, M., S. H. Ahn, N. J. Krogan, J. F. Greenblatt, and S. Buratowski. 2004.Transitions in RNA polymerase II elongation complexes at the 3� ends ofgenes. EMBO J. 23:354–364.

26. King, T. H., W. A. Decatur, E. Bertrand, E. S. Maxwell, and M. J. Fournier.2001. A well-connected and conserved nucleoplasmic helicase is required forproduction of box C/D and H/ACA snoRNAs and localization of snoRNPproteins. Mol. Cell. Biol. 21:7731–7746.

27. Kiss, T. 2001. Small nucleolar RNA-guided post-transcriptional modificationof cellular RNAs. EMBO J. 20:3617–3622.

28. Kiss, T., and W. Filipowicz. 1995. Exonucleolytic processing of small nucle-olar RNAs from pre-mRNA introns. Genes Dev. 9:1411–1424.

29. Kiss, T., and W. Filipowicz. 1993. Small nucleolar RNAs encoded by intronsof the human cell cycle regulatory gene RCC1. EMBO J. 12:2913–2920.

30. Kobor, M. S., L. D. Simon, J. Omichinski, G. Zhong, J. Archambault, and J.Greenblatt. 2000. A motif shared by TFIIF and TFIIB mediates their inter-action with the RNA polymerase II carboxy-terminal domain phosphataseFcp1p in Saccharomyces cerevisiae. Mol. Cell. Biol. 20:7438–7449.

31. Komarnitsky, P., E. J. Cho, and S. Buratowski. 2000. Different phosphory-lated forms of RNA polymerase II and associated mRNA processing factorsduring transcription. Genes Dev. 14:2452–2460.

32. Krogan, N. J., M. Kim, S. H. Ahn, G. Zhong, M. S. Kobor, G. Cagney, A.Emili, A. Shilatifard, S. Buratowski, and J. F. Greenblatt. 2002. RNA poly-merase II elongation factors of Saccharomyces cerevisiae: a targeted pro-teomics approach. Mol. Cell. Biol. 22:6979–6992.

33. Krogan, N. J., W. T. Peng, G. Cagney, M. D. Robinson, R. Haw, G. Zhong,X. Guo, X. Zhang, V. Canadien, D. P. Richards, B. K. Beattie, A. Lalev, W.Zhang, A. P. Davierwala, S. Mnaimneh, A. Starostine, A. P. Tikuisis, J.Grigull, N. Datta, J. E. Bray, T. R. Hughes, A. Emili, and J. F. Greenblatt.2004. High-definition macromolecular composition of yeast RNA-processingcomplexes. Mol. Cell 13:225–239.

34. Lafontaine, D. L., C. Bousquet-Antonelli, Y. Henry, M. Caizergues-Ferrer,and D. Tollervey. 1998. The box H � ACA snoRNAs carry Cbf5p, theputative rRNA pseudouridine synthase. Genes Dev. 12:527–537.

35. Longtine, M. S., A. McKenzie III, D. J. Demarini, N. G. Shah, A. Wach, A.Brachat, P. Philippsen, and J. R. Pringle. 1998. Additional modules forversatile and economical PCR-based gene deletion and modification in Sac-charomyces cerevisiae. Yeast 14:953–961.

36. Mason, P. B., and K. Struhl. 2003. The FACT complex travels with elon-

gating RNA polymerase II and is important for the fidelity of transcriptionalinitiation in vivo. Mol. Cell. Biol. 23:8323–8333.

37. Meier, U. T., and G. Blobel. 1994. NAP57, a mammalian nucleolar proteinwith a putative homolog in yeast and bacteria. J. Cell Biol. 127:1505–1514.

38. Mitchell, J. R., E. Wood, and K. Collins. 1999. A telomerase component isdefective in the human disease dyskeratosis congenita. Nature 402:551–555.

39. Mochizuki, Y., J. He, S. Kulkarni, M. Bessler, and P. J. Mason. 2004. Mousedyskerin mutations affect accumulation of telomerase RNA and small nu-cleolar RNA, telomerase activity, and ribosomal RNA processing. Proc.Natl. Acad. Sci. USA 101:10756–10761.

40. Morlando, M., M. Ballarino, P. Greco, E. Caffarelli, B. Dichtl, and I. Boz-zoni. 2004. Coupling between snoRNP assembly and 3� processing controlsbox C/D snoRNA biosynthesis in yeast. EMBO J. 23:2392–2401.

41. Peng, W. T., M. D. Robinson, S. Mnaimneh, N. J. Krogan, G. Cagney, Q.Morris, A. P. Davierwala, J. Grigull, X. Yang, W. Zhang, N. Mitsakakis,O. W. Ryan, N. Datta, V. Jojic, C. Pal, V. Canadien, D. Richards, B. Beattie,L. F. Wu, S. J. Altschuler, S. Roweis, B. J. Frey, A. Emili, J. F. Greenblatt,and T. R. Hughes. 2003. A panoramic view of yeast noncoding RNA pro-cessing. Cell 113:919–933.

42. Phatnani, H. P., J. C. Jones, and A. L. Greenleaf. 2004. Expanding thefunctional repertoire of CTD kinase I and RNA polymerase II: novel phos-phoCTD-associating proteins in the yeast proteome. Biochemistry 43:15702–15719.

43. Richard, P., X. Darzacq, E. Bertrand, B. E. Jady, C. Verheggen, and T. Kiss.2003. A common sequence motif determines the Cajal body-specific local-ization of box H/ACA scaRNAs. EMBO J. 22:4283–4293.

44. Rigaut, G., A. Shevchenko, B. Rutz, M. Wilm, M. Mann, and B. Seraphin.1999. A generic protein purification method for protein complex character-ization and proteome exploration. Nat. Biotechnol. 17:1030–1032.

45. Ruggero, D., S. Grisendi, F. Piazza, E. Rego, F. Mari, P. H. Rao, C. Cordon-Cardo, and P. P. Pandolfi. 2003. Dyskeratosis congenita and cancer in micedeficient in ribosomal RNA modification. Science 299:259–262.

46. Steinmetz, E. J., N. K. Conrad, D. A. Brow, and J. L. Corden. 2001. RNA-binding protein Nrd1 directs poly(A)-independent 3�-end formation of RNApolymerase II transcripts. Nature 413:327–331.

47. Storici, F., L. K. Lewis, and M. A. Resnick. 2001. In vivo site-directedmutagenesis using oligonucleotides. Nat. Biotechnol. 19:773–776.

48. Sun, Z. W., and M. Hampsey. 1995. Identification of the gene (SSU71/TFG1) encoding the largest subunit of transcription factor TFIIF as a sup-pressor of a TFIIB mutation in Saccharomyces cerevisiae. Proc. Natl. Acad.Sci. USA 92:3127–3131.

49. Tollervey, D., and T. Kiss. 1997. Function and synthesis of small nucleolarRNAs. Curr. Opin. Cell Biol. 9:337–342.

50. Wang, C., and U. T. Meier. 2004. Architecture and assembly of mammalianH/ACA small nucleolar and telomerase ribonucleoproteins. EMBO J. 23:1857–1867.

51. Yang, P. K., G. Rotondo, T. Porras, P. Legrain, and G. Chanfreau. 2002. TheShq1p.Naf1p complex is required for box H/ACA small nucleolar ribonu-cleoprotein particle biogenesis. J. Biol. Chem. 277:45235–45242.

3304 YANG ET AL. MOL. CELL. BIOL.

Page 201: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

3. Discussion

Les résultats présentés dans cette publication confortent l’hypothèse selon laquelle la

protéine Naf1p aurait un rôle très précoce au cours de l’assemblage des RNP H/ACA. En

effet, nous avons montré que Naf1p est présente au niveau des sites de transcription des gènes

codant les snoARN H/ACA. Le fait que cette localisation nécessite une transcription active

ainsi que la présence d’un domaine de type H/ACA au sein de la zone transcrite suggère

fortement que Naf1p est recrutée au niveau des ces sites de transcription via une interaction

avec l’ARN en cours de transcription et non pas, du moins pas uniquement, via une

interaction avec le complexe de transcription. Cette hypothèse est confortée par le fait que la

substitution du promoteur naturel du gène SNR32 par le promoteur pGal1-10 n’empêche pas

l’association de Naf1p avec ce gène ce qui démontre bien que les déterminants requis pour le

recrutement de Naf1p ne se trouvent pas dans la région promotrice. De plus, les résultats des

tests concernant le gène RPS22B montrent que Naf1p est recrutée au niveau du gène codant le

snoARN H/ACA snR44, bien qu’il soit inséré dans un intron et non pas transcrit de façon

indépendante comme c’est le cas de la plupart des snoARN H/ACA chez la levure.

Il est probable que lorsque Naf1p est recrutée au niveau des sites de transcription des

snoARN H/ACA, elle se retrouve à proximité des protéines du complexe de transcription,

Spt16p, Tfg1p et Sub1p. L’interaction que nous avons mise en évidence, lors des expériences

de purification, entre Naf1p et la machinerie associée à l’ARN polymérase II traduit

probablement une interaction indirecte. En effet, Naf1p serait en interaction avec l’ARN en

cours de synthèse alors que celui-ci interagit avec l’ADN et le complexe de transcription.

D’après nos résultats, la phosphorylation du domaine CTD de l’ARN polymérase II

n’est pas un pré-requis pour le recrutement de Naf1p au niveau des sites de transcription. En

effet, les résultats des immunoprécipitations de chromatine réalisées dans une souche où le

gène CTK1, codant la kinase du domaine CTD, est invalidé sont identiques à ceux obtenus

dans un contexte sauvage. De façon surprenante, l’équipe d’Irene Bozzoni a mis évidence, par

le même type d’approche, que lorsque CTK1 est invalidé, Naf1p et Cbf5p sont moins

présentes au niveau des sites de transcription (Ballarino, Morlando et al. 2005). Il est possible

que la différence de fonds génétiques entre nos souches et celles utilisées par Monica

Ballarino entraîne des réponses différentes à l’absence de Ctk1p. De plus, il n’a pas été testé

77

Page 202: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

si l’absence de Ctk1p dans leurs souches entraîne une diminution du niveau de transcription

des snoARN et donc du nombre de molécules d’ARN, ce qui induirait par conséquent un

recrutement moins important de Naf1p.

Dans notre étude, nous avons également testé la présence des protéines H/ACA,

Cbf5p, Gar1p, Nhp2p et Nop10p au niveau des gènes codant les snoARN H/ACA. Nous

avons mis en évidence que Cbf5p se comporte exactement de la même manière que la

protéine Naf1p. En revanche, Nhp2p, Gar1p et Nop10p ne montrent pas d’association

significative avec les gènes codant les snoARN H/ACA. L’équipe d’Irene Bozzoni a

également testé ces différentes protéines. Leurs résultats sont en accord avec les nôtres pour

les protéines Cbf5p et Gar1p. En revanche, ils ont mis en évidence un recrutement significatif

de Nhp2p au niveau de la chromatine. Toutefois, il est important de noter qu’ils ont un

résultat pour Nhp2p très proche du nôtre, à savoir un signal d’un niveau égal à deux fois le

bruit de fond ce que nous considérons comme non significatif. Pour Nhp2p, il s’agit donc

juste d’une différence d’interprétation des résultats.

En conclusion, Naf1p et Cbf5p (et peut être Nhp2p), chez la levure, seraient recrutées

de façon très précoce sur le snoARN H/ACA en cours de transcription. Il n’est pas encore

possible de dire si elles interagissent ensemble avant d’être recrutées sur le snoARN ou bien

si elles sont recrutées de façon séquentielle sur le snoARN. Il est possible que Naf1p s’associe

d’abord avec le snoARN et qu’elle permette ensuite le recrutement de Cbf5p.

Malheureusement, ce n’est pas une hypothèse facile à tester, en grande partie à cause du fait

qu’en absence de Naf1p, les protéines Cbf5p, Gar1p et Nop10p sont complètement

déstabilisées.

Nos résultats suggèrent que les protéines Nhp2p, Gar1 et Nop10p sont recrutées plus

tardivement sur le snoARN, après que celui-ci se soit éloigné du site de transcription.

Néanmoins, lorsque l’on obtient un résultat négatif dans des tests d’immunoprécipitation de

chromatine, il est impossible d’écarter l’hypothèse d’un faux négatif car la protéine peut être

présente au niveau du site de transcription mais présenter un épitope masqué ce qui rend

l’immunoprecipitation impossible.

Des études menées par le groupe de Tomas Meier ont permis de mettre en évidence

que l’assemblage des particules H/ACA humaines semble également initié au niveau co-

transcriptionnel (Darzacq, Kittur et al. 2006). En effet, ils ont mis en évidence que les

78

Page 203: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

protéines hNaf1, dyskérine, Nhp2 et Nop10 sont recrutées au niveau d’un site artificiel de

transcription du snoARN H/ACA E3. La construction utilisée lors de cette étude est présentée

dans la figure 52. Elle a été intégrée en plusieurs exemplaires à un seul locus dans le génome

des cellules humaines U2OS et contient la séquence codant le snoARN E3 de rat insérée dans

le second intron du gène de la -globine. Le promoteur utilisé est induit en présence de

doxycycline. La construction comprend également la séquence codant le fluorophore CFP

fusionné à un signal d’adressage aux péroxysomes (SKL). Ceci permet de contrôler

l’expression du transgène par la visualisation de péroxysomes fluorescents. Enfin, l’ARNm

produit par cette construction comprend à l’extrémité 3’, 18 sites de reconnaissance pour la

protéine MS2 permettant de détecter le site de transcription via l’utilisation d’une protéine

MS2-RFP. La détection par immunofluoresence in situ de Naf1p, dyskérine, Nop10 et Nhp2 a

permis de mettre en évidence qu’elles co-localisent avec MS2-RFP et donc avec le site de

transcription. Il y aurait donc, comme chez la levure, un assemblage co-transcriptionnel des

protéines sur le snoARN E3. Cela a été confirmé par des tests de ChIP. Toutefois, il est

important de noter qu’aucun résultat de ChIP n’a pu être obtenu pour un site de transcription

d’ARN H/ACA endogène, que se soit dans notre laboratoire ou dans celui de T. Meier. Cela

est peut être du à un problème technique (et/ou un manque de sensibilité). Néanmoins, nous

ne pouvons pas exclure l’hypothèse selon laquelle, chez l’homme, l’assemblage des particules

ne se fasse pas de façon co-transcriptionnel. En effet, il est possible que les résultats de

l’équipe de T. Meier soient faussés par le fait que le locus qu’ils visualisent comprend des

copies répétées du transgène. Cela peut avoir pour conséquence de ralentir localement les

étapes de maturation et d’assemblage des particules H/ACA et ainsi permettre aux protéines

de venir s’associer de façon plus précoce.

De façon intéressante, l’équipe de T. Meier a présenté des résultats permettant de

proposer que hNaf1 permet d’induire la présence des protéines dyskérine et Nhp2p au niveau

de la chromatine. Pour cela, ils ont exprimé une forme de la protéine hNaf1 fusionnée à la

protéine LacI. Ils ont ensuite induit l’adressage de cette protéine hNaf1-LacI au niveau de la

chromatine via l’insertion d’un site « LacO » reconnu par LacI. Ils ont alors mis en évidence

que les protéines dyskérine et Nhp2 sont également présentes au niveau du site LacO. Cela

suggère que Naf1-lacI a adressé ou bien a recruté ces protéines au niveau de LacO.

En ce qui concerne la protéine Gar1p, les résultats des tests chez la levure ainsi que

ceux réalisés que l’homme sont en accord et suggèrent que Gar1p est recrutée au sein de la

particule de façon plus tardive que les autres protéines. Cette hypothèse est appuyée par des

79

Page 204: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 205: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

résultats de Patricia Richard, dans le laboratoire de Tamas Kiss. Ils ont mis en évidence que la

protéine dyskérine est capable de s’associer à le snoARN H/ACA U64 présent au sein d’un

intron de pré-ARNm. L’interaction a donc lieu de façon très précoce, avant l’épissage du pré-

ARNm. En revanche, la protéine Gar1p ne montre aucune interaction avec le pré-ARNm et ne

s’associe qu’avec le snoARN H/ACA U64 mature. Gar1p est donc recrutée à une étape

postérieure à l’évènement d’épissage.

80

Page 206: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

C. Caractérisation au niveau moléculaire du mode

d’action de Naf1p

Afin de mieux comprendre le rôle joué par la protéine Naf1p au cours de l’assemblage

des particules de type H/ACA, nous avons entrepris une étude au niveau moléculaire dans le

but de caractériser l’interaction entre Naf1p et les composants des particules de type H/ACA.

Lors de cette étude nous avons également cherché à déterminer quels sont les rôles joués par

les différents domaines de Naf1p dans l’interaction avec ses partenaires.

1. Caractérisation des différents domaines de la protéine

Naf1p

Nous avons entrepris l’étude des différents domaines de Naf1p dans le but d’identifier,

au niveau moléculaire, les rôles qu’ils exercent dans la fonction de la protéine Naf1p. Dans un

premier temps, nous avons cherché à déterminer quels sont les domaines essentiels in vivo.

Nous avons mis en évidence que les domaines riches en sérine ainsi que ceux riches en

proline/glutamine ne sont pas strictement requis pour la viabilité cellulaire. Nous avons donc

pu obtenir des souches dépourvues de la protéine Naf1p WT et exprimant les formes

tronquées Naf1 Sp, Naf1 Qp, Naf1 PQp, Naf1 SPQp, ainsi que Naf1 h1p et Naf1 h2p où

h1 et h2 sont deux hélices alpha prédites en amont du domaine riche en sérine. Nous avons

comparé, par des tests de croissance en goutte ou en culture liquide, la vitesse de croissance

de ces différentes souches par rapport à la souche sauvage (figure 53A et B.) Il apparaît que

l’absence des différents domaines testés n’affecte pas ou très peu la croissance. De façon

intéressante nous avons réussi à construire une souche exprimant la forme tronquée Naf1(109-

272)p qui n’ést constituée que de la région centrale comprenant le domaine GAR1, le domaine

UCDN ainsi qu’une partie de la NLS. Cette souche est viable ce qui suggère que tous les

éléments requis pour les fonctions essentielles de la protéine Naf1p sont présents. Néanmoins,

les tests de croissance (figure 53C) indiquent que cette souche a une vitesse de croissance très

basse. De plus, lorsque l’on observe sa morphologie, il est évident que cette souche est

malade (figure 53D) ce qui indique que les domaines situés en dehors de la région centrale

81

Page 207: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

37°C

Naf1p wtNaf1p h1p

Naf1p h2p

Naf1p Sp

Naf1p QpNaf1p PQp

3000

600

120

5 1

30°C 13°C

3000

600

120

5 13000

600

120

5 1

DO

600

nm

Mesure de la croissance de souches exprimant différentes versions de la protéine Naf1p cultivées en milieu minimum à 30°C

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0 100 200 300 400 500 600

temps en minutes

Naf1p h1pNaf1p h2pNaf1p SpNaf1p QpNaf1p PQpNaf1p WT

0

0,5

1

1,5

2

2,5

0 105 170 250 305 370

Naf1p WTNaf1 PQpNaf1 SPQpNaf1(109-272)p

Mesure de la croissance de souches exprimant différentes versions de la protéine Naf1p

cultivées en milieu minimum à 30°C

temps en minutes

DO

600

nm

Page 208: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Naf1p - - + +

snR5

U24

RNP

A B

FIGURE 54: Tests d'interaction entre la protéine Naf1p et le snoARN H/ACA snR5

(A): Structure secondaire du snoARN H/ACA snR5(B): Tests en gel retard des interactions entre Naf1p et snR5 d'une part et Naf1p et U24 d'autre part(C et D): Tests en gel retard de l'interaction entre Naf1p et snR5 en présence d'ARN compétiteur, snR5, U24, snR37 et snR42

1 2 3 4

D

Naf1p

Competitor

Molar ratio

+ + + + + + + + +

250

500

50

250

500

50

250

500

50

snR37 snR42 U24

1 2 3 4 5 6 7 8 9

C

RNP

- + + + + +

BS17 - 1

Naf1p

BS17 - 1

Naf1p - + + + + +

snR5 snR5

RNP

Comp snR5 - - + + + +

Molar ratio

Comp U24 - - + + + +

Molar ratio 25

0 50

0 10

00

2000

250

500

1000

20

00

RNP

- + + + + +

BS17 - 1

Naf1p

BS17 - 1

Naf1p - + + + + +

snR5 snR5

RNP

Comp snR5 - - + + + +

Molar ratio

Comp U24 - - + + + +

Molar ratio 25

0 50

0 10

00

2000

250

500

1000

20

00

1 2 3 4 5 6 7 8 9 10 11 12

Page 209: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

sont requis pour une activité optimale de la protéine. En conclusion, les domaines essentiels

de la protéine Naf1p sont les domaines GAR1 et UCDN. Nous avons entrepris des tests

d’interaction in vitro afin de déterminer dans quelle mesure ces domaines sont requis pour

l’interaction entre la protéine Naf1p et les composants des RNP H/ACA

2. Naf1p interagit spécifiquement avec les snoARN H/ACA in

vitro

a) Etude de l’interaction entre la protéine Naf1p et les

ARN H/ACA

La protéine Naf1p présente de l’affinité pour l’ARN. Cela a été mis en évidence par

Fatica et ses collaborateurs via une approche par gel retard entre le snoARN H/ACA snR36 et

la protéine Naf1p recombinante. Néanmoins, l’interaction qu’ils ont visualisée ne semblait

pas vraiment être spécifique. En effet, lorsqu’ils ont réalisé des tests de compétition avec des

ARN froids, ils ont pu empêcher la formation du complexe snR36/Naf1p en ajoutant un excès

de l’ARN antisens de snR36. Fatica et Tollervey ont alors proposé que Naf1p a de l’affinité

pour des structures d’ARN plutôt que pour une séquence particulière.

Au laboratoire, nous avons entrepris une étude par gel retard afin de mieux définir les

éléments ARN permettant l’interaction ente les snoARN H/ACA et Naf1p. Les résultats

présentés ci-après ont été obtenus en collaboration avec Régine Capeyrou.

La protéine Naf1p utilisée lors de nos tests a été produite chez la bactérie (E.coli

BL21) et purifiée dans un premier temps sur une colonne de nickel via une étiquette 6xHIS

placée à son extrémité carboxy-terminale. Suite à cette première purification, nous avons

constaté qu’une quantité non négligeable de protéines contaminantes persiste. Nous avons

réalisé une seconde étape de purification sur chromatographie d’exclusion. Cela a permis

d’éliminer beaucoup de contaminants ainsi qu’une très grande part de la protéine Naf1p

présente sous forme d’agrégats. Les snoARN H/ACA utilisés pour les gels retard ont été

transcrits in vitro et marqués par incorporation de P32 CTP. Nous avons alors testé

l’interaction entre Naf1p et snR5 par gel retard. La figure 54 présente les résultats que nous

82

Page 210: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

avons obtenus. Nous avons mis en évidence que Naf1p est capable d’interagir avec snR5

(figure 54B ligne 2). De plus nous avons montré que cette interaction est spécifique car,

d’une part, Naf1p n’entraîne pas de retard de migration du snoARN C/D U24 (figure 54B

ligne 4) et d’autre part dans des tests de compétition, seule l’utilisation des snoARN HACA

snR5, snR37 et snR42 permet d’empêcher la formation du complexe Naf1p/snR5 (figure 54

C et D).

En conclusion, nous avons mis en évidence une interaction spécifique entre Naf1p et

les snoARN H/ACA snR5, snR37 et snR42.

Nous avons également testé la capacité de la protéine hNaf1 à interagir spécifiquement

avec des ARN H/ACA par gel retard (Naf1p humaine). La figure 55 présente les résultats

préliminaires que nous avons obtenus. Nous avons mis en évidence que hNaf1, comme Naf1p

de levure, est capable de s’associer de façon spécifique avec les snoARN H/ACA de levure.

Malheureusement, pour l’instant, nous rencontrons des problèmes techniques ne nous

permettant par de tester l’association entre hNaf1 et des ARN H/ACA humains.

Afin de localiser le site de fixation de Naf1p sur le snoARN snR5, nous avons réalisé

des gels retard avec des formes tronquées ou mutées de snR5. Il apparaît que la protéine

Naf1p interagit de façon préférentielle avec la tige 3’ et la région charnière de snR5 (figure

56B lignes 2 à 16). D’autre part, les boites H et ACA ne semblent pas être strictement

requises pour l’association avec Naf1p (figure 56A lignes 2 à 8).

Nous projetons de poursuivre ces tests d’interaction en gel retard afin d’étudier, entre

autre, l’association de hNaf1 avec l’ARN de la télomérase. De plus, nous souhaitons réaliser

des expériences de footprint pour déterminer de façon précise les sites au sein de l’ARN snR5

permettant l’interaction avec la protéine Naf1p.

b) Recherche du domaine de liaison à l’ARN de la

protéine Naf1p

Nous avons également entrepris la recherche du domaine de liaison à l’ARN de la

protéine Naf1p. Pour cela, nous avons réalisés des expériences de gel retard avec des formes

83

Page 211: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

- + hNaf1

Competitor

Molar ratio

250

500

+ + + + + + + + + + + +

50

250

500

50

250

500

50

250

500

50

0

snR5 snR37 snR42 U24

FIGURE 55: Tests d'interaction entre la protéine hNaf1 et le snoARN H/ACA snR5Tests en gel retard des interactions entre hNaf1 et snR5 en présence d'ARN compétiteur, snR5, U24, snR37 et snR42

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Page 212: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

- Naf1p

ARN

- - - + + + +

snR5 WT snR5mutH snR5mutACA snR5mutH/ACA

Naf1p snR5 WT snR5 WT snR5 WT snR5 WT

FIGURE 56: Tests d'interaction entre la protéine Naf1p et des formes modifiées du snoARN H/ACA snR5

(A): Tests en gel retard des interactions entre Naf1p et des formes de snR5 mutées sur les boites H et ACA; la mutation "mut ACA" a consisté à remplacer la boite ACA en CGC; Dans les mutants "mutH" la boite H (AGACCA) a été remplacée par la séquence GGGCCA(B): Tests en gel retard des interactions entre Naf1p et différentes formes tronquées et mutées de snR5

A

B

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

1 2 3 4 5 6 7 8

Page 213: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

tronquées ou modifiées de la protéine Naf1p. Naf1p possède à l’extrémité carboxy-terminale

un domaine riche en résidus proline et glutamine. L’extrémité amino-terminale présente un

domaine riche en sérine contenant plusieurs sites potentiels de phosphorylation par la caséine

kinase II. Dans la région centrale de Naf1p se trouvent un signal de localisation nucléaire

(NLS) ainsi qu’un domaine présentant une forte homologie avec le domaine central de la

protéine Gar1p (composant des particules H/ACA). Il a été mis en évidence que ce domaine

chez la protéine Gar1p présente, in vitro, de l’affinité pour les ARN snR10 et snR30 (Bagni

and Lapeyre 1998). Afin de tester si, au sein de la protéine Naf1p, ce domaine permet

également l’interaction avec les snARN H/ACA, nous avons réalisé des expériences de gel

retard avec une protéine Naf1p dépourvue du domaine GAR1. Nous avons également exprimé

une forme de Naf1p présentant la mutation G186E (la glycine 186 est conservée chez tous les

homologues de Naf1p) dans le domaine GAR1. La figure 57A présente les résultats que nous

avons obtenus. Il apparaît que le domaine GAR1 et la glycine 186 ne sont pas strictement

requis pour l’interaction spécifique avec snR5. Quelques temps après avoir réalisé ces tests, la

structure de la protéine aGar1 en interaction avec la protéine aCbf5 a été publiée (Rashid,

Liang et al. 2006). Cette structure a mis en évidence que le domaine GAR1 est, au sein de

aGar1, un domaine de liaison à la protéine Cbf5. Il a alors été proposé que le domaine GAR1

de Naf1p pourrait exercer la même fonction.

Afin de poursuivre la recherche du domaine de liaison à l’ARN, nous avons supprimé

d’autres domaines de la protéine Naf1p (figure 57B). Malheureusement, nous n’avons pas

réussi à déterminer de façon précise où se trouve le domaine de liaison spécifique à l’ARN.

Néanmoins, il semble qu’il se trouve dans la région centrale de Naf1p car les domaines riches

en sérine et proline/glutamine ne sont pas strictement requis pour la liaison à l’ARN.

Nous envisageons de poursuivre cette étude par la réalisation de suppression plus

restreinte dans la région centrale de Naf1p. Nous porterons une attention toute particulière au

domaine nommé UCDN (« Ultra Conserved Domain of Naf1p ». Ce domaine est la portion de

Naf1p qui a été la plus conservée au cours de l’évolution. Il est donc probable qu’il est requis

pour une des fonctions clés de la protéine. Nous n’avons noté aucune similarité entre ce

domaine et des domaines de liaison à l’ARN connus. Néanmoins, il serait vraiment

intéressant de déterminer si la suppression de UCDN affecte l’interaction entre Naf1p et

l’ARN.

84

Page 214: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE 57: Tests d'interaction entre différentes formes modifiées de la protéine Naf1p et le snoARN H/ACA snR5

(A): Tests de compétitions réalisés avec les ARN froids U24 et snR5

Résultats des tests d'interaction avec snR5

1

Naf1p 55 81 136 220 264 276 361 419 456 489

492

Serine rich region

Proline rich region

Glutamine rich region

Gar1 domain

226 268

NLS +

Naf1 SPQp +

Naf1 Qp + Naf1 PQp +

Naf1(109-272)p

Naf1(220-451)p

--

A

B

Page 215: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

3. Le domaine GAR1 de la protéine Naf1p est impliqué dans

l’interaction avec la protéine Cbf5p

Lorsque l’on étudie une protéine, il est souvent très utile de connaître sa structure. En

effet, cette information s’avère d’une grande aide lorsque l’on souhaite comprendre quels sont

les rôle joués par les différentes portions de la protéine. De plus, cela permet dans certain cas

de trouver des similarités (n’apparaissant pas au niveau de la séquence primaire) avec des

protéines dont la fonction est déjà caractérisée.

En collaboration avec Sophie Chéruel et Nicolas Leulliot de l’équipe de H. van

Tilbeurgh, nous avons entrepris de déterminer la structure cristallographique de la protéine

Naf1p. Nous avons rencontré des difficultés d’expression et de cristallisation de la protéine

Naf1p pleine taille. Par conséquent, nous avons testé l’expression de différentes formes

tronquées aux extrémités amino- et carboxy-terminales. Seule la protéine Naf1 1p a pu

former des cristaux d’une qualité suffisante pour permettre la détermination d’une structure

par diffraction des rayons X. Naf1 1p correspond à la région centrale de Naf1p et contient le

domaine GAR1. Ce domaine, retrouvé chez tous les orthologues de la protéine Naf1p,

présente une forte homologie avec la protéine Gar1p. La structure cristallographique à une

résolution de 2.74 angströms que nous avons obtenue a permis de mettre en évidence que le

domaine Gar1 de Naf1p présente une structure très similaire à celle de la protéine aGar1. La

structure de Naf1 1p comprend une hélice et sept brins formant une structure de type

tonneau .

La comparaison des structures de Naf1 1p et de la protéine aGar1 en complexe avec

aCbf5 montre que Naf1 1p présente une structure lui permettant d’interagir avec aCbf5 de la

même manière que aGar1. Toutefois, Naf1 1p est retrouvée, dans le cristal ainsi qu’en

solution (en RMN), sous forme de dimères; la surface potentielle de liaison avec aCbf5 est

celle permettant la dimérisation. Grâce à des tests d’interaction protéine/protéine in vitro,

nous avons mis en évidence que Naf 1p n’est capable d’interagir avec Cfb5p que lorsque

nous dissocions au préalable l’homodimère Naf1 1p/ Naf1 1p. De plus, nous avons mis en

évidence que Naf1 1p est capable d’interagir avec la protéine Gar1p.

L’expression in vivo de différentes formes modifiées de Naf1p nous a permis de

85

Page 216: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

démontrer que le domaine Gar1 est strictement essentiel mais pas suffisant pour la viabilité

cellulaire. De plus, il est requis pour l’interaction entre Naf1p et les composants des particules

H/ACA.

86

Page 217: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

a) Publication

« The Box H/ACA RNP Assembly Factor Naf1p contains a Domain

homologous to Gar1p Mediating its Interaction with Cbf5p»

Nicolas Leulliot*, Katherine S.Godin*, Coralie Hoareau-Aveilla*, Sophie Quevillon-Chéruel, Gabriele

Varani, Yves Henry and Herman Van Tilbeurgh

J.Mol.Biol. (2007), Aug 31;371(5):1338-53

(* N.Leulliot, K.S.Gobin and C.Hoareau-Aveilla contributed equally to the work)

87

Page 218: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 219: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

The Box H/ACA RNP Assembly Factor Naf1p Contains aDomain Homologous to Gar1p Mediating itsInteraction with Cbf5p

Nicolas Leulliot1⁎†, Katherine S. Godin2†, Coralie Hoareau-Aveilla4†Sophie Quevillon-Cheruel1, Gabriele Varani2,3, Yves Henry4

and Herman Van Tilbeurgh1

1Institut de Biochimie et deBiophysique Moléculaire etCellulaire, UMR8619, Bât 430,Université de Paris-Sud,91405 Orsay Cedex, France2Department of Chemistry,Box 351700, University ofWashington, Seattle,WA 98195, USA3Department of Biochemistry,Box 357350, University ofWashington, Seattle,WA 98195, USA4Laboratoire de BiologieMoléculaire Eucaryote,CNRS, Université de Toulouse,UPS, Toulouse, France

Naf1 is an essential protein involved in the maturation of box H/ACAribonucleoproteins, a group of particles required for ribosome biogenesis,modification of spliceosomal small nuclear RNAs and telomere synthesis.Naf1 participates in the assembly of the RNP at transcription sites and in thenuclear trafficking of the complex. The crystal structure of a domain of yeastNaf1p, Naf1Δ1p, reveals a striking structural homology with the core do-main of archaeal Gar1, an essential protein component of the mature RNP;it suggests that Naf1p and Gar1p have a common binding site on theenzymatic protein component of the particle, Cbf5p. We propose that Naf1pis a competitive binder for Cbf5p, which is replaced by Gar1p duringmaturation of the H/ACA particle. The exchange of Naf1p by Gar1p mightbe prompted by external factors that alter the oligomerisation state of Naf1pand Gar1p. The structural homology with Gar1 suggests that the function ofNaf1 involves preventing non-cognate RNAs from being loaded duringtransport of the particle by inducing a non-productive conformation of Cbf5.

© 2007 Elsevier Ltd. All rights reserved.

*Corresponding author Keywords: Box H; ACA biogenesis; Naf1

Introduction

The box H/ACA ribonucleoproteins (RNPs) arenuclear particles required for essential and diversemolecular functions such as protein synthesis, geneexpression and chromosome stability.1 Biochemi-cally, they participate in ribosome biogenesis, the for-mation of spliceosome components and in telomeremaintenance. The large majority of box H/ACA

RNPs are responsible for the pseudo-uridylation ofuridine residues in ribosomal RNAs (rRNAs) and,less commonly, pseudo-uridylation or cleavage ofspliceosomal small nuclear RNAs (snRNAs). Thesetwo activities are performed, respectively, in thenucleolus by the Box H/ACA small nucleolarribonucleoprotein particles (snoRNPs)2,3 or in Cajalbodies by small Cajal body-specific ribonucleoproteinparticles (scaRNPs).4,5 In mammals, snoRNPs andscaRNPs are responsible for more than 100 pseudo-uridylation reactions.Although most H/ACA RNPs participate in

pseudo-uridylation, a number of H/ACA RNPshave other functions. For example, the 3′ half oftelomerase RNA contains the box H/ACA consen-sus sequence6,7 which is not essential for in vitrofunction, but is required for telomerase RNA pro-cessing7 and RNP assembly.8–10 snR30 (E1/U17 invertebrates) also does not participate in pseudo-uridylation but is required for pre-rRNA cleavagesteps essential for mature 18 S rRNA production.11,12

† N.L., K.S.G. and C.H.-A. contributed equally to thework.Abbreviations used: RNP, ribonucleoprotein; scaRNP,

Cajal body specific ribonucleoprotein particle; snoRNP,small nucleolar ribonucleoprotein particle; snRNA, smallnuclear RNA; SAD, single anomalous diffraction; HSQC,heteronuclear single-quantum coherence; GFP, greenfluorescent protein.E-mail address of the corresponding author:

[email protected]

doi:10.1016/j.jmb.2007.06.031 J. Mol. Biol. (2007) 371, 1338–1353

0022-2836/$ - see front matter © 2007 Elsevier Ltd. All rights reserved.

Page 220: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Fully assembled and functional, all box H/ACARNPs contain a specific RNA component (snoRNAor scaRNA) and at least four proteins common to allsuch particles.1 These areCbf513 (Nap57 in rodents,14dyskerin in humans9,15), Gar1,16–18 Nhp210,19,20 andNop10.10,19 These proteins are highly conservedfrom yeast to mammals and homologs are alsopresent in archaea.21 In most eukaryotes, the RNAcomponent of box H/ACA RNPs has a conservedhairpin-hinge–hairpin-tail secondary structure withconsensus sequences located in the hinge (box H)and three nucleotides upstream from the mature 3′end (box ACA).16,17 In the case of H/ACA RNPsinvolved in pseudo-uridylation, the conserved bulgeof one or both hairpins of the RNA possessessequence complementarity to the bases flanking thetarget uridine residues to be modified on the targetRNA and which effectively guides the enzymaticactivity of the RNP through base-pairing.2

Recently, the structure of all protein components ofbox H/ACA RNPs and of a fully assembled particlehave been revealed by X-ray crystallographic studiesconducted on archaeal proteins.22–27 As expectedfrom the sequence homology to stand-alone pseudo-uridine synthases, Cbf5 is almost certainly the coreenzyme that catalyses the pseudo-uridylation reac-tion. Nop10 is a small basic protein that is onlypartially structured in isolation,28 but interacts withaCbf5 through a very extensive interface24–27 thatmay stabilise the conformation of aCbf5 and affectsits enzymatic activity and specificity. ArchaealL7Ae/eukaryotic Nhp2 belongs to a family ofRNA-binding proteins19,20,29–31 and, at least in thecase of L7Ae,27,30 recognises a characteristic RNAstructure, a K-turn, as do other members of thisprotein family. aGar1 resembles RNA bindingdomains found in translational initiation and elon-gation factors, but apparently does not bindRNA.26,27 Instead, it binds to aCbf5 independentlyof aNop1032 and contacts a loop predicted to beinvolved in RNA binding. This observation has ledto the speculation that aGar1 might be involved insubstrate loading and release.27 Although the recentstructure of a complete archaeal box H/ACA RNPhas revealed how each of these four proteinsrecognises the guide RNA and the core aCbf5component, the exact function of each of the othersmall proteins in controlling the enzymatic activityof these RNPs remains unclear.The biogenesis of eukaryotic box H/ACA RNPs is

remarkably complex considering that most matureH/ACA particles contain only five components.While a functional archaeal RNP can be assembledin vitro purely from the final RNP components,eukaryotic box H/ACA RNP biogenesis in vivo isinitiated co-transcriptionally and requires additionalassembly factors and a specific nuclear traffickingpathway. Two proteins play major roles in eukar-yotic box H/ACA RNP assembly, Shq1 and Naf1:depletion of either component leads to decreasedH/ACARNP levels.33–37 Both proteins are conserved inhigher eukaryotes, but homologues have not beenidentified in archaea so far. Yeast Naf1p was iden-

tified through its interaction in two-hybrid screenswith Cbf5p and Nhp2p.38 While co-immunoprecipi-tation reveals that Naf1p interacts with all thecomponents of the mature H/ACA snoRNPs,34 it isnot present in the mature RNPs. Naf1 is co-trans-criptionally recruited along with Cbf5p/NAP57 (therat Cbf5p orthologue) to H/ACA RNA transcriptionsites,35,36,39,40 and depletion of NAP57 by RNAi abo-lished Naf1 recruitment.36 Conversely, when Naf1 isdepleted in both yeast and humans, reduced levels ofCbf5p/dyskerin are observed.34,35

The recruitment of Naf1 with Cbf5 by componentsof the transcription apparatus suggests that it is acentral player in eukaryotic box H/ACA RNPbiogenesis. Its association with Cbf5 may benecessary to stabilise Cbf5 and/or to recruit it toH/ACA RNA transcription sites. It may alsofacilitate the nuclear trafficking of the pre-H/ACARNPs, directing them to the appropriate nuclearstructure where final maturation and RNP assemblyoccur. While the two other small protein compo-nents of box H/ACA RNPs (Nop10 and Nhp2) arerecruited to the elongating polymerase togetherwith Cbf5 and Naf1, Gar1 is thought to associatewith the pre-RNP only later in the assemblyprocess.36,39,40 It has been proposed that Naf1 isexchanged for Gar1 during RNP transport and thatthis exchange may be the signal for activation of thefully functional RNP.36

Here, we report the crystal structure of a domainof yeast Naf1p determined at a resolution of 2.74 Å.We show that this domain is structurally similar tothe core domain of archaeal Gar1, suggesting thatthey share a common Cbf5 binding surface thatoverlaps with the Naf1p dimer interface. We havetested in vitro and in vivo the interaction of thisdomain with other H/ACA proteins and shown thatthe Naf1p dimer has to be disrupted by chemicaltreatment or site-directed mutagenesis before thisdomain is able to bind to Cbf5p.

Results and Discussion

Structure of the Gar1-homology domain ofNaf1p

Naf1p is a 55 kDa protein that contains regions oflow sequence complexity (rich in serine, proline andglutamine residues; Figure 1(a)) which are predictedto be unstructured. Due to these large unstructuredregions, the bacterially expressed protein was inmajority insoluble and the small soluble fractionextremely unstable after purification. Smaller solu-ble constructs were isolated by random domaingeneration, soluble expression screens and limitedproteolysis (S.Q.-C. et al., unpublished results). Ofthe final set of soluble domains, two constructs wereretained for structural investigation due to theirhigh solubility. These two domains overlap with theregion of Naf1p predicted to have homology withGar1 and have been called Naf1Δ1p (residues109–232) and Naf1Δ2p (residues109–272) (Figure 1(b)).

1339Structure of the Naf1 Core Domain

Page 221: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Figure 1 (legend on next page)

1340 Structure of the Naf1 Core Domain

Page 222: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Both Naf1Δ1p and Naf1Δ2p constructs yieldedcrystals, but a full X-ray diffraction dataset couldonly be obtained on the Naf1Δ1p construct afterlimited proteolysis. The protein crystallized in spacegroup P3121 with six copies in the asymmetric unit.The structure was determined by single anomalousdiffraction (SAD) on a selenium-labelled protein at2.95 Å. Only one selenium atom per protein (120amino acid residues)was detectable, and this yieldedpoor phasing power. The relatively poor initial mapswere significantly improved by electron densityaveraging across the six molecules and the finalmodel was fully refined against a 2.74 Å dataset.Since limited proteolysis was performed beforecrystallization, the exact construct crystallized wasunknown, but its size was determined by massspectroscopy on dissolved crystals. The final modelin the longest chain comprises residues 120 to 220 ofNaf1p, corresponding to a mass of 11,468.3 Daltons.The measured mass of 11,900 Daltons indicates thatsomeN and/or C-terminal residues are not visible inthe structure. Furthermore, the loop between resi-dues 155 and 168 is not visible in some of the copiesin the asymmetric unit; a minor peak on the massspectroscopy spectrum is compatible with cleavageof this loop in some polypeptide chains.For NMR studies, both Naf1Δ1p and Naf1Δ2p

constructs were modified by introduction of acleavable N-terminal 6xHis-tag for collection of1H-15N heteronuclear single-quantum coherence(HSQC) spectra. Naf1Δ1p showed greater resonancedispersion indicating that the protein is folded andamenable to structural studies, but both spectra alsocontain a large cluster of resonances near 8 ppmsuggestive of an unstructured region (data notshown).The structure of Naf1Δ1p comprises seven β-

strands and one α-helix (Figure 2(a)). It can bedescribed as a β–β sandwich with two antiparallelsheets, β1β2β5β4b and β1β6β3β4a, the extended β1strand being common to both sheets. The two sheetspack tightly through hydrophobic interactions. Thestructure can also be described as a six-strandedantiparallel β-barrel with strand order β1β2β5(β4a/β4b)β3β6. The β4a and β4b strands are described asone broken strand to simplify the comparison withother proteins containing this fold (see below). Theα1 helix is inserted between β5 and β6 and closesone side of the barrel, while the loop between β2 andβ3 closes the other side. In contrast to the α1 helix,which is tightly packed by hydrophobic interac-tions, the loop between β2 and β3 is not visible in allthe copies of the asymmetric unit, probably reflect-ing structural flexibility. The 17 N-terminal residuesbefore β1 wrap around almost half of the protein'scircumference on the side of the barrel and pack

along strands β6, β3 and β4a and β5. The packing ofthe N-terminal residues is relatively tight and buriesa hydrophobic patch on the surface of the barrel.These residues are not sensitive to proteolysis, sug-gesting that they are an integral part of the coreNaf1p domain. In the crystal, this region is also in-volved in extensive intermolecular crystal contacts.

Comparison with Gar1

The fold of Naf1Δ1p is most similar to proteinsbelonging to the all-beta SCOP reductase/isomer-ase/elongation factor class, as already noticed forthe archaeal Gar1 domain. Proteins belonging to thisclass adopt a core six-stranded barrel with varioushelical additions and insertions and have unrelatedfunctions. The proteins most similar to Naf1Δ1pinclude the “core” Gar1 domain of aGar1 itself (PDBcode 2ey4; rmsd 1.64 Å for 69 residues, 19%sequence identity), the N-terminal domain of ribo-flavin synthase from Escherichia coli (PDB code 1il8;rmsd 2.47 Å for 68 residues, 13% sequence identity),ribosomal protein L35AE from Pyrococcus furiosus.(PDB code 1sqr; rmsd 2.10 Å for 64 residues, 27%sequence identity), a domain of F1-bovine ATPase(PDB code 1h8e; rmsd 1.87 Å for 62 residues, 10%sequence identity) and a domain of elongation factorEf-Tu (PDB code 1b23; rmsd 2.68 Å for 68 residues,10% sequence identity). Although some proteinscontaining this fold bind to RNA, there is nocommon RNA binding region and the same foldcan also be involved in protein–protein interactionsor the binding of small molecules. Compared toaGar1, Naf1Δ1p contains an additional α-helixinserted between β5 and β6. This helix is alsopresent in the N-terminal domain of riboflavinsynthase and the aGar1 loop in this region containssome helical turns. It therefore seems that this helixis not unique to Naf1p, but a common structuraltheme in this superfamily.

Naf1Δ1p is a structural homologue of the Cbf5binding domain of aGar1

Naf1p interacts with Cbf5p and other nucleolarproteins in vivo, but the details of these interactionsare unknown. Since Naf1p has a domain that adoptsthe core aGar1 fold, it is tempting to speculate thatthese domains are functional homologues as well.Figure 3(a) shows Naf1Δ1p superposed on aGar1 inthe same orientation as in Figure 2(a), as observed inthe archaeal aGar1–aCbf5–aNop10 complex.26 TheaCbf5 interaction surface of aGar1 is located on theβ1β2β4β5 strands and the β1–β2, β2–β3 and β4–β5hairpin loops. Helix α5 in aCbf5 packs roughlyperpendicularly to the aGar1 β-sheet, while α3 and

Figure 1. (a) Schematic domain structure of yeast Naf1p (WTNaf1p) and of the constructs used in this study(Naf1Δ1p). (b) Sequence alignment of Naf1 and Gar1 protein families; the alignment is truncated at both the N and Cterminus of the domain homologous between both families. The structure-based alignment of Naf1p (this work) withaGar1 (PDB code 2EY4) was used to align both families with T-Coffee.68 The secondary structures are shown at the top foryeast Naf1p and at the bottom of the alignment for aGar1. The boundaries of the Naf1Δ1p construct used for structuredetermination are indicated.

1341Structure of the Naf1 Core Domain

Page 223: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

β7 interact with strand β4 and the β2–β3 and β4–β5loops of aGar1 (aCbf5 numbering is adapted fromRashid et al.26). The interface mainly involveshydrophobic interactions. The superposition ofNaf1Δ1p on aGar1 shows that the aCbf5 interaction

surface of aGar1 is structurally conserved in Naf1p(Figure 3(a)). Moreover, the hydrophobic nature ofthe residues at the interface is well conserved, forexample the two aromatic rings of Phe185 andPhe192, plus Gly186, Pro187, Ile152, Val163 (Naf1p

Figure 2. (a) Stereo ribbon representation of the Naf1Δ1p monomer structure. The protein is coloured in graduatedcolours from blue (N-terminal) to red (C-terminal); these Figures were generated with PyMol [http://pymol.sourceforge.net/]. (b) Ribbon representation of the Naf1Δ1p dimer. The monomer on the left is presented in the same orientation as in(a); bound sulfate atoms are shown in stick representation. (c) Ribbon representation of the Naf1Δ1p dimer, rotated by 90°compared to (b). (d) Close-up representation of the Naf1Δ1p dimer interface (boxed in (c)); residues involved indimerization are represented in stick.

1342 Structure of the Naf1 Core Domain

Page 224: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

numbering; Figure 3(b)). Asp43 in aGar1, involvedin hydrogen bonding to the absolutely conservedHis189 in aCbf5, is conservatively replaced byGlu183 in Saccharomyces cerevisiae Naf1p and Gar1p(Figure 3(b)). Since all the residues involved inbinding aCbf5 are conserved in Naf1Δ1p, withoutany obvious structural impediments, it is very likelythat Naf1Δ1p is the bona fide Cbf5p binding moduleof Naf1p and that the same interface is used to bindCbf5 in both Naf1p and aGar1.

Dimerization of Naf1Δ1p involves the putativeCbf5p binding interface

The Naf1Δ1p protein is present in the asymmetricunit as three independent dimers and the twomonomers forming the dimer are related by 2-foldsymmetry (Supplementary Data, Figure S1). Thedimerization surface involves one side on the barrelwith strands β1, β2, β4b and β5 stacked onto thesame strands of the opposing monomer (Figure 2(b)and (c)). Dimerization buries 570 Å2 of solvent-accessible surface per protein (10% of the total) andinvolves 14 residues from each monomer, mostlythrough hydrophobic interactions. His154, Phe192,and Phe185 are involved in extensive stacking inter-actions; Phe185 stacks onto Phe185 of the opposingmolecule, forming a continuous side-chain stackalong the interface. Five hydrogen bonds are formedacross the interface, Ser145–Ser145, His154–Glu148,Gly186–Glu183 (Figure 2(d)), and one salt bridge(Glu148–Lys144) is observed as well (Figure 2(d)).Two sulfate molecules from the crystallization bufferbind at the interface of the dimer (Figure 2(b)),sandwiched between Lys144 of one monomer andLys209 of the other. This sulfate is present in everycopy of the asymmetric unit, but as the lysineresidues are not conserved in other species thisinteraction probably aids in crystallogenesis ratherthan reflecting an important functional feature.In the asymmetric unit, two dimers interact

through the β2–β3 and β4–β5 loops, leading to atetramer with both dimers related by a 2-fold axiswith D2 symmetry (Supplementary Data, FigureS1). The last dimer in the asymmetric unit also formsthe same tetrameric structure with the dimergenerated by the crystallographic 2-fold axis (Sup-plementary Data, Figure S1). The dimer–dimerinteraction buries about 520 Å2 per chain, and iscompatible with a stable tetrameric arrangement insolution. The β2–β3 loop, although at the interfacebetween two dimers, is not well structured in all ofthe polypeptide chains present in the asymmetricunit. However, this loop cannot have the sameconformation in all the molecules, as this would leadto severe steric clashes. A minor peak in the massspectroscopy spectrum of the crystallized proteinindicates that a small fraction has been cut by theprotease in this loop.In order to confirm the oligomeric state of the

Naf1Δ1p protein (∼14 kDa) in solution, T1 and T2relaxation times were measured by NMR. Theaverage relaxation times were 817 ms and 54 ms,

respectively, over the well-structured region of theprotein; the overall rotational correlation time cal-culated from these data, τc=14.5 ns, corresponds to aprotein of roughly 34 kDa. This result confirms thatthe protein is a dimer in solution as well. Finally,analytical ultracentrifugation measurements indi-cate that Naf1Δ1p behaves as an ideal monomer–dimer. Analysis of the velocity data indicates thatthis protein exists as a homogeneous mixture ofdimer with a small amount of monomer, while theequilibrium data indicate that the protein self-associates reversibly with a Kd=20–90 μM (Supple-mentary Data, Figure S2). From this analysis we canconclude that Naf1Δ1p is a dimer in solution andthat tetramer formation is induced only in the crystal.The model of Naf1Δ1p in complex with aCbf5 in

Figure 3(a) is shown in the same orientation as theNaf1Δ1p monomer depicted on the left in Figure2(b). It is clear that the predicted Cbf5p bindingsurface of Naf1Δ1p, defined by analogy to aGar1,overlaps with its dimerisation interface. Therefore,Naf1p cannot bind to Cbf5p in the dimeric form. Thisraises fundamental questions as to the function ofNaf1p and Gar1p. If Naf1p interacts with Cbf5p inthe same way as aGar1 does, the Naf1p dimer has tobe disrupted. Likewise, this interaction surface ishighly conserved in Naf1p and Gar1p leading to thepossibility that Gar1p may dimerise in solution, andthat Naf1p and Gar1p may interact through thissame surface to form a heterodimer. These hypoth-eses have been addressed by studying the interactionof Naf1Δ1p with box H/ACA RNP components.

Naf1Δ1p association with box H/ACA RNPcomponents

In order to study the interaction of Naf1Δ1p withCbf5p and Gar1p, we covalently attached yeastCbf5Δp, Gar1p, or afibrillarin used as a negativecontrol, to CNBr-activated Sepharose beads andincubated the charged beads with purified recombi-nant histidine-tagged Naf1Δ1p (see Materials andMethods for details). Cbf5Δp is a truncated versionof Cbf5p lacking its 138 C-terminal amino acidresidues.41 It was used instead of full-length Cbf5pbecause we have so far failed to obtain the entirerecombinant protein produced in E. coli in a solubleform. Cbf5Δp is properly folded because it candirectly and specifically interact with H/ACAsnoRNAs in vitro.41 As shown in Figure 4, lane 5,native Naf1Δ1p interacts very weakly with Cbf5Δpin vitro; we hypothesise that this occurs because,within the native Naf1Δ1p dimer, the Cbf5p bindingsurface is not accessible for binding. In order forNaf1p to interact with Cbf5p,we reasoned that in thecell the Naf1p dimer must be broken up in order tofree the Cbf5p binding interface. In order to test thishypothesis, we tried several chemical treatments ofNaf1Δ1p and tested the protein for interaction withCbf5Δp in vitro. Incubation of Naf1Δ1p in a glycine-containing buffer at low pH (pH 2.5) immediatelyprior to its addition to the beads, strongly increasedits binding to Cbf5Δp-coated beads (lane 13); the

1343Structure of the Naf1 Core Domain

Page 225: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Figure 3 (legend on next page)

1344 Structure of the Naf1 Core Domain

Page 226: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

interaction is specific, because no binding to afibril-larin-coated beads (lane 11), used as negative control,could be detected. We propose that treatment withthe acidic glycine buffer disrupts the dimer, exposesthe Cbf5p binding site of Naf1Δ1p and allows theassociation with Cbf5Δp.In order to assess whether this may occur in vivo

as well, we searched for mutants that disrupt theNaf1Δ1p dimer and analysed them by NMR andanalytical ultracentrifugation. From the analysis ofthe structure, we hypothesised that substitution ofthe absolutely conserved G186 residue by aglutamate would prevent the formation of thetwo E183–G186 hydrogen bonds between Naf1Δ1pmonomers and strongly weaken dimerisation(Figure 2(d)). Analysis of the mutant protein byNMR using 15N-HSQC measurements shows adrastic loss of signal corresponding to the proteinamides, suggesting that the oligomeric state ofNaf1Δ1G186Ep in solution is strongly altered.Analytical ultracentrifugation velocity data indi-cate that the Naf1Δ1G186Ep protein displays twodistinct species corresponding to the monomer and

trimer as well as a broad range of highermolecular masses (Supplementary Data, FigureS2). The trimer was present about ∼60% of thetime and higher-order oligomeric aggregates weremore prevalent than the monomer, and anequilibrium constant for multimerisation couldnot be calculated. The tendency for Naf1Δ1G186Epto multimerise indicates that the stable dimericassociation observed for the wild-type protein isstrongly perturbed by the G186E mutation. TheNaf1Δ1G186Ep protein was therefore tested forinteraction with Cbf5Δp in the hope that the G186Ereplacement would affect only marginally theproposed Cbf5p–Naf1p interaction. In contrast tothe Naf1Δ1p protein, Naf1Δ1G186Ep could interactwith Cbf5Δp without prior treatment with the acidicglycine buffer (Figure 4, lane 6), demonstrating thatin Naf1Δ1G186Ep, the Cbf5p binding interface isconstitutively accessible. These results stronglysuggest that the Naf1p dimerization interface andthe Cbf5p binding interface overlap; this mutantwas therefore used in in vivo tests and the implica-tions of this observation are discussed below.

Figure 4. Interactions of the Gar1-homology domain of Naf1p protein with Cbf5p and Gar1p. Native purifiedrecombinant histidine-tagged Naf1Δ1p (lanes 3, 5 and 7) and Naf1Δ1G186Ep (lanes 4, 6 and 8) were incubated withafibrillarin-coated beads (lanes 3 and 4), Cbf5Δp-coated beads (lanes 5 and 6) and Gar1p-coated beads (lanes 7 and 8).Naf1Δ1p and Naf1Δ1G186Ep previously treated with 24 mM glycine buffer (pH 2.5) (respectively, lanes 11, 13, 15 andlanes 12, 14, 16) were incubated with afibrillarin-coated beads (lanes 11 and 12), Cbf5Δp-coated beads (lanes 13 and 14)and Gar1p-coated beads (lanes 15 and 16). After precipitation and washing, beads were resuspended in proteindenaturing buffer. Aliquots of the resulting supernatants or ≅13% of the corresponding input were submitted to SDS–PAGE and Western analysis using antibodies specific for the histidine tag. (1*): bands detected by antibodies specific forthe histidine tag corresponding probably to Naf1Δ1p multimeric forms. (2*): bands detected by antibodies specific for thehistidine tag corresponding to monomeric and aggregated forms of histidine-tagged Cbf5p released from the beadsduring the elution.

Figure 3. (a) Superposition of the Naf1Δ1p monomer (rainbow colored) with aGar1 (coloured in grey) as observed inthe complex with archaeal aCbf5 (coloured in blue) and aNop10. Naf1Δ1p is in the same orientation as in Figure 2(a) and(b) (left monomer). (b) Stereo representation of the interaction interface between Naf1p (orange)/aGar1 (light blue) andaCbf5 (blue). This region is boxed in (a). Residues involved in contacts with aCbf5 are represented in sticks. Numberingrefers to Naf1p residues. (c) Model of Naf1p in complex with aCbf5/aNop10/L7Ae/guideRNA, rotated by 90° comparedto (a). The β7–β10 loop of aCbf5 is shown in the closed conformation and modelled by broken lines for the openconformation. The N and C-terminal extensions of Naf1p, not present in the crystallized construct, are shown in blue andred broken lines, respectively.

1345Structure of the Naf1 Core Domain

Page 227: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Interestingly, Naf1Δ1p is able to interact specifi-cally in vitro with Gar1p without any acidic glycinebuffer treatment (Figure 4, lane 7). We hypothesisethat Naf1Δ1p monomers produced by low levelNaf1Δ1p dimer dissociation under native conditionsmay be captured by Gar1p to produce Naf1Δ1p/Gar1p hetero-dimers. Nevertheless, as we wouldpredict, treatment with the acidic glycine bufferimproves the interaction between Naf1Δ1p andGar1p (compare lanes 1 to 7 and 9 to 15). As ex-pected, however, theG186E replacement inNaf1Δ1pinhibits the interaction with Gar1p (Figure 4,compare lanes 7 to 8 and 15 to 16), although onlypartially so. This is likely due to the fact that in thecase of the Naf1Δ1G186Ep/Gar1p hetero-dimer,only one hydrogen bond is missing, whereas in theNaf1Δ1G186Ep–Naf1Δ1G186Ep homodimer, twostabilising hydrogen bonds cannot form.

Functional significance of the Cbf5p- interactionsurface of Naf1p

We next assessed whether the integrity of the Gar1domain of yeast Naf1p, which mediates the inter-action with Cbf5p in vitro, is essential for viability.For this purpose, we performed plasmid shufflingassays, using a genomic naf1 null strain (naf1::kanMX4) harbouring a plasmid containing the wild-type NAF1 gene and a URA3 marker. This strainwas further transformed with TRP1-containing

plasmids possessing the NAF1 wild-type gene orderivatives encoding a Naf1p protein lacking theGar1 domain altogether (Naf1ΔGar1p), a Naf1pprotein containing glutamate instead of glycine atposition 186 (Naf1G186Ep), or just the Gar1 domainof Naf1p (Naf1Δ1p). We addressed whether theresulting transformed strains remained viable in theabsence of the URA3-NAF1 plasmid by assessingtheir growth on a medium containing 5-fluorooroticacid. Only strains harbouring the TRP1-NAF1plasmid can grow on such medium (SupplementaryData, Figure S3). Since Naf1ΔGar1p, Naf1Δ1p andNaf1G186Ep are expressed at the same level as wild-type Naf1p (data not shown), these results suggestthat (i) the Gar1 domain is absolutely required forthe activity of Naf1p, (ii) the Gar1 domain alonecannot fulfill all the functions of Naf1p, and (iii) theG186E mutation destroys the function of Naf1p,possibly by disruption of Naf1p dimerization.In order to characterise more precisely the func-

tion impaired in the Naf1ΔGar1p, Naf1G186Ep andNaf1Δ1p proteins, we assessed whether thesealtered proteins are still able to associate in vivowith box H/ACA snoRNP components. For thatpurpose, we transformed plasmids encoding theZZ-tagged wild-type Naf1p or its derivatives into awild-type yeast strain and performed immunopre-cipitation assays using IgG-Sepharose. As shown inFigure 5, none of the altered versions of Naf1pinteracts with the H/ACA snoRNAs and proteins,

Figure 5. The Gar1-homology domain of Naf1p protein is absolutely required but not sufficient for the association ofNaf1p with H/ACA snoRNP components in vivo. Immunoprecipitation experiments were carried out using IgG-Sepharose and total cellular extracts from different strains expressing the ZZ tag alone (lanes 9 and 10), Naf1p-ZZ (lanes 1and 2), Naf1ΔGar1p-ZZ (lanes 3 and 4), Naf1G186Ep-ZZ (lanes 5 and 6) or Naf1Δ1p-ZZ (lanes 7 and 8). (a) and (b) RNAswere extracted from the pellets obtained following precipitation (IP) or from an amount of input extract corresponding to1/150th of that used for the precipitation (T). Extracted RNAs were analyzed by the Northern blot technique usingoligonucleotide probes specific to U3, snR11 and snR44 (a) or labelled with [32P]pCp and separated on a 6% sequencinggel (b). M, molecular mass marker (ФX174 digested with Hinf1). (c) after precipitation and washing, beads wereresuspended in protein denaturing buffer. Aliquots of the resulting supernatants (IP, lanes 2, 4, 6, 8 and 10) and 1/20th ofthe corresponding input extract (T, lanes 1, 3, 5, 7 and 9) were submitted to SDS–PAGE and Western analysis.

1346 Structure of the Naf1 Core Domain

Page 228: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

in contrast with tagged wild-type Naf1p, which caninteract specifically with the box H/ACA snoRNPcomponents in the presence of endogenous Naf1p.The immunolocalisation data for these proteins areshown in Figure 6, and show that all proteins arelocalised in the nucleus, with the exception ofNaf1Δ1p, which is localized in both the nucleusand the cytoplasm. This indicates that the loss ofinteraction of the Naf1p mutants is not due to adefect of localisation that could affect their associa-

tion with snoRNP components. Thus, the Gar1domain is absolutely required but not sufficient forthe association of Naf1p with components of H/ACA particles in vivo. The G186E mutation, whichdestabilises the Naf1p dimer but does not preventCbf5p binding in vitro, also impairs binding to boxH/ACA snoRNP components in vivo. This discre-pancy might arise from the fact that the alteration ofthe oligomeric state of Naf1G186Ep also alters itsinteraction with other factors thereby influencing its

Figure 6. Localisation of Naf1p mutants. Immunolocalisation of ZZ-tagged protein Naf1p, ZZ-tagged Naf1ΔGar1p,ZZ-tagged Naf1G186Ep, and ZZ-tagged Naf1Δ1p. Immunofluorescence was carried out with anti-protein A antibodiesand anti-rabbit IgG TRITC conjugates. Yeast nuclei were visualized by DNA staining with DAPI.

1347Structure of the Naf1 Core Domain

Page 229: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

localisation, sequestering the pool of Naf1G186Ep orpreventing Naf1G186Ep to be recycled after oneround of transport of a box H/ACA particle.

Function of the Gar1-homology domain of Naf1p

The structure of the complete archaeal H/ACARNP bound to a single hairpin H/ACA RNA27

provides insight into the possible function of theGar1 domain of Naf1p during box H/ACA RNPmaturation. The aCbf5–aGar1–aNop10–L7Ae guideRNA complex is shown in Figure 3(c) with Naf1psuperposed on aGar1 (aGar1 has been omitted forclarity). In the complex, aGar1 interacts with theβ7–β10 loop of aCbf5 which is fully visible in theaCbf5–aGar1–aNop10 structure26 (closed conforma-tion, Figure 3(a) and (c)). In the aCbf5–aGar1–aNop10–L7Ae–RNA complex, the β7–β10 hairpinis flipped in the opposite direction and partiallydisordered27 (open conformation, broken lines inFigure 3(c)). This loop is thought to bind andstabilise the substrate RNA in the closed conforma-tion, whereas loading and release of the substrateRNA is facilitated in the open conformation. It isenvisaged that binding of aGar1 to aCbf5 influencesthe β7–β10 hairpin conformation, thereby modulat-ing the association with the target RNA and there-fore the activity of aCbf5. If Naf1 binds to Cbf5 inthe same way as Gar1, as our structure suggests, itwould also interact with the substrate-loading loopand modulate the ability of Cbf5p to load andrelease the target RNA. The interaction of Cbf5with the core Naf1 domain, and also with regionsof Naf1 not present in our construct, maycontribute to inhibiting the activity of the enzymeduring transport by preventing loading of non-cognate RNAs.

Conclusions

Naf1p likely plays an important role in theassembly and transport of box H/ACA RNPs. Wehave determined the structure of the domain ofyeast Naf1p that is closely related to the core domainof aGar1. This structure unambiguously shows thatyeast Naf1p contains a domain structurally homo-logous to aGar1, with a conserved Cbf5p bindingsurface. Unexpectedly, this same surface is involvedin dimerisation of Naf1Δ1p both in the crystal and insolution. This observation is especially noteworthy,since it distinguishes the Gar1 domain of Naf1pfrom Gar1, which is a monomer at least in archaea.We have shown that the Naf1Δ1p dimer shows littleaffinity for Cbf5p, and the interaction with Cbf5pcan only be observed when the Naf1Δ1p homo-dimer is destabilized.Modulation of the equilibrium between the

dimeric state of Naf1p and its complex with Cbf5pprovides an appealing hypothesis for the regulationof box H/ACA RNP transport and assembly. It hasrecently been shown that overexpressed humanNaf1 delocalises to the cytoplasm.42 This might be

due to a concentration effect, shifting the equili-brium between monomeric and dimeric forms ofhuman Naf1. Naf1 most likely assembles along withCbf5, Nop10 and Nhp2, early during H/ACAsnoRNA transcription. During transport of the H/ACA RNPs from the nucleoplasm to the nucleoli orCajal bodies, cellular conditions or some unknownassembly factor(s) could push the equilibrium infavour of dimerization of Naf1. Gar1 could alsocompete with Naf1 for Cbf5 binding. If so, Gar1could gradually be incorporated in the H/ACARNP and Naf1 might be sequestered in the dimericform, which is unable to interact with Cbf5. Thereplacement of Naf1 by Gar1 would then ensure thatonly mature and functional H/ACA RNPs areformed.Since the exact function of Gar1 is not known, the

function of Naf1 during maturation of the boxH/ACA particle is also elusive. Gar1 has beenproposed to be involved in the regulation of Cbf5activity by modulation of the Cbf5 RNA substrate-binding loop. Naf1 might also have a role inmodulating the activity of Cbf5 by interacting withthe RNA binding region of Cbf5 and maybe with theboxH/ACARNA itself. The electrostatic potential ofNaf1p (Supplementary Data, Figure S4) is veryacidic and does not define any conserved positiveelectrostatic patch that would be a candidate for anRNA binding surface. Our results show that regionsoutside the core-Gar1 domain are necessary for Naf1function. It is interesting to note that the N and Cterminus of our construct are in close proximity tothe β7–β10 loop of Cbf5p in the model proposed forthis interaction (Figure 3(c)). The Naf1Δ1p constructcrystallized in this work ends at residue 220, and thenext 50 residues (220–270) that define the mostconserved region of Naf1p are present in constructNaf1Δ2p (Figure 1(b)). Interestingly, the HSQCspectrum of this longer construct contains onlythree additional resonances, suggesting that theNaf1Δ2p extension does not harbour any additionalstructure. It is therefore probable that this region isnot part of the core Gar1-like structural domain, butis instead the binding epitope for other yet to becharacterized factors. This region is rich in conservedacidic and basic residues and is ideally placed tointeract with Cbf5p or to recruit other factors to thisregion. Our work suggests that these regions areimportant for localisation, but further experimentsare needed to define the precise role of these regionsin Naf1 function.

Material and Methods

Cloning, expression and purification of a solubleNaf1p construct

Naf1p contains several regions of low sequence com-plexity that are predicted to be unstructured. Notsurprisingly, full-length Naf1p is only weakly over-expressed in E. coli, is difficult to purify to homogeneityand does not crystallize. In order to find domains amen-

1348 Structure of the Naf1 Core Domain

Page 230: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

able to structural studies by NMR or crystallography, wedeveloped a systematic procedure to generate multiplerandom protein domains from the same protein andscreen them for solubility. Briefly, a random pool ofdomains was generated by PCR using the complete NAF1gene as a template and the random primer 5′-GACCAT-GAGGACGTTAAGCTTNNNNNNNNNNNNNNN-3′.This pool of PCR products was cloned into the HindIII siteof a derivative of pET9 vector. One-sixth of all clones arein-frame with six histidine codons at the C terminus,followed by the suppressible stop codon TAG and by acDNA coding for the green fluorescent protein (GFP).43

During the “on plate” expression tests of the library, GFPacts as a solubility reporter, since it will not fluoresce if theinserted open reading frame is out of frame or if the fusionis insoluble.44

The Gold (DE3) expression strain pre-transformed witha plasmid coding for the sup-tRNALys3 was transformedwith the collection of pET vectors containing the randominsertions. The two plasmids are independently main-tained by selection with chloramphenicol and kanamycin,respectively. About 2000 individual clones were platedand placed at 37°C until colonies were observed. After oneor two days at 25 °C, GFP fluorescence was monitored.Only about 0.1% of all colonies were green; seven of themcontained an insert larger than 300 nucleotides. The sevenplasmids were individually purified and re-transformedinto the Gold (DE3) strain without the sup-tRNALys3plasmid. All seven constructs isolated expressed a solubleprotein domain even in the absence of GFP fusion thatcould be purified as a soluble polypeptide. Ultimately, thisprocedure yielded two soluble constructs covering thedomain of Naf1p predicted to be homologous to Gar1pand comprising residues 109–232 (Naf1Δ1p) and 109–272(Naf1Δ2p).Both Naf1Δ1p and Naf1Δ2p were expressed in 1 liter of

2xYT cultures inoculated with transformed Gold (DE3),followed by induction with 0.5 mM IPTG for 3 h at 37 °C.Cells were harvested by centrifugation, resuspended in40 ml of 20 mM Tris–HCl (pH 7.5), 200 mM NaCl, 5 mMβ-mercaptoethanol and stored overnight at −20 °C. Celllysis was completed by sonication. The His-taggedproteins were purified on a Ni-NTA column (QiagenInc.), eluted with imidazol and loaded on a Super-dexTM200 column (Amersham Pharmacia Biotech), equi-librated against 20 mM Tris–HCl (pH7.5), 200 mM NaCl,10 mM β-mercaptoethanol.

Crystallization and data collection

While Naf1Δ1p and Naf1Δ2p failed to crystallize,limited proteolysis of these domains showed that shorterconstructs could be generated pointing to the possibilitythat flexible regions were hindering crystallization. Bothconstructs were subjected to limited proteolysis andscreened for crystallization without further purificationor separation of the protease enzymes. The Naf1Δ1p con-struct that underwent limited proteolysis was crystallizedat 293 K by the hanging drop vapour diffusion methodfrom 1:1 μl drops of protein (20 mg/ml in 20 mM Tris(pH7.5), 200 mM NaCl, 10 mM BSH, 0.1 mg/ml papain)and precipitant containing 2 M ammonium sulfate, 0.2 MK/Na tartrate, sodium citrate (pH5.6). Crystals weretransferred in the mother liquor containing 30% (v/v)ethylene glycol prior to flash freezing in liquid nitrogen.Two X-ray diffraction data from crystals of the seleno-

methionine (SeMet)-substituted protein were collected onbeamlines BM30A (used for phasing) and ID14-3 (used for

refinement) at the ESRF. Data processing was carried outwith XDS or MOSFLM and SCALA.45–47 The crystalsbelong to space group P3121 with six molecules per asym-metric unit, corresponding to 40% solvent content. Cellparameters and data collection statistics are reported inTable 1.

Structure solution and refinement

The structure of the soluble domain of Naf1pwas solvedby single anomalous diffraction (SAD) using data to 2.95 Åresolution collected from a single selenated crystal. Theprogram SHELXD48 was used to find an initial set of six Sesites. Refinement of the Se sites and phasing were carriedout with the program SHARP.49 Phase refinement andextension were carried out via density modification withSOLOMON.50 Due to the low number of anomalousscattering atoms (1 for 120 amino acids), this procedureresulted in maps of relatively poor quality that allowedonly a few secondary structure elements to be identified.However, inspection of the selenium sites in the asym-metric unit revealed that they were arranged in pairs. Thispointed to the presence of three dimers corresponding to60% solvent content. The non-crystallographic symmetry(NCS) relating the six molecules was established using acombination of manual rebuilding and superposition ofdensity with the homologous aGar1 structure. When theNCS was found, the sixfold averaging of the density wasperformed using the solvent flattening procedures ofresolve51 and dmulti,52 resulting in a greatly improvedmap. Multiple cycles of manual and automatic rebuilding,as implemented in resolve, finally enabled a completemodel to be built and refined using O and REFMAC.53,54

The model was fully refined and completed from thehigher resolution data set, using NCS restraints and TLSrefinement (1 group per molecule). Inspection of the finalrefined structure revealed that the six additional sites werein methionine residues located in a disordered loop.Refinement statistics are shown in Table 1. All the residuesfall in favourable regions of the Ramachandran plot.

Table 1. Data collection and refinement statistics

Peak Native

Wavelength (Å) 0.9797 0.9797Unit-cell parameters a, b, c (Å) 103.7 103.7

109.2103.5 103.5

109.2Resolution (Å) 2.95 2.74Total number of reflections 189,404 159,822Total of unique reflections 14,225 18,030Multiplicity 13.4 (13.7) 8.9 (9.1)Rmerge

a 11.9 (52) 8.8 (59)I/σ(I) 19.3 (5.6) 18.9 (3.3)Overall completeness (%) 97.3 (96.8) 99.4 (99.7)Reflections (working/test) 17,085 (1220)Rcryst/Rfree

b 25.7/28.6Non-hydrogen atoms 4576Water molecules 0Bonds (Å) 0.03Angles (°) 2.6Mean B factor (Å2) protein 30.5Ramachadran analysis

Most-favoured/allowed/generously allowed (%)

83.8/16.0/0.2

a Rmerge=∑h∑i|Ihi−bIhN|/∑h∑iIhi, were Ihi is the ith observa-tion of the reflection h, while bIhN is the mean intensity ofreflection h.

b Rfactor=∑||Fo|−|Fc||/|Fo|. Rfree was calculated witha set of randomly selected reflections (5%).

1349Structure of the Naf1 Core Domain

Page 231: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Protein–protein interaction assays

Histidine-tagged Cbf5Δp and T7-tagged Gar1p proteinsare expressed in E. coli as insoluble aggregates. However,soluble proteins could be obtained by incubation of thecorresponding inclusion bodies with 100 mM NaHCO3,500 mM NaCl and 1% (w/v) SDS. Histidine-taggedarchaeal afibrillarin (from Pseudomonas abyssi) was purifiedon Ni-NTA Sepharose beads (Qiagen) according to themanufacturer's instructions in the following buffer: 20mMNa2HPO3 (pH8), 200 mM NaCl, 0.2% (v/v) Triton X100,2 mM MgCl2, 5 mM β-mercaptoethanol and 20% (v/v)glycerol. Histidine-tagged Naf1Δ1p and Naf1Δ1G186Epwere first purified on Ni-NTA Sepharose beads in 20 mMTris–HCl (pH 8), 200 mM NaCl, 0.2% Triton X100, 2 mMMgCl2, 5 mM beta-mercaptoethanol and 20% glycerol andsubsequently on superdex 200 gel filtration column(Amersham) in 20 mM Na2HPO3 pH 8, 200 mM NaCl,0.2% triton X100, 2 mM MgCl2, 5 mM β-mercaptoethanol.Cbf5Δp, Gar1p and afibrillarin proteins were immobilizedon CNBr-Sepharose activated beads (Roche), according tothe manufacturer's instructions. In some cases, Naf1Δ1pand Naf1Δ1G186Ep were treated prior to the interactiontests for 30 min at room temperature with a buffercontaining 24 mM glycine–HCl (pH 2.5). Binding assayswere performed in the following interaction buffer (IB):20 mM Tris–HCl (pH 7.5), 500 mM NaCl and 0.05% (v/v)NP40 for 2 h at room temperature. Beads were then washedsix times with 1 ml of IB. Proteins were eluted in 100 mMTris–HCl (pH 8), 4% SDS, 20% glycerol, 0.04% (w/v)bromophenol blue, 200 mM DTT. His-tagged proteinswere detected by Western blot assays using anti-histidinetag HRP-conjugated mouse monoclonal antibodies (6xHismAb/HRPconjugate; Clontech) diluted 500-fold.

Immunoprecipitation assays

These were performed as described.55

Immunolocalisation assays

Immunolocalisation of TAP proteins was performed asdescribed.56 Briefly, spheroplasts were incubated over-night at 4 °C with rabbit anti-protein A antibodies (Sigma)in phosphate-buffered saline/bovine serum albumin(1:20,000 dilution). Fluorescence detection was achievedwith anti-rabbit IgG TRITC conjugates (Sigma) diluted2000-fold, and DNAwas counterstained with DAPI. Ima-ges were captured with a Coolsnap ES camera (RoperScientifics) mounted on a DMRB microscope (Leica) usingthe Metavue software (Universal Imaging).

Plasmid shuffling assays

In order to assess whether Naf1ΔGar1p, Naf1G186Ep,Naf1Δ1p and Naf1Δ1G186Ep could salvage growth of ayeast strain totally devoid of endogenous Naf1p, weconstructed plasmids that constitutively express wild-typeNaf1p (pCH9), Naf1ΔGar1p (pCH11), Naf1G186Ep(pCH13), and Naf1Δ1p (pCH47) from the GAR1 promo-ter. The open reading frame (ORF) encoding Naf1Δ1p wasobtained by PCR amplification using the following oligo-nucleotides: 5′-CCCCCCCAGATCTTGGTCCTATACTAT-CGAAGAAC-3′ and 5′-CCCCCCAGATCTGCCTTTAACT-CGAAAGTATCTAT-3′. The PCR product digested by BglIIwas inserted in the BamHI-cut pHA113 vector (containingthe yeast TRP1marker sequence) downstream of the GAR1

promoter and upstream of a ZZ tag coding sequencecreating plasmid pCH47. ORFs encoding Naf1ΔGar1p andNaf1G186Ep were amplified by PCR using the followingoligonucleotides; for the naf1Δgar1 ORF: 5′-CCCCCCCCT-CGAGGAGTTAAAGCGCAAC′-3 and 5′-CCCCCCGCAT-GCTGAAGGATCTGCGG′-3 and for the naf1G186E ORF:5′-CCCCCCTCGAGGATAGAACTTTGATCGGGATGTT-GACGGAGGTGTTTGAACCCTTGCAAAACCCATTTTA-TAG′-3 and 5′-CCCCCCGCATGCTGAAGGATCTGCGG′-3. PCR products were digested by XhoI and SphI andinserted in XhoI/SphI-cut pCH9, creating plasmids pCH11and pCH13, respectively. The pCH36 plasmidwas obtainedby the ligation of an EcoRI/HindIII fragment from thepFL38 plasmid (containing the URA3 gene57) with anEcoRI/HindIII fragment from the pCH9 plasmid (contain-ing the wild-type NAF1 gene). pCH9, pCH11, pCH13,pCH47 were transformed into a naf1::kanMX4 strainpossessing the pCH36plasmid. To select cells able to survivein the absence of pCH36 (URA3-containing plasmid), thetransformed naf1::kanMX4 strainswere streaked onminimalmedium containing 0.6 mg/ml of fluoroorotic acid.

NMR assignments and relaxation measurements

The plasmid expressing Naf1Δ1p was redesigned tocontain a 6xHis-tag and TEV cleavage site at the Nterminus in order to reduce spectral overlap from theunstructured fusion tag. Isotopic labellingwas achieved byexpression in M9 media supplemented with [15N]NH4Cland [13C]glucose. Purified protein was concentrated withan Amicon pressure cell to a final concentration of 1.0 mMand dialyzed into 50 mMKCl, 50 mMKH2PO4, 4 mMDTT(pH 7.0). NMR spectra were collected at 298 °K, processedby NMRPipe,58 and viewed with Sparky (T. D. Goddard &D. G. Kneller, SPARKY 3, University of California, SanFrancisco). For assignment of the backbone amino acids,triple resonance experiments were recorded on a BrukerDRX 500 spectrometer equipped with Cryoprobe atNMRFAM. Sequential backbone assignments wereobtained from HNCO,59,60 HNCA,60,61 HNCACB,62,60and HN(CO)CACB62,60 spectra. Validation of the assign-ments was obtained from the analysis of NOE patternsobserved in a 15N-NOESY-HSQC63 spectrum collected on aBruker DRX 750 MHz with a 100 ms mixing time.Transverse T1 and T2 relaxation measurements64,65 wereobtained from a 15N-labelled sample with relaxationdelays varying between 10–850 ms and 8–160 ms, respec-tively, at 500 MHz on a Bruker Avance spectrometer. T1and T2 relaxation timeswere determined for each assignedresidue by fitting the peak heights to an exponential curvewith the Sparky software. An approximate rotationalcorrelation timewas estimated from the ratio of T1/T2:66,67

H c ¼ 12NN

ffiffiffiffiffiffiffiffiffiffiffiffiffiffiT1

T2� 7

r

where τc is the rotational correlation time and ωN is theLarmor frequency of nitrogen. The molecular mass wasthen obtained from the Stokes–Einstein equation.

Analytical ultracentrifugation

Both Naf1Δ1p and Naf1ΔG186Ep were purified anddialyzed into a buffer containing 50 mM KCl, 50 mMKH2PO4 (pH 7.0), and 0.5 mM TCEP. To generate proteinspecies following the pH jumps, both the wild-type andmutant proteins were dialyzed into a second buffercontaining 200 mM NaCl, 20 mM Tris–HCl (pH 7.5),

1350 Structure of the Naf1 Core Domain

Page 232: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

2 mMMgCl2, 4 mM 2-mercaptoethanol, 0.2% Triton-X, and20% glycerol. An equal volume of 0.1 M glycine (pH 2.5) inthe same buffer, but excluding Tris–HCl, was mixed withthe protein solution and incubated at 25 °C for 30min. Afteracidic glycine treatment, the proteins were exchanged intothe first buffer by rapid dilution and gel filtration for thecentrifugation experiments. Data were collected on anUltracentrifuge XLI/A and analyzed with Ultrascan 9.0 bythe CAUMA facility at the University of Texas in SanAntonio. Equilibrium experiments were run from 25,000–50,000 rpm over 107 h and measured by absorbance at280 nm. Both proteins, under native conditions, weresubmitted in a volume of 120 μl at six concentrationsbetween 35 μM and 0.3 mM. The velocity experimentssubjected samples to 60,000 rpm and were measured byinterference. Both proteins were provided in 450 μl at 0.1 Min the native state and after treatment with acidic glycine.

Acknowledgements

We thank Patrice Gouet for a special version ofESPRIPT used in Figure 1; Drs Borries Demeler andVirgil Schirff from CAUMA for their support andanalysis; Michèle Caizergues-Ferrer and AnthonyHenras for their support, advice and critical readingof the manuscript. Work at IBBMC-Université Paris-Sud was supported by the European 3D-repertoireprogram (LSHG-CT-2005-512028). Work at UW wassupported by a grant fromNIH-NCI (to G.V.). C.H. isa recipient of a post-graduate fellowship from theAssociation pour la Recherche sur le Cancer.Work atLBME-Université Paul Sabatier was supported bythe CNRS, the Université Paul Sabatier and grantsfrom La Ligue Nationale contre le Cancer (“EquipeLabellisée”) and the Agence Nationale de laRecherche (to Y.H.).

Supplementary Data

Supplementary data associated with this articlecan be found, in the online version, at doi:10.1016/j.jmb.2007.06.031

References

1. Meier, U. T. (2005). The many facets of H/ACAribonucleoproteins. Chromosoma, 114, 1–14.

2. Ganot, P., Bortolin, M. L. & Kiss, T. (1997). Site-specificpseudouridine formation in preribosomal RNA isguided by small nucleolar RNAs. Cell, 89, 799–809.

3. Ni, J., Tien, A. L. & Fournier, M. J. (1997). Smallnucleolar RNAs direct site-specific synthesis of pseu-douridine in ribosomal RNA. Cell, 89, 565–573.

4. Darzacq, X., Jady, B. E., Verheggen, C., Kiss, A. M.,Bertrand, E. & Kiss, T. (2002). Cajal body-specificsmall nuclear RNAs: a novel class of 2′-O-methyla-tion and pseudo-uridylation guide RNAs. EMBO J.21, 2746–2756.

5. Jady, B. E. & Kiss, T. (2001). A small nucleolar guideRNA functions both in 2′-O-ribose methylation andpseudouridylation of the U5 spliceosomal RNA.EMBO J. 20, 541–551.

6. Chen, J. L., Blasco, M. A. & Greider, C. W. (2000).Secondary structure of vertebrate telomerase RNA.Cell, 100, 503–514.

7. Mitchell, J. R., Cheng, J. & Collins, K. (1999). A boxH/ACAsmall nucleolar RNA-like domain at thehumantelomerase RNA 3′ end. Mol. Cell. Biol. 19, 567–576.

8. Dragon, F., Pogacic, V. & Filipowicz, W. (2000). In vitroassembly of human H/ACA small nucleolar RNPsreveals unique features of U17 and telomerase RNAs.Mol. Cell. Biol. 20, 3037–3048.

9. Mitchell, J. R., Wood, E. & Collins, K. (1999). Atelomerase component is defective in the humandisease dyskeratosis congenita. Nature, 402, 551–555.

10. Pogacic, V., Dragon, F. & Filipowicz, W. (2000).Human H/ACA small nucleolar RNPs and telomer-ase share evolutionarily conserved proteins NHP2and NOP10. Mol. Cell. Biol. 20, 9028–9040.

11. Atzorn, V., Fragapane, P. & Kiss, T. (2004). U17/snR30is a ubiquitous snoRNAwith two conserved sequencemotifs essential for 18S rRNA production. Mol. Cell.Biol. 24, 1769–1778.

12. Morrissey, J. P. & Tollervey, D. (1993). Yeast snR30 is asmall nucleolar RNA required for 18S rRNA synth-esis. Mol. Cell. Biol. 13, 2469–2477.

13. Lafontaine, D. L., Bousquet-Antonelli, C., Henry, Y.,Caizergues-Ferrer, M. & Tollervey, D. (1998). The boxH+ACA snoRNAs carry Cbf5p, the putative rRNApseudouridine synthase. Genes Dev. 12, 527–537.

14. Meier, U. T. & Blobel, G. (1994). NAP57, a mammaliannucleolar protein with a putative homolog in yeastand bacteria. J. Cell Biol. 127, 1505–1514.

15. Heiss, N. S., Knight, S.W., Vulliamy, T. J., Klauck, S.M.,Wiemann, S., Mason, P. J. et al. (1998). X-linkeddyskeratosis congenita is caused by mutations in ahighly conserved gene with putative nucleolar func-tions. Nature Genet. 19, 32–38.

16. Balakin, A. G., Smith, L. & Fournier, M. J. (1996). TheRNA world of the nucleolus: two major families ofsmall RNAs defined by different box elements withrelated functions. Cell, 86, 823–834.

17. Ganot, P., Caizergues-Ferrer, M. & Kiss, T. (1997). Thefamily of box ACA small nucleolar RNAs is definedby an evolutionarily conserved secondary structureand ubiquitous sequence elements essential for RNAaccumulation. Genes Dev. 11, 941–956.

18. Girard, J. P., Lehtonen, H., Caizergues-Ferrer, M.,Amalric, F., Tollervey, D. & Lapeyre, B. (1992). GAR1 isan essential small nucleolar RNP protein required forpre-rRNA processing in yeast. EMBO J. 11, 673–682.

19. Henras, A., Henry, Y., Bousquet-Antonelli, C., Noaillac-Depeyre, J., Gelugne, J. P. & Caizergues-Ferrer, M.(1998).Nhp2p andNop10pare essential for the functionof H/ACA snoRNPs. EMBO J. 17, 7078–7090.

20. Watkins, N. J., Gottschalk, A., Neubauer, G., Kastner,B., Fabrizio, P., Mann, M. & Luhrmann, R. (1998).Cbf5p, a potential pseudouridine synthase, andNhp2p, a putative RNA-binding protein, are presenttogether with Gar1p in all H BOX/ACA-motifsnoRNPs and constitute a common bipartite structure.RNA, 4, 1549–1568.

21. Watanabe, Y. & Gray, M. W. (2000). Evolutionaryappearance of genes encoding proteins associatedwith box H/ACA snoRNAs: cbf5p in Euglena gracilis,an early diverging eukaryote, and candidate Gar1pand Nop10p homologs in archaebacteria. Nucl. AcidsRes. 28, 2342–2352.

22. Charron, C., Manival, X., Clery, A., Senty-Segault, V.,Charpentier, B., Marmier-Gourrier, N. et al. (2004). Thearchaeal sRNA binding protein L7Ae has a 3D

1351Structure of the Naf1 Core Domain

Page 233: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

structure very similar to that of its eukaryal counter-part while having a broader RNA-binding specificity.J. Mol. Biol. 342, 757–773.

23. Hamma, T. & Ferre-D'Amare, A. R. (2004). Structureof protein L7Ae bound to a K-turn derived from anarchaeal box H/ACA sRNA at 1.8 Å resolution.Structure, 12, 893–903.

24. Manival, X., Charron, C., Fourmann, J. B., Godard, F.,Charpentier, B. & Branlant, C. (2006). Crystal structuredetermination and site-directed mutagenesis of thePyrococcus abyssi aCBF5-aNOP10 complex revealcrucial roles of the C-terminal domains of bothproteins in H/ACA sRNP activity. Nucl. Acids Res.34, 826–839.

25. Hamma, T., Reichow, S. L., Varani, G. & Ferre-D'Amare, A. R. (2005). The Cbf5-Nop10 complex is amolecular bracket that organizes box H/ACA RNPs.Nature Struct. Mol. Biol. 12, 1101–1107.

26. Rashid, R., Liang, B., Baker, D. L., Youssef, O. A.,He, Y., Phipps, K. et al. (2006). Crystal structure of aCbf5-Nop10-Gar1 complex and implications in RNA-guided pseudo-uridylation and dyskeratosis conge-nita. Mol. Cell, 21, 249–260.

27. Li, L. & Ye, K. (2006). Crystal structure of an H/ACAbox ribonucleoprotein particle. Nature, 443, 302–307.

28. Khanna, M., Wu, H., Johansson, C., Caizergues-Ferrer,M. & Feigon, J. (2006). Structural study of the H/ACAsnoRNP components Nop10p and the 3′ hairpin ofU65 snoRNA. RNA, 12, 40–52.

29. Henras, A., Dez, C., Noaillac-Depeyre, J., Henry, Y.& Caizergues-Ferrer, M. (2001). Accumulation ofH/ACA snoRNPs depends on the integrity of theconserved central domain of the RNA-binding proteinNhp2p. Nucl. Acids Res. 29, 2733–2746.

30. Rozhdestvensky, T. S., Tang, T. H., Tchirkova, I. V.,Brosius, J., Bachellerie, J. P. & Huttenhofer, A. (2003).Binding of L7Ae protein to the K-turn of archaealsnoRNAs: a shared RNA binding motif for C/D andH/ACA box snoRNAs in Archaea.Nucl. Acids Res. 31,869–877.

31. Wang, C. & Meier, U. T. (2004). Architecture and as-sembly of mammalian H/ACA small nucleolar andtelomerase ribonucleoproteins.EMBO J. 23, 1857–1867.

32. Baker, D. L., Youssef, O. A., Chastkofsky, M. I.,Dy, D. A., Terns, R. M. & Terns, M. P. (2005). RNA-guided RNA modification: functional organization ofthe archaeal H/ACA RNP. Genes Dev. 19, 1238–1248.

33. Yang, P. K., Rotondo, G., Porras, T., Legrain, P. &Chanfreau, G. (2002). The Shq1p.Naf1p complex is re-quired for box H/ACA small nucleolar ribonucleopro-tein particle biogenesis. J. Biol. Chem. 277, 45235–45242.

34. Dez, C., Noaillac-Depeyre, J., Caizergues-Ferrer, M.& Henry, Y. (2002). Naf1p, an essential nucleoplas-mic factor specifically required for accumulation ofbox H/ACA small nucleolar RNPs. Mol. Cell. Biol.22, 7053–7065.

35. Hoareau-Aveilla, C., Bonoli, M., Caizergues-Ferrer, M.&Henry, Y. (2006). hNaf1 is required for accumulationof human box H/ACA snoRNPs, scaRNPs, andtelomerase. RNA, 12, 832–840.

36. Darzacq, X., Kittur, N., Roy, S., Shav-Tal, Y., Singer,R. H. & Meier, U. T. (2006). Stepwise RNP assemblyat the site of H/ACA RNA transcription in humancells. J. Cell Biol. 173, 207–218.

37. Fatica, A., Dlakic, M. & Tollervey, D. (2002). Naf1 p isa box H/ACA snoRNP assembly factor. RNA, 8,1502–1514.

38. Ito, T., Chiba, T., Ozawa, R., Yoshida, M., Hattori, M. &Sakaki, Y. (2001). A comprehensive two-hybrid

analysis to explore the yeast protein interactome.Proc. Natl Acad. Sci. USA, 98, 4569–4574.

39. Yang, P. K., Hoareau, C., Froment, C., Monsarrat, B.,Henry, Y. & Chanfreau, G. (2005). Cotranscriptionalrecruitment of the pseudouridylsynthetase Cbf5p andof the RNA binding protein Naf1p during H/ACAsnoRNP assembly. Mol. Cell. Biol. 25, 3295–3304.

40. Ballarino, M., Morlando, M., Pagano, F., Fatica, A. &Bozzoni, I. (2005). The co-transcriptional assembly ofsnoRNPs controls the biosynthesis of H/ACA sno-RNAs in Saccharomyces cerevisiae. Mol. Cell Biol. 25,5396–5403.

41. Normand, C., Capeyrou, R., Quevillon-Cheruel, S.,Mougin, A., Henry, Y. & Caizergues-Ferrer, M. (2006).Analysis of the binding of the N-terminal conserveddomain of yeast Cbf5p to a box H/ACA snoRNA.RNA, 12, 1868–1882.

42. Kittur, N., Darzacq, X., Roy, S., Singer, R. H. & Meier,U. T. (2006). Dynamic association and localization ofhuman H/ACA RNP proteins. RNA, 12, 2057–2062.

43. Waldo, G. S., Standish, B. M., Berendzen, J. &Terwilliger, T. C. (1999). Rapid protein-folding assayusing green fluorescent protein. Nature Biotechnol. 17,691–695.

44. Pedelacq, J. D., Piltch, E., Liong, E. C., Berendzen, J.,Kim, C. Y., Rho, B. S. et al. (2002). Engineering solubleproteins for structural genomics. Nature Biotechnol. 20,927–932.

45. Kabsch, W. (1993). Automatic processing of rotationdiffraction data from crystals of initially unknownsymmetry and cell constants. J. Appl. Crystallog. 26,795–800.

46. Leslie, A. G. W. (1992). Recent changes to theMOSFLM package for processing film and imageplate data. Joint CCP4+ESF-EAMCB Newsletter onProtein Crystallography, 26.

47. Evans, P. (2006). Scaling and assessment of dataquality. Acta Crystallog. sect. D, 62, 72–82.

48. Schneider, T. R. & Sheldrick, G. M. (2002). Substruc-ture solution with SHELXD. Acta Crystallog. sect. D,58, 1772–1779.

49. Bricogne, G., Vonrhein, C., Flensburg, C., Schiltz, M. &Paciorek, W. (2003). Generation, representation andflow of phase information in structure determination:recent developments in and around SHARP 2.0. ActaCrystallog. sect. D, 59, 2023–2030.

50. Abrahams, J. P. & Leslie, A. G. (1996). Methods used inthe structure determination of bovine mitochondrialF1 ATPase. Acta Crystallog. sect. D, 52, 30–42.

51. Terwilliger, T. C. (1999). Reciprocal-space solventflattening. Acta Crystallog. sect. D, 55, 1863–1871.

52. Cowtan, K. (1994). Joint CCP4 and ESF-EACBMNewsletter on Protein Crystallography, 31, 34–38.

53. Jones, T. A. & Kjeldgaard, M. (1991). Improvedmethods for building protein models in electrondensity maps and the location of errors in thesemodels. Acta Crystallog. sect. A, 47, 110–119.

54. Murshudov, G. N., Vagin, A. A. & Dodson, E. J. (1997).Refinement of macromolecular structures by themaximum-likelihood method. Acta Crystallog. sect. D,53, 240–255.

55. Lebaron, S., Froment, C., Fromont-Racine, M.,Rain, J. C., Monsarrat, B., Caizergues-Ferrer, M. &Henry, Y. (2005). The splicing ATPase prp43p is acomponent of multiple preribosomal particles. Mol.Cell. Biol. 25, 9269–9282.

56. Leger-Silvestre, I., Milkereit, P., Ferreira-Cerca, S.,Saveanu, C., Rousselle, J. C., Choesmel, V. et al. (2004).The ribosomal protein Rps15p is required for nuclear

1352 Structure of the Naf1 Core Domain

Page 234: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

exit of the 40S subunit precursors in yeast. EMBO J. 23,2336–2347.

57. Bonneaud, N., Ozier-Kalogeropoulos, O., Li, G. Y.,Labouesse, M., Minvielle-Sebastia, L. & Lacroute, F.(1991). A family of low and high copy replicative,integrative and single-stranded S. cerevisiae/E. colishuttle vectors. Yeast, 7, 609–615.

58. Delaglio, F., Grzesiek, S., Vuister, G. W., Zhu, G.,Pfeifer, J. & Bax, A. (1995). NMRPipe: a multidimen-sional spectral processing system based on UNIXpipes. J. Biomol. NMR, 6, 277–293.

59. Kay, L. E., Xu, G. Y. & Yamazaki, T. (1994). Enhanced-sensitivity triple-resonance spectroscopywithminimalH2O saturation. J. Magn. Reson. ser. A, 109, 129–133.

60. Mori, S., Abeygunawardana, C., Johnson, M. O.,Berg, J. & van Zijl, P. C. M. (1995). Improvedsensitivity of HSQC spectra of exchanging protonsat short interscan delays using a new fast HSQC(FHSQC) detection scheme that avoids water satura-tion. J. Magn. Reson. ser. B, 108, 94–98.

61. Yamazaki, T., Lee,W. T., Revington,M.,Mattiello, D. L.,Dahlquist, F., Arrowsmith, C.H.&Kay, L. E. (1994). AnHNCA pulse scheme for the backbone assignment of15N, 13C,2H labeled proteins: pplication to a 37 kDa Trprepressor-DNA complex. J. Am. Chem. Soc. 116,6464–6465.

62. Yamazaki, T., Lee, W. T., Arrowsmith, C. H., Muhan-diram, D. R. & Kay, L. E. (1994). A suite of triple

resonance NMR experiments for the backbone assign-ment of 15N, 13C, 2H labelled proteins with highsensitivity. J. Am. Chem. Soc. 116, 11655–11666.

63. Talluri, S. & Wagner, G. (1996). An optimized 3DNOESY-HSQC. J. Magn. Reson. ser. B, 112, 200–205.

64. Farrow, N. A., Muhandiram, R., Singer, A. U., Pascal,S. M., Kay, C. M., Gish, G. et al. (1994). Backbonedynamics of a free and phosphopeptide-complexedSrc homology 2 domain studied by 15N NMRrelaxation. Biochemistry, 33, 5984–6003.

65. Deka, P., Rajan, P. K., Perez-Canadillas, J. M. &Varani, G. (2005). Protein and RNA dynamics playkey roles in determining the specific recognition ofGU-rich polyadenylation regulatory elements byhuman Cstf-64 protein. J. Mol. Biol. 347, 719–733.

66. Renner, C. & Holak, T. (2001). NMR 15N relaxation ofthe insulin-like growth factor (IGF)-binding domain ofIGF binding protein-5 (IGFBP-5) determined free insolution and in complex with IGF-II. Eur. J. Biochem.268, 1058–1065.

67. Fushman, D., Weisemann, R., Thüring, H. & Rüterjans,H. (1994). Backbone dynamics of ribonuclease T1 andits complex with 2′GMP studied by two-dimensionalheteronuclear NMR spectroscopy. J. Biomol. NMR, 4,61–78.

68. Notredame, C., Higgins, D. G. & Heringa, J. (2000).T-Coffee: a novelmethod for fast and accuratemultiplesequence alignment. J. Mol. Biol. 302, 205–217.

Edited by J. Doudna

(Received 11 March 2007; received in revised form 6 June 2007; accepted 12 June 2007)Available online 16 June 2007

1353Structure of the Naf1 Core Domain

Page 235: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Résultats

b) Discussion

La détermination de la structure du domaine Gar1 de Naf1p nous a permis de mettre en

évidence que ce domaine présente une structure tertiaire très similaire à celle de la protéine

aGar1. De plus, il permet l’interaction entre la protéine Naf1 1p et Cb5p probablement selon

un mode identique à celui de aGar1. Nous avons mis en évidence que ce domaine est

strictement essentiel in vivo mais qu’il n’est pas suffisant pour permettre la viabilité cellulaire

et l’interaction avec les composants des particules H/ACA. De façon surprenante, la protéine

Naf 1p est sous forme dimérique dans le cristal ainsi qu’en solution. Nous avons montré que

cette homodimérisation empêche l’interaction avec la protéine Cbf5p. En effet, nous avons du

réaliser un traitement chimique de la protéine Naf1 1p avec une solution concentrée de

glycine à pH2.5 afin de séparer les sous-unités du dimère pour permettre l’interaction avec

Cbf5p. Nous avons également pu empêcher la formation des dimères en mutant un résidu très

conservé (la glycine 186) absolument crucial pour la dimérisation. De façon intéressante, la

glycine 186 est absolument requise pour les fonctions essentielles de Naf1p in vivo. Pour

l’instant, nous ne disposons pas encore de résultats nous permettant de déterminer si cette

dimérisation à une signification physiologique. Nous ne pouvons pas exclure le fait que cette

dimérisation soit un artefact du à l’expression d’une forme raccourcie de Naf1p et qu’elle

n’ait pas lieu lorsque les domaines amino et carboxy-terminaux de Naf1p sont présents.

La similarité de structure que nous avons mise en évidence entre le domaine Gar1 de

Naf1p et la protéine aGar1 suggère qu’elles pourraient être en compétition pour l’interaction

avec Cbf5p. Cette hypothèse est confortée par des résultats obtenus pour les particules

humaines dans le laboratoire de T.Meier (Darzacq, Kittur et al. 2006). Ils ont mis en évidence

dans des tests de reconstitution des particules in vitro que hNaf1 interagit directement avec

dyskérine et qu’elle est intégrée dans un tri-complexe contenant les protéines

dyskérine/Nop10/Nhp2. D’autre part, la présence de hNaf1 au sein de ce tri-complexe inhibe

le recrutement de la protéine Gar1. Il a donc été proposé que hNaf1 et Gar1 sont en

compétition pour la liaison avec dyskérine.

88

Page 236: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 237: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

DISCUSSION et PERPECTIVES

89

Page 238: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 239: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

I. Les RNP H/ACA au cours de l’évolution

Les particules ribonucléoprotéiques de type H/ACA sont retrouvées des archées aux

eucaryotes supérieurs. Chez les RNP H/ACA d’archées (sRNP H/ACA) l’homologue de la

protéine Nhp2p est la protéine L7Ae. L7Ae fait également partie des particules de type C/D et

des ribosomes. Elle reconnaît au sein de ces trois types de structure le même motif ARN

nommé Kink-turn. La présence d’une seule et même protéine au sein de ces trois types de

complexes suggère qu’ils ont une origine commune. Il a été proposé que ces différentes RNP

auraient été présentes dans un seul et même complexe, un ribosome archaïque, chez un

ancêtre commun aux archées et eucaryotes. Au sein de ce complexe, les « modules »

correspondant aux ancêtres des RNP H/ACA et C/D auraient agit en cis pour guider des

pseudouridylations lors du processus d’assemblage du ribosome. Au cours de l’évolution, ces

« modules » se seraient détachés et auraient acquis les spécificités que nous leur connaissons

(pour revue: (Tran, Brown et al. 2004). Cette séparation a probablement représenté un intérêt

pour le processus d’assemblage des ribosomes et les particules résultantes ont par conséquent

été conservées. Un des premiers avantages possible est qu’en étant séparés des ribosomes les

RNP H/ACA ont pu se multiplier et évoluer plus rapidement. En effet, à l’heure actuelle,

plusieurs dizaines de RNP H/ACA sont connues. Si la séparation n’avait pas eu lieu, il parait

difficile d’imaginer qu’un aussi grand nombre de RNP auraient trouvé leur place au sein du

ribosome sans en altérer la fonction. Au cours de l’évolution, ces RNP H/ACA indépendantes

ont acquis la capacité de guider de nouvelles modifications. L’utilisation d’un ARN guide

pour sélectionner l’uridine cible a ainsi permis d’augmenter considérablement le nombre de

pseudouridylations au sein des ribosomes d’archées et eucaryotes par rapport aux ribosomes

bactériens. Cette évolution aurait sans doute été bien plus difficile via l’utilisation d’une

enzyme spécifique pour chaque uridine cible. En effet, le ciblage d’une nouvelle modification

ne nécessite qu’un nombre limité de mutations afin de permettre à l’ARN H/ACA de

s’apparier au nouveau substrat. Le processus de sélection naturelle a, sans doute, permis de

conserver les ARN H/ACA issus de ces évènements mutationnels dans la mesure où les

modifications qu’ils guident confèrent un avantage sélectif.

De plus, des RNP H/ACA présentant des fonctions de chaperons sont apparues chez

90

Page 240: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

les eucaryotes (aucun homologue n’a pour l’instant été identifié chez les archées), ce sont les

RNP H/ACA contenant les snoARN snR10 et snR30. Chez les eucaryotes supérieurs certaines

RNP H/ACA ont évolué pour changer de localisation et de cibles, ce sont les scaRNP

H/ACA. Elles ciblent des pseudouridylations au sein des snARN de la machinerie d’épissage

et sont localisées dans les corpuscules de Cajal. Enfin, chez les vertébrés, l’ARN de la

télomérase a acquis un domaine de type H/ACA. Ce domaine ne permet pas de guider de

pseudouridylation et semble avoir un rôle dans le transport de la particule télomérase. En

effet, il a été montré que ce domaine H/ACA permet la localisation de l’ARN de la télomérase

au sein des corpuscules de Cajal (Jady, Bertrand et al. 2004). Cette localisation pourrait jouer

un rôle important dans la régulation de l’activité du complexe. Il a été proposé que les

corpuscules de Cajal pourraient acheminer le complexe télomérase au niveau des télomères

(Jady, Richard et al. 2006). De façon surprenante, l’ARN de la télomérase a acquis un

domaine H/ACA uniquement chez les vertébrés. En effet, chez la levure par exemple, il

contient à la place un domaine de type Sm (Seto, Zaug et al. 1999). Nous ne connaissons pas,

à l’heure actuelle, ce que traduisent ces différences. Il serait intéressant de déterminer quel

pourrait être l’effet d’un remplacement du domaine H/ACA par un domaine Sm, sur

l’accumulation de la particule télomérase humaine, sur sa localisation et également sur son

activité.

Il demeure encore quelques ARN de type H/ACA dits orphelins car aucune cible ni

aucune fonction ne leur a été attribuée. Un de ces ARN, nommé HBI-36 chez l’homme et

MBI-36 chez la souris présente la particularité de n’être exprimé que dans le cerveau. Il est

donc possible qu’il présente une fonction spécifique au sein de cet organe.

De façon intéressante, il semble que l’ARNm RPS28A ait acquis la capacité

d’interagir avec les protéines Gar1p et Nhp2p chez la levure Saccharomyces cerevisae. La

prédiction de structure secondaire indique qu’une portion de cet ARN pourrait adopter une

structure de type H/ACA (Torchet, Badis et al. 2005). Il a été proposé que ce domaine

pourrait être requis pour la régulation post-transcriptionnelle de l’ARN. Il serait intéressant de

déterminer si cet ARN est également associé aux protéines Cbf5p et Nop10p et dans quel

mesure l’absence d’une de ces protéines modifie l’accumulation de l’ARNm RPS28A.

Au cours de l’évolution, les RNP H/ACA se sont multipliées mais également

diversifiées. Pour cela, elles ont du subir des modifications requises pour leurs nouvelles

fonctions et/ou localisation telles que l’acquisition d’une boite CAB (Cajal Body box) pour

91

Page 241: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

les scaARN et l’ARN de la télomérase permettant la localisation dans les corpuscules de Cajal

ou encore un domaine de type CR7 au sein de la télomérase. L’ARN snR30 présente

également deux séquences spécifiques requises pour la production de l’ARNr de 18S (Atzorn,

Fragapane et al. 2004). Il a été proposé que ces deux séquences pourraient permettre

l’appariement avec le pré-ARNr de 35S.

En conclusion, la classe des ARN H/ACA est très répandue (sans doute une des plus

grandes classes d’ARN non codant) et présente de nombreuses fonctions. Une telle

multiplication et diversification suggère que ce type de motif a du conférer un avantage

certain au cours de la sélection naturelle. Il est important de déterminer de façon précise

comment se déroule le processus d’assemblage de ce type de particule et dans quelle mesure

ce processus a été conservé pour toutes les particules de type H/ACA.

II. Processus d’assemblage des RNP H/ACA

Les données dont nous disposons sur l’assemblage des particules H/ACA chez les

archées et les eucaryotes ont été présentées dans l’introduction de ce manuscrit. Il apparaît,

bien que nous ne disposions pas de données de structure pour les particules eucaryotes, que

l’agencement des différents composants au sein du complexe ait été relativement bien

conservé.

Néanmoins, il existe certaines différences telles que l’acquisition de domaines

supplémentaires au sein des protéines (domaines GAR, KKE.. etc) qui entraînent

probablement des différences d’interaction et/ou de positionnement des différents membres

les uns par rapport aux autres dans le complexe. Il est également possible que ces extensions

protéiques soient requises pour des étapes d’assemblage des différents composants

spécifiques aux complexes eucaryotes chez lesquels la séparation des lieux de synthèse des

protéines et des ARN a probablement rendu le processus plus complexe.

Nous disposons à l’heure actuelle d’un certain nombre de données sur la manière dont

sont disposés les différents composants au sein des particules H/ACA d’archées et eucaryotes

obtenues par des expériences d’assemblage in vitro. Néanmoins, il demeure de nombreuses

92

Page 242: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

questions concernant le mode d’assemblage de ces complexes in vivo. Les mécanismes

d’assemblage semblent différer entre archées et eucaryotes. En effet, chez les eucaryotes ce

processus requiert la participation de plusieurs facteurs dits « d’assemblage », semblant être

absents chez les archées. Il est toutefois possible que des homologues de ces facteurs existent

chez les archées mais que leur séquence soit trop dégénérée pour être identifiée comme telle.

Les deux facteurs les mieux caractérisés sont Naf1p et Shq1p. Les étapes de synthèse des

ARN et des protéines étant séparées chez les eucaryotes, les protéines doivent être

acheminées dans le noyau, jusqu’à un endroit bien précis, afin de s’associer avec l’ARN. Il est

probable que cette complexification apparue chez les eucaryotes ait nécessité la participation

de protéines auxiliaires présentant des fonctions de chaperons d’assemblage.

La protéine Shq1p a été, comme Naf1p, initialement identifiée chez la levure

Saccharomyces cerevisiae où elle est nucléoplasmique et spécifiquement requise pour

l’accumulation des composants des snoRNP H/ACA. De plus, Shq1p interagit directement in

vitro avec la protéine Naf1p et en double hybride avec Rnt1p (Yang, Rotondo et al. 2002).

Rnt1p est une protéine à activité endonucléasique requise pour la maturation de certains pré-

snoARN H/ACA en ARN mature. Shq1p semble être requise, dans le processus

d’assemblage, à une étape plus tardive que Naf1p. En effet, lors des expériences

d’immunoprécipitation de chromatine, nous n’avons mis en évidence aucune interaction entre

Shq1p et les gènes codant les snoARN H/ACA. Pok Kwan Yang et collaborateurs ont montré

une interaction directe in vitro entre Naf1p et Shq1p. Néanmoins, lors des expériences de

purification TAP, Shq1p n’a pas été retrouvée dans les complexes associés à la protéine

Naf1p. Il est possible que cela soit dû à un problème technique ou à une interaction entre les

deux protéines trop transitoire in vivo pour être visualisée par ce genre d’approche. De façon

intéressante, il a été mis en évidence, au laboratoire, par Véronique Dossat et Christophe Dez,

que Shq1p est associée à la protéine Gar1p-TAP. Cette donnée est en parfait accord avec

l’hypothèse selon laquelle Shq1p serait requise dans des étapes tardives d’assemblage dans la

mesure où elle interagit avec Gar1p et que de nombreuses données suggèrent que Gar1p est

recrutée tardivement au sein des particules H/ACA en formation. Toutefois, nous ne pouvons

pas exclure l’hypothèse d’une implication de Shq1p dans une étape antérieure au recrutement

des protéines H/ACA au niveau de la chromatine.

93

Page 243: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

A. Modèle du mode d’assemblage des particules H/ACA

chez les Archées

Les données de reconstitution de particules in vitro suggèrent que la protéine L7Ae

pourrait, comme dans le cas des particules de type C/D, être la première protéine à s’associer

au sARN H/ACA. En effet, il a été mis en évidence que, bien que aCbf5 soit capable

d’interagir directement et de façon indépendante avec l’ARN, la présence de la protéine L7Ae

augmente de façon significative son affinité pour l’ARN (Charpentier, Muller et al. 2005). Il

est possible que L7Ae permette la structuration correcte du site de liaison à aCbf5 ; au sein de

l’ARN. A l’heure actuelle, aucune donnée ne permet de déterminer de façon plus précise

comment se déroule la suite du processus d’assemblage. Il est possible que les protéines

soient pré-assemblées avant leur association avec l’ARN ou bien qu’elles soient recrutées de

façon séquentielle. Pour répondre à ces questions, il faudrait, entre autre, supprimer

l’expression de chacune de ces protéines, déterminer l’effet que cela provoque sur

l’accumulation des autres membres du complexe et dans quelle mesure ils sont toujours

capables de former des sous-complexes.

B. Modèle du mode d’assemblage des particules H/ACA

chez les eucaryotes

Les données in vivo dont nous disposons sur les RNP H/ACA nous permettent de

proposer le modèle présenté dans la figure 58. La protéine Naf1p jouerait un rôle primordial

lors des premières étapes du processus d’assemblage des RNP H/ACA. Elle serait recrutée

très précocement au niveau des sites de transcription des gènes codant les ARN H/ACA via

une interaction directe avec le pré-ARNr H/ACA en cours de synthèse. Il est probable que

l’interaction entre Naf1p et Cbf5p soit cruciale lors de cette étape car lorsque Naf1p ne

possède plus le domaine d’interaction avec Cbf5p, le domaine GAR1, elle n’est plus présente

au niveau de la chromatine. Cela a été mis en évidence par des expériences de ChIP en

collaboration avec l’équipe de Guillaume Chanfreau. Dans la mesure où nous avons montré

que l’absence du domaine GAR1 réduit l’affinité de la protéine Naf1p pour l’ARN mais

94

Page 244: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Gar1

CTD

RNA polymerase II

machinery

Box H/ACA RNA coding gene

Naf1

Cbf5

Nop10

Nhp2

Co-transciptional recruitment of a complex pre-formed in the cytoplasm

Maturation of the box H/ACA particle: -processing of the 3' end and sometimes the 5' end of the box H/ACA RNA precursor -exchange between Naf1 and Gar1 -transport of the particle to a Cajal body or to the nucleolus

Naf1p

Mature box H/ACA particle

Synthesis of box H/ACA RNA precursor

Gar1

Box H/ACA

domain

RNA polymerase II

machinery

RNA polymerase II

machinery

Naf1

Naf1

Cbf5

Nop10

Nhp2

Cbf5

Nop10

Nhp2

FIGURE 58: Modèle du mode d'assemblage des RNP H/ACA

Role of Shq1p?

Page 245: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

n’empêche pas l’interaction spécifique entre Naf1p et les ARN H/ACA in vitro, nous

proposons que la liaison de Naf1p avec Cbf5p est requise, in vivo, pour la stabilisation du

complexe Naf1p/ARN/Cbf5p.

Les protéines Nhp2p et Nop10p se semblent pas présenter de signal d’importation

nucléaire (NLS). Ce sont des protéines de petite taille (inférieure à 25kDa) donc elles peuvent

diffuser librement à travers la membrane nucléaire. Néanmoins, il est possible qu’elles soient

acheminées dans le noyau de façon active (et donc plus efficacement) via une interaction avec

la protéine Cbf5p, pour laquelle plusieurs NLS possibles ont été prédites. Il y aurait donc

assemblage entre les protéines Cbf5p, Nop10p et Nhp2p avant leur importation dans le noyau.

Il serait intéressant de déterminer si ces prédictions sont justes en supprimant certains acides

aminés au niveau de ces séquences afin de déterminer si elles sont requises pour la

localisation de Cbf5p et éventuellement de Nhp2p et Nop10p.

Différentes données suggèrent que la protéine Gar1p est recrutée de façon plus tardive

au sein de la particule. En effet, elle n’est pas présente au niveau de la chromatine contenant

les gènes codant des ARN H/ACA (Yang, Hoareau et al. 2005), (Darzacq, Kittur et al. 2006),

(Ballarino, Morlando et al. 2005). De plus, Patricia Richard de l’équipe de Tamas Kiss a mis

en évidence que Gar1p n’est pas associée, contrairement à Dyskérine, au pré-ARNm de la -

globine contenant dans un intron le snoARN U64. Gar1p étant associée au snoARN mature,

cela suggère qu’elle ne serait recrutée qu’après l’étape d’épissage du pré-ARNm (Richard,

Kiss et al. 2006). Nous proposons que Naf1p, en interagissant avec Cbf5p, occupe le site de

liaison à Gar1p au sein de la particule en cours de formation. Gar1p étant nécessaire pour

l’activité optimale de la particule, la présence de Naf1p pourrait, en empêchant le recrutement

de Gar1p, prévenir une activité prématurée de particules encore immatures.

Nous avons mis en évidence que la protéine Naf1 1p, une forme de Naf1p constituée

uniquement de la région centrale contenant le domaine GAR1, est capable de

s’homodimériser. Cette dimérisation implique le domaine GAR1 et il est possible qu’elle soit

requise pour la dissociation de la protéine Naf1p des RNP H/ACA. La figure 59 présente le

modèle que nous proposons. La protéine Naf1p se trouverait en deux exemplaires au sein de

la pré-particule H/ACA, chaque copie participant à l’assemblage d’un complexe sur chacune

des deux tiges. Au cours du processus d’assemblage, il est possible que le complexe acquiert

une conformation telle que les deux exemplaires de Naf1p puissent s’homodimériser et ainsi

se dissocier de Cbf5p et de la particule. La protéine Cbf5p étant accessible, Gar1p pourrait

alors être recrutée. Il sera bien sur important de déterminer si effectivement Naf1p est capable

95

Page 246: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

FIGURE 59 : Modèle du mode d'action de Naf1p

Page 247: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

de former un homodimère in vivo.

Nous ne disposons pas encore de données permettant de dire à quelle étape Shq1p

intervient. Néanmoins, le fait qu’elle ait été trouvée dans des complexes co-purifiés avec

Gar1p, qu’elle ne soit pas associée à la chromatine et qu’elle interagisse in vitro avec Naf1p

laisse supposer qu’elle pourrait être requise au cours de la transition entre les étapes de

dissociation de Naf1p et de recrutement de Gar1p. De plus, il a été mis en évidence que

Shq1p interagit avec la protéine Rnt1p. Celle-ci étant une endonucléase requise pour, entre

autre, la maturation des pré-ARN H/ACA (Chanfreau, Legrain et al. 1998), il est possible que

Shq1p ait un rôle important non seulement dans le processus d’assemblage de la particule

mais également dans les étapes de maturation des extrémités du pré-ARN H/ACA via le

recrutement de facteurs de maturation tels que Rnt1p.

Afin de caractériser plus précisément les rôles des protéines Shq1p et Naf1p dans

l’assemblage des RNP H/ACA, il sera nécessaire de réaliser, entre autre, une étude complète

de toutes les interactions entre les composants des particules H/ACA et ces deux protéines.

De plus, il faudrait poursuivre l’étude des différents domaines de la protéine Naf1p.

Nous avons d’ores et déjà déterminé que le domaine de liaison à l’ARN de Naf1p semble se

trouver dans la région centrale de la protéine. Nous avons montré que le domaine GAR1 n’est

pas strictement indispensable pour la liaison spécifique à l’ARN. Nous avons noté la présence

dans la région centrale d’une portion très conservée, que nous avons nommée « domaine

UCDN » (Ultra Conserved Domain of Naf1p). Nous avons montré que l’expression du

domaine GAR1, seul in vivo, ne permet pas d’assurer la viabilité cellulaire. La portion de

Naf1p minimale présentant toutes les fonctions essentielles correspond à la région centrale de

la protéine contenant à la fois le domaine GAR1, le domaine UCDN ainsi qu’une partie d’une

NLS probable. Nous avons montré que le domaine GAR1 permet l’interaction avec Cbf5p. Il

serait intéressant de tester si le domaine UCDN permet quant à lui la liaison de Naf1p aux

ARN H/ACA.

Les domaines riches en sérine (domaine S) et proline/glutamine (domaine P/Q)

positionnés aux deux extrémités de la protéine Naf1p ne sont pas essentiels in vivo.

Néanmoins, l’expression d’un forme de la protéine Naf1p dépourvue des domaines P/Q

entraîne un léger retard de croissance ce qui suggère qu’ils sont requis pour l’activité optimale

de Naf1p. Nous ne connaissons pas encore le rôle de ces domaines. Nous avons montré qu’ils

ne sont requis ni pour la liaison à Cbf5p ni pour la liaison à l’ARN. Le domaine S contient

96

Page 248: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

une grande proportion de résidus chargés négativement ainsi que plusieurs sites potentiels de

phosphorylation par la caséine kinase II (CKII). Michèle Caizergues-Ferrer a montré

qu’effectivement il existe, au sien de la protéine Naf1p, des sites phosphorylés par la CKII in

vitro. Il serait intéressant de déterminer s’il en est de même in vivo et si tel est le cas, quels

sont les effets entraînés par l’inhibition de ces phosphorylations.

En conclusion, les particules H/ACA ne sont constituées que de cinq composants.

Néanmoins, il semble qu’elles requierent, chez les eucaryotes, un système d’assemblage et de

transport complexe dans lesquels sont impliquées les protéines Naf1p et Shq1p mais

également plusieurs autres protéines: SMN, Nopp140 et les hélicases p50/p55 (Pellizzoni,

Baccon et al. 2001), (Bachand, Boisvert et al. 2002), (Yang, Isaac et al. 2000), (King, Decatur

et al. 2001). De plus, des travaux initiaux ont montré que PHAX interagit avec l’ARN de la

télomérase (Boulon, Verheggen et al. 2004). Il est tentant d’imaginer que, comme dans le cas

des RNP C/D, la protéine PHAX est requise pour l’adressage de la télomérase au niveau des

corpuscules de Cajal. Il serait intéressant de tester cette hypothèse ainsi que l’implication de

PHAX dans la localisation des RNP de type H/ACA au sein des corpuscules de Cajal. De

plus, il a été montré que la protéine Crm1p est requise pour l’acheminement des snoRNP C/D

des corpuscules de Cajal vers le nucléole (Boulon, Verheggen et al. 2004). Son éventuelle

implication dans le transport des snoRNP H/ACA devra également être investiguée.

De nombreuses études sont encore à réaliser afin de déterminer les fonctions exactes

exercées par ces différents facteurs dans l’assemblage, l’adressage et la fonction des RNP

H/ACA.

Il est important de noter que toutes les particules H/ACA ne sont pas strictement

identiques. En effet, tout d’abord, le composant ARN est spécifique à chaque particule. Bien

qu’il contient des structures et des boites conservées, chaque ARN a une séquence distincte.

Nous avons mis en évidence que ces spécificités entraînent des différences de comportement

des particules lorsque que l’on introduit par exemple des mutations dans la protéine Nhp2p

(Henras, Dez et al. 2001) ou encore lors des tests de « décortication » des particules H/ACA

(Henras, Capeyrou et al. 2004). De plus, j’ai également mis en évidence lors de ma thèse que

l’absence des domaines riches en proline et glutamine au sein de la protéine Naf1p entraîne

des effets variables sur l’accumulation des snoARN H/ACA chez la levure. En effet, nous

97

Page 249: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

avons observé que certains snoARN étaient sous-accumulés alors que d’autres étaient sur-

accumulés ou bien non affectés lors de l’expression de la protéine Naf1 PQp. Il serait

intéressant de déterminer ce que signifient ces comportements variables. Sont-ils dus à des

modifications de morphologie et/ou de composition des différentes particules. Il est possible

que cela reflète le fait que certaines particules sont associées à des protéines spécifiques

comme c’est le cas de la RNP H/ACA contenant le snoARN snR5 qui contient, en plus des

protéine Cbf5p, Np2p,Nop10p et Gar1p, les complexes Lsm2-Lsm7 (Fernandez, Pannone et

al. 2004). Il apparaît important d’identifier toutes les protéines spécifiques de chaque RNP

H/ACA et de déterminer quels sont leurs rôles. Il est fort probable que des particules telles

que celles contenant les ARN snR30 et snR10 contiennent des protéines auxiliaires participant

à leur fonction de chaperon du processus de production de l’ARNr de 18S.

III. Dégradation des RNP H/ACA mal formées

Les processus de synthèse et d’assemblage des RNP H/ACA ont fait l’objet d’une

large description dans ce manuscrit. Il est également important de discuter de la possible

existence de mécanismes de dégradation des RNP H/ACA. Par analogie avec ce qui a été

montré pour les ARN ribosomiques (Dez, Houseley et al. 2006), il est probable que

l’exosome et le complexe TRAMP soient requis pour la dégradation des snoARN H/ACA. En

effet, il a été mis en évidence que des formes polyadénylées de certains snoARN H/ACA

s’accumulent dans une souche présentant une invalidation du gène RRP6 (souche rrp6) (van

Hoof, Lennertz et al. 2000). La protéine Rrp6p est un composant crucial de l’exosome

nucléaire. Il a été proposé que ces formes polyadénylées correspondent à des formes

aberrantes de snoARN dirigées vers une voie de dégradation impliquant l’exosome. Leur

polyadénylation serait réalisée par le complexe TRAMP. Il a été mis en évidence qu’une telle

polyadénylation permet une dégradation plus efficace par l’exosome (LaCava, Houseley et al.

2005). Ces espèces polyadénylées ne seraient pas visualisables dans un complexe sauvage car

elles présenteraient des durées de vie très courtes. Il serait intéressant de déterminer si ce

système de dégradation participe à la perte d’accumulation des ARN H/ACA lorsque l’on

supprime l’expression des protéines Cbf5p, Nhp2p, Nop10p, Naf1p ou Shq1p.

De plus, il a été mis en évidence que la suppression de l’expression de Rrp6p entraîne

98

Page 250: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

une concentration de la protéine Nop1p et du snoARN U14, deux composants des RNP de

type C/D, au sein d’un sous domaine nucléolaire détectable uniquement dans ce contexte

mutant. Ce domaine a été nommé « poly(A) domain » car il contient des formes

polyadénylées du snoARN U14 (Carneiro, Carvalho et al. 2007). La détermination de la

localisation des snoARN H/ACA et des protéines H/ACA dans la souche rrp6 permettrait de

déterminer si cette structure présente une fonction générale dans la dégradation des RNP

nucléolaires. De plus, il sera important de déterminer si en absence de l’une des protéines du

complexe, les ARN H/ACA sont dégradés selon un mode « actif » ou bien tout simplement

lors du processus de maturation par l’exosome qui, du fait de l’absence d’une ou plusieurs

protéines, digérerait de façon aberrante l’ARN non protégé. L’existence d’un mode actif de

dégradation suppose l’existence de facteurs permettant de reconnaître les particules aberrantes

et de les diriger vers les voies de dégradation adéquates. L’identification de ce genre de

facteur ne sera sans doute pas chose aisée. Des approches génétiques telles que des recherches

de suppresseurs multicopies de mutations dans les gènes NAF1 et SHQ1 pourraient permettre

l’identification de gènes dont la mutation permettrait de favoriser l’accumulation des

particules H/ACA normalement déstabilisées par la présence de mutations dans les gènes

NAF1 et SHQ1. Les gènes identifiés par cette approche pourraient correspondre à des facteurs

nécessaires au ciblage des particules aberrantes vers la dégradation.

Enfin, il semble qu’il existe également un système de dégradation des composants

protéiques des RNP H/ACA. En effet, lorsque l’on déstabilise le complexe en supprimant

l’expression de Cbf5p, Nhp2p, Nop10p, Shq1p ou Naf1p, on observe un défaut

d’accumulation des ARN H/ACA ainsi que des protéines Cbf5p, Nop10p et Gar1p. Cela

suggère qu’il existe un système de dégradation empêchant l’accumulation de complexes mal

formés ou incomplets. Nous avons testé plusieurs protéines connues pour être impliquées

dans la dégradation des protéines, des protéases et certains composants du protéasome.

Malheureusement, dans aucun de nos tests nous n’avons pu stabiliser les protéines H/ACA. Il

est possible que lorsqu’une des protéines est absente, l’ARN H/ACA présent au sein du

complexe incomplet soit adressé vers la voie de dégradation impliquant l’exosome. La

dégradation du composant ARN entraînerait une dissociation des protéines du complexe, ce

qui pourrait avoir pour conséquence de les déstabiliser. Cette hypothèse est étayée par le fait

que nous n’avons pas été capables de surexprimer les protéines Cbf5p, Gar1p et Nop10p de

façon individuelle. Il serait intéressant de déterminer, dans un premier temps, si dans la

99

Page 251: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Discussion et perspectives

souche rrp6 les ARN H/ACA sont stabilisés en absence par exemple de la protéine Naf1p.

Puis, dans un deuxième temps, si les composants protéiques sont également stabilisés. Si tel

est le cas, ce système pourrait servir d’outil pour la détermination du processus d’assemblage

des RNP H/ACA.

De façon intéressante, Guillaume Chanfreau et collaborateurs ont proposé que le

complexe TRAMP, et plus particulièrement les protéines Trf4p et Trf5p, pourraient être

requis pour promouvoir l’activité de l’exosome au cours du processus de maturation de

l’extrémité 3’ des précurseurs des ARN C/D. Leurs rôles ne seraient donc pas seulement

limités à la voie de dégradation des ARN aberrants. Cette hypothèse a été proposée car dans

une souche trf4, ils ont détecté une accumulation de formes précurseurs des ARN U3 et

U14. Toutefois, on ne peut pas exclure que ces ARN sont des espèces aberrantes qui dans un

contexte sauvage pour TRF4 seraient dirigées vers la voie de dégradation par l’exosome. Il

serait intéressant de déterminer si l’invalidation du gène TRF4 induit également

l’accumulation de formes précurseurs des ARN H/ACA. Si tel est le cas, nous pourrions tester

si ces formes sont toujours présentes en absence des protéines Naf1p et/ou Shq1p. Ainsi, il

pourrait être possible de déterminer si les protéines H/ACA sont capables de s’associer à ces

formes précurseurs des ARN H/ACA en absence de Naf1p/Shq1p. Cela permettrait de

progresser dans la compréhension des rôles de ces deux protéines dans le processus

d’assemblage des RNP H/ACA

100

Page 252: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 253: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

REFERENCES

101

Page 254: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses
Page 255: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

Aittaleb, M., R. Rashid, et al. (2003). "Structure and function of archaeal box C/D sRNP core proteins." Nat Struct Biol 10(4): 256-63.

Allmang, C., J. Kufel, et al. (1999). "Functions of the exosome in rRNA, snoRNA and snRNA synthesis." Embo J 18(19): 5399-410.

Allmang, C., E. Petfalski, et al. (1999). "The yeast exosome and human PM-Scl are related complexes of 3' --> 5' exonucleases." Genes Dev 13(16): 2148-58.

Aravind, L. and E. V. Koonin (1999). "Novel predicted RNA-binding domains associated with the translation machinery." J Mol Evol 48(3): 291-302.

Atzorn, V., P. Fragapane, et al. (2004). "U17/snR30 is a ubiquitous snoRNA with two conserved sequence motifs essential for 18S rRNA production." Mol Cell Biol 24(4): 1769-78.

Autexier, C. and N. F. Lue (2006). "The structure and function of telomerase reverse transcriptase." Annu Rev Biochem 75: 493-517.

Bachand, F. and C. Autexier (2001). "Functional regions of human telomerase reverse transcriptase and human telomerase RNA required for telomerase activity and RNA-protein interactions." Mol Cell Biol 21(5): 1888-97.

Bachand, F., F. M. Boisvert, et al. (2002). "The product of the survival of motor neuron (SMN) gene is a human telomerase-associated protein." Mol Biol Cell 13(9): 3192-202.

Bagni, C. and B. Lapeyre (1998). "Gar1p binds to the small nucleolar RNAs snR10 and snR30 in vitro through a nontypical RNA binding element." J Biol Chem 273(18): 10868-73.

Baker, D. L., O. A. Youssef, et al. (2005). "RNA-guided RNA modification: functional organization of the archaeal H/ACA RNP." Genes Dev 19(10): 1238-48.

Balakin, A. G., L. Smith, et al. (1996). "The RNA world of the nucleolus: two major families of small RNAs defined by different box elements with related functions." Cell 86(5): 823-34.

Ballarino, M., M. Morlando, et al. (2005). "The cotranscriptional assembly of snoRNPs controls the biosynthesis of H/ACA snoRNAs in Saccharomyces cerevisiae." Mol Cell Biol 25(13): 5396-403.

Ban, N., P. Nissen, et al. (2000). "The complete atomic structure of the large ribosomal subunit at 2.4 A resolution." Science 289(5481): 905-20.

Bassler, J., P. Grandi, et al. (2001). "Identification of a 60S preribosomal particle that is closely linked to nuclear export." Mol Cell 8(3): 517-29.

Beltrame, M., Y. Henry, et al. (1994). "Mutational analysis of an essential binding site for the U3 snoRNA in the 5' external transcribed spacer of yeast pre-rRNA." Nucleic Acids Res 22(23): 5139-47.

Beltrame, M. and D. Tollervey (1992). "Identification and functional analysis of two U3 binding sites on yeast pre-ribosomal RNA." Embo J 11(4): 1531-42.

Beltrame, M. and D. Tollervey (1995). "Base pairing between U3 and the pre-ribosomal RNA is required for 18S rRNA synthesis." Embo J 14(17): 4350-6.

Bernstein, K. A., J. E. Gallagher, et al. (2004). "The small-subunit processome is a ribosome assembly intermediate." Eukaryot Cell 3(6): 1619-26.

Billy, E., T. Wegierski, et al. (2000). "Rcl1p, the yeast protein similar to the RNA 3'-phosphate cyclase, associates with U3 snoRNP and is required for 18S rRNA biogenesis." Embo J 19(9): 2115-26.

Borovjagin, A. V. and S. A. Gerbi (1999). "U3 small nucleolar RNA is essential for cleavage at sites 1, 2 and 3 in pre-rRNA and determines which rRNA processing pathway is taken in Xenopus oocytes." J Mol Biol 286(5): 1347-63.

102

Page 256: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

Bortolin, M. L., J. P. Bachellerie, et al. (2003). "In vitro RNP assembly and methylation guide activity of an unusual box C/D RNA, cis-acting archaeal pre-tRNA(Trp)." Nucleic Acids Res 31(22): 6524-35.

Boulon, S., C. Verheggen, et al. (2004). "PHAX and CRM1 are required sequentially to transport U3 snoRNA to nucleoli." Mol Cell 16(5): 777-87.

Bousquet-Antonelli, C., Y. Henry, et al. (1997). "A small nucleolar RNP protein is required for pseudouridylation of eukaryotic ribosomal RNAs." Embo J 16(15): 4770-6.

Briggs, M. W., K. T. Burkard, et al. (1998). "Rrp6p, the yeast homologue of the human PM-Scl 100-kDa autoantigen, is essential for efficient 5.8 S rRNA 3' end formation." J Biol Chem 273(21): 13255-63.

Cahill, N. M., K. Friend, et al. (2002). "Site-specific cross-linking analyses reveal an asymmetric protein distribution for a box C/D snoRNP." Embo J 21(14): 3816-28.

Carneiro, T., C. Carvalho, et al. (2007). "Depletion of the yeast nuclear exosome subunit Rrp6 results in accumulation of polyadenylated RNAs in a discrete domain within the nucleolus." Mol Cell Biol 27(11): 4157-65.

Cavaille, J., M. Nicoloso, et al. (1996). "Targeted ribose methylation of RNA in vivo directed by tailored antisense RNA guides." Nature 383(6602): 732-5.

Chai, W., L. P. Ford, et al. (2002). "Human Ku70/80 associates physically with telomerase through interaction with hTERT." J Biol Chem 277(49): 47242-7.

Chanfreau, G., P. Legrain, et al. (1998). "Yeast RNase III as a key processing enzyme in small nucleolar RNAs metabolism." J Mol Biol 284(4): 975-88.

Charpentier, B., S. Muller, et al. (2005). "Reconstitution of archaeal H/ACA small ribonucleoprotein complexes active in pseudouridylation." Nucleic Acids Res 33(10): 3133-44.

Charron, C., X. Manival, et al. (2004). "The archaeal sRNA binding protein L7Ae has a 3D structure very similar to that of its eukaryal counterpart while having a broader RNA-binding specificity." J Mol Biol 342(3): 757-73.

Chen, J. L., M. A. Blasco, et al. (2000). "Secondary structure of vertebrate telomerase RNA." Cell 100(5): 503-14.

Chen, J. L. and C. W. Greider (2003). "Determinants in mammalian telomerase RNA that mediate enzyme processivity and cross-species incompatibility." Embo J 22(2): 304-14.

Colley, A., J. D. Beggs, et al. (2000). "Dhr1p, a putative DEAH-box RNA helicase, is associated with the box C+D snoRNP U3." Mol Cell Biol 20(19): 7238-46.

Darzacq, X., N. Kittur, et al. (2006). "Stepwise RNP assembly at the site of H/ACA RNA transcription in human cells." J Cell Biol 173(2): 207-18.

Decatur, W. A. and M. J. Fournier (2002). "rRNA modifications and ribosome function." Trends Biochem Sci 27(7): 344-51.

Demoinet, E., A. Jacquier, et al. (2007). "The Hsp40 chaperone Jjj1 is required for the nucleo-cytoplasmic recycling of preribosomal factors in Saccharomyces cerevisiae." Rna 13(9): 1570-81.

Dez, C., A. Henras, et al. (2001). "Stable expression in yeast of the mature form of human telomerase RNA depends on its association with the box H/ACA small nucleolar RNP proteins Cbf5p, Nhp2p and Nop10p." Nucleic Acids Res 29(3): 598-603.

Dez, C., J. Houseley, et al. (2006). "Surveillance of nuclear-restricted pre-ribosomes within a subnucleolar region of Saccharomyces cerevisiae." Embo J 25(7): 1534-46.

Dez, C., J. Noaillac-Depeyre, et al. (2002). "Naf1p, an essential nucleoplasmic factor specifically required for accumulation of box H/ACA small nucleolar RNPs." Mol Cell Biol 22(20): 7053-65.

103

Page 257: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

Dez, C. and D. Tollervey (2004). "Ribosome synthesis meets the cell cycle." Curr Opin Microbiol 7(6): 631-7.

Dlakic, M. and D. Tollervey (2004). "The Noc proteins involved in ribosome synthesis and export contain divergent HEAT repeats." Rna 10(3): 351-4.

Dragon, F., J. E. Gallagher, et al. (2002). "A large nucleolar U3 ribonucleoprotein required for 18S ribosomal RNA biogenesis." Nature 417(6892): 967-70.

Dragon, F., V. Pogacic, et al. (2000). "In vitro assembly of human H/ACA small nucleolar RNPs reveals unique features of U17 and telomerase RNAs." Mol Cell Biol 20(9): 3037-48.

Dunbar, D. A. and S. J. Baserga (1998). "The U14 snoRNA is required for 2'-O-methylation of the pre-18S rRNA in Xenopus oocytes." Rna 4(2): 195-204.

Dunbar, D. A., S. Wormsley, et al. (1997). "Mpp10p, a U3 small nucleolar ribonucleoprotein component required for pre-18S rRNA processing in yeast." Mol Cell Biol 17(10): 5803-12.

Faber, A. W., M. Van Dijk, et al. (2002). "Ngl2p is a Ccr4p-like RNA nuclease essential for the final step in 3'-end processing of 5.8S rRNA in Saccharomyces cerevisiae." Rna 8(9): 1095-101.

Faber, A. W., H. R. Vos, et al. (2006). "5'-end formation of yeast 5.8SL rRNA is an endonucleolytic event." Biochem Biophys Res Commun 345(2): 796-802.

Fatica, A., A. D. Cronshaw, et al. (2002). "Ssf1p prevents premature processing of an early pre-60S ribosomal particle." Mol Cell 9(2): 341-51.

Fatica, A., M. Dlakic, et al. (2002). "Naf1 p is a box H/ACA snoRNP assembly factor." Rna 8(12): 1502-14.

Fatica, A., M. Oeffinger, et al. (2003). "Nob1p is required for cleavage of the 3' end of 18S rRNA." Mol Cell Biol 23(5): 1798-807.

Fatica, A. and D. Tollervey (2002). "Making ribosomes." Curr Opin Cell Biol 14(3): 313-8. Feng, J., W. D. Funk, et al. (1995). "The RNA component of human telomerase." Science

269(5228): 1236-41. Fernandez, C. F., B. K. Pannone, et al. (2004). "An Lsm2-Lsm7 complex in Saccharomyces

cerevisiae associates with the small nucleolar RNA snR5." Mol Biol Cell 15(6): 2842-52.

Ford, L. P., J. W. Shay, et al. (2001). "The La antigen associates with the human telomerase ribonucleoprotein and influences telomere length in vivo." Rna 7(8): 1068-75.

Ford, L. P., W. E. Wright, et al. (2002). "A model for heterogeneous nuclear ribonucleoproteins in telomere and telomerase regulation." Oncogene 21(4): 580-3.

Fromont-Racine, M., B. Senger, et al. (2003). "Ribosome assembly in eukaryotes." Gene 313: 17-42.

Gadal, O., D. Strauss, et al. (2001). "Nuclear export of 60s ribosomal subunits depends on Xpo1p and requires a nuclear export sequence-containing factor, Nmd3p, that associates with the large subunit protein Rpl10p." Mol Cell Biol 21(10): 3405-15.

Gagnon, K. T., X. Zhang, et al. (2006). "Assembly of the archaeal box C/D sRNP can occur via alternative pathways and requires temperature-facilitated sRNA remodeling." J Mol Biol 362(5): 1025-42.

Galardi, S., A. Fatica, et al. (2002). "Purified box C/D snoRNPs are able to reproduce site-specific 2'-O-methylation of target RNA in vitro." Mol Cell Biol 22(19): 6663-8.

Gallagher, J. E., D. A. Dunbar, et al. (2004). "RNA polymerase I transcription and pre-rRNA processing are linked by specific SSU processome components." Genes Dev 18(20): 2506-17.

Ganot, P., M. Caizergues-Ferrer, et al. (1997). "The family of box ACA small nucleolar

104

Page 258: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

RNAs is defined by an evolutionarily conserved secondary structure and ubiquitous sequence elements essential for RNA accumulation." Genes Dev 11(7): 941-56.

Gautier, T., T. Berges, et al. (1997). "Nucleolar KKE/D repeat proteins Nop56p and Nop58p interact with Nop1p and are required for ribosome biogenesis." Mol Cell Biol 17(12): 7088-98.

Gerczei, T. and C. C. Correll (2004). "Imp3p and Imp4p mediate formation of essential U3-precursor rRNA (pre-rRNA) duplexes, possibly to recruit the small subunit processome to the pre-rRNA." Proc Natl Acad Sci U S A 101(43): 15301-6.

Ghaemmaghami, S., W. K. Huh, et al. (2003). "Global analysis of protein expression in yeast." Nature 425(6959): 737-41.

Girard, J. P., C. Bagni, et al. (1994). "Identification of a segment of the small nucleolar ribonucleoprotein-associated protein GAR1 that is sufficient for nucleolar accumulation." J Biol Chem 269(28): 18499-506.

Girard, J. P., H. Lehtonen, et al. (1992). "GAR1 is an essential small nucleolar RNP protein required for pre-rRNA processing in yeast." Embo J 11(2): 673-82.

Gleizes, P. E., J. Noaillac-Depeyre, et al. (2001). "Ultrastructural localization of rRNA shows defective nuclear export of preribosomes in mutants of the Nup82p complex." J Cell Biol 155(6): 923-36.

Gottschalk, A., G. Neubauer, et al. (1999). "Identification by mass spectrometry and functional analysis of novel proteins of the yeast [U4/U6.U5] tri-snRNP." Embo J 18(16): 4535-48.

Grandi, P., V. Rybin, et al. (2002). "90S pre-ribosomes include the 35S pre-rRNA, the U3 snoRNP, and 40S subunit processing factors but predominantly lack 60S synthesis factors." Mol Cell 10(1): 105-15.

Granneman, S. and S. J. Baserga (2004). "Ribosome biogenesis: of knobs and RNA processing." Exp Cell Res 296(1): 43-50.

Greider, C. W. and E. H. Blackburn (1985). "Identification of a specific telomere terminal transferase activity in Tetrahymena extracts." Cell 43(2 Pt 1): 405-13.

Greider, C. W. and E. H. Blackburn (1987). "The telomere terminal transferase of Tetrahymena is a ribonucleoprotein enzyme with two kinds of primer specificity." Cell 51(6): 887-98.

Greider, C. W. and E. H. Blackburn (1989). "A telomeric sequence in the RNA of Tetrahymena telomerase required for telomere repeat synthesis." Nature 337(6205): 331-7.

Griffith, J. D., L. Comeau, et al. (1999). "Mammalian telomeres end in a large duplex loop." Cell 97(4): 503-14.

Hamma, T. and A. R. Ferre-D'Amare (2004). "Structure of protein L7Ae bound to a K-turn derived from an archaeal box H/ACA sRNA at 1.8 A resolution." Structure 12(5): 893-903.

Hamma, T., S. L. Reichow, et al. (2005). "The Cbf5-Nop10 complex is a molecular bracket that organizes box H/ACA RNPs." Nat Struct Mol Biol 12(12): 1101-7.

Harms, J., F. Schluenzen, et al. (2001). "High resolution structure of the large ribosomal subunit from a mesophilic eubacterium." Cell 107(5): 679-88.

Harnpicharnchai, P., J. Jakovljevic, et al. (2001). "Composition and functional characterization of yeast 66S ribosome assembly intermediates." Mol Cell 8(3): 505-15.

Harrington, L., T. McPhail, et al. (1997). "A mammalian telomerase-associated protein." Science 275(5302): 973-7.

Hedges, J., M. West, et al. (2005). "Release of the export adapter, Nmd3p, from the 60S

105

Page 259: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

ribosomal subunit requires Rpl10p and the cytoplasmic GTPase Lsg1p." Embo J 24(3): 567-79.

Heiss, N. S., S. W. Knight, et al. (1998). "X-linked dyskeratosis congenita is caused by mutations in a highly conserved gene with putative nucleolar functions." Nat Genet 19(1): 32-8.

Henras, A., C. Dez, et al. (2001). "Accumulation of H/ACA snoRNPs depends on the integrity of the conserved central domain of the RNA-binding protein Nhp2p." Nucleic Acids Res 29(13): 2733-46.

Henras, A., Y. Henry, et al. (1998). "Nhp2p and Nop10p are essential for the function of H/ACA snoRNPs." Embo J 17(23): 7078-90.

Henras, A. K., R. Capeyrou, et al. (2004). "Cbf5p, the putative pseudouridine synthase of H/ACA-type snoRNPs, can form a complex with Gar1p and Nop10p in absence of Nhp2p and box H/ACA snoRNAs." Rna 10(11): 1704-12.

Henras, A. K., C. Dez, et al. (2004). "RNA structure and function in C/D and H/ACA s(no)RNPs." Curr Opin Struct Biol 14(3): 335-43.

Henry, Y., H. Wood, et al. (1994). "The 5' end of yeast 5.8S rRNA is generated by exonucleases from an upstream cleavage site." Embo J 13(10): 2452-63.

Ho, J. H., G. Kallstrom, et al. (2000). "Nmd3p is a Crm1p-dependent adapter protein for nuclear export of the large ribosomal subunit." J Cell Biol 151(5): 1057-66.

Ho, Y., A. Gruhler, et al. (2002). "Systematic identification of protein complexes in Saccharomyces cerevisiae by mass spectrometry." Nature 415(6868): 180-3.

Hoang, C. and A. R. Ferre-D'Amare (2001). "Cocrystal structure of a tRNA Psi55 pseudouridine synthase: nucleotide flipping by an RNA-modifying enzyme." Cell 107(7): 929-39.

Hoang, T., W. T. Peng, et al. (2005). "Esf2p, a U3-associated factor required for small-subunit processome assembly and compaction." Mol Cell Biol 25(13): 5523-34.

Holt, S. E., D. L. Aisner, et al. (1999). "Functional requirement of p23 and Hsp90 in telomerase complexes." Genes Dev 13(7): 817-26.

Hughes, J. M. (1996). "Functional base-pairing interaction between highly conserved elements of U3 small nucleolar RNA and the small ribosomal subunit RNA." J Mol Biol 259(4): 645-54.

Hughes, J. M. and M. Ares, Jr. (1991). "Depletion of U3 small nucleolar RNA inhibits cleavage in the 5' external transcribed spacer of yeast pre-ribosomal RNA and impairs formation of 18S ribosomal RNA." Embo J 10(13): 4231-9.

Hurt, E., S. Hannus, et al. (1999). "A novel in vivo assay reveals inhibition of ribosomal nuclear export in ran-cycle and nucleoporin mutants." J Cell Biol 144(3): 389-401.

Ito, T., T. Chiba, et al. (2001). "A comprehensive two-hybrid analysis to explore the yeast protein interactome." Proc Natl Acad Sci U S A 98(8): 4569-74.

Jady, B. E., E. Bertrand, et al. (2004). "Human telomerase RNA and box H/ACA scaRNAs share a common Cajal body-specific localization signal." J Cell Biol 164(5): 647-52.

Jady, B. E., P. Richard, et al. (2006). "Cell cycle-dependent recruitment of telomerase RNA and Cajal bodies to human telomeres." Mol Biol Cell 17(2): 944-54.

Jarmolowski, A., J. Zagorski, et al. (1990). "Identification of essential elements in U14 RNA of Saccharomyces cerevisiae." Embo J 9(13): 4503-9.

Jiang, W., K. Middleton, et al. (1993). "An essential yeast protein, CBF5p, binds in vitro to centromeres and microtubules." Mol Cell Biol 13(8): 4884-93.

Jorgensen, P., I. Rupes, et al. (2004). "A dynamic transcriptional network communicates growth potential to ribosome synthesis and critical cell size." Genes Dev 18(20): 2491-505.

106

Page 260: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

Kapp, L. D. and J. R. Lorsch (2004). "The molecular mechanics of eukaryotic translation." Annu Rev Biochem 73: 657-704.

Kass, S., K. Tyc, et al. (1990). "The U3 small nucleolar ribonucleoprotein functions in the first step of preribosomal RNA processing." Cell 60(6): 897-908.

Kempers-Veenstra, A. E., J. Oliemans, et al. (1986). "3'-End formation of transcripts from the yeast rRNA operon." Embo J 5(10): 2703-10.

Keppler, B. R. and M. B. Jarstfer (2004). "Inhibition of telomerase activity by preventing proper assemblage." Biochemistry 43(2): 334-43.

Khanna, M., H. Wu, et al. (2006). "Structural study of the H/ACA snoRNP components Nop10p and the 3' hairpin of U65 snoRNA." Rna 12(1): 40-52.

Kharbanda, S., V. Kumar, et al. (2000). "Regulation of the hTERT telomerase catalytic subunit by the c-Abl tyrosine kinase." Curr Biol 10(10): 568-75.

King, T. H., W. A. Decatur, et al. (2001). "A well-connected and conserved nucleoplasmic helicase is required for production of box C/D and H/ACA snoRNAs and localization of snoRNP proteins." Mol Cell Biol 21(22): 7731-46.

King, T. H., B. Liu, et al. (2003). "Ribosome structure and activity are altered in cells lacking snoRNPs that form pseudouridines in the peptidyl transferase center." Mol Cell 11(2): 425-35.

Kiss-Laszlo, Z., Y. Henry, et al. (1996). "Site-specific ribose methylation of preribosomal RNA: a novel function for small nucleolar RNAs." Cell 85(7): 1077-88.

Kiss-Laszlo, Z., Y. Henry, et al. (1998). "Sequence and structural elements of methylation guide snoRNAs essential for site-specific ribose methylation of pre-rRNA." Embo J 17(3): 797-807.

Kittur, N., X. Darzacq, et al. (2006). "Dynamic association and localization of human H/ACA RNP proteins." Rna 12(12): 2057-62.

Kolodrubetz, D. and A. Burgum (1991). "Sequence and genetic analysis of NHP2: a moderately abundant high mobility group-like nuclear protein with an essential function in Saccharomyces cerevisiae." Yeast 7(2): 79-90.

Koonin, E. V. (1996). "Pseudouridine synthases: four families of enzymes containing a putative uridine-binding motif also conserved in dUTPases and dCTP deaminases." Nucleic Acids Res 24(12): 2411-5.

Koonin, E. V., P. Bork, et al. (1994). "A novel RNA-binding motif in omnipotent suppressors of translation termination, ribosomal proteins and a ribosome modification enzyme?" Nucleic Acids Res 22(11): 2166-7.

Korostelev, A., S. Trakhanov, et al. (2006). "Crystal structure of a 70S ribosome-tRNA complex reveals functional interactions and rearrangements." Cell 126(6): 1065-77.

Kufel, J., B. Dichtl, et al. (1999). "Yeast Rnt1p is required for cleavage of the pre-ribosomal RNA in the 3' ETS but not the 5' ETS." Rna 5(7): 909-17.

LaCava, J., J. Houseley, et al. (2005). "RNA degradation by the exosome is promoted by a nuclear polyadenylation complex." Cell 121(5): 713-24.

Lafontaine, D., J. Vandenhaute, et al. (1995). "The 18S rRNA dimethylase Dim1p is required for pre-ribosomal RNA processing in yeast." Genes Dev 9(20): 2470-81.

Lafontaine, D. L., C. Bousquet-Antonelli, et al. (1998). "The box H + ACA snoRNAs carry Cbf5p, the putative rRNA pseudouridine synthase." Genes Dev 12(4): 527-37.

Lafontaine, D. L., T. Preiss, et al. (1998). "Yeast 18S rRNA dimethylase Dim1p: a quality control mechanism in ribosome synthesis?" Mol Cell Biol 18(4): 2360-70.

Lafontaine, D. L. and D. Tollervey (1999). "Nop58p is a common component of the box C+D snoRNPs that is required for snoRNA stability." Rna 5(3): 455-67.

Lafontaine, D. L. and D. Tollervey (2000). "Synthesis and assembly of the box C+D small

107

Page 261: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

nucleolar RNPs." Mol Cell Biol 20(8): 2650-9. Lai, C. K., J. R. Mitchell, et al. (2001). "RNA binding domain of telomerase reverse

transcriptase." Mol Cell Biol 21(4): 990-1000. Le, S., R. Sternglanz, et al. (2000). "Identification of two RNA-binding proteins associated

with human telomerase RNA." Mol Biol Cell 11(3): 999-1010. Lebreton, A., C. Saveanu, et al. (2006). "A functional network involved in the recycling of

nucleocytoplasmic pre-60S factors." J Cell Biol 173(3): 349-60. Lee, G. E., E. Y. Yu, et al. (2004). "DNA-protein kinase catalytic subunit-interacting protein

KIP binds telomerase by interacting with human telomerase reverse transcriptase." J Biol Chem 279(33): 34750-5.

Lee, S. J. and S. J. Baserga (1999). "Imp3p and Imp4p, two specific components of the U3 small nucleolar ribonucleoprotein that are essential for pre-18S rRNA processing." Mol Cell Biol 19(8): 5441-52.

Lee, Y. and R. N. Nazar (1997). "Ribosomal 5 S rRNA maturation in Saccharomyces cerevisiae." J Biol Chem 272(24): 15206-12.

Leger-Silvestre, I., S. Trumtel, et al. (1999). "Functional compartmentalization of the nucleus in the budding yeast Saccharomyces cerevisiae." Chromosoma 108(2): 103-13.

Lendvay, T. S., D. K. Morris, et al. (1996). "Senescence mutants of Saccharomyces cerevisiae with a defect in telomere replication identify three additional EST genes." Genetics 144(4): 1399-412.

Li, H., C. K. Tsang, et al. (2006). "Nutrient regulates Tor1 nuclear localization and association with rDNA promoter." Nature 442(7106): 1058-61.

Li, H. D., J. Zagorski, et al. (1990). "Depletion of U14 small nuclear RNA (snR128) disrupts production of 18S rRNA in Saccharomyces cerevisiae." Mol Cell Biol 10(3): 1145-52.

Li, L. and K. Ye (2006). "Crystal structure of an H/ACA box ribonucleoprotein particle." Nature 443(7109): 302-7.

Liljas, A. (2006). "Deepening ribosomal insights." ACS Chem Biol 1(9): 567-9. Lingner, J. and T. R. Cech (1996). "Purification of telomerase from Euplotes aediculatus:

requirement of a primer 3' overhang." Proc Natl Acad Sci U S A 93(20): 10712-7. Liu, Y., B. E. Snow, et al. (2000). "Telomerase-associated protein TEP1 is not essential for

telomerase activity or telomere length maintenance in vivo." Mol Cell Biol 20(21): 8178-84.

Lygerou, Z., C. Allmang, et al. (1996). "Accurate processing of a eukaryotic precursor ribosomal RNA by ribonuclease MRP in vitro." Science 272(5259): 268-70.

Lyman, S. K., L. Gerace, et al. (1999). "Human Nop5/Nop58 is a component common to the box C/D small nucleolar ribonucleoproteins." Rna 5(12): 1597-604.

Manival, X., C. Charron, et al. (2006). "Crystal structure determination and site-directed mutagenesis of the Pyrococcus abyssi aCBF5-aNOP10 complex reveal crucial roles of the C-terminal domains of both proteins in H/ACA sRNP activity." Nucleic Acids Res 34(3): 826-39.

Meyer, A. E., N. J. Hung, et al. (2007). "The specialized cytosolic J-protein, Jjj1, functions in 60S ribosomal subunit biogenesis." Proc Natl Acad Sci U S A 104(5): 1558-63.

Milkereit, P., O. Gadal, et al. (2001). "Maturation and intranuclear transport of pre-ribosomes requires Noc proteins." Cell 105(4): 499-509.

Mitchell, J. R., J. Cheng, et al. (1999). "A box H/ACA small nucleolar RNA-like domain at the human telomerase RNA 3' end." Mol Cell Biol 19(1): 567-76.

Mitchell, J. R. and K. Collins (2000). "Human telomerase activation requires two independent interactions between telomerase RNA and telomerase reverse transcriptase." Mol Cell 6(2): 361-71.

108

Page 262: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

Mitchell, J. R., E. Wood, et al. (1999). "A telomerase component is defective in the human disease dyskeratosis congenita." Nature 402(6761): 551-5.

Mitchell, P., E. Petfalski, et al. (1997). "The exosome: a conserved eukaryotic RNA processing complex containing multiple 3'-->5' exoribonucleases." Cell 91(4): 457-66.

Mitchell, P., E. Petfalski, et al. (1996). "The 3' end of yeast 5.8S rRNA is generated by an exonuclease processing mechanism." Genes Dev 10(4): 502-13.

Moriarty, T. J., S. Huard, et al. (2002). "Functional multimerization of human telomerase requires an RNA interaction domain in the N terminus of the catalytic subunit." Mol Cell Biol 22(4): 1253-65.

Moriarty, T. J., D. T. Marie-Egyptienne, et al. (2004). "Functional organization of repeat addition processivity and DNA synthesis determinants in the human telomerase multimer." Mol Cell Biol 24(9): 3720-33.

Moy, T. I. and P. A. Silver (1999). "Nuclear export of the small ribosomal subunit requires the ran-GTPase cycle and certain nucleoporins." Genes Dev 13(16): 2118-33.

Nakayama, J., M. Saito, et al. (1997). "TLP1: a gene encoding a protein component of mammalian telomerase is a novel member of WD repeats family." Cell 88(6): 875-84.

Newman, D. R., J. F. Kuhn, et al. (2000). "Box C/D snoRNA-associated proteins: two pairs of evolutionarily ancient proteins and possible links to replication and transcription." Rna 6(6): 861-79.

Nicoloso, M., L. H. Qu, et al. (1996). "Intron-encoded, antisense small nucleolar RNAs: the characterization of nine novel species points to their direct role as guides for the 2'-O-ribose methylation of rRNAs." J Mol Biol 260(2): 178-95.

Nissan, T. A., J. Bassler, et al. (2002). "60S pre-ribosome formation viewed from assembly in the nucleolus until export to the cytoplasm." Embo J 21(20): 5539-47.

Nissen, P., J. Hansen, et al. (2000). "The structural basis of ribosome activity in peptide bond synthesis." Science 289(5481): 920-30.

Normand, C., R. Capeyrou, et al. (2006). "Analysis of the binding of the N-terminal conserved domain of yeast Cbf5p to a box H/ACA snoRNA." Rna 12(10): 1868-82.

Nottrott, S., K. Hartmuth, et al. (1999). "Functional interaction of a novel 15.5kD [U4/U6.U5] tri-snRNP protein with the 5' stem-loop of U4 snRNA." Embo J 18(21): 6119-33.

Oeffinger, M., M. Dlakic, et al. (2004). "A pre-ribosome-associated HEAT-repeat protein is required for export of both ribosomal subunits." Genes Dev 18(2): 196-209.

Omer, A. D., M. Zago, et al. (2006). "Probing the structure and function of an archaeal C/D-box methylation guide sRNA." Rna 12(9): 1708-20.

Omer, A. D., S. Ziesche, et al. (2002). "In vitro reconstitution and activity of a C/D box methylation guide ribonucleoprotein complex." Proc Natl Acad Sci U S A 99(8): 5289-94.

Pellizzoni, L., J. Baccon, et al. (2001). "The survival of motor neurons (SMN) protein interacts with the snoRNP proteins fibrillarin and GAR1." Curr Biol 11(14): 1079-88.

Pertschy, B., C. Saveanu, et al. (2007). "Cytoplasmic recycling of 60S pre-ribosomal factors depends on the AAA-protein Drg1." Mol Cell Biol.

Piper, P. W., N. Patel, et al. (1984). "Processing of the 3' sequence extensions upon the 5S rRNA of a mutant yeast in Xenopus laevis germinal vesicle extract." Eur J Biochem 141(1): 115-8.

Planta, R. J. and W. H. Mager (1998). "The list of cytoplasmic ribosomal proteins of Saccharomyces cerevisiae." Yeast 14(5): 471-7.

Poderycki, M. J., L. H. Rome, et al. (2005). "The p80 homology region of TEP1 is sufficient for its association with the telomerase and vault RNAs, and the vault particle." Nucleic Acids Res 33(3): 893-902.

109

Page 263: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

Pogacic, V., F. Dragon, et al. (2000). "Human H/ACA small nucleolar RNPs and telomerase share evolutionarily conserved proteins NHP2 and NOP10." Mol Cell Biol 20(23): 9028-40.

Powers, T. and P. Walter (1999). "Regulation of ribosome biogenesis by the rapamycin-sensitive TOR-signaling pathway in Saccharomyces cerevisiae." Mol Biol Cell 10(4): 987-1000.

Ramakrishnan, V. (2002). "Ribosome structure and the mechanism of translation." Cell 108(4): 557-72.

Rashid, R., M. Aittaleb, et al. (2003). "Functional requirement for symmetric assembly of archaeal box C/D small ribonucleoprotein particles." J Mol Biol 333(2): 295-306.

Rashid, R., B. Liang, et al. (2006). "Crystal structure of a Cbf5-Nop10-Gar1 complex and implications in RNA-guided pseudouridylation and dyskeratosis congenita." Mol Cell 21(2): 249-60.

Raska, I., P. J. Shaw, et al. (2006). "Structure and function of the nucleolus in the spotlight." Curr Opin Cell Biol 18(3): 325-34.

Richard, P., A. M. Kiss, et al. (2006). "Cotranscriptional recognition of human intronic box H/ACA snoRNAs occurs in a splicing-independent manner." Mol Cell Biol 26(7): 2540-9.

Rodnina, M. V., T. Daviter, et al. (2002). "Structural dynamics of ribosomal RNA during decoding on the ribosome." Biochimie 84(8): 745-54.

Rozhdestvensky, T. S., T. H. Tang, et al. (2003). "Binding of L7Ae protein to the K-turn of archaeal snoRNAs: a shared RNA binding motif for C/D and H/ACA box snoRNAs in Archaea." Nucleic Acids Res 31(3): 869-77.

Saveanu, C., D. Bienvenu, et al. (2001). "Nog2p, a putative GTPase associated with pre-60S subunits and required for late 60S maturation steps." Embo J 20(22): 6475-84.

Saveanu, C., A. Namane, et al. (2003). "Sequential protein association with nascent 60S ribosomal particles." Mol Cell Biol 23(13): 4449-60.

Savino, R. and S. A. Gerbi (1990). "In vivo disruption of Xenopus U3 snRNA affects ribosomal RNA processing." Embo J 9(7): 2299-308.

Schafer, T., B. Maco, et al. (2006). "Hrr25-dependent phosphorylation state regulates organization of the pre-40S subunit." Nature 441(7093): 651-5.

Schafer, T., D. Strauss, et al. (2003). "The path from nucleolar 90S to cytoplasmic 40S pre-ribosomes." Embo J 22(6): 1370-80.

Schimmang, T., D. Tollervey, et al. (1989). "A yeast nucleolar protein related to mammalian fibrillarin is associated with small nucleolar RNA and is essential for viability." Embo J 8(13): 4015-24.

Schluenzen, F., A. Tocilj, et al. (2000). "Structure of functionally activated small ribosomal subunit at 3.3 angstroms resolution." Cell 102(5): 615-23.

Schultz, A., S. Nottrott, et al. (2006). "Protein-protein and protein-RNA contacts both contribute to the 15.5K-mediated assembly of the U4/U6 snRNP and the box C/D snoRNPs." Mol Cell Biol 26(13): 5146-54.

Schuwirth, B. S., M. A. Borovinskaya, et al. (2005). "Structures of the bacterial ribosome at 3.5 A resolution." Science 310(5749): 827-34.

Seimiya, H., H. Sawada, et al. (2000). "Involvement of 14-3-3 proteins in nuclear localization of telomerase." Embo J 19(11): 2652-61.

Seiser, R. M., A. E. Sundberg, et al. (2006). "Ltv1 is required for efficient nuclear export of the ribosomal small subunit in Saccharomyces cerevisiae." Genetics 174(2): 679-91.

Selmer, M., C. M. Dunham, et al. (2006). "Structure of the 70S ribosome complexed with mRNA and tRNA." Science 313(5795): 1935-42.

110

Page 264: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

Seto, A. G., A. J. Zaug, et al. (1999). "Saccharomyces cerevisiae telomerase is an Sm small nuclear ribonucleoprotein particle." Nature 401(6749): 177-80.

Sharma, K. and D. Tollervey (1999). "Base pairing between U3 small nucleolar RNA and the 5' end of 18S rRNA is required for pre-rRNA processing." Mol Cell Biol 19(9): 6012-9.

Spirin, A. S. (2002). "Omnipotent RNA." FEBS Lett 530(1-3): 4-8. Stevens, S. W. and J. Abelson (1999). "Purification of the yeast U4/U6.U5 small nuclear

ribonucleoprotein particle and identification of its proteins." Proc Natl Acad Sci U S A 96(13): 7226-31.

Storz, G. (2002). "An expanding universe of noncoding RNAs." Science 296(5571): 1260-3. Suryadi, J., E. J. Tran, et al. (2005). "The crystal structure of the Methanocaldococcus

jannaschii multifunctional L7Ae RNA-binding protein reveals an induced-fit interaction with the box C/D RNAs." Biochemistry 44(28): 9657-72.

Szewczak, L. B., S. J. DeGregorio, et al. (2002). "Exclusive interaction of the 15.5 kD protein with the terminal box C/D motif of a methylation guide snoRNP." Chem Biol 9(10): 1095-107.

Tesmer, V. M., L. P. Ford, et al. (1999). "Two inactive fragments of the integral RNA cooperate to assemble active telomerase with the human protein catalytic subunit (hTERT) in vitro." Mol Cell Biol 19(9): 6207-16.

Tollervey, D., H. Lehtonen, et al. (1993). "Temperature-sensitive mutations demonstrate roles for yeast fibrillarin in pre-rRNA processing, pre-rRNA methylation, and ribosome assembly." Cell 72(3): 443-57.

Tomlinson, R. L., T. D. Ziegler, et al. (2006). "Cell cycle-regulated trafficking of human telomerase to telomeres." Mol Biol Cell 17(2): 955-65.

Torchet, C., G. Badis, et al. (2005). "The complete set of H/ACA snoRNAs that guide rRNA pseudouridylations in Saccharomyces cerevisiae." Rna 11(6): 928-38.

Tran, E., J. Brown, et al. (2004). "Evolutionary origins of the RNA-guided nucleotide-modification complexes: from the primitive translation apparatus?" Trends Biochem Sci 29(7): 343-50.

Tran, E. J., X. Zhang, et al. (2003). "Efficient RNA 2'-O-methylation requires juxtaposed and symmetrically assembled archaeal box C/D and C'/D' RNPs." Embo J 22(15): 3930-40.

Tycowski, K. T., M. D. Shu, et al. (1996). "A mammalian gene with introns instead of exons generating stable RNA products." Nature 379(6564): 464-6.

van Hoof, A., P. Lennertz, et al. (2000). "Three conserved members of the RNase D family have unique and overlapping functions in the processing of 5S, 5.8S, U4, U5, RNase MRP and RNase P RNAs in yeast." Embo J 19(6): 1357-65.

van Hoof, A., P. Lennertz, et al. (2000). "Yeast exosome mutants accumulate 3'-extended polyadenylated forms of U4 small nuclear RNA and small nucleolar RNAs." Mol Cell Biol 20(2): 441-52.

Vanrobays, E., J. P. Gelugne, et al. (2003). "Late cytoplasmic maturation of the small ribosomal subunit requires RIO proteins in Saccharomyces cerevisiae." Mol Cell Biol 23(6): 2083-95.

Vanrobays, E., P. E. Gleizes, et al. (2001). "Processing of 20S pre-rRNA to 18S ribosomal RNA in yeast requires Rrp10p, an essential non-ribosomal cytoplasmic protein." Embo J 20(15): 4204-13.

Venema, J. and D. Tollervey (1996). "RRP5 is required for formation of both 18S and 5.8S rRNA in yeast." Embo J 15(20): 5701-14.

Venema, J., H. R. Vos, et al. (2000). "Yeast Rrp9p is an evolutionarily conserved U3 snoRNP

111

Page 265: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

protein essential for early pre-rRNA processing cleavages and requires box C for its association." Rna 6(11): 1660-71.

Vidovic, I., S. Nottrott, et al. (2000). "Crystal structure of the spliceosomal 15.5kD protein bound to a U4 snRNA fragment." Mol Cell 6(6): 1331-42.

Wang, C. and U. T. Meier (2004). "Architecture and assembly of mammalian H/ACA small nucleolar and telomerase ribonucleoproteins." Embo J 23(8): 1857-67.

Wang, C., C. C. Query, et al. (2002). "Immunopurified small nucleolar ribonucleoprotein particles pseudouridylate rRNA independently of their association with phosphorylated Nopp140." Mol Cell Biol 22(24): 8457-66.

Wang, F., E. R. Podell, et al. (2007). "The POT1-TPP1 telomere complex is a telomerase processivity factor." Nature 445(7127): 506-10.

Watkins, N. J., A. Dickmanns, et al. (2002). "Conserved stem II of the box C/D motif is essential for nucleolar localization and is required, along with the 15.5K protein, for the hierarchical assembly of the box C/D snoRNP." Mol Cell Biol 22(23): 8342-52.

Watkins, N. J., A. Gottschalk, et al. (1998). "Cbf5p, a potential pseudouridine synthase, and Nhp2p, a putative RNA-binding protein, are present together with Gar1p in all H BOX/ACA-motif snoRNPs and constitute a common bipartite structure." Rna 4(12): 1549-68.

Watkins, N. J., V. Segault, et al. (2000). "A common core RNP structure shared between the small nucleoar box C/D RNPs and the spliceosomal U4 snRNP." Cell 103(3): 457-66.

Wehner, K. A. and S. J. Baserga (2002). "The sigma(70)-like motif: a eukaryotic RNA binding domain unique to a superfamily of proteins required for ribosome biogenesis." Mol Cell 9(2): 329-39.

West, M., J. B. Hedges, et al. (2005). "Defining the order in which Nmd3p and Rpl10p load onto nascent 60S ribosomal subunits." Mol Cell Biol 25(9): 3802-13.

West, M., J. B. Hedges, et al. (2007). "Novel interaction of the 60S ribosomal subunit export adapter Nmd3 at the nuclear pore complex." J Biol Chem 282(19): 14028-37.

Wiederkehr, T., R. F. Pretot, et al. (1998). "Synthetic lethal interactions with conditional poly(A) polymerase alleles identify LCP5, a gene involved in 18S rRNA maturation." Rna 4(11): 1357-72.

Wimberly, B. T., D. E. Brodersen, et al. (2000). "Structure of the 30S ribosomal subunit." Nature 407(6802): 327-39.

Winkler, A. A., A. Bobok, et al. (1998). "The lysine-rich C-terminal repeats of the centromere-binding factor 5 (Cbf5) of Kluyveromyces lactis are not essential for function." Yeast 14(1): 37-48.

Wu, P., J. S. Brockenbrough, et al. (1998). "Nop5p is a small nucleolar ribonucleoprotein component required for pre-18 S rRNA processing in yeast." J Biol Chem 273(26): 16453-63.

Xin, H., D. Liu, et al. (2007). "TPP1 is a homologue of ciliate TEBP-beta and interacts with POT1 to recruit telomerase." Nature 445(7127): 559-62.

Yang, P. K., C. Hoareau, et al. (2005). "Cotranscriptional recruitment of the pseudouridylsynthetase Cbf5p and of the RNA binding protein Naf1p during H/ACA snoRNP assembly." Mol Cell Biol 25(8): 3295-304.

Yang, P. K., G. Rotondo, et al. (2002). "The Shq1p.Naf1p complex is required for box H/ACA small nucleolar ribonucleoprotein particle biogenesis." J Biol Chem 277(47): 45235-42.

Yang, Y., C. Isaac, et al. (2000). "Conserved composition of mammalian box H/ACA and box C/D small nucleolar ribonucleoprotein particles and their interaction with the common factor Nopp140." Mol Biol Cell 11(2): 567-77.

112

Page 266: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

Références

Yu, G. L., J. D. Bradley, et al. (1990). "In vivo alteration of telomere sequences and senescence caused by mutated Tetrahymena telomerase RNAs." Nature 344(6262): 126-32.

Yusupov, M. M., G. Z. Yusupova, et al. (2001). "Crystal structure of the ribosome at 5.5 A resolution." Science 292(5518): 883-96.

Zebarjadian, Y., T. King, et al. (1999). "Point mutations in yeast CBF5 can abolish in vivo pseudouridylation of rRNA." Mol Cell Biol 19(11): 7461-72.

Zhou, X. Z. and K. P. Lu (2001). "The Pin2/TRF1-interacting protein PinX1 is a potent telomerase inhibitor." Cell 107(3): 347-59.

113

Page 267: Doctorat de l’Université TOULOUSE III- Paul Sabatierthesesups.ups-tlse.fr/2929/1/2007TOU30312.pdf · RESUME Mes travaux de ... Anthony, merci pour ta bonne humeur et les nombreuses

RESUME

Mes travaux de thèse se sont concentrés sur l’étude de la biogenèse des particules

ribonucléoprotéiques H/ACA (RNP H/ACA). Ces RNP sont impliquées dans divers processus

cellulaires essentiels comprenant la synthèse des ribosomes et des télomères. Les RNP

H/ACA se composent d'un petit ARN non-codant (ARN H/ACA) et de 4 protéines : Cbf5p,

Gar1p, Nhp2p et Nop10p.

Au début de mon travail de thèse, nous disposions de plusieurs résultats suggérant que

la protéine Naf1p, chez la levure, est impliquée dans l'assemblage de RNP H/ACA. Pendant

ma thèse, j'ai caractérisé l'orthologue humain (hNaf1) de la protéine Naf1p de Levure. J'ai

prouvé que hNaf1 peut fonctionnellement remplacer Naf1p endogène chez la levure et que, au

sein des cellules humaines, hNaf1 est requise pour l'accumulation des composants des RNP

H/ACA. De plus, j'ai démontré que hNaf1 interagi avec les différents types d’ARN H/ACA

c'est-à-dire: les scaARN H/ACA, les snoARN H/ACA et l'ARN de télomérase. Afin de

déterminer le rôle exact de Naf1p, j'ai réalisé une purification des complexes qui lui sont

associés chez la levure. J'ai ainsi démontré que Naf1p interagi avec la machinerie de

transcription associée à l’ARN polymérase II. Puis, en collaboration avec l’équipe de

Guillaume Chanfreau, nous avons mis en évidence que Naf1p est associée aux gènes codant

les snoARN H/ACA. Ce qui suggère fortement que Naf1p pourrait permettre le recrutement

des protéines Cbf5p, Nhp2p et Nop10p sur les ARN H/ACA en cours de synthèse. En

collaboration avec l’équipe de H. van Tilbeurgh, nous avons déterminé la structure

cristallographique du domaine central de Naf1p. Ce domaine présente une structure similaire

à la protéine aGar1. J'ai également démontré que ce domaine est essentiel in vivo et qu'il

permet l'interaction avec la protéine Cbf5p in vitro.

Nous proposons que Naf1p promeut les étapes précoces d’assemblage des RNP

H/ACA en recrutant Cbf5p, Nhp2p et Nop10p au niveau des sites de transcription des

snoARN H/ACA. Naf1p serait ensuite requise pour prévenir une activité prématurée des

complexes en cours d’assemblage en inhibant l’interaction de Cbf5p avec Gar1p.