Phénoménologie des neutrinos dans une théorie de matrices ...

144
© Nicolas Giasson, 2019 Phénoménologie des neutrinos dans une théorie de matrices aléatoires Thèse Nicolas Giasson Doctorat en physique Philosophiæ doctor (Ph. D.) Québec, Canada

Transcript of Phénoménologie des neutrinos dans une théorie de matrices ...

Page 1: Phénoménologie des neutrinos dans une théorie de matrices ...

© Nicolas Giasson, 2019

Phénoménologie des neutrinos dans une théorie de matrices aléatoires

Thèse

Nicolas Giasson

Doctorat en physique

Philosophiæ doctor (Ph. D.)

Québec, Canada

Page 2: Phénoménologie des neutrinos dans une théorie de matrices ...

Phénoménologie des neutrinosdans une théorie de matrices aléatoires

Thèse

Nicolas Giasson

Sous la direction de :

Luc Marleau, directeur de rechercheJean-François Fortin, codirecteur de recherche

Page 3: Phénoménologie des neutrinos dans une théorie de matrices ...

Résumé

Le mécanisme permettant d’expliquer l’origine de la masse des neutrinos demeure, encore aujourd’hui,un mystère complet dont la résolution est susceptible de modifier considérablement la structure dumodèle standard en physique des particules élémentaires. Dans la littérature, plusieurs candidats po-tentiels sont donc proposés afin de combler cette lacune et, ainsi, faire la lumière sur certaines despropriétés les plus étranges des neutrinos. Parmi ceux-ci, les mécanismes seesaw de type I, II et IIIconstituent sans doute les approches les plus attrayantes et les plus étudiées. Cependant, bien que cesmécanismes offrent un cadre de travail simple et élégant pour expliquer la faible masse des neutrinos(l’ordre de grandeur), ceux-ci n’offrent aucune prédiction sur les paramètres fondamentaux caracté-risant le phénomène d’oscillation, soit les angles de mélange, les phases complexes et la hiérarchiedes masses. Afin d’obtenir des prédictions concrètes sur la phénoménologie des neutrinos, certaineshypothèses de travail supplémentaires doivent donc être formulées pour contraindre la structure desmatrices de masse obtenue.

Dans ce travail, l’hypothèse anarchique propre au secteur des neutrinos est adoptée. Les matrices demasse générées par les trois mécanismes seesaw dans la limite des basses énergies sont traitées dansle contexte d’une théorie de matrices aléatoires, ce qui permet de définir et d’analyser de nouveauxensembles matriciels aléatoires appelés ensembles seesaw. Un cadre théorique unifié est donc présentépour la construction de ces ensembles. Grâce au formalisme élaboré, qui repose sur les outils tradition-nels relevant de la théorie des matrices aléatoires, les densités de probabilité jointes caractérisant cesensembles sont obtenues de façon analytique. Une étude détaillée de leurs propriétés est alors réalisée,ce qui permet d’extraire les tendances dominantes propres à ces mécanismes de masse et d’analyserleurs conséquences pour le secteur des neutrinos du modèle standard étendu.

En ce qui concerne le spectre de masse, les résultats obtenus indiquent que les mécanismes seesawde type I et de type III sont plus adéquats pour reproduire les observations expérimentales. De plus,une forte préférence pour la différence de masses associée à la hiérarchie normale est observée. Encontrepartie, il est également démontré que pour une différence de masses donnée entre les trois gé-nérations, toutes les permutations des masses sont équiprobables, ce qui rend hors de portée touteprédiction concernant la hiérarchie du spectre (normale ou inverse) sous l’hypothèse anarchique. En cequi concerne les variables du groupe de symétrie (les angles de mélange et les phases complexes), onconstate, d’une part, que la notion de mélange quasi-maximal est naturellement favorisée et, d’autrepart, que la matrice PMNS peut être décrite comme une matrice unitaire générique tirée au hasardd’un ensemble matriciel caractérisé par la mesure de Haar du groupe de Lie correspondant. Par ailleurs,il est également démontré que ces conclusions sont indépendantes du mécanisme de masse considéré.

iii

Page 4: Phénoménologie des neutrinos dans une théorie de matrices ...

Abstract

The neutrino mass generation mechanism remains, to this day, a complete mystery which is likely toplay an important role in understanding the foundations of the Standard Model of particle physics. Inan effort to fill this gap and, ultimately, shed some light on some of the most intriguing properties ofneutrinos, many theoretical models are proposed in the literature. Among the many candidates, thetype I, type II and type III seesaw mechanisms may very well be the most attractive and the moststudied propositions. However, despite the fact that these mechanisms provide a simple and elegantframework for explaining the smallness of neutrino masses (the order of magnitude), no predictioncan be made on the fundamental parameters governing neutrino oscillations (the mixing angles, theCP -violating phases and the mass differences). Thus, to obtain concrete results regarding neutrinophenomenology, additional working assumptions must be made in order to constrain the structure ofthe corresponding mass matrices.

In this work, the anarchy hypothesis relevant to the neutrino sector is investigated. The mass matricesgenerated by the three seesaw mechanisms in the low-energy limit are studied within the frameworkof random matrix theory, which leads to the developement and the analysis of the seesaw ensembles.A unified and precise theoretical formalism, based on the usual tools of random matrix theory, ispresended for the construction of these new random matrix ensembles. Using this formalism, the jointprobability density functions characterizing these ensembles are obtained analytically, thus paving theway for a detailed study of their properties. This study is then carried out, revealing the underlyingtrends in these ensembles and, thereby, offering a thorough analysis of their consequences for the neu-trino sector of the seesaw-extended Standard Model.

Regarding the mass spectrum, it is found that the type I and type III seesaw mechanisms are bet-ter suited to accommodate experimental data. Moreover, the results indicate a strong preference forthe mass splitting associated to normal hierarchy. However, since all permutations of the masses arefound to be equally probable for a particular mass splitting between the three generations, predictionsconcerning the hierarchy of the mass spectrum (normal or inverted) remains out of reach in the fra-mework of anarchy. Regarding the group variables (the mixing angles an CP -violating phases), it isfound that near-maximal mixing is naturally favored by these ensembles and, that the PMNS matrixcan be described as a generic unitary matrix drawn at random from a matrix ensemble caracterizedby the Haar measure of the corresponding Lie group. Furthermore, these conclusions are found to beindependent of the mass mechanism considered.

iv

Page 5: Phénoménologie des neutrinos dans une théorie de matrices ...

Table des matières

Résumé iii

Abstract iv

Table des matières v

Liste des tableaux vii

Liste des figures viii

Remerciements x

Introduction 1

1 Description des neutrinos et de leurs propriétés 111.1 Champs fermioniques : Les spineurs de Dirac, Majorana et Weyl . . . . . . . . . . . . . 111.2 Les neutrinos et le secteur électrofaible . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.2.1 Interaction de type courant chargé . . . . . . . . . . . . . . . . . . . . . . . . . . 191.2.2 Le phénomène d’oscillation dans le vide . . . . . . . . . . . . . . . . . . . . . . . 221.2.3 Contraintes expérimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.3 Les origines de la masse dans une théorie de jauge . . . . . . . . . . . . . . . . . . . . . 281.3.1 Le mécanisme de Higgs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291.3.2 Neutrinos massifs et extension minimale du modèle standard . . . . . . . . . . . 331.3.3 Mécanismes seesaw . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

2 Principe anarchique et matrices aléatoires 472.1 Une approche alternative qui repose sur le hasard . . . . . . . . . . . . . . . . . . . . . . 47

2.1.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482.1.2 Le principe anarchique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

2.2 Introduction à la théorie des matrices aléatoires : L’ensemble gaussien orthogonal . . . . 512.2.1 Distribution jointe des éléments de matrice . . . . . . . . . . . . . . . . . . . . . 532.2.2 Distribution jointe des valeurs propres . . . . . . . . . . . . . . . . . . . . . . . . 56

2.3 Éléments d’analyse statistique multivariée . . . . . . . . . . . . . . . . . . . . . . . . . . 602.3.1 Propriétés du produit extérieur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 602.3.2 Calcul de mesures : l’ensemble gaussien unitaire . . . . . . . . . . . . . . . . . . 622.3.3 Variété de Stiefel et mesure de Haar . . . . . . . . . . . . . . . . . . . . . . . . . 642.3.4 Décomposition en valeurs singulières et mesures associées . . . . . . . . . . . . . 66

3 Ensembles seesaw 733.1 Définitions et concepts de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

3.1.1 Ensembles de base de type Dirac et Majorana . . . . . . . . . . . . . . . . . . . . 743.1.2 L’ensemble seesaw de type I-III . . . . . . . . . . . . . . . . . . . . . . . . . . . . 763.1.3 Distribution jointe des valeurs singulières et des variables du groupe . . . . . . . 79

3.2 Propriétés des ensembles seesaw . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

v

Page 6: Phénoménologie des neutrinos dans une théorie de matrices ...

3.2.1 Comportements asymptotiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 823.2.2 Les cas N = 1 et N = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

3.3 Le secteur des neutrinos du modèle standard étendu (le cas N = 3) . . . . . . . . . . . . 903.3.1 Paramètres angulaires et masses . . . . . . . . . . . . . . . . . . . . . . . . . . . 903.3.2 Symétrie CP et invariants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

3.4 Analyse et discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1143.4.1 Retour sur les principales tendances observées . . . . . . . . . . . . . . . . . . . . 1153.4.2 Spectre de masse des neutrinos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1163.4.3 Invariants quartiques du secteur leptonique . . . . . . . . . . . . . . . . . . . . . 119

Conclusion 122

A Quelques résultats utiles 127A.1 Intégrales multidimensionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127A.2 Décomposition en valeurs singulières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

A.2.1 Matrice arbitraire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128A.2.2 Matrice symétrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

A.3 Paramétrisation du groupe unitaire U(N) . . . . . . . . . . . . . . . . . . . . . . . . . . 130

Bibliographie 131

vi

Page 7: Phénoménologie des neutrinos dans une théorie de matrices ...

Liste des tableaux

1.1 Valeurs propres des opérateurs d’isospin I et I3, d’hypercharge Y et de charge électriqueQ pour les trois générations de fermions du modèle standard (tableau adapté de [1]). . . 17

1.2 Valeurs des différents paramètres d’oscillation (1σ) tels que présentés dans [2]. . . . . . . 261.3 Propriétés du doublet de Higgs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.1 Paramètres de localisation des distributions marginales de la figure 3.3. . . . . . . . . . 883.2 Test de probabilité pour les angles de mélange et les phases complexes générés à partir

de la mesure de Haar et de la mesure uniforme. Les probabilités PHaar et PUniforme sontobtenues en intégrant ces mesures sur le volume expérimental Vexp défini par les donnéesà 1σ (voir tableau 1.2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

3.3 Paramètres de localisation des distributions marginales de la figure 3.6. . . . . . . . . . 953.4 Valeurs maximales des invariants |jD|, |j1| et |j2| de la matrice PMNS selon les mesures

actuelles (±1σ) des angles de mélange pour la hiérarchie normale et inverse [2]. . . . . . 1053.5 Premiers moments des invariants |jD|, |j1| et |j2| pour la mesure de Haar et la mesure

uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1133.6 Valeurs prédites au premier quadrant pour les phases complexes obtenues à partir des

premiers moments 〈|j|〉 relevant de la mesure de Haar et de la mesure uniforme et ce,pour les hiérarchies normale et inverse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

3.7 Probabilités P (|j| ≤ |jmax|) que les invariants quartiques générés à partir de la me-sure de Haar et de la mesure uniforme soient dans l’intervalle permis par les valeursexpérimentales des hiérarchies normale et inverse. . . . . . . . . . . . . . . . . . . . . . . 114

vii

Page 8: Phénoménologie des neutrinos dans une théorie de matrices ...

Liste des figures

1.1 Spectre des masses et composition des états |νk〉 selon une hiérarchie normale ou inverse.Figure adaptée de [3] avec les données du tableau 1.2. . . . . . . . . . . . . . . . . . . . 27

3.1 Distributions des valeurs singulières (masses) des ensembles seesaw pour le cas N = 1.Les histogrammes ont été obtenus à partir d’un échantillon de 5×104 matrices de massesans dimension. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

3.2 Distributions de l’angle de mélange et de la phase complexe des deux ensembles seesawpour le cas N = 2. Les histogrammes ont été obtenus à partir d’un échantillon de2.5 × 104 matrices unitaires provenant de la décomposition en valeurs singulières desmatrices de masse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

3.3 Distributions des valeurs singulières (masses) des ensembles seesaw pour le cas N = 2.Les histogrammes ont été obtenus à partir d’un échantillon de 2.5 × 104 matrices demasse sans dimension dans les deux cas. Les valeurs singulières sont ordonnées selon0 ≤ mν

1 ≤ mν2 et un facteur de 2! est introduit pour corriger la constante de normalisation

des distributions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 873.4 Courbes de densité PI-III

ν (mν1 , m

ν2) et PII

ν (mν1 , m

ν2) des valeurs singulières (masses) des

ensembles seesaw pour le cas N = 2. Les deux figures sont séparées selon l’axe de symé-trie afin que les triangles inférieurs et supérieurs représentent les résultats numériqueset analytiques respectivement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

3.5 Distributions des angles de mélange et des phases complexes des deux ensembles seesawpour le cas N = 3. Les histogrammes ont été obtenus à partir d’un échantillon de2.5 × 104 matrices unitaires provenant de la décomposition en valeurs singulières desmatrices de masse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

3.6 Distributions des valeurs singulières (masses) des ensembles seesaw pour le cas N = 3.Les histogrammes ont été obtenus à partir d’un échantillon de 2.5 × 104 matrices demasse sans dimension dans les deux cas. Les valeurs singulières sont ordonnées selon0 ≤ mν

1 ≤ mν2 ≤ mν

3 et un facteur de 3! est introduit pour corriger la constante denormalisation des distributions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

3.7 Distributions des ratios R des ensembles seesaw pour le cas N = 3. Les histogrammesont été obtenus à partir d’un échantillon de 2.5× 104 matrices de masse sans dimensiondans les deux cas. Les valeurs singulières sont ordonnées selon 0 ≤ mν

1 ≤ mν2 ≤ mν

3 et unfacteur de 3! est introduit pour corriger la constante de normalisation des distributions. 96

3.8 Test de probabilité pour les valeurs singulières (masses) des ensembles seesaw pour lecas N = 3. La probabilité obtenue est tracée en fonction du paramètre d’échelle Λν pourles deux scénarios possibles, soit la hiérarchie normale et inverse. . . . . . . . . . . . . . 98

3.9 Distributions P(j1) = P(|j1|)/2 de l’invariant sous rephasage j1 pour le cas de matricesunitaires 2 × 2. Les histogrammes ont été obtenus à partir d’un échantillon de 5 × 104

matrices générées à partir de la mesure de Haar et de la mesure uniforme. . . . . . . . . 1093.10 Distributions P(j) = P(|j|)/2 des invariants sous rephasage jD, j1 et j2 pour le cas de

matrices unitaires 3× 3. Les histogrammes ont été obtenus à partir d’un échantillon de5× 104 matrices générées à partir de la mesure de Haar et de la mesure uniforme. . . . 112

viii

Page 9: Phénoménologie des neutrinos dans une théorie de matrices ...

What can be asserted without evidence canalso be dismissed without evidence.

Christopher Hitchens

ix

Page 10: Phénoménologie des neutrinos dans une théorie de matrices ...

Remerciements

La réalisation de ce projet de doctorat, aussi captivant et stimulant soit-il, n’aurait pas été possible sansle soutien inestimable de plusieurs personnes ayant joué, chacune à leur façon, un rôle déterminant danscet accomplissement. Comme la clé de la réussite en recherche consiste avant tout à établir et entretenirdes collaborations fructueuses, je me dois de remercier, en premier lieu, mon directeur de rechercheainsi que mon codirecteur de recherche, les professeurs Luc Marleau et Jean-François Fortin. Je suisprofondément reconnaissant de la marque de confiance qu’ils m’ont accordé en acceptant la direction demes travaux de recherche, de la grande liberté dont j’ai bénéficié dans le choix et dans l’élaboration de ceprojet, de même que pour leur patience inébranlable lorsqu’affligés de mes nombreux questionnements.Leur support constant tout au long de ces années, ainsi que leur rigueur, leur professionnalisme etleur grande curiosité intellectuelle, ont été des sources intarissables d’inspiration, de motivation etde dépassement de soi. De cette collaboration a émergé un projet de recherche à la hauteur de mesambitions et dont les conclusions ont permis de repousser, un tant soit peu, les limites de la connaissancedans ce domaine. En second lieu, j’aimerais remercier le professeur Patrick Desrosiers pour avoiraccepté de partager son expertise sur la théorie des matrices aléatoires à un moment charnière dansl’élaboration de ce projet, de même que pour avoir réalisé la prélecture de cette thèse. Dans ce mêmeesprit de collaboration, je tiens aussi à souligner l’importance des interactions hautement non trivialesavec les étudiants diplômés du groupe de recherche en physique théorique (présents et passés), qui ontdonnées lieu à de nombreux échanges formateurs à bien des niveaux.

Je souhaite également exprimer toute ma gratitude envers mes amis qui ont suivi, de près ou de loin,l’évolution de mon parcours universitaire et qui m’ont offert leur support et leurs encouragementsdans les moments décisifs. Parmi ceux-ci, j’aimerais remercier Olivier pour les nombreuses discussionsenrichissantes, pour ses conseils de vie éclairés de même que pour m’avoir communiqué son souci dudétail quant à la notation et la présentation de résultats mathématiques. Un merci spécial également àPierre-Alain et Marc-Antoine, pour les verres de scotch occasionnels qui ont su me changer les idées etm’alléger l’esprit lorsque c’était nécessaire. J’ai toujours anticipé nos rencontres (quasi) hebdomadairesavec beaucoup d’enthousiasme. De plus, je tiens à remercier Michelle pour son aide précieuse lors dela révision linguistique du manuscrit original de cette thèse. Son travail méticuleux et fort apprécié acontribué à agrémenter la lecture de cet ouvrage. Évidemment, dans l’éventualité où certaines erreursgrammaticales se révéleraient être de nature plutôt persistante, celles-ci ne devraient leur existencequ’à ma propre négligence. Enfin, merci aux membres de la famille qui ont tenté, tant bien que mal,de comprendre les différents aspects de ce projet de recherche et plus particulièrement, merci à mesparents pour leur appui inconditionnel tout au long de mes études. Sans leur dévouement exemplaire,rien de tout ça n’aurait été possible.

x

Page 11: Phénoménologie des neutrinos dans une théorie de matrices ...

Introduction

Neutrino physics is largely an art of learning a great deal by observing nothing.- Haim Harari

L a recherche en physique des particules, alimentée par plus d’un siècle d’observations et dedécouvertes, permet aujourd’hui de peindre un portrait riche et diversifié des constituants fondamen-taux de la nature et de leurs interactions [4]. La panoplie de particules actuellement répertoriées, auxpropriétés et fonctions fort variées, sont autant d’indices qui contribuent à révéler les secrets de l’uni-vers grâce à leur apport remarquable à notre compréhension des lois de la nature et des mécanismesqui les gouvernent. S’étant considérablement démarqués au sein de ce large éventail de particules, lesneutrinos représentent sans doute l’une des composantes de la matière les plus énigmatiques et les plusétudiées, générant à eux seuls un champ de recherche d’une grande importance (autant sur le planexpérimental que théorique) s’étalant maintenant sur plusieurs décennies. Cet intérêt marqué pourl’étude des propriétés qui les caractérisent, qui s’avère être un défi de taille pour les expérimentateurscomme les théoriciens, rend manifeste le fait que celles-ci ont désormais des répercussions importantesdans plusieurs branches de la physique moderne [1, 5, 6]. À titre d’exemple, l’astrophysique (modélisa-tion de supernovae), la cosmologie (mécanismes derrière la leptogénèse) et la physique nucléaire (étudede désintégrations bêta particulières) sont des domaines où l’avancement des connaissances est en par-tie tributaire d’une meilleure compréhension (au niveau fondamental) de cette particule élémentaire.Ainsi, afin de bien saisir la place et l’importance qu’occupent les neutrinos dans la recherche fonda-mentale de pointe en physique des particules, il convient d’abord de présenter une revue des différentsthèmes, concepts et principes élémentaires à la base d’une description adéquate des neutrinos. Cetteapproche pragmatique offre ainsi une vue d’ensemble de l’état actuel des connaissances, tant sur le planexpérimental que théorique, et permet de mieux cerner les différentes ramifications et limitations desmodèles utilisés. Conséquemment, cette perspective contribue également à la description du contextedans lequel se situe ce présent projet de recherche.

Considérant la classification actuelle en physique des particules [3], il s’avère possible d’attribuer letitre de particules élémentaires (objets sans structure interne apparente) à six saveurs de leptons et sixsaveurs de quarks réparties sur trois générations, quatre catégories de bosons de jauge transmettantles forces fondamentales (photon, gluons, bosons W± et le Z0) ainsi que le désormais célèbre bosonde Higgs (et leurs antiparticules correspondantes). À celles-ci s’ajoute également une multitude departicules composites qui se démarquent par leur contenu en quarks, regroupées sous la bannière deshadrons. De ce groupe, on distingue les baryons (une combinaison de trois quarks) et les mésons (la

1

Page 12: Phénoménologie des neutrinos dans une théorie de matrices ...

combinaison d’un quark et d’un antiquark), qui sont les seules configurations hadroniques stables ayantété observées. Ces diverses familles décrivent donc des particules qui interagissent de façon fort diffé-rente avec leur milieu dû aux propriétés individuelles et collectives (charges, masses, spins, etc.) qui lescaractérisent. En fait, cette méthode de classification particulière, qui repose sur la théorie des groupes,relève de l’étude de ces propriétés et de leur loi de conservation respective, ce qui permet d’entrevoirles différents patrons et symétries privilégiés par la nature. De manière réciproque, ces outils essentielspermettent à leur tour de mieux comprendre les rouages internes de ces interactions fondamentaleset d’incorporer cette information dans la construction de modèles prédictifs. Ainsi, la synthèse desconnaissances accumulées, complémentées de mesures expérimentales de plus en plus précises, a donnélieu à l’émergence du modèle standard (MS) actuel en physique des particules [7]. Ce modèle, quis’inscrit dans un effort continu pour tenter d’expliquer l’univers à partir de ses constituants les plussimples, a donc été édifié au gré des découvertes expérimentales et théoriques et est aujourd’hui consi-déré comme l’un des grands triomphes de la science moderne. En effet, celui-ci établit les fondationsthéoriques sur lesquelles repose la dynamique des interactions pertinentes à l’étude des particules élé-mentaires (les interactions électromagnétique, faible et forte) tout en générant des prédictions qui sontvérifiables expérimentalement à un très haut degré de précision. Puisqu’il s’agit d’une théorie quan-tique des champs [8, 9, 10] qui est à la fois renormalisable, invariante sous transformations de jaugelocales et qui possède les symétries internes du groupe SU(3)c ⊗ SU(2)L ⊗U(1)Y , le modèle standardoffre donc un point de vue unique à partir duquel il devient possible d’étudier le comportement de lamatière dans ses moindres détails. 1 Cependant, puisque les particules élémentaires ne sont pas toutesassujetties aux mêmes interactions dues aux différentes propriétés qui les caractérisent, cela impliqueque celles-ci ne peuvent pas toutes être sondées et analysées avec le même niveau de précision.

En ce sens, les neutrinos représentent sans doute l’une des particules élémentaires les plus difficiles àétudier. Suggérés pour la première fois en 1930 par Pauli afin de rétablir la conservation de l’énergiedans certaines désintégrations bêta, les neutrinos se sont par la suite révélés être bien plus intéres-sants qu’anticipé à l’origine. 2 Étant aujourd’hui répertoriés comme les seuls leptons connus de chargeélectrique nulle, cela signifie qu’en plus de la traditionnelle interprétation en termes de fermion deDirac (à laquelle tous les autres fermions du modèle standard sont contraints), les neutrinos admettentégalement une description alternative en termes de fermion de Majorana [12], ce qui implique que leneutrino est susceptible d’être sa propre antiparticule. Bien sûr, outre cette ambivalence majeure surla nature du champ fermionique, l’absence de charge électrique signifie également que les trois généra-tions de neutrinos interagissent avec la matière seulement via les interactions faibles et les interactionsgravitationnelles. Conséquemment, puisque les interactions gravitationnelles sont négligeables à cetteéchelle et que les interactions faibles ont une portée très courte (principalement due à la grande massedes bosons de jauge qui la transmettent), les neutrinos possèdent une probabilité d’interaction trèsfaible avec la matière. Autrement dit, ceux-ci passent au travers de la matière pratiquement sans au-cune interruption ou obstruction. De plus, lorsqu’une interaction impliquant des neutrinos se produit,

1. Ce groupe de jauge détermine de façon unique les interactions et le nombre de bosons vectoriels qui leur estattribuable, correspondant au nombre de générateurs du groupe auquel ils appartiennent.

2. Bien qu’il soit maintenant pratique courante de postuler l’existence de particules non observées afin de comblerles lacunes des modèles existants, cela représentait une initiative fort audacieuse à cette époque. Pauli, qui a été d’unecertaine façon l’instigateur de cette pratique, était bien conscient des critiques auxquelles il s’exposait à la suite de cetteproposition : « I have done something very bad today by proposing a particle that cannot be detected ; it is somethingno theorist should ever do. » -W. Pauli [11].

2

Page 13: Phénoménologie des neutrinos dans une théorie de matrices ...

ceux-ci ne peuvent pas être détectés directement (la majorité des détecteurs reposent sur les interac-tions électromagnétiques et on retrouve également certains détecteurs de type hadronique). Ils sontdonc identifiés grâce à la détection du lepton chargé (électron, muon ou tau) qui leur est associé, égale-ment produit dans la réaction. Les trois saveurs de neutrinos sont alors étiquetées νe, νµ et ντ pour lapremière, deuxième et troisième génération respectivement. 3 En fait, ce mécanisme particulier derrièrel’émission, la propagation et la détection présente certaines subtilités qui sont au coeur d’une propriétéemblématique des neutrinos, l’oscillation [1, 3]. Relevant de considérations purement « quantiques »,ce phénomène implique qu’un neutrino émis selon une saveur précise, après s’être propagé sur unecertaine distance, peut être détecté avec une saveur différente de celle de départ. Ce changement desaveur spontané et périodique lors de la propagation, qui possède des effets bien réels et mesurables(la résolution du problème des neutrinos solaires, au tournant des années 2000, en est un bon exemple[6]), est par ailleurs intimement lié à la notion de masse pour les neutrinos, 4 ce qui amène des défissupplémentaires lors de la construction de modèles capables d’offrir des prédictions intéressantes surl’évolution de ces systèmes. En somme, ces propriétés inusitées contribuent activement à dissimulercette particule aux yeux des experts et soulèvent également d’importantes questions auxquelles le mo-dèle standard, dans sa forme actuelle, peine à répondre. Ainsi, pour bien comprendre les différentsenjeux associés au statut particulier que possèdent les neutrinos dans le modèle standard, il s’avèreavant tout nécessaire de s’attarder aux particularités du secteur électrofaible.

Constituant une partie essentielle du modèle standard, le secteur électrofaible correspond à une théoriede jauge non abélienne caractérisée par le groupe de symétries SU(2)L ⊗ U(1)Y . Celui-ci offre unedescription unifiée des interactions faibles et des interactions électromagnétiques (QED, Quantumelectrodynamics) aux hautes énergies (& 100 GeV) et repose sur le concept de brisure spontanée desymétrie pour découpler ces interactions et reproduire la masse (et donc le spectre) des particulesélémentaires observées dans la limite des basses énergies. De plus, puisque le concept de brisure desymétrie est uniquement confiné au secteur électrofaible, celui-ci peut être étudié séparément desinteractions fortes (QCD, Quantum chromodynamics). Cela est dû au fait que le groupe de symétriesSU(3)c demeure intact (non brisé) dans le MS, impliquant qu’il ne peut pas y avoir de mélange entreles huit bosons de jauge de QCD (les gluons) et les quatre bosons de jauge du secteur électrofaible. Encontrepartie, dû au mécanisme derrière la brisure spontanée de la symétrie électrofaible (mécanismede Higgs), il faut considérer un mélange entre les bosons de jauge électriquement neutres de SU(2)L etU(1)Y afin de pouvoir identifier correctement les degrés de liberté physique des interactions faibles etdes interactions électromagnétiques. Cela s’avère nécessaire puisque ce sont les combinaisons linéairesorthogonales qui émergent naturellement entre ces champs qui possèdent une masse bien définie etpar conséquent, qui forment les champs physiques du boson Z0 et du photon (dans le cas du photon,l’absence d’un terme de masse bosonique pour cette combinaison particulière signifie une masse nulle).Les interactions faibles, dont la première description convenable remonte à Fermi au début des années

3. Les neutrinos observés sont produits dans des processus régis par les interactions faibles (soit par exemple unedésintégration de la forme W+ → `+α να, avec α = e, µ, τ) telles que la désintégration du pion ou la désintégration bêta.Ceux-ci sont donc des états propres des interactions faibles. On distingue ces états par la saveur α du lepton chargé `±α(qui étiquette du même coup la génération), ce qui implique que la saveur des neutrinos est un concept dynamique quidiffère complètement de la façon dont la saveur est définie dans le secteur des quarks.

4. Pour qu’il y ait oscillation, au moins deux des trois neutrinos doivent avoir une masse et ces masses doivent êtredifférentes. De plus, puisque cette section a pour but d’illustrer l’importance de ce phénomène dans la recherche depointe, il ne serait pas convenable de passer sous silence l’attribution du prix Nobel de physique 2015, décerné à T.Kajita et A.B. McDonald (donc en partie canadien) pour « la découverte du phénomène d’oscillation des neutrinos, quidémontre que les neutrinos ont une masse » [13].

3

Page 14: Phénoménologie des neutrinos dans une théorie de matrices ...

1930, 5 sont donc maintenant interprétées comme une manifestation à basse énergie des effets liés à labrisure d’un groupe de symétries plus élevé, 6 ce qui est une conséquence directe des travaux de Glashow,Weinberg et Salam. Cependant, comparativement à QED et QCD, les interactions faibles revêtentun caractère particulier attribuable à la structure dite « chirale » qui distingue considérablement ladynamique de cette interaction. Cette construction particulière, qui repose sur un lagrangien de la formeV − A, 7 implique que les particules de chiralité gauche sont traitées différemment des particules dechiralité droite, ce qui découle directement du fait que la symétrie de parité P est maximalement violéesous le régime des interactions faibles. Par ailleurs, en plus de la parité, l’invariance sous conjugaison decharge C (qui revient à remplacer une particule par son antiparticule) et la symétrie de charge-paritéCP ne sont pas préservées sous cette interaction, 8 ce qui influence les propriétés phénoménologiques quien découlent. Également, cette interaction ne produit pas d’état lié et n’est donc responsable d’aucuneforme d’énergie de liaison. Celle-ci se démarque plutôt par son action sur la saveur des particulesélémentaires. En effet, parmi la variété de processus physiques qui proviennent des interactions faibles(ou pour lesquels celles-ci assument un rôle de premier plan), on retrouve, à titre d’exemple, la grandemajorité des désintégrations de particules composites et élémentaires (radioactivité, fission, fusion,etc.). Ceci est dû, en partie, au fait qu’il s’agit de la seule interaction qui permet un changement desaveur au niveau des quarks et des leptons en plus d’être communiquée par des particules d’échanges(les bosons W+, W− et le Z0) ayant de grandes masses en comparaison à celle des autres typesd’interactions fondamentales. En fait, ces particules médiatrices présentent un fort contraste avec cellesde QED et QCD, qui correspondent à des bosons de jauge électriquement neutres, sans masse et despin 1. Dans le cas des interactions faibles, la possibilité d’avoir un sommet d’interaction qui repose surune particule chargée, 9 en l’occurrence les bosons W±, donne accès à une variété impressionnante dephénomènes physiques et joue un rôle crucial en ce qui concerne le changement de saveur des particulesélémentaires. Pour ce qui est des interactions impliquant le boson Z0, qui est électriquement neutre,celles-ci sont décrites par un sommet d’interaction dont la forme interdit tout changement de saveur, cequi implique des conséquences physiques très différentes. Pour cette raison, les interactions faibles sont

5. La théorie de Fermi, qui repose sur un sommet d’interaction à quatre fermions (un opérateur de dimension [masse]6proportionnel à la constante de Fermi GF , qui est de dimension [masse]−2), décrit remarquablement bien les interactionsfaibles (la partie décrivant le changement de saveurs) dans la limite des basses énergies (Λ > 100 GeV). Cependant, àhaute énergie, certains problèmes majeurs surviennent dans le calcul de la section efficace (σ) de cette interaction. Eneffet, il s’avère possible de démontrer que cette quantité (de dimension [masse]−2), qui dépend directement de la force ducouplage GF , croît proportionnellement à Λ2 (c’est-à-dire que σ ∝ G2

FΛ2), où Λ est un paramètre d’échelle représentantune limite énergétique (une coupure arbitraire) de la théorie. La probabilité d’interaction du sommet à quatre fermionsdevient donc infinie dans la limite Λ→∞, ce qui est typique d’une théorie non renormalisable [9].

6. À la suite d’un choix judicieux de l’état du vide pour le champ de Higgs, le groupe de symétries internes est briséselon SU(2)L ⊗ U(1)Y → U(1)Q. La présence de la symétrie résiduelle U(1)Q, associée à la conservation de la chargeélectrique q (la valeur propre de l’opérateur Q), assure ainsi que le photon demeure sans masse et fait don à notre universd’une propriété indispensable, l’électromagnétisme.

7. Il s’agit du patron général permettant de regrouper sous un seul lagrangien les phénomènes observés relatifs auxinteractions faibles. Grâce à leur transformation particulière sous l’opération de parité P , la combinaison d’un courantde type vectoriel (Vector current) à un courant de type pseudovectoriel (Axial vector current) s’est avérée fournir lemécanisme approprié pour expliquer la violation de la parité observée expérimentalement et a constitué une étape cléderrière l’unification des interactions électromagnétiques et des interactions faibles.

8. Contrairement à la parité et à la conjugaison de charge, la brisure de la symétrie CP n’est pas une conséquence dela structure V −A du lagrangien. En réalité, puisque les actions combinées de P et C préservent la chiralité d’un spineur,les interactions faibles ne violent pas nécessairement la symétrie CP à première vue. Cependant, puisque la brisure decette symétrie est nécessaire pour expliquer l’asymétrie matière-antimatière présente dans l’univers observable, celle-cidoit être prise en compte dans la structure du MS. À ce jour, il s’avère que seul le secteur électrofaible est en mesured’accommoder ce résultat et ce n’est qu’en mesurant les paramètres fondamentaux de ce secteur que la source de cettebrisure est devenue apparente (en ce qui concerne les quarks).

9. Ces sommets d’interaction couplent donc uniquement des fermions qui diffèrent par une unité de charge électrique,soit par exemple un neutrino et un lepton chargé.

4

Page 15: Phénoménologie des neutrinos dans une théorie de matrices ...

subdivisées en deux catégories distinctes, dites de « courants chargés » (CC) et de « courants neutres »(CN) selon que le sommet d’interaction comprend les bosons W± ou le Z0 respectivement. 10

Par ailleurs, puisque tous les leptons et les quarks actuellement répertoriés sont soumis aux interac-tions faibles, il devient alors utile de classifier les phénomènes observés selon la nature des particulesimpliquées. Conséquemment, on distingue les interactions faibles de types leptonique, hadronique ousemi-leptonique selon que les bosonsW± ou Z0 se couplent aux leptons, aux quarks ou à une combinai-son leptons/quarks (chacun sur leur sommet respectif). Ayant présenté certains des éléments clés quicaractérisent les interactions faibles, une description détaillée du secteur leptonique et des conséquencesqui découlent du traitement réservé aux neutrinos s’avère maintenant possible. Tout d’abord, comptetenu des propriétés discutées précédemment, il est important d’insister sur le fait que les neutrinos« observés » sont uniquement produits par des interactions faibles de type CC. En effet, la détectionde cette particule implique nécessairement un couplage avec les bosons W± puisqu’il s’agit de la seuleinteraction qui peut créer le lepton chargé nécessaire à l’identification du neutrino produit. Bien en-tendu, les neutrinos peuvent également être produits à la suite d’une désintégration du Z0. Cependant,puisque ce boson se désintègre uniquement en couple fermion-antifermion, les neutrinos ainsi produitséchappent inévitablement à toute détection, ce qui rend les courants neutres inaptes à l’étude des pro-priétés individuelles des neutrinos. En second lieu, bien que les interactions faibles de type CN puissentgénérer des couplages pour les deux types de chiralité (en proportion différente), il en est autrementdes interactions faibles de type CC, qui font intervenir uniquement des fermions de chiralité gauche (ils’agit de la structure chirale mentionnée précédemment). Ainsi, d’un point de vue théorique, il appertque les neutrinos de chiralité droite ne sont pas requis pour expliquer les observations expérimentalesactuelles. En conséquence, puisque le modèle standard s’avère être le plus économique possible en cequi concerne son contenu en particules, seuls les neutrinos de chiralité gauche sont présents. Cettesituation unique à l’intérieur du modèle standard, qui limite grandement le pouvoir prédictif de cemodèle en ce qui a trait aux neutrinos, constitue en réalité l’un des obstacles majeurs à la constructiond’un terme de masse pour cette particule. En fait, en raison du contenu en particules, de l’invariancede jauge et de la propriété de renormalisation, 11 il s’avère impossible d’écrire un terme de masse pourles neutrinos dans le lagrangien du MS (qui respecte simultanément ces trois contraintes). Il est im-portant de souligner cependant que ces contraintes, qui sont en réalité responsables de la présenced’une symétrie « accidentelle » de type B − L, sont quelque peu arbitraires. 12 Puisqu’il n’existe pasde principe fondamental ou de loi de conservation qui interdit des neutrinos massifs, il ne semble doncpas naturel d’un point de vue théorique de supposer que ceux-ci soient sans masse. Quoi qu’il en soit,les neutrinos demeurent sans masse dans le modèle standard alors qu’en contrepartie, les expériences

10. À cet égard, la théorie de Fermi discutée précédemment doit donc être interprétée comme une théorie efficace desinteractions de type CC à basse énergie [3].11. Cette propriété fixe la dimensionnalité des termes présents dans le lagrangien. Pour qu’une théorie soit renorma-

lisable, il faut que la dimension d des termes du lagrangien satisfasse d ≤ 4, où il est sous-entendu que d exprime lapuissance d’une unité de masse (ou d’énergie), soit [masse]d.12. Une symétrie qualifiée d’accidentelle est une symétrie qui n’est pas imposée au lagrangien, sa présence est seulement

due au contenu en champs du modèle et aux limites imposées sur les dimensions possibles des termes du lagrangien(condition de renormalisation) [14]. Règle générale (en physique des particules), seules les symétries locales sont imposées,ce qui signifie en principe que ce sont les symétries globales qui peuvent être accidentelles. Dans ce cas-ci, il s’agit d’unesymétrie globale hypothétique U(1)B−L qui survient fréquemment dans les théories grandement unifiées. Le nombrequantique B − L (la différence entre le nombre baryonique et le nombre leptonique) est préservé puisque les anomalieschirales (qui brisent la conservation de B et L séparément) ou les anomalies gravitationnelles s’annulent parfaitementdans cette construction. La présence de cette symétrie constitue ainsi une autre façon de visualiser les contraintes quiinterdisent la présence d’un terme de masse pour les neutrinos.

5

Page 16: Phénoménologie des neutrinos dans une théorie de matrices ...

en lien avec le phénomène d’oscillation offrent maintenant de solides arguments en faveur d’une massenon nulle, exposant ainsi les lacunes de la théorie sous-jacente. Aujourd’hui révélés par des observa-tions expérimentales de plus en plus précises, les résultats actuellement admis concernant les massesdes neutrinos et les paramètres d’oscillation représentent sans contredit une source d’embarras notoirepour le modèle standard et par conséquent, méritent d’être examinés plus en détail.

Historiquement, les neutrinos ont longtemps été considérés comme étant sans masse. En fait, cela s’estavéré être le paradigme prédominant jusqu’à la fin des années 1990 en raison du manque de preuvetangible pouvant indiquer le contraire. Par ailleurs, cette hypothèse se trouvait être en parfait accordavec les prédictions du modèle standard, ce qui a contribué à renforcer le consensus adopté durant cettepériode. La découverte du phénomène d’oscillation, qui a considérablement enrichi la dynamique depropagation des neutrinos, a donc constitué l’élément clé qui a permis d’obtenir des mesures fiables surun bon nombre de paramètres fondamentaux du secteur leptonique. Cependant, puisque les quantitésmesurables sont dictées par la forme particulière de l’expression pour la probabilité de transition d’uneoscillation neutrino-neutrino (ou antineutrino-antineutrino) et que celle-ci est, entre autres, fonctiondes éléments de la matrice PMNS (Pontecorvo-Maki-Nakagawa-Sakata), cela contraint fortement letype d’information qu’on peut extraire sur les masses des neutrinos et les paramètres décrivant lemélange des états. 13 À ce jour, trois angles de mélange (θ12, θ13, θ23), une phase complexe (la phasede Dirac δ) et deux différences de masse au carré (4m2

21 = m22−m2

1 et 4m231 = m2

3−m21) peuvent être

mesurés expérimentalement [2, 4]. Ces résultats permettent de constater que le mélange dans le secteurdes neutrinos est quasi-maximal et que les différences de masse sont très petites en comparaison à cellesdes quarks et des leptons chargés, ce qui suggère une très faible hiérarchie entre les trois générations deneutrinos. D’autre part, selon la convention utilisée pour la numérotation des états propres de masse[4], 4m2

21 est toujours considérée comme étant positive, ce qui laisse le signe de 4m231 indéterminé.

Puisque les données actuelles ne permettent pas de fixer le signe de cette quantité et que la grandeur dela masse du neutrino le plus léger n’est pas connue, trois scénarios sont donc possibles en ce qui concernel’ordre des masses, c’est-à-dire que le spectre peut être quasi dégénéré (m1 ∼ m2 ∼ m3) ou manifesterune hiérarchie dite « normale » (m1 < m2 < m3) ou « inverse » (m3 < m1 < m2). De plus, bien queles valeurs exactes de ces masses ne puissent être déduites à partir des résultats actuels, les limitesexpérimentales actuellement admises sur celles-ci suggèrent que les neutrinos ont une masse beaucoupplus petite (de l’ordre de l’eV) que celles des leptons chargés et des quarks. 14 On trouve, par exemple, unratio de l’ordre de 106 entre la masse de l’électron (le lepton chargé le plus léger) et la borne supérieurela plus élevée sur la masse des neutrinos. La faible masse des neutrinos constitue donc une contraintesupplémentaire qui doit être prise en compte dans tout mécanisme qui souhaite offrir des prédictionsviables sur celles-ci. Finalement, comme le neutrino est la seule particule élémentaire répertoriée quipeut être traitée comme un fermion de Majorana, il faut également considérer la possibilité d’observerdes oscillations neutrino-antineutrino, ce qui ajoute deux phases complexes (les phases de Majorana13. La matrice PMNS apparaît dans le lagrangien du courant chargé leptonique lorsque celui-ci est diagonalisé dans

la base des masses et constitue, en réalité, le lien entre les états propres de saveur et les états propres de masse desneutrinos. Cette matrice unitaire, qui est responsable du changement de saveur pour les trois générations de neutrinos,contient les angles de mélange et les phases physiques qui caractérisent ce phénomène. Le phénomène d’oscillation peutdonc être interprété comme une conséquence du fait qu’il existe deux bases distinctes pour la description de neutrinosmassifs (la base des saveurs et la base des masses) et que ces deux bases ne sont pas simultanément diagonalisables pourdes interactions de type CC.14. Outre les expériences en lien avec le phénomène d’oscillation, les mesures directes qui reposent sur les tests de

cinématique, la double désintégration bêta sans neutrino et la cosmologie permettent de fixer des limites supérieures surces masses. Voir par exemple [15].

6

Page 17: Phénoménologie des neutrinos dans une théorie de matrices ...

α21 et α31) au nombre des paramètres mesurables. 15 À l’heure actuelle, aucune information n’estconnue sur ces phases puisque ce type d’oscillation n’a toujours pas été observé. Cela signifie que sur leplan expérimental, l’état des connaissances ne permet pas de déterminer si le neutrino est un fermionde Dirac ou de Majorana, ce qui entraine des répercussions phénoménologiques très différentes dansles deux cas. Néanmoins, ces résultats pointent tous vers un constat indéniable : les neutrinos sont desparticules massives (pour au moins deux des trois générations).

Ainsi, cette incompatibilité notable entre les prédictions du modèle standard et les observations expé-rimentales est désormais à l’origine de plusieurs extensions de ce modèle [16, 17]. Celles-ci sont doncessentielles, sur le plan théorique, pour obtenir un portrait plus complet du secteur leptonique desinteractions faibles et plus spécifiquement, faire la lumière sur le comportement singulier des neutri-nos. Bien qu’elles puissent provenir d’ensembles d’axiomes très différents, ces extensions partagenttoutes le même objectif, qui consiste à générer un terme de masse pour les neutrinos actifs (de chira-lité gauche) permettant de reproduire les résultats expérimentaux actuellement admis, et ce, à partirde principes fondamentaux susceptibles de contribuer au développement de la théorie sous-jacente.Dans la littérature, plusieurs approches ont ainsi été proposées pour s’attaquer à ce problème, les plusconnues et étudiées étant sans doute celles qui reposent sur les mécanismes de type seesaw [1, 6]. 16

Ces mécanismes, qui sont les plus contraignants ayant été élaborés jusqu’à présent (ceux qui dévientle moins du modèle standard actuel), sont classifiés en trois catégories distinctes appelées type I, typeII et type III et offrent une solution élégante au problème de la faible masse des neutrinos. En effet,puisque ceux-ci reposent sur l’ajout de nouveaux degrés de liberté « lourds » à la théorie existante, celapermet de préserver l’invariance de Lorentz et l’invariance de jauge tout en justifiant une violation dela symétrie B−L, ce qui engendre une plus grande variété de couplages possibles (à haute énergie) avecces nouveaux champs. À la suite d’une brisure spontanée de la symétrie électrofaible, ces couplagesfondamentaux permettent alors de générer l’ensemble des matrices de masse élémentaires de type Di-rac et Majorana de ce nouveau spectre de particules, ce qui constitue le point d’origine de la théorieefficace résultante à basse énergie. 17 Enfin, une fois le lagrangien diagonalisé dans la base formée deschamps physiques de la théorie (les neutrinos de chiralité gauche et les champs associés aux degrés deliberté supplémentaires), cela permet d’identifier correctement la matrice de masse résultante pour lesneutrinos actifs, qui s’avère être décrite par un produit spécifique (unique à chacun des trois types)des matrices de masse élémentaires (qui dépendent des couplages fondamentaux) engendrées par cesnouveaux degrés de liberté. Dans ce contexte, la forme particulière des trois matrices de masse quien résulte suggère que la faible masse des neutrinos est attribuable aux grandes masses des nouvellesparticules ainsi introduites de même qu’à la violation du nombre leptonique.

Autrement dit, ces mécanismes consistent à modifier le contenu en particules du MS de façon à générerdes couplages additionnels entre les champs qui permettent de reproduire la faible masse des neutrinos15. Cette notation particulière pour les angles de mélange et les phases physiques repose sur la paramétrisation standard

de la matrice PMNS telle que présentée dans [4].16. Les quelques traductions françaises répertoriées de la désignation anglaise seesaw mechanism, quoique peu utilisées,

incluent « mécanisme à bascule » et « mécanisme de la balançoire ».17. De façon plus spécifique, ce ne sont pas tous les nouveaux couplages qui sont sensibles à la brisure de la symétrie

électrofaible. Les couplages qui ne brisent aucune symétrie de jauge forment déja des termes de masse fermioniquesadéquats du point de vue de la théorie à basse énergie. De plus, les matrices résultantes sont qualifiées d’« élémentaires »puisqu’elles constituent les ingrédients de base sur lesquels repose la matrice de masse des neutrinos actifs obtenue suiteau processus de diagonalisation.

7

Page 18: Phénoménologie des neutrinos dans une théorie de matrices ...

dans la limite des basses énergies, c’est-à-dire valides sous l’échelle d’énergie de la brisure spontanéede la symétrie électrofaible. Ainsi, de façon équivalente, le terme de masse résultant pour les neutrinosactifs peut être vu comme provenant d’une théorie efficace contenant un opérateur de Weinberg dedimension d = 5 (non renormalisable) unique à chaque type de mécanisme seesaw (dont le domainede validité est compris entre l’échelle d’énergie de la brisure de la symétrie électrofaible et l’échelled’énergie associée à ces nouveaux degrés de liberté) et où les degrés de liberté lourds ont été intégrés,ce qui donne un coefficient pour cet opérateur ayant la même forme que la matrice de masse résultantdu processus de diagonalisation. Ces nouveaux couplages fondamentaux, principalement contraintspar la symétrie de jauge, sont donc rendus possibles grâce à l’ajout de particules hypothétiques auxpropriétés méthodiquement choisies pour chacun des trois types. Ainsi, les trois scénarios de base quipermettent d’implémenter cette méthode particulière consistent à introduire trois singulets leptoniquesde chiralité droite (c’est-à-dire trois neutrinos droits stériles) pour le type I, un triplet scalaire dans lesecteur du Higgs pour le type II et trois triplets leptoniques de chiralité droite pour le type III. Parailleurs, bien qu’il soit peu probable que ces nouvelles particules puissent être observées dans un futurproche dû, entre autres, à la possibilité que leur masse soit liée à une nouvelle échelle d’énergie dontl’ordre de grandeur (∼ O(1015) GeV) s’apparente à celle de l’échelle d’énergie de la grande unification,les trois types de mécanismes seesaw sont considérés comme de solides candidats pour expliquer lafaible masse des neutrinos. En contrepartie, ces mécanismes génèrent à leur tour bon nombre dequestions qui demeurent sans réponse et n’offrent aucune prédiction sur les couplages fondamentauxainsi introduits, qui prennent naturellement une place prépondérante dans la composition des matricesde masse résultantes des neutrinos actifs. Comme c’est le cas pour l’ensemble des paramètres libres dumodèle standard, ces diverses constantes de couplage doivent être déterminées expérimentalement afind’être en mesure de tester la viabilité de ces mécanismes et ainsi obtenir des prédictions concrètes etprécises, ce qui constitue une tâche largement hors de portée de la technologie actuelle.

Conséquemment, pour entreprendre une analyse détaillée du secteur des neutrinos tout en tirant profitdu cadre théorique fourni par les mécanismes seesaw de type I, II et III, il s’avère nécessaire deformuler certaines hypothèses quant à la structure (ou l’absence de structure) des matrices de masseélémentaires qui contiennent les couplages fondamentaux. Étant donné la connexion profonde entreles masses des neutrinos et les paramètres d’oscillation, l’approche traditionnelle consiste à s’appuyersur les résultats expérimentaux tels qu’observés à basse énergie, qui permettent une reconstructioncomplète de la matrice PMNS, pour tenter d’extraire certaines symétries de saveurs entre les troisgénérations de neutrinos susceptibles de se traduire en une « texture » ou un patron particulier pources matrices de masse [18, 19]. Cette approche, fortement inspirée de celle du secteur des quarksoù la matrice CKM (Cabibbo-Kobayashi-Maskawa) présente un patron clair pouvant être visualisé àl’aide de la paramétrisation de Wolfenstein [20], est cependant beaucoup moins efficace dans le secteurdes neutrinos en raison de la nature très irrégulière de celui-ci. 18 En effet, les angles de mélangequasi-maximaux, les très petites différences de masse au carré et l’absence de symétrie ou structurefacilement discernable pour la matrice PMNS constituent un obstacle majeur à l’implémentation de ce18. La matrice CKM constitue l’équivalent de la matrice PMNS dans le secteur des quarks. Celle-ci décrit donc les

couplages entre les bosons de jauge W± et les quarks et a pour effet de mélanger les différentes saveurs. La structureobservée de la matrice CKM montre que celle-ci est en réalité très près de la matrice identité, c’est-à-dire une successionde « 1 » sur la diagonale combinés à des éléments hors diagonale très petits, menant naturellement à de petits angles demélange pour le secteur des quarks. La matrice PMNS est différente en ce sens que toutes les entrées sont comparableset relativement grandes.

8

Page 19: Phénoménologie des neutrinos dans une théorie de matrices ...

type d’approche et peut mener à des modèles ad hoc démontrant un certain manque de robustesse faceà des mesures plus précises des paramètres de ce secteur [21]. En fait, la récente mesure de l’angle demélange θ13, en 2012, a entre autres permis d’exclure certains des scénarios reposant sur des groupesde symétries discrètes nécessitant θ13 = 0. 19 Ainsi, bien que cette méthode mène à des modèleshautement prédictifs, il n’en demeure pas moins que ces prédictions sont sensibles, dans une certainemesure, aux choix des symétries imposées aux paramètres libres du lagrangien. Parallèlement à cetaxe de recherche, une hypothèse alternative s’appuyant sur un principe en apparence plus simple maisradicalement différent a été introduite au tournant des années 2000. Se situant à l’opposé de l’approchetraditionnelle, l’hypothèse dite « anarchique » [23, 24, 25] a permis de faire émerger naturellementcertains des comportements et des tendances difficilement justifiables par des arguments de symétrie,et ce, en exploitant le caractère très désordonné du secteur des neutrinos. Plus précisément, l’hypothèseanarchique (ou principe anarchique) consiste à adopter le point de vue selon lequel les matrices de masseélémentaires (ou, telle que proposée à l’origine, la matrice PMNS) ne possèdent aucune structure oupatron intrinsèque, c’est-à-dire que toutes les entrées sont comparables (du même ordre de grandeur)et qu’il n’existe pas de ratios spécifiques qui sont privilégiés entre les éléments. En d’autres termes, cesmatrices sont donc considérées comme étant le résultat de processus purement aléatoires. Cela signifieque d’un point de vue pratique, pour étudier le spectre de masse des neutrinos sous cette hypothèse,il devient alors nécessaire de se référer à la variété impressionnante d’outils qui ont été développésavec la théorie des matrices aléatoires (RMT, Random matrix theory) [26, 27]. Il est important dementionner cependant que cette approche n’est pas interprétée comme une finalité en soi, c’est-à-direque celle-ci doit plutôt être vue comme une technique d’analyse permettant d’offrir un regard nouveausur le secteur des neutrinos à basse énergie tout en s’affranchissant des contraintes liées à l’élaborationde modèles hautement symétriques.

En fait, il ne serait pas surprenant que les paramètres physiques de ce secteur puissent être gouvernéspar un principe plus structuré associé à une symétrie fondamentale relevant d’une échelle d’énergieélevée (qui pourrait par exemple provenir d’une théorie de grande unification) tout en étant compatibleavec les conclusions tirées de l’approche anarchique [24]. Ce serait le cas, par exemple, dans le contexteoù les vestiges de cette symétrie hypothétique à basse énergie seraient pratiquement imperceptiblespour le secteur des neutrinos. 20 Autrement dit, le simple fait que les valeurs des paramètres physiquesdu secteur des neutrinos soient compatibles avec l’hypothèse anarchique ne signifie pas pour autantque celle-ci soit la voie privilégiée par la nature ; cela signifie simplement que cette approche peut êtreutilisée pour étudier le spectre de masse et le mélange des états plus en détail. En réalité, l’attraitparticulier de cette hypothèse réside dans le fait que celle-ci permet une analyse statistique complètedu secteur des neutrinos tout en imposant le moins de contraintes possible aux paramètres libres dulagrangien, ce qui permet d’extraire une quantité surprenante d’informations sur les neutrinos dans lalimite des basses énergies. Cette approche permet ainsi de faire des progrès importants à partir d’uneconnaissance minimale de la théorie sous-jacente à la phénoménologie des neutrinos en évitant toute19. L’année 2012 est en effet d’une grande importance en ce qui a trait à la recherche de pointe en physique des

particules. La découverte du boson Higgs, combinée à la mesure expérimentale du dernier angle de mélange jusqu’iciinconnu (θ13) de la matrice PMNS (grâce aux expériences Daya Bay et RENO) [22], a permis de répondre à plusieursquestions de longue date en lien avec les fondements même du secteur électrofaible du MS.20. Ce scénario hautement spéculatif dépend du mécanisme derrière la brisure de cette symétrie et du mécanisme

permettant de générer la masse des neutrinos. Cependant, on peut penser que les effets du groupe de renormalisation, lefait que plusieurs champs ont été intégrés ou simplement si un sous-ensemble des champs leptoniques ne sont pas chargéssous cette symétrie (les rendant insensibles à sa présence) puissent être des causes possibles de ce constat.

9

Page 20: Phénoménologie des neutrinos dans une théorie de matrices ...

supposition infondée quant aux particularités d’une symétrie hypothétique gouvernant ces phénomènes.Il va sans dire qu’il s’agit d’une approche fort inusitée, voir même non conventionnelle en physique desparticules. Par ailleurs, bien que la mesure de θ13 ait fourni des arguments supplémentaires favorisantcette approche [28, 29, 30], très peu d’études détaillées ont été entreprises sur ce sujet, impliquantque ses conséquences et répercussions demeurent en grande partie mal documentées dans la littératureexistante. Ainsi, dans la perspective d’explorer cette avenue davantage tout en contribuant à mettre enévidence les différents impacts de cette approche pour le secteur des neutrinos, l’hypothèse anarchiqueconstitue la pierre angulaire de ce présent projet de recherche.

Objectif principal. Dans le cadre de ce travail, cette approche est utilisée comme un outil de sé-lection permettant de comparer les différents types de mécanismes seesaw. Le but est donc d’extraireles tendances dominantes propres à ces mécanismes de masse, d’analyser leurs conséquences sur laphénoménologie des neutrinos et d’identifier ceux qui sont les mieux adaptés à reproduire les résultatsexpérimentaux actuellement admis. Pour ce faire, les matrices de masse émergeant des mécanismesseesaw de type I, II et III sont traitées dans le contexte d’une théorie de matrices aléatoires, ce quipermet d’introduire une nouvelle classe d’ensembles matriciels appelés ensembles seesaw [29].

L’étude détaillée de ces ensembles a ainsi permis de produire une série d’articles qui ont contribué à fa-çonner le contenu de cette présente thèse [31, 32, 33]. Dans un premier temps, la densité de probabilitémultivariée comprenant les masses et les paramètres d’oscillation a été obtenue à partir de méthodesbien connues provenant de la théorie des matrices aléatoires [31]. Cette densité de probabilité, pré-sentée sous la forme d’une intégrale multidimensionnelle, a par la suite été utilisée pour extraire lesdistributions marginales des paramètres physiques d’intérêt à l’aide de méthodes d’intégration numé-riques, ce qui a permis de compléter l’analyse permettant de caractériser complètement ces ensembles[32]. Finalement, une étude des invariants sous rephasage [33], qui quantifient la brisure de la symétrieCP dans les secteurs leptonique et hadronique des interactions faibles, a été entreprise afin de mieuxcomprendre et identifier les sources possibles de cette brisure sous l’hypothèse anarchique.

À ce stade, il est important de préciser que le format retenu pour l’écriture de cette thèse ne faitpas appel à l’insertion d’articles scientifiques. Résultant d’un effort soutenu visant à communiquer lesrésultats obtenus de façon pédagogique, concise et rigoureuse, ce présent document consiste donc en untexte original divisé en trois chapitres distincts dont les thématiques représentent le cheminent parcourupour mener à terme ce projet de recherche. Ainsi, le premier chapitre constitue une introduction auxmodèles utilisés pour générer la masse des neutrinos, soit les mécanismes seesaw de type I, II et III.Les notions théoriques nécessaires à la compréhension de ces mécanismes sont présentées, de mêmequ’un examen approfondi des prédictions qui leur sont associés et des nombreuses questions qu’ilssoulèvent. Le second chapitre est dédié à la méthodologie propre à ce projet de recherche. L’approcheanarchique y est donc discutée plus en détail et une introduction sommaire à la théorie des matricesaléatoires est présentée afin d’illustrer les concepts de base nécessaires à l’étude des ensembles seesaw.Finalement, le troisième chapitre est consacré à l’étude de ces ensembles et forme ainsi la partie centralede cette thèse. Les densités de probabilité multivariée sont obtenues et les résultats qui en découlentsont présentés. Une analyse détaillée de ces résultats, qui permet de mettre en évidence les forces et leslimitations de cette approche, est ensuite proposée afin de clore ce chapitre. Celui-ci est ensuite suivid’une conclusion résumant l’ensemble du travail accompli tout en amorçant une discussion quant auxpossibles orientations futures qui pourraient être considérées.

10

Page 21: Phénoménologie des neutrinos dans une théorie de matrices ...

Chapitre 1

Description des neutrinos et deleurs propriétés

Ayant maintenant une meilleure idée du contexte dans lequel s’inscrit ce projet de recherche, il convientà présent de plonger dans les détails d’une description méthodique des neutrinos dans le modèlestandard. L’objectif principal de ce chapitre est donc de couvrir les notions théoriques fondamentalesallant des propriétés des champs fermioniques aux mécanismes seesaw, en passant par le phénomèned’oscillation et les résultats expérimentaux qui en découlent. Cette revue des concepts de base est parailleurs essentielle afin de bien identifier les assises de ce projet et la portée des résultats obtenus.

1.1 Champs fermioniques : Les spineurs de Dirac, Majoranaet Weyl

La théorie de Dirac présentée dans cette section forme la base en ce qui concerne la description deschamps fermioniques qui caractérisent les particules massives de spin 1

2 . Constituant une étape cléderrière l’unification de la relativité restreinte et de la mécanique quantique, les travaux de Dirac ontpermis de décrire avec succès la dynamique des fermions fondamentaux à partir d’une équation d’onderelativiste, en plus de prédire l’existence des antiparticules qui leur sont associées. L’équation de Dirac(1928), linéaire dérivée en spatiale et temporelle, prend donc la forme suivante [8] :

(iγµ∂µ −mIN )ψ = 0. (1.1)

Ici, (γµ) ≡ (γ0, γ1, γ2, γ3) est le quadrivecteur comprenant les matrices de Dirac, m est la masse, INest une matrice identité de dimensions N ×N et ψ = ψ(x) ≡ ψ(t, x) est le champ fermionique qui doitêtre quantifié (qui est une fonction des coordonnées d’espace-temps). Les contraintes imposées à l’équa-tion (1.1) pour assurer l’invariance de Lorentz, la compatibilité avec l’équation de Klein-Gordon et lesprincipes de la mécanique quantique dictent les propriétés des objets γµ et ψ. En ce qui concerne lesmatrices gamma, ces contraintes se traduisent par la relation d’anticommutation γµ, γν = 2gµνIN ,ce qui correspond à l’algèbre de Dirac (un cas spécial de l’algèbre de Clifford). Par ailleurs, il s’avèreque les objets mathématiques les plus simples satisfaisant cette relation (pour un espace de Minkowski)sont des matrices hermitiennes 4×4 de trace nulle. Cette relation implique également qu’il n’existe pas

11

Page 22: Phénoménologie des neutrinos dans une théorie de matrices ...

de représentation unique pour les γµ puisque toute transformation de la forme γµ → γµ ′ = UγµU†, oùU est une matrice unitaire, satisfait également la relation d’anticommutation (cependant, les représen-tations sont équivalentes et les prédictions physiques ne dépendent pas de la représentation choisie).De plus, cette structure a des répercussions importantes sur le champ ψ : il doit être considéré commeun spineur (ou bispineur) ayant quatre degrés de liberté. 21 Finalement, il existe deux types de spi-neurs à quatre composantes qui satisfont l’équation (1.1) et ceux-ci se distinguent par la présence (oul’absence) d’une symétrie supplémentaire sous l’opération de conjugaison de charge.

Il semble donc tout à fait à-propos de débuter cette section en considérant la solution la plus généraleà l’équation (1.1), connue sous le nom de spineur de Dirac. Bien sûr, afin de pouvoir en étudier lecontenu plus en détail, il faut choisir une représentation particulière pour les matrices γµ. Dans lecontexte des interactions faibles, la représentation la plus utilisée est appelée la représentation chirale(ou représentation de Weyl) et permet d’écrire les matrices γµ en fonction des trois matrices de Pauliσi, soit

γ0 =(

0 I2I2 0

), γi =

(0 σi

−σi 0

), γ5 =

(−I2 0

0 I2

). (1.2)

La nouvelle matrice introduite, dont la forme explicite dépend également de la représentation choisie,est définie comme un produit spécifique de quatre matrices gamma, c’est-à-dire γ5 ≡ iγ0γ1γ2γ3, et estappelée l’opérateur de chiralité. L’ensemble des matrices (1.2) forme ainsi une base à partir de laquelleles 16 éléments indépendants contenus dans l’algèbre de Dirac complète peuvent être construits. 22

L’avantage de cette structure particulière est que celle-ci rend manifeste le fait que la représentationchirale est réductible, ce qui permet de décomposer le spineur de Dirac en deux blocs distincts :

ψ = ψL + ψR =(χL

0

)+(

0χR

)=(χL

χR

). (1.3)

Les composantes χL et χR (de dimension deux), qui se transforment indépendamment sous un « boost »de Lorentz et une rotation, sont appelées spineurs de Weyl de chiralité gauche et droite respective-ment. 23 Dans cette représentation, on constate que les champs chiraux ψR et ψL correspondent auxétats propres de γ5 (γ5ψR = ψR et γ5ψL = −ψL), ayant les valeurs propres ±1. 24 Dans le cadre dece travail, ces spineurs ne sont pas contraints à être des états propres de l’opérateur d’hélicité, ce quipermet d’introduire le concept de masse pour le spineur de Weyl également [12]. L’équation de Diracprédit ainsi de façon naturelle l’existence de deux types de particules, dites « gauche » et « droite ».Toutefois, pour obtenir une théorie de champs quantifiés offrant une description adéquate des fermions,21. En fait, cet objet est défini par ses propriétés de transformation sous un « boost » de Lorentz et une rotation.22. Les quatre matrices de Dirac, complémentées de leur relation d’anticommutation, impliquent que tout produit de

plus de quatre matrices peut se réduire à des produits de quatre matrices ou moins. Les 16 éléments indépendants decette algèbre consistent donc en la matrice identité (I4), quatre matrices gamma (γµ), six produits de deux matricesgamma ( 1

2 i[γµ, γν ]), quatre produits de trois matrices gamma (γµγ5) et un produit de quatre matrices gamma (γ5).23. La chiralité (les valeurs propres de γ5) est une propriété intrinsèque de nature « quantique » associée à la manière

dont une particule (le spineur) se transforme sous le groupe de Lorentz. Il existe donc deux types de transformationsindépendantes, étiquetées « gauche » et « droite ». De plus, cette propriété est fondamentale dans la description desneutrinos, particulièrement dans la construction de termes de masse. Pour une particule massive, la chiralité et l’hélicité(la projection du spin sur la quantité de mouvement) doivent être distinguées puisque l’hélicité est un concept qui dépenddu référentiel choisi et par conséquent n’est pas un invariant de Lorentz.24. De façon plus générale, on peut également constater que le rôle de la matrice γ5 peut être interprété comme une

façon de définir les champs chiraux indépendamment de la représentation choisie. En effet, puisque celle-ci satisfait larelation (γ5)2 = I4, on peut définir les opérateurs de projection PR,L = 1

2 (I4± γ5) qui, une fois appliqués sur le spineur,projettent la composante chirale souhaitée, c’est-à-dire PLψ ≡ ψL et PRψ ≡ ψR.

12

Page 23: Phénoménologie des neutrinos dans une théorie de matrices ...

la quantité d’intérêt devient alors le lagrangien associé à l’équation (1.1). Celui-ci s’obtient en consi-dérant que l’on doit retrouver l’équation (1.1) lorsque l’on y applique les équations d’Euler-Lagrange.Par ailleurs, pour s’assurer d’obtenir un scalaire de Lorentz, il faut définir le champ conjugué (adjoint)comme ψ = ψ†γ0. Suivant ces considérations, on obtient le lagrangien de Dirac

LDirac = ψ(iγµ∂µ −mI4)ψ. (1.4)

Ce lagrangien peut donc être utilisé comme point de départ dans une procédure de quantificationcanonique, ce qui produit un champ spinoriel quantifié dont les excitations correspondent aux quarkset aux leptons. 25 Également, en utilisant la représentation chirale, celui-ci prend la forme

LDirac = ψLiγµ∂µψL + ψRiγµ∂µψR −m(ψLψR + ψRψL

), (1.5)

qui s’avère être fort utile pour analyser la structure du terme de masse. En effet, le terme de masse del’équation (1.5), qui nécessite un couplage entre les deux composantes chirales, constitue la signaturetypique d’un fermion de Dirac massif. D’autre part, cette forme particulière suggère également qu’ententant de démontrer l’existence d’un lien entre les composantes chirales, une forme plus simple, voireplus économique pourrait être obtenue, où seulement une des composantes est nécessaire. Cela impliquedonc de regarder plus en détail les effets de la conjugaison de charge sur ces spineurs. En utilisantles propriétés générales concernant la transformation d’un spineur sous l’opération de conjugaisonde charge (voir annexe G de [34]), qui permet de définir le conjugué de charge du champ selon latransformation ψ C→ ψc ≡ CψT , où C ≡ iγ2γ0 est la matrice conjugaison de charge, on obtient que

ψR = C(ψc)LT , ψL = C(ψc)R

T , (1.6)

où les champs (ψc)L et (ψc)R représentent les antiparticules de chiralité gauche et droite respective-ment. On peut donc toujours écrire, par exemple, le lagrangien (1.5) en termes de champs chirauxde chiralité gauche, à condition d’utiliser les champs de la particule ψL et de l’antiparticule (ψc)L.Par ailleurs, il est important de mentionner que pour un spineur de Dirac, bien que les champs ψLet (ψc)L (ou ψR et (ψc)R) soient tous deux de chiralité gauche (ou droite), ceux-ci représentent desétats différents. Une façon intuitive de s’en convaincre est de réaliser que ces champs peuvent êtrechargés sous un groupe de symétries internes, impliquant que la conjugaison de charge C, qui changele signe de tous les nombres quantiques présents (excepté le spin), génère naturellement des étatsquantiques différents. Pour cette raison, bien que le lagrangien puisse être exprimé en fonction d’uneseule composante chirale, cette description alternative ne s’avère pas réellement plus économique quela précédente puisqu’il y a toujours présence d’un couplage entre des champs différents. En contre-partie, celle-ci permet de constater qu’un champ complètement neutre satisfaisant l’égalité ψ = ψc,c’est-à-dire l’équivalence particule-antiparticule, permettrait une réelle économie lors de l’élaborationd’une théorie chirale, et ce, au coût d’une représentation spinorielle beaucoup plus contraignante. Ils’agit, en fait, de l’idée de base derrière le spineur de Majorana. Sous cette nouvelle représentation,on peut s’attendre à ce qu’il soit possible d’obtenir une relation entre les composantes chirales d’unmême champ spinoriel tout en respectant les contraintes liées à l’équation de Dirac. Dans la perspective25. Il faut préciser que cette forme particulière ne constitue pas une théorie complète puisque celle-ci ne respecte pas

la symétrie de jauge locale SU(3)c ⊗ SU(2)L ⊗ U(1)Y . Néanmoins, celle-ci s’avère plus que suffisante pour étudier lescaractéristiques des champs fermioniques.

13

Page 24: Phénoménologie des neutrinos dans une théorie de matrices ...

d’offrir une certaine motivation derrière cette relation particulière, il s’avère instructif, comme pointde départ, 26 de regarder les équations du mouvement du lagrangien (1.5), soit

iγµ∂µψL = mψR, iγµ∂µψR = mψL. (1.7)

Cela permet ainsi de constater que l’évolution des champs ψL et ψR dans l’espace-temps est coupléepar la masse m. Puisque l’idée est de chercher une description où les équations du mouvement contien-draient seulement une seule des composantes chirales, les équations (1.7) doivent donc être considéréescomme deux façons d’écrire la même équation en fonction d’un seul champ indépendant, par exempleψL. Dans un premier temps, on peut choisir l’une ou l’autre des équations (1.7) et y appliquer leconjugué hermitien pour ensuite multiplier par la droite avec γ0, ce qui donne, par exemple

− i∂µψ†R㵆γ0 = mψ†Lγ0. (1.8)

Considérant la relation γ0㵆γ0 = γµ, on peut obtenir l’identité 㵆γ0 = γ0γµ sachant que γ0γ0 = I4,ce qui permet d’écrire

− i∂µψ†Rγ0γµ = mψ†Lγ0 ⇒ −i∂µψRγµ = mψL. (1.9)

Le but est d’obtenir une équation qui possède la même structure que l’équation de gauche dans (1.7).Pour ce faire, il suffit de corriger la position du γµ en prenant la transposée de chaque côté de l’égalité,ce qui donne

− iγµT∂µψRT = mψLT . (1.10)

À cette étape, il devient nécessaire d’introduire la matrice de conjugaison de charge C ainsi que lapropriété CγµTC−1 = −γµ, ce qui implique que

iγµ∂µCψRT = mCψLT . (1.11)

L’équation précédente permet donc de conclure que l’on retombe bien sur l’équation de gauche de (1.7)à condition de poser ψR = CψLT , ce qui correspond à la relation de Majorana entre les composanteschirales. Cependant, il faut bien entendu s’assurer que la quantité CψLT se transforme comme unspineur de chiralité droite, ce qui est effectivement le cas. 27 En comparant la relation obtenue avec latransformation générale (1.6) pour le champ ψR, on peut donc constater que celles-ci sont équivalentesà condition de poser ψ = ψc. Une fois de plus, le point important est de réaliser que la relation deMajorana lie les composantes chirales d’un même spineur, ce qui permet d’obtenir une description souslaquelle une seule des composantes est requise (dans ce cas-ci la gauche). Finalement, en se référant àla définition du conjugué de charge, on peut écrire le champ résultant sous une forme plus compacte,soit ψR = CψLT = (ψL)c. Le champ neutre introduit précédemment, qui porte maintenant le titre despineur de Majorana, peut donc prendre la forme ψ = ψL + ψR = ψL + (ψL)c dans la représentation26. La description de Majorana peut également être obtenue en changeant de représentation pour les matrices gamma.

En imposant des solutions réelles à l’équation de Dirac, cela implique des matrices gamma purement imaginaires, ce quiest appelé la représentation de Majorana. Il s’agit ensuite de transposer ces résultats dans la représentation chirale (labase dans laquelle l’opérateur γ5 est diagonale) pour pouvoir construire le spineur de Majorana à partir des spineurs deWeyl. De plus, notons que certains auteurs préfèrent changer de symbole pour désigner le champ neutre. Par exemple,le symbole Ψ pourrait être employé, à condition de le réserver uniquement pour identifier un spineur de Majorana.27. Cela se vérifie en appliquant l’un des opérateurs de projection (PR,L) sur cette quantité pour obtenir, par exemple,

PRCψLT = CψLT , ou de façon équivalente PLCψLT = 0.

14

Page 25: Phénoménologie des neutrinos dans une théorie de matrices ...

chirale. Sous cette forme particulière, la condition ψ = ψc se vérifie aisément, c’est-à-dire qu’on obtientψc = (ψL + (ψL)c)c = (ψL)c + ψL = ψ. Par construction, un spineur de Majorana est donc invariantsous l’opération de conjugaison de charge, c’est-à-dire que ce champ ne peut pas posséder de nombresquantiques permettant de distinguer la particule de l’antiparticule (il doit donc demeurer neutre). 28

Au final, le lagrangien correspondant est LMaj. = 12ψ(iγµ∂µ −mI4)ψ, ce qui donne

LMaj. = 12

(ψLiγµ∂µψL + (ψL)ciγµ∂µ(ψL)c −m

((ψL)cψL + ψL(ψL)c

)). (1.12)

Ici, le facteur 12 est introduit pour éviter un double comptage dû à la relation entre les composantes

chirales, ce qui permet également de s’assurer que le paramètre m représente bien la masse de la par-ticule. Le terme de masse du lagrangien (1.12) constitue donc la signature typique d’un fermion deMajorana massif. De plus, en raison de la convention utilisée dans ce travail concernant la définitiondes champs chiraux [12], il s’avère possible d’établir une correspondance directe entre le lagrangien(1.12) et une théorie reposant sur un fermion de Weyl massif. Il n’existe donc aucune distinctionphysique possible entre les deux théories, c’est-à-dire que le lagrangien (1.12), une fois écrit dans leformalisme à deux composantes (en fonction du champ χL ou χR), est identique à celui obtenu endonnant une masse à un fermion de Weyl. Le lagrangien de Majorana peut donc être vu comme laversion à quatre composantes d’une théorie décrivant un fermion de Weyl massif. Ainsi, le spineurde Dirac est initialement considéré comme la solution la plus générale à l’équation de Dirac puisquecelui-ci n’est soumis à aucune contrainte additionnelle. En contrepartie, étant donné la liberté dans lechoix de la représentation des matrices γµ, deux types de contraintes peuvent être imposées à cettesolution tout en préservant l’invariance de Lorentz.

En premier lieu, la condition de « chiralité » est imposée, ce qui génère les spineurs de Weyl. Dû àleur transformation particulière sous un « boost » de Lorentz et une rotation, ces spineurs formentdeux représentations irréductibles différentes du groupe de Lorentz [35], ce qui en fait naturellementdes blocs fondamentaux à partir desquels les spineurs de Dirac et de Majorana peuvent être construits(toute théorie chirale peut donc être écrite en termes de spineurs de Weyl dans la notation à deuxcomposantes). Pour un spineur de Dirac, cela implique que les deux spineurs de Weyl qui le composentse transforment dans une représentation complexe du groupe de symétrie auquel ils appartiennent. 29

En second lieu, la démarche présentée dans cette section est équivalente à imposer la condition de« réalité », ce qui définit le spineur de Majorana. Cette contrainte implique un champ complètementneutre, tel que le champ de Weyl associé se transforme comme un singulet du groupe de symétrie auquelil appartient (voir la note 29). Les champs de Weyl et de Majorana peuvent donc être vus comme dessolutions plus simples, voire plus fondamentales, mais qui doivent obéir à certaines contraintes.28. Par exemple, le nombre leptonique et la charge électrique ne sont pas conservés dans cette description, de même

que tout nombre quantique avec une loi de conservation additive.29. Dans le formalisme à deux composantes (c’est-à-dire, par exemple, une théorie reposant sur une collection de

spineurs de Weyl de chiralité gauche), la distinction entre un fermion de Dirac et de Majorana se définie à partir del’invariance du lagrangien correspondant sous un groupe de symétries continues (globales ou locales) et de la structuredes multiplets contenant les spineurs de Weyl [34]. L’absence de symétrie signifie que les spineurs de Weyl concernéscorrespondent à des fermions de Majorana alors que dans le cas contraire, cette distinction relève de la façon dontle multiplet se transforme sous le groupe de symétrie. Un multiplet se transformant dans une représentation réelle(complexe) implique donc que les spineurs de Weyl concernés correspondent à des fermions de Majorana (Dirac). Pourun fermion de Majorana, cette définition constitue donc une généralisation de la contrainte usuelle (plus rectrictive)nécessitant que ce champ se transforme comme un singulet du groupe de symétrie (c’est-à-dire un champ complètementneutre). Des champs « chargés » sous un groupe de symétries internes sont donc également permis à condition queceux-ci se transforment dans une représentation réelle non triviale de ce groupe.

15

Page 26: Phénoménologie des neutrinos dans une théorie de matrices ...

1.2 Les neutrinos et le secteur électrofaible

Le formalisme général développé à la section précédente peut donc être employé pour décrire l’ensembledes particules de matière observées dans le contexte de théories plus élaborées. Puisque la quasi-totalitédes fermions répertoriés possède une charge électrique, de même que pour des raisons historiquesliées à la conservation de la parité dans des théories telles que QED et QCD, le modèle standardest entièrement construit sur la notion de spineur de Dirac. La seule exception à cette règle est bienentendu le neutrino, qui est présent uniquement sous la forme d’un spineur de Weyl de chiralité gauche.À l’heure actuelle, l’utilisation du spineur de Majorana est donc restreinte à des théories au-delà dumodèle standard, comme la supersymétrie ou les mécanismes derrière la masse des neutrinos. Dansle cas de la supersymétrie, ce sont les superpartenaires fermioniques des bosons neutres de spin 0ou 1 qui sont présumés se transformer comme des fermions de Majorana alors que dans le cas desneutrinos, la plupart des modèles actuellement admis partent directement de la supposition que ceux-ci peuvent être décrits comme un fermion de Majorana. Cependant, contrairement à la supersymétrie,dont les ouvrages modernes tirent profit de la notation à deux composantes (où tout est expriméen fonction des spineurs de Weyl), la littérature existante sur les mécanismes derrière la masse desneutrinos est toujours majoritairement dominée par la notation à quatre composantes (où les spineursde Dirac et de Majorana sont définis), sans doute dans le but de faciliter un certain parallèle avec lesleptons chargés et le secteur des quarks. Quoi qu’il en soit, le point de départ de toute étude détailléeconcernant l’émission, la propagation et la détection des neutrinos est bien entendu le lagrangien dumodèle électrofaible. Celui-ci s’écrit, dans sa forme la plus symétrique et la plus compacte,

Lef =∑

α=e,µ,τLαi /DLα +

∑j=1,2,3

Qj i /DQj

+∑

α=e,µ,τ`αRi /D`αR +

∑β=d,s,b

qdβ i /Dqd

β +∑

β=u,c,tquβ i /Dqu

β

−14

3∑a=1

(Fa)µν (Fa)µν − 14BµνB

µν

+(DρΦ)†DρΦ− µ2Φ†Φ− λ(Φ†Φ)2 (1.13)

−∑

α,β=e,µ,τ

(Y lαβLαΦ`βR + Y l∗

βα`βRΦ†Lα)

−∑

j=1,2,3

∑β=d,s,b

(Y djβQjΦqd

β + Y d∗βj q

dβΦ†Qj

)−∑

j=1,2,3

∑β=u,c,t

(Y ujβQjΦqu

β + Y u∗βj q

uβΦ†Qj

),

pour les trois générations de fermions, tels que le suggèrent les modes de désintégration du boson Z0

[1, 5]. 30 Il s’agit du lagrangien le plus général qui est à la fois renormalisable et invariant sous le groupede symétries locales SU(2)L⊗U(1)Y (invariant de jauge). 31 Cela implique, en termes plus spécifiques,

30. D’autres générations de fermions fondamentaux sujets aux interactions faibles sont possibles si leur masse est plusgrande que mZ0/2 puisque ces particules ne doivent pas être observées dans les produits de désintégration du Z0.31. Un lagrangien invariant sous une transformation appliquée uniformément sur tout l’espace, de la forme ϕ(x) →

ϕ′(x) = eiθϕ(x) (avec θ constant), possède une symétrie dite globale. Cette symétrie implique une charge conservée maisne génère pas de force. En contrepartie, si le lagrangien est invariant sous une transformation qui a la possibilité de variersur l’espace, de la forme ϕ(x)→ ϕ′(x) = eiη(x)ϕ(x), la symétrie est dite locale. Celle-ci est beaucoup plus contraignantequ’une symétrie globale (qui peut être vue comme un cas spécial où η(x) = constante) et est toujours accompagnée dechamps de jauge bosoniques qui induisent une force en plus des lois de conservation.

16

Page 27: Phénoménologie des neutrinos dans une théorie de matrices ...

que sous une transformation de la forme

ϕ(x)→ ϕ′(x) = ei(α(x)·T+η(x)Y2 )ϕ(x), (1.14)

le lagrangien demeure inchangé. Dans l’expression (1.14), ϕ(x) peut être n’importe lequel des champsdu lagrangien (1.13), 32 T contient les trois générateurs du groupe d’isospin faible SU(2)L (T a = σa

2dans la représentation fondamentale, qui est de dimension deux), α(x) contient trois fonctions quispécifient la phase locale à chaque point de l’espace (même chose pour la fonction η(x)) et Y correspondau générateur du groupe U(1)Y associé à l’hypercharge. L’équation (1.13) contient donc une quantitéimportante d’information qu’il faut maintenant pouvoir décortiquer davantage. Dans ce chapitre, uneattention particulière est bien sûr portée sur la partie leptonique de l’expression (1.13). Cependant,afin de présenter un portrait plus complet, une brève description du contenu en particules est de mise.Concernant les particules de matière, les quantités Lα et Qj représentent les doublets d’isospin faiblede SU(2)L regroupant les composantes de chiralité gauche des champs fermioniques, soit

Le =(νe

e

)L

, Lµ =(νµ

µ

)L

, Lτ =(ντ

τ

)L

, Q1 =(u

d

)L

, Q2 =(c

s

)L

, Q3 =(t

b

)L

, (1.15)

alors que les quantités `αR, quβ et qd

β représentent les composantes de chiralité droite de ces champs,qui se transforment comme des singulets sous ce groupe de jauge :

`eR = eR, `µR = µR, `τR = τR, quu = uR, qu

c = cR,

qut = tR, qd

d = dR, qds = sR, qd

b = bR. (1.16)

Ici, les lettres u et d sont utilisées pour regrouper les contributions des quarks de type « up » et detype « down ». Le tableau 1.1 regroupe donc les différentes propriétés qui caractérisent ces champs etdictent les interactions et couplages possibles. Naturellement, cette construction est une conséquencedirecte du caractère chiral des interactions faibles, qui implique que les deux types de chiralité nepossèdent pas les mêmes interactions.

Tableau 1.1 – Valeurs propres des opérateurs d’isospin I et I3, d’hypercharge Y et de charge électriqueQ pour les trois générations de fermions du modèle standard (tableau adapté de [1]).

Leptons Quarks

Champs I I3 Y Q Champs I I3 Y Q(νe

e

)L

(νµ

µ

)L

(ντ

τ

)L

1/2 1/2 -1 0 (u

d

)L

(c

s

)L

(t

b

)L

1/2 1/2 1/3 2/3-1/2 -1 -1/2 -1/3

- - - - - - - uR, cR, tR

dR, sR, bR

0 0 4/3 2/3

eR, µR, τR 0 0 -2 -1 0 0 -2/3 -1/3

En ce qui concerne les particules d’échange (les bosons de jauge vectoriels), le contenu en champs qui

32. Pour un singulet, seul le terme η(x)Y2 est présent dans l’exponentielle puisque ceux-ci ne sont pas chargés sousSU(2)L, c’est-à-dire qu’ils ont un isospin nul.

17

Page 28: Phénoménologie des neutrinos dans une théorie de matrices ...

les décrit est dissimulé dans l’opérateur /D et donc émerge lorsque l’invariance de jauge est imposéeaux termes du lagrangien. En effet, l’un des ingrédients essentiels qui permet d’écrire ce lagrangiencomme un invariant de jauge (une théorie de Yang-Mills) est la dérivée covariante /D ≡ γµDµ, c’est-à-dire l’opérateur qui remplace la dérivée usuelle dans les théories de jauge. Par construction, celle-ciagit différemment selon qu’elle est appliquée sur un doublet ou un singulet et assure que les termesdu lagrangien demeurent invariants sous une transformation de jauge locale (invariants sous la trans-formation (1.14)), ce qui implique l’introduction de champs de jauge qui se transforment de façonappropriée. Ainsi,

Dµ = ∂µ + igw3∑a=1

W aµT

a + ig′wBµY

2 , (1.17)

où W 1µ , W 2

µ et W 3µ sont les trois champs de jauge bosoniques sans masse (qui forment un triplet sous

SU(2)L) associés aux trois générateurs du groupe d’isospin faible SU(2)L et où Bµ est le champ dejauge (également sans masse) associé au générateur du groupe U(1)Y . 33 Finalement, le champ scalaireΦ (et son conjugué Φ, voir (1.55)), qui se couple à tous les fermions et les bosons de jauge, est associéau boson de Higgs. Ses particularités sont discutées à la section 1.3, où il est question de l’origine de lamasse des particules élémentaires. Ayant une connaissance plus approfondie du contenu en particules,on peut donc maintenant s’intéresser à la structure des termes du lagrangien (1.13). La première et ladeuxième ligne contiennent les termes cinétiques des fermions ainsi que les termes d’interaction entreceux-ci et les bosons de jauge (qu’on obtient en développant la dérivée covariante). À la troisième ligne,on retrouve les termes cinétiques des bosons de jauge, où (Fa)µν = ∂µW ν

a −∂νWµa −gw

∑b,c εabcW

µb W

νc

et Bµν = ∂µBν − ∂νBµ sont les tenseurs antisymétriques construits à partir des champs de jauge. Cescontributions sont responsables de la propagation des bosons de jauge et de leur interaction avec eux-mêmes, une conséquence naturelle d’une théorie de jauge non abélienne. 34 Considérant les besoins dece travail, ces contributions ne seront pas détaillées davantage. Ensuite, on retrouve à la quatrièmeligne le lagrangien du champ de Higgs (la partie responsable de la brisure spontanée de la symétrieélectrofaible) et finalement, les lignes 5 à 7 décrivent les couplages de Yukawa (il s’agit des matrices Y l,Y d et Y u, qui contiennent les constantes de couplage sans dimension) entre les fermions et le Higgs, quipermettent ultimement de générer les termes de masse fermionique et le mélange des quarks. En effet,le lagrangien (1.13) ne contient aucun de ces termes de masse puisque ceux-ci couplent les deux types dechiralité (fermion de Dirac) et ne sont pas, par conséquent, des invariants de jauge. 35 Conséquemment,

33. La structure particulière de la dérivée covariante s’explique par le fait que celle-ci doit pouvoir annuler les contri-butions indésirables qui proviennent de la dérivée usuelle ∂µ sous la transformation (1.14). Celle-ci dépend donc despropriétés des champs fermioniques sur lesquels elle agit. De plus, elle contient les constantes fondamentales du secteurélectrofaible, soit gw et g′w (les générateurs de SU(2)L et U(1)Y commutent entre eux et donc les constantes de couplagesont a priori différentes). Dans ce modèle, l’hypercharge est fixée par la relation de Gell-Mann-Nishijima Q = I3 + Y

2 ,ce qui permet d’obtenir l’action de Dµ sur chacun des champs aux équations (1.15) et (1.16).34. Les générateurs du groupe SU(2)L (et également ceux de SU(3)c) ne commutent pas et cette théorie de jauge

est dite « non abélienne ». Dans une théorie non abélienne, les propriétés de transformation des champs de jauge nesont pas indépendantes, ce qui se traduit, dans le cas présent, par l’introduction d’un terme de la forme εabcWµ

bW νc

dans le lagrangien pour assurer l’invariance de jauge. Cette contribution apparait dans le terme cinétique des bosons dejauge (Fa)µν (Fa)µν et est responsable de l’interaction des Wa

µ avec eux-mêmes (sommets à trois et quatre champs).Ainsi, même en l’absence de champs fermioniques, une théorie de jauge non abélienne possède des interactions nontriviales. Ici, εabc contient les constantes de structure du groupe, définies par les règles de commutation des générateurs[Ta, Tb] = iεabcTc. Pour SU(2)L, il s’agit du tenseur de Levi-Civita, qui est totalement antisymétrique. Pour une excellenteintroduction aux théories de jauge non abéliennes en physique des particules, voir [3, 36].35. Pour un champ de Dirac, le terme de masse est de la forme (1.5), où ψ peut être, en principe, l’un des six champs

de quarks ou de leptons. Puisque les composantes de chiralité gauche se transforment comme un doublet et que celles dechiralité droite se transforment comme un singulet, ces termes ne sont manifestement pas invariants de jauge (le termede masse résultant ne se transforme pas comme un singulet).

18

Page 29: Phénoménologie des neutrinos dans une théorie de matrices ...

les champs fermioniques présents dans ce lagrangien ne sont pas les champs physiques réels, ceux-cisont définis après la brisure de la symétrie électrofaible, une fois que le lagrangien est exprimé dans labase des masses (à la suite d’une procédure de diagonalisation). Concernant les champs de jauge réelsWµ

1 , Wµ2 , W

µ3 et Bµ, ceux-ci forment des combinaisons particulières une fois la partie interaction du

lagrangien proprement développée (sous la forme d’une amplitude associée à un sommet d’interaction).Ces combinaisons spécifiques se retrouvent également dans les termes de masse bosonique résultants dela brisure de symétrie spontanée (provenant du terme (DρΦ)†DρΦ), ce qui implique qu’elles peuventêtre correctement identifiées aux bosons physiques W±, Z0 et au photon. Le secteur électrofaible estdonc très riche en information et constitue l’une des parties les mieux comprises du modèle standard.

1.2.1 Interaction de type courant chargé

On peut donc constater que tel qu’anticipé, la nature des interactions faibles implique que le spineur deWeyl de chiralité gauche est suffisant pour décrire complètement les interactions des neutrinos et, plusprécisément, illustrer l’émergence du phénomène d’oscillation. 36 À partir de l’expression (1.13), onpeut donc extraire le lagrangien d’interaction de type CC qui couple les leptons chargés, les neutrinoset les bosons W± et en étudier les conséquences. En développant les lignes 1 et 2 de l’expression(1.13), en considérant seulement la partie leptonique et en ignorant les termes cinétiques, cela permetd’obtenir la contribution décrivant l’interaction. Celle-ci prend donc la forme suivante :

Lint = −12∑

α=e,µ,τLαγ

µ

(gw

3∑a=1

σaW aµ − g′wBµI2

)Lα + g′w

∑α=e,µ,τ

`αRγµBµ`αR, (1.18)

où les propriétés du tableau 1.1 ont été utilisées. La forme matricielle correspondante est donc

Lint = −12

(νeL, eL

)( gw /W3 − g′w /B gw( /W 1 − i /W 2)

gw( /W 1 + i /W 2) −gw /W3 − g′w /B

)(νeL

eL

)

−12

(νµL, µL

)( gw /W3 − g′w /B gw( /W 1 − i /W 2)

gw( /W 1 + i /W 2) −gw /W3 − g′w /B

)(νµL

µL

)(1.19)

−12

(ντL, τL

)( gw /W3 − g′w /B gw( /W 1 − i /W 2)

gw( /W 1 + i /W 2) −gw /W3 − g′w /B

)(ντL

τL

)+g′w

(eR /BeR + µR /BµR + τR /BτR

).

À partir de l’expression précédente, on peut donc identifier deux types de transitions qui sont à l’originedes interactions CC et NC du secteur leptonique. En effet, un simple coup d’oeil suffit pour constaterque sous cette construction, les champs W 1

µ et W 2µ doivent être chargés puisque ceux-ci assurent la

transition entre deux membres d’un même doublet dont la charge électrique diffère d’une unité (ils’agit de compléter le produit matriciel de l’expression (1.19) pour s’en convaincre). Leur charge estdonc fixée par la nécessité de préserver une densité lagrangienne dont la charge nette est nulle. 37 En36. Le phénomène d’oscillation neutrino-neutrino relève uniquement de considérations cinématiques. Celui-ci est donc

insensible à la nature du champ fermionique et, par conséquent, ses effets sont les mêmes dans les deux cas.37. La densité lagrangienne est invariante sous les actions combinées de la conjugaison de charge C, de la parité P et

du renversement du temps T , ce qui représente l’invariance CPT et implique une densité lagrangienne « réelle ». Puisquel’ensemble des observations physiques actuelles corrobore ce résultat, cela suggère que la symétrie CPT correspond bienà une symétrie de la nature. Toute théorie de champs locale invariante de Lorentz doit donc préserver cette symétrie, cequi signifie la condition L † = L .

19

Page 30: Phénoménologie des neutrinos dans une théorie de matrices ...

suivant le même raisonnement, il s’avère possible de déduire que les champs W 3µ et Bµ doivent être

neutres puisqu’ils assurent la transition entre un champ et son conjugé. Ainsi, les interactions de typecourant chargé sont décrites par la partie du lagrangien qui contient les termes hors diagonaux duproduit matriciel (1.19), soit

L CCint = −gw2

(νeL( /W 1 − i /W 2)eL + eL( /W 1 + i /W 2)νeL + νµL( /W 1 − i /W 2)µL

+ µL( /W 1 + i /W 2)νµL + ντL( /W 1 − i /W 2)τL + τL( /W 1 + i /W 2)ντL). (1.20)

On souhaite ensuite écrire l’expression précédente sous la forme usuelle d’un sommet d’interaction pourpouvoir correctement identifier les degrés de liberté physiques de la théorie, soit les bosonsW±. Il s’agitdonc de pouvoir écrire le lagrangien sous la forme L CC

int = − gw2√

2

(jµ+W

+µ + jµ−W

−µ

), où W±µ sont les

champs dont l’excitation produit les bosons chargés et les jµ± sont les courants chargés leptoniques.On peut vérifier qu’avec l’introduction des opérateurs d’échelle de l’isospin faible σ± et les définitionsstandards des champs W±µ (après la brisure spontannée de la symétrie électrofaible), c’est-à-dire

σ+ = σ1 + iσ2

2 =(

0 10 0

), σ− = σ1 − iσ2

2 =(

0 01 0

), W±µ = 1√

2(W 1µ ∓ iW 2

µ

), (1.21)

où (W+µ )† = W−µ , on peut réécrire (1.20) sous la forme suivante

L CCint = − gw

2√

2∑

α=e,µ,τ

(2Lαγµσ+LαW

+µ + 2Lαγµσ−LαW−µ

)= − gw

2√

2∑

α=e,µ,τ

(2ναLγµ`αLW+

µ + 2`αLγµναLW−µ). (1.22)

Ici, `eL = eL, `µL = µL et `τL = τL correspondent aux champs des leptons chargés. Le rôle desopérateurs d’échelle est donc de sélectionner uniquement les composantes hors diagonale du produitmatriciel (1.19) en élevant (descendant) la composante inférieure (supérieure) d’un doublet, ce qui setraduit par l’augmentation (diminution) d’une unité de la valeur de sa troisième composante d’isospin.On peut donc directement identifier l’expression des courants chargés jµ± à partir de la relation (1.22),sans oublier le facteur 2 dans la définition pour que les quantités soient proprement normalisées. Onobtient donc les relations suivantes

jµ+ = 2∑

α=e,µ,τναLγ

µ`αL, jµ− = 2∑

α=e,µ,τ`αLγ

µναL. (1.23)

Plus précisément, il s’agit de la contribution au lagrangien responsable du changement de saveur dans lesecteur leptonique. L’expression (1.23) permet en effet de conclure qu’un neutrino est donc transforméen son lepton chargé associé à la suite de l’interaction avec un boson W±, et vice versa. Pour obtenirle lagrangien d’interaction en termes des champs physiques, celui-ci doit être exprimé dans la basedes états propres de masse, ce qui implique ultimement des matrices de Yukawa diagonales (voirsection 1.3). Dans le cas des leptons, on a que Y l = U l

LylU l†R , où U l

L et U lR sont des matrices unitaires

appropriées telles que yl est diagonale, réélle et non négative, ce qui définit une diagonalisation detype biunitaire pour une matrice complexe quelconque (voir annexe A). Ceci implique en retour queles champs des leptons chargés sont transformés selon `L → ˜

L = U l†L `L et `R → ˜

R = U l†R `R, où ˜

L

20

Page 31: Phénoménologie des neutrinos dans une théorie de matrices ...

et ˜R sont les états propres de masse de la théorie et où les définitions suivantes sont utilisées

νL =

νeL

νµL

ντL

, `L =

eL

µL

τL

, `R =

eR

µR

τR

. (1.24)

Sans grande surprise, seuls les leptons chargés sont affectés par cette transformation puisque les neu-trinos sont sans masse dans le modèle standard, la base arbitraire dans laquelle ceux-ci sont exprimésconstitue donc également une base où la « masse » est bien définie (il n’existe pas de matrice detype Yukawa pour les neutrinos). Afin d’étudier les conséquences de cette diagonalisation, il s’avèreinstructif de regarder la transformation des courants chargés

jµ+ = 2νLγµU lL

˜L, jµ− = 2˜

LUl†L γ

µνL. (1.25)

Puisque l’on peut redéfinir librement les champs de neutrinos (sans masse) en raison du fait que ceux-cine se trouvent pas dans une base précise fixée par la diagonalisation, la matrice unitaire peut ainsiêtre absorbée dans la définition des champs sans conséquence physique, c’est-à-dire que νL ≡ U l†

L νL

et qu’on obtient simplementjµ+ = 2νLγµ˜

L, jµ− = 2˜Lγ

µνL. (1.26)

Le résultat (1.26) permet de conclure qu’il n’y a pas d’oscillations dans le secteur des neutrinos dumodèle standard puisque tous les champs sont maintenant exprimés dans la base des masses et qu’il nereste aucune matrice unitaire dans cette expression permettant un mélange des états. En contrepartie,ce résultat permet également de constater qu’en considérant des neutrinos massifs, ce qui impliquel’existence d’une base permettant de définir les champs physiques des neutrinos de chiralité gauchetels que νL → νL = Uν†L νL, cela se traduit par un courant chargé de la forme

jµ+ = 2νLUν†L γµU lL

˜L = 2νLU†γµ˜

L, jµ− = 2˜LU

l†L γ

µUνLνL = 2˜Lγ

µU νL. (1.27)

Puisque tous les champs sont maintenant dans une base précise fixée par le processus de diagonalisation,le produit U ≡ U l†

LUνL ne peut pas être absorbé dans la définition des champs des neutrinos sans

conséquences physiques majeures. 38 En effet, une fois le lagrangien diagonalisé dans la base des masses,on constate alors que les états propres de saveur et les états propres de masse des neutrinos sont liéspar la relation

νL = U νL ⇒ ναL =3∑k=1

UαkνkL. (1.28)

Ici, la convention usuelle réservant les indices grecs aux saveurs et les indices latins aux masses estadoptée. La présence de la matrice de mélange U (en général non diagonale), qui correspond à lamatrice PMNS mentionnée dans l’introduction, permet alors de conclure que le courant (1.27) génèreune superposition d’états massifs, ce qui implique qu’un neutrino dans un état de saveur bien défini nepossède pas de masse bien définie. Les trois générations de neutrinos massifs peuvent donc être classées38. L’interaction de type courant neutre ne génère pas de mélange puisque les combinaisons de champs impliquant les

neutrinos sont du type ναLγµναL. La condition d’unitarité sur la matrice UνL permet donc de l’éliminer de ces termes.Ici, on choisit (sans perte de généralité) de travailler dans une base où les états propres de masse et les états propresde saveur pour les leptons chargés coïncident parfaitement [6], il n’y a donc aucun mélange possible pour ceux-ci. Celaimplique donc que dans l’expression (1.27), la matrice U est entièrement absorbée dans la définition des états propresde saveur des neutrinos.

21

Page 32: Phénoménologie des neutrinos dans une théorie de matrices ...

selon deux bases distinctes, soit la base des saveurs ναL et la base des masses νkL. Ces deux bases étantreliées par une transformation unitaire définie par la matrice U (voir (1.28)), le rôle de cette matricese résume alors à mélanger les différents états. La relation (1.28) est donc à l’origine de ce qui estappelé le phénomène d’oscillation. En somme, le fait que les propriétés des neutrinos soient seulementvisibles grâce à leur interaction de type CC, combiné au fait qu’il existe deux bases distinctes pourdécrire l’état des neutrinos qui ne sont pas simultanément diagonalisables pour ce type d’interaction,entraine des répercussions bien réelles sur leur dynamique de propagation et d’interaction. Il s’avèredonc important de faire la distinction entre ces deux bases de façon précise puisque ce phénomène joueun rôle clé qui ne peut pas être dissocié de la problématique liée aux masses des neutrinos.

1.2.2 Le phénomène d’oscillation dans le vide

En étudiant les courants chargés leptoniques, il a été possible de constater que le fait de définir unebase dans laquelle les neutrinos possèdent un spectre de masse non dégénéré entraine automatiquementle phénomène d’oscillation, gouverné par les paramètres de la matrice PMNS. 39 Bien entendu, il fautultimement pouvoir motiver un tel ajout au modèle standard, ce qui fait l’objet de la section 1.3.Néanmoins, la relation (1.28) est suffisante pour examiner ce phénomène davantage et obtenir lesprobabilités de transition et de survie associées. Pour les besoins de cette discussion, une descriptionde ce phénomène au niveau des états quantiques est suffisante, ce qui nécessite l’introduction desétats propres de saveur |να〉 et les états propres de masse |νk〉. L’idée ici est simplement de décrirel’oscillation et le mélange des neutrinos en termes de particules physiques dans la limite relativiste, cequi permet certaines approximations utiles (la démarche présentée dans cette section est analogue àcelle que l’on peut trouver dans [1]). La connexion entre le champ νkL et l’état quantique |νk〉 peut êtrevue, par exemple, en exprimant la solution la plus générale possible de l’équation de Dirac selon sondéveloppement en modes de Fourier [5]. Pour un champ de Dirac, ce développement prend la forme 40

νk =ˆ d3~p

(2π)31√2E∑s

(as(p)us(p)e−ip·x + bs†(p)vs(p)eip·x) . (1.29)

Concernant le cas d’intérêt, il s’agit donc du champ νkL qui contient l’opérateur de création de l’état|νk〉 à partir de l’état du vide |0〉 (ce qui est également valide pour un fermion de Majorana). Larelation équivalente à (1.28) pour les états quantiques est donc

|να〉 =3∑k=1

U∗αk |νk〉 . (1.30)

Ainsi, les états |νk〉 sont les états physiques (de la particule fondamentale) avec une masse mk et uneénergie Ek bien définies pour chaque génération. Puisque les neutrinos sont produits et détectés parleurs états propres de saveur |να〉 alors que leur propagation s’effectue par leurs états propres de masse|νk〉, qui sont les états propres de l’hamiltonien libre qui les décrits, la relation (1.30) entraine des réper-

39. Cette démarche est complètement analogue à celle présente dans le secteur des quarks, qui donne lieu à l’émergencede la matrice CKM. De plus, cette matrice est partie intégrante du modèle standard puisque les deux types de chiralitédes quarks possèdent des couplages de Yukawa bien définis (voir (1.13)). La différence majeure ici est que les quarks nepeuvent pas se propager comme des particules libres dû à la propriété de confinement.40. Ici, s = ± 1

2 tient compte des deux états de spin possibles, as(p) est l’opérateur d’annihilation détruisant unneutrino de masse mk et bs†(p) est l’opérateur de création créant un antineutrino de même masse. De plus, us(p) etvs(p) correspondent aux spineurs de Dirac de la particule et de l’antiparticule dans l’espace « quantité de mouvement ».

22

Page 33: Phénoménologie des neutrinos dans une théorie de matrices ...

cussions physiques importantes. En effet, puisque ces états sont définis par la relation H |νk〉 = Ek |νk〉,où Ek =

√|~p|2 +m2

k (on suppose que la quantité de mouvement initiale est la même pour les troisétats propres de masse), 41 la solution de l’équation de Schrödinger correspondante implique que cesétats se propagent comme une onde plane |νk(t)〉 = e−iEkt |νk〉 (i.e. que les états propres de massen’interagissent pas entre eux durant la propagation). Les états propres de saveur |να〉, en contrepartie,sont définis comme l’état décrivant un neutrino produit dans une interaction CC incluant un leptonchargé. En fait, la saveur peut être déterminée seulement par l’identification du lepton chargé associéau neutrino dans cette interaction. Comme décrit par la relation (1.30), ceux-ci forment un conceptutile mais valide seulement dans certaines approximations. En effet, il a été démontré dans [5] qu’iln’est pas possible de définir convenablement les opérateurs de création et d’annihilation de ces étatspropres de saveur, car en général, ceux-ci ne satisfont pas les relations d’anticommutations (à tempségaux) usuelles imposées par le processus de quantification (celles-ci ne sont pas diagonales dans la basedes indices de saveur, c’est-à-dire /∝ δαβ). En conséquence, l’espace de Fock associé à ces états n’existepas d’un point de vue rigoureux. Par contre, dans la limite où les neutrinos sont relativistes (ce qui esttoujours le cas en pratique), un espace de Fock approximatif peut être construit, 42 ce qui justifie l’uti-lisation de la relation (1.30) pour introduire le phénomène d’oscillation. Ces considérations permettentmaintenant de mieux apprécier les différentes subtilités entre la masse des neutrinos et celle des leptonschargés. Dans le cas des leptons chargés, la seule caractéristique qui distingue les trois générations estleur masse. La saveur d’un électron, d’un muon ou d’un tau est donc identifiée par la mesure de leurmasse. Leur masse détermine également leurs propriétés cinématiques et leur mode de désintégration,qui peuvent être mesurés directement grâce aux interactions électromagnétiques. Un lepton chargé desaveur bien définie est par conséquent une particule de masse bien définie puisque celui-ci interagit« trop » avec la matière pour être dans un état quantique mal défini. En contrepartie, la saveur d’unneutrino est identifiée grâce à la saveur du lepton chargé avec lequel celui-ci interagit. Les |να〉 nesont donc pas requis d’avoir une masse bien définie et l’équation (1.30) suggère une superpositiond’états avec une masse bien définie. De ce point de vue, la « masse » d’un état de saveur corresponddonc à une valeur pondérée sur les masses mk puisque les |νk〉 sont mélangés en différentes proportions.

L’oscillation des neutrinos entre les différents états de saveur n’est donc pas un phénomène très intuitifpuisque celui-ci est dû à des effets purement quantiques s’étalant sur des distances de propagationmacroscopiques. L’argument le plus simple permettant de visualiser cet effet est donc de considérer lapropagation des états propres de masse. En supposant des masses mk toutes différentes, cela impliqueque les |νk〉 « contenus » dans un |να〉 vont posséder des énergies différentes (voir la note 41). Ainsi,pour une distance de propagation suffisamment grande, la phase relative entre les états de masse changede façon significative au point de modifier la saveur de l’état de départ, ce qui implique qu’un étatdifférent est observé au détecteur. Dans un premier temps, considérons un état |να(t)〉 qui décrit un

41. Un état |να〉 peut être produit avec une quantité de mouvement bien précise, ce qui implique que les |νk〉 ont uneénergie différente. Une oscillation temporelle est donc observée avec une période bien définie. Un état de saveur peutégalement être produit avec une énergie bien précise, ce qui implique que les états propres de masse ont une quantitéde mouvement différente. Une oscillation spatiale est donc observée avec une longueur d’onde bien définie. Pour desneutrinos relativistes, ces deux scénarios sont équivalents puisque Etot ' |~p|. En réalité, les différences en énergie (ou enquantité de mouvement) des |νk〉 sont toujours plus petites que l’incertitude sur l’énergie (ou la quantité de mouvement)du paquet d’ondes correspondant (condition de cohérence) [37]. La conservation énergie-impulsion est donc toujoursprotégée par le principe d’incertitude, c’est ce qui rend possible le phénomène d’oscillation.42. Pour une description formelle et rigoureuse des états de saveur, il faut recourir au concept de paquet d’ondes pour

traiter la propagation de l’état cohérent correspondant. Cela implique qu’il faut faire une distinction entre l’état desaveur produit

∣∣νPα ⟩ et l’état de saveur détecté∣∣νDα ⟩, tel que discuté dans [1].

23

Page 34: Phénoménologie des neutrinos dans une théorie de matrices ...

neutrino de saveur définie au temps t = 0. À partir de la relation (1.30) et de l’approximation d’ondeplane discutée précédemment, l’évolution temporelle est donnée par

|να(t)〉 =3∑k=1

U∗αke−iEkt |νk〉 . (1.31)

Par la suite, la relation (1.30) peut être inversée en utilisant la propriété U†U = I3, ce qui donne

|νk〉 =∑

α=e,µ,τUαk |να〉 . (1.32)

Cette expression peut être substituée dans (1.31), d’où il en résulte que

|να(t)〉 =3∑k=1

U∗αke−iEkt( ∑β=e,µ,τ

Uβk |νβ〉)

=∑

β=e,µ,τ

( 3∑k=1

U∗αke−iEktUβk

)|νβ〉 . (1.33)

Ici, on peut identifier le coefficient devant |νβ〉 comme l’amplitude de la transition να → νβ en fonctiondu temps, soit

Aνα→νβ (t) ≡ 〈νβ |να(t)〉 =3∑k=1

U∗αkUβke−iEkt. (1.34)

La probabilité d’occurrence de la transition s’écrit alors comme 43

Pνα→νβ (t) =∣∣Aνα→νβ (t)

∣∣2 =3∑k=1|Uαk|2 |Uβk|2 + 2Re

( 2∑k=1

3∑j>k

UαkU∗βkU

∗αjUβje−i(Ej−Ek)t

). (1.35)

Puisque l’on considère des neutrinos relativistes, certaines approximations peuvent être faites. Dansun premier temps, on utilise le développement de l’énergie au second ordre, soit Ek ' |~p| + m2

k

2|~p| ,ce qui implique également une quantité de mouvement initiale équivalente pour les trois états. Enconsidérant ensuite que celle-ci est approximativement égale à l’énergie totale de l’état initial Etot

pour une particule relativiste, cela permet d’écrire Etot ' |~p| pour les trois générations. Enfin, ils’ensuit que le temps de propagation peut être approximé par t ' l, où l est la distance de propagation(la distance source-détecteur). 44 Au final, on obtient

Pνα→νβ (l, Etot) =3∑k=1|Uαk|2 |Uβk|2 + 2Re

( 2∑k=1

3∑j>k

UαkU∗βkU

∗αjUβje

−i4m2

jkl

2Etot

), (1.36)

où 4m2jk = m2

j − m2k. Pour obtenir la probabilité de survie d’un état de saveur, il suffit de poser

α = β et de calculer Pνα→να(l, Etot) à partir de (1.36). Le point important de cette discussion est doncque l’oscillation des neutrinos confirme que ceux-ci ont une masse. Cependant, les expériences en lienavec ce phénomène ne peuvent renseigner que sur les différences de masses au carré (4m2

jk) et nonsur les grandeurs absolues. De plus, comme cette probabilité possède également une forte dépendancesur les éléments de U , cela signifie que les paramètres contenus dans cette matrice peuvent aussi être

43. Ici, l’identité∣∣∣ n∑i=1

zi

∣∣∣2 =n∑i=1|zi|2 + 2Re

(n−1∑i=1

n∑j>i

z∗i zj

)a été utilisée, où zi est un nombre complexe quelconque.

44. Les mesures expérimentales ne reposent pas sur le temps de propagation mais bien sur la distance. La quantitéimportante est donc l. Celle-ci s’obtient à partir de la relation l = |~v| t = |~p|

Etott ' t pour une particule relativiste.

24

Page 35: Phénoménologie des neutrinos dans une théorie de matrices ...

fixés expérimentalement. Enfin, notons que ce phénomène ne préserve pas les nombres leptoniques desaveurs Le, Lµ et Lτ , mais le nombre leptonique total L = Le + Lµ + Lτ est préservé.

1.2.3 Contraintes expérimentales

Au cours des dernières décennies, de nombreuses expériences ont contribué à établir un portrait deplus en plus clair du secteur des neutrinos. Un résumé sommaire des expériences importantes et desrésultats qui s’y rattachent est donc proposé dans cette sous-section. Pour ce faire, il est nécessaireavant tout de détailler le contenu de la matrice U afin d’en extraire les paramètres significatifs, quicorrespondent aux paramètres fondamentaux du secteur des saveurs leptoniques du modèle standard(il va sans dire que ces paramètres doivent tous être déterminés expérimentalement à l’heure actuelle).La paramétrisation la plus générale de cette matrice pour des fermions de Dirac (ce qui inclut à la foisles leptons chargés et les neutrinos) contient trois angles de mélange et une phase complexe alors quedans le cas où les neutrinos sont des fermions de Majorana, deux phases complexes supplémentairessont requises. En se référant à [4], on peut donc écrire la matrice PMNS pour des fermions de Dirac(la forme la plus simple) comme le produit de trois rotations et une phase complexe, c’est-à-dire

U =

1 0 00 cos(θ23) sin(θ23)0 − sin(θ23) cos(θ23)

cos(θ13) 0 sin(θ13)e−iδ

0 1 0− sin(θ13)eiδ 0 cos(θ13)

×

cos(θ12) sin(θ12) 0− sin(θ12) cos(θ12) 0

0 0 1

. (1.37)

Pour obtenir la paramétrisation adéquate dans le cas où les neutrinos sont traités comme des fermionsde Majorana, il faut réintroduire une matrice de phases diagonale de la forme ΨM = diag(1, eiα21

2 , eiα312 )

[1, 4], à partir de laquelle on peut écrire UM = UΨM, où U est définie telle qu’à la relation (1.37).Cette différence s’explique par le fait que les effets physiques de cette matrice sont visibles seulementpar le biais des interactions de type courant chargé (éq. (1.27)) et que, dans le cas où les neutrinossont traités comme des fermions de Dirac, les autres termes du lagrangien (en particulier le terme demasse) sont également invariants sous une transformation de phase globale. Cela permet d’absorbertrois phases supplémentaires dans la définition des champs de neutrinos sans conséquence physique,contrairement au cas où les neutrinos sont traités comme des fermions de Majorana (dont le terme demasse ne respecte pas cette symétrie). 45 Par ailleurs, en se référant à l’expression (1.36), on constateque la substitution U → UM ne change pas la probabilité d’oscillation puisque celle-ci n’acquiert aucunedépendance en fonction des éléments de la matrice ΨM. En conséquence, les phases de Majorana α21

et α31 ne sont pas discutées davantage dans cette section. Au final, les paramètres qui doivent êtredéterminés à partir des expériences d’oscillations sont les trois angles de mélange, soit θ12, θ13, θ23, laphase complexe δ et les différences de masses 4m2

21, 4m231, 4m2

32. En ce qui concerne les différencesde masses, on constate que seulement deux d’entre elles sont indépendantes puisque l’on peut écrire,

45. Puisqu’une matrice unitaire N×N respecte la condition U†U = UU† = IN , celle-ci est soumise à N contraintes de« normalisation » (la diagonale de IN ) et N(N − 1) contraintes supplémentaires pour s’assurer que celle-ci est unitaire(les 0 du triangle supérieur de IN par exemple). Il y a donc N2 contraintes possibles pour un total de 2N2 éléments réelsdans U (les parties réelles et imaginaires de chaque élément doivent être traitées séparément). Cela correspond donc àun système sous-déterminé, avec N2 paramètres libres. Cela signifie également que dans le cas de la matrice PMNS, cene sont pas toutes les phases présentes qui ont une signification physique [1, 3, 38].

25

Page 36: Phénoménologie des neutrinos dans une théorie de matrices ...

par exemple, 4m231 = 4m2

32 +4m221. Cela laisse donc au total six paramètres indépendants à fixer.

1.2.3.1 Synthèse des différentes expériences sur l’oscillation

De façon générale, ces expériences peuvent être divisées en quatre catégories selon la source d’émissiondes neutrinos. On distingue ainsi les neutrinos solaires, atmosphériques et ceux produits dans lesaccélérateurs et les réacteurs. Le but de ces expériences est de mesurer les effets non triviaux quisurviennent lorsque la distance de propagation l est différente d’un multiple entier de la longueurd’oscillation caractéristique, définie comme losc

jk ≡4πEtot4m2

jk

(la longueur pour laquelle la phase généréepar 4m2

jk est égale à 2π) [39].

Tableau 1.2 – Valeurs des différents paramètres d’oscillation (1σ) tels que présentés dans [2].

Paramètres Hiérarchie normale Hiérarchie inverse

θ12[] 33.56+0.77−0.75 33.56+0.77

−0.75

θ13[] 8.46+0.15−0.15 8.49+0.15

−0.15

θ23[] 41.6+1.5−1.2 50.0+1.1

−1.4

δ[] 261+51−59 277+40

−46

4m221[10−5eV2] 7.50+0.19

−0.17 7.50+0.19−0.17

4m231(2)[10−3eV2]** +2.524+0.039

−0.040 −2.514+0.038−0.041

**4m231(2) désigne 4m2

31 ou 4m232 selon la hiérarchie.

Les expériences notables concernant les neutrinos solaires sont, par exemple, SNO et BOREXINO, tan-dis que pour les neutrinos atmosphériques, il est question de Super-Kamiokande [2, 4, 40]. Concernantles accélérateurs, on retrouve K2K, MINOS et T2K, alors que pour les réacteurs il s’agit principale-ment de KamLAND, Daya Bay, RENO et Double Chooz. Tel que discuté dans [2], une analyse globaledes résultats de ces différentes expériences permet de construire le tableau 1.2. Évidemment, la numé-rotation des états propres de masse est arbitraire. Pour pouvoir associer les angles de mélange à desobservables physiques, il est pratique courante d’identifier

∣∣4m221∣∣ à la plus petite des deux différences

de masses [4], c’est-à-dire celle observée à partir des neutrinos solaires (νe) et du réacteur KamLAND(νe). La numérotation est choisie de telle sorte que m1 < m2, ce qui implique 4m2

21 > 0. Ce faisant,deux scénarios sont possibles, soit m1 < m2 < m3 (hiérarchie normale) ou m3 < m1 < m2 (hiérarchieinverse). Il s’ensuit que la différence de masse la plus grande,

∣∣4m231∣∣ ou ∣∣4m2

32∣∣, peut être associée aux

neutrinos atmosphériques (νµ et νµ) et à ceux produits par des accélérateurs (principalement K2K etMINOS), soit νµ. 46 Concernant le tableau 1.2, la convention utilisée dans [2] est de spécifier la valeurde 4m2

31 ou 4m232 selon celle qui a la plus grande valeur absolue. De plus, les angles de mélange sont

choisis dans le premier quadrant θij ∈[0, π2

]sans perte de généralité, alors que δ ∈ [0, 2π]. Ici, on

constate que les présentes données ne permettent pas de distinguer le type de hiérarchie que possède le46. D’un point de vue expérimental, les effets de 4m2

21 dans les expériences de neutrinos atmosphériques (ou les effetsde 4m2

31(2) dans les expériences de neutrinos solaires) ne sont pas des contributions dominantes. Ceci est dû au fait queles paramètres Etot, l et l/Etot sont très différents dans les deux cas. Par ailleurs, la production et la propagation desétats diffèrent également, ainsi que la grandeur relative entre

∣∣4m221

∣∣ ∣∣4m231(2)

∣∣ (un facteur ' 30). Cela implique,entre autres, que 4m2

31 ' 4m232 pour les deux hiérarchies.

26

Page 37: Phénoménologie des neutrinos dans une théorie de matrices ...

spectre de masses. En fait, les expériences avec les neutrinos atmosphériques ne sont pas assez sensiblespour déterminer le signe (±) de 4m2

31 car celles-ci mesurent essentiellement la probabilité de surviePνµ→νµ(l, Etot) qui devient [6], dans la limite 4m2

21 ' 0 et θ13 ' 0,

Pνµ→νµ(l, Etot) ' 1− sin2(2θ23) sin2(4m2

31l

4Etot

), (1.38)

où la paramétrisation (1.37) ainsi que l’expression (1.36) ont été utilisées pour obtenir ce résultat.On constate donc que la contribution dominante, proportionnelle à un sinus au carré, est insensibleau signe de 4m2

31. Cela signifie que les deux hiérarchies sont donc toujours possibles, car les effetssous-dominants ne sont pas mesurables à l’heure actuelle. Pour cette raison, la prochaine générationd’expériences reposant sur les accélérateurs espère pouvoir étudier plus en détail le canal d’oscillationPνe→νµ(l, Etot) (ou vice-versa) [4], ce qui donne une probabilité de transition de la forme

Pνe→νµ(l, Etot) ' sin2(2θ13) sin2(θ23) sin2(4m2

31l

4Etot

)(1.39)

dans la limite 4m221 ' 0. Ici encore, la contribution dominante est insensible au signe de 4m2

31.Cependant, les corrections liées à l’oscillation des neutrinos dans la matière sont susceptibles de modifiercette contribution et ainsi donner lieu à des effets mesurables. 47 Au final, la figure 1.1 regroupe defaçon schématique les deux spectres discutés ainsi que la composition relative des états propres demasse.

m2 m2Hiérarchie normale Hiérarchie inverse

4m231 > 0 4m2

31 < 00

m21

m22

m23

?

Sol. ' 7.50× 10−5eV2

Atm.' 2.45× 10−3eV2

0

m23

m21

m22

?

Sol. ' 7.5× 10−5eV2

Atm.' 2.44× 10−3eV2

νe

νµ

ντ

Figure 1.1 – Spectre des masses et composition des états |νk〉 selon une hiérarchie normale ou inverse.Figure adaptée de [3] avec les données du tableau 1.2.

Dans les deux scénarios, la masse du neutrino le plus léger n’est soumise à aucune contrainte. Ainsi,selon la valeur de la plus petite masse, si min(mk) ∼ 0 eV, on a m1 < m2 m3 ou m3 m1 < m2.Un troisième cas est également possible si min(mk) 0 eV (plus précisément, min(mk) ? 0.10 eV) [4],ce qui donne des masses quasi dégénérées, soit m1 ' m2 ' m3. Cependant, il s’avère beaucoup plus47. Ces effets sont donc sensibles à la hiérarchie du spectre de masses des neutrinos et diffèrent dans le cas d’antineu-

trinos.

27

Page 38: Phénoménologie des neutrinos dans une théorie de matrices ...

difficile de générer un tel cas de façon naturelle à l’intérieur des modèles existants et ce cas ne sera pastraité dans ce présent travail.

1.2.3.2 Limites sur les grandeurs absolues

Afin de clore cette sous-section, mentionnons brièvement quelques résultats concernant les limitesconnues sur les grandeurs absolues des masses. Pour obtenir de l’information sur les paramètres qui nesont pas reliés aux expériences en lien avec le phénomène d’oscillation tels que la grandeur des masseset les phases de Majorana, il faut recourir aux mesures directes des tests de cinématique [41], à ladouble désintégration bêta sans neutrino (ββ0ν) [42] et à la cosmologie [15]. Concernant l’échelle degrandeur des masses, les résultats associés à ces expériences ne donnent qu’une limite supérieure surcelles-ci. Par exemple, les expériences Troitzk et Mainz ont obtenu respectivement [4]

mνe < 2.05 eV (Troitzk) mνe < 2.3 eV (Mainz). (1.40)

Celles-ci font partie des tests de cinématique et génèrent la limite la moins contraignante obtenue àce jour. Il s’avère également possible d’obtenir une limite sur la somme des masses pour restreindredavantage l’intervalle permis. Les collaborateurs de l’expérience Planck [43] ont publié leur contraintesur cette somme en combinant différentes données (qui inclut celles de WMAP), ce qui donne

3∑k=1

mk < 0.23 eV. (1.41)

Le point important ici est de noter que ces mesures impliquent une échelle d’énergie pour les masses del’ordre de l’électronvolt (eV) ou moins, ce qui contraste fortement avec les masses connues des leptonschargés (un facteur d’environ 106 par rapport à la masse de l’électron et 109 par rapport à la massedu tau) et des quarks. La prochaine section est donc dédiée aux mécanismes permettant de générerles masses des fermions à l’intérieur du modèle standard de façon à bien saisir les limitations actuellesen ce qui concerne le neutrino. Celle-ci sert également d’introduction aux mécanismes seesaw, qui sontconsidérés être parmi les meilleurs candidats pour générer naturellement de petites masses pour lesneutrinos.

1.3 Les origines de la masse dans une théorie de jauge

Les symétries du modèle standard jouent un rôle fondamental dans la compréhension et la constructiond’un mécanisme permettant d’expliquer les différentes masses observées des particules élémentaires.Dans ce contexte, l’invariance du lagrangien sous une transformation de jauge locale (la transformation(1.14) dans le cas du secteur électrofaible) constitue le point d’appui sur lequel repose l’ensemble desinteractions connues, ainsi que les propriétés des bosons de jauge qui les transmettent. Puisque cemodèle contient uniquement des fermions de Dirac pour décrire la matière, le terme de masse adéquatpour les leptons chargés et les quarks doit donc être de la forme (1.5). Par ailleurs, comme ce termede masse a pour fonction de coupler les deux chiralités présentes dans un champ fermionique, la massepeut donc être interprétée comme la constante qui indique la force de ce couplage. Cependant, enraison de ce couplage particulier, ce terme de masse n’est pas compatible avec le formalisme invariantde jauge du secteur électrofaible (les champs de chiralité gauche et droite appartiennent à des multiplets

28

Page 39: Phénoménologie des neutrinos dans une théorie de matrices ...

du groupe de jauge qui se transforment différemment, soit un doublet et un singulet dans ce cas-ci),tel qu’il en a été fait mention au début de ce chapitre. Pour cette raison, aucun terme de massefermionique ne peut être présent directement dans le lagrangien (1.13), puisque cela introduirait unebrisure explicite de la symétrie électrofaible (il en va de même pour les termes de masse des bosonsde jauge, qui ne se transforment pas de façon appropriée). Bien entendu, il existe un moyen beaucoupplus subtil de générer ces termes à partir du lagrangien (1.13), comme le suggère la présence desdifférents couplages avec le champ Φ(x). Ainsi, pour reproduire avec succès les résultats observés dansle contexte d’une théorie de jauge, un nouveau mécanisme a été élaboré au début des années 1960,nécessitant l’introduction d’un champ scalaire complexe aux propriétés spécifiques. Le champ de HiggsΦ(x), présent dans tout l’espace et dont l’excitation produit le boson de Higgs, constitue en effetun ingrédient essentiel pour obtenir un mécanisme universel permettant de générer les masses desparticules élémentaires tout en respectant les symétries du modèle standard. La construction la plussimple de ce champ bosonique (dans une représentation de dimension deux), qui doit posséder quatredegrés de liberté, requiert ainsi deux composantes scalaires complexes φ+(x) et φ0(x) placées dans undoublet d’isospin ayant les propriétés décrites au tableau 1.3.

Tableau 1.3 – Propriétés du doublet de Higgs.

Doublet de Higgs I I3 Y Q

Φ(x) =(φ+(x)φ0(x)

)= 1√

2

(φ1(x) + iφ2(x)φ3(x) + iφ4(x)

)1/2 1/2 1 1

-1/2 0

Ici, I, I3, Y et Q sont définis tel qu’au tableau 1.1. Ces propriétés spécifiques décrivent la structurela plus simple permettant de rendre les bosons de jauge W± et Z0 (de même que le Higgs lui-même)massifs à la suite d’une brisure spontanée de la symétrie électrofaible (tel que SU(2)L⊗U(1)Y → U(1)Q)et ainsi reproduire adéquatement leurs propriétés dans cette limite (ceux-ci sont obtenus à partir dela quatrième ligne du lagrangien (1.13)). Dans le cas des fermions, puisque ce champ peut se coupler àtous les quarks et les leptons, leur masse est également sensible à cette brisure de symétrie et est doncgénérée par les lignes 5 à 7 du lagrangien (1.13), ce qui permet d’obtenir le terme de masse appropriédans la limite des basses énergies.

1.3.1 Le mécanisme de Higgs

De façon à bien saisir comment étendre le modèle standard afin de donner une masse aux neutrinos, ils’avère nécessaire, dans un premier temps, de détailler le mécanisme de Higgs et d’étudier la manièredont les leptons et les bosons de jauge se couplent au champ de Higgs pour obtenir leur masse. Le casdes quarks, qui est complètement analogue à celui des leptons chargés, ne sera pas discuté davantage.Le point de départ est bien sûr le lagrangien (1.13). Plus précisément, la contribution d’intérêt est

LHiggs = (DρΦ)†DρΦ− µ2Φ†Φ− λ(Φ†Φ)2, (1.42)

où l’on définit V (Φ) ≡ µ2Φ†Φ + λ(Φ†Φ

)2 comme le potentiel de Higgs, ce qui forme la base dumodèle de Weinberg-Salam [10]. Le lagrangien (1.13) demeure valide, en principe, pour une échelled’énergie arbitrairement élevée et décrit un univers hautement symétrique quelques instants après leBig Bang. Cependant, puisque notre univers s’est considérablement refroidi depuis, le champ de Higgs

29

Page 40: Phénoménologie des neutrinos dans une théorie de matrices ...

est donc maintenant confiné à son état d’énergie minimale. Cela a de profondes répercussions physiquespuisque cet état d’énergie minimale possède une valeur moyenne non nulle dans le vide (VEV, Vacuumexpectation value) qui introduit une brisure de la symétrie électrofaible. Conséquemment, pour quele lagrangien de Higgs (1.42) reflète la physique telle qu’observée à basse énergie et ainsi obtenir lespectre complet de cette théorie, l’idée se résume à pouvoir écrire, sans perte de généralité, le champΦ(x) comme une petite perturbation h(x) autour d’un minimum stable du potentiel V (Φ) (l’état duvide), où h(x) correspond donc à un état excité de ce champ, soit le boson de Higgs. Pour ce faire,la forme du potentiel a donc été choisie de façon à obtenir l’expression la plus simple permettantdes interactions dans une théorie de jauge renormalisable. Dans ce cas-ci, pour que V (Φ) possèdeun minimum bien défini, cela implique λ > 0 (condition de stabilité de l’état du vide). De plus, ceminimum est sensible au signe de µ2 et le cas intéressant correspond au choix µ2 < 0 puisque dans cecas, une simple réécriture du potentiel, soit

V (Φ) = λ

(Φ†Φ− v2

2

)2

⇒ ∂

∂ΦV (Φ) = 2λ(

Φ†Φ− v2

2

)Φ∗ où v2 ≡ −µ

2

λ, (1.43)

permet de constater que le minimum ne se situe plus à Φ†Φ = 0 mais bien à

Φ†Φ = 12(φ2

1 + φ22 + φ2

3 + φ24)

= v2

2 , avec ∂

∂ΦV (Φ)∣∣∣∣Φ†Φ= v2

2

=(

00

). (1.44)

Ici, v ' 246 GeV (mesurée expérimentalement) est la valeur moyenne du champ de Higgs dans levide et le terme constant v4

4 dans V (Φ) à l’expression (1.43) est négligeable puisqu’un lagrangien esttoujours défini à une constante près. En d’autres mots, le fait qu’il existe une infinité de minimumsdégénérés sur un rayon v 6= 0 implique que de choisir un tel minimum (ce qui fixe une directionprivilégiée dans cet espace) brise spontanément la symétrie de jauge du lagrangien et cette brisureest responsable de l’apparition de termes de masse pour les bosons de jauge et les fermions. 48 Pourécrire correctement le champ de Higgs lorsque celui-ci prend la valeur qui minimise le potentiel, ilfaut spécifier la direction (dans l’espace d’isospin) selon laquelle le champ prend cette valeur. Puisquel’on peut toujours fixer la jauge de manière à éliminer les degrés de liberté non physiques susceptiblesd’émerger à la suite d’une brisure spontanée de la symétrie électrofaible dans une jauge arbitraire,le choix (φ1 = φ2 = φ4 = 0, φ3 = v) est adopté, ce qui définit la jauge unitaire. Cela permet d’écrirel’état d’énergie minimale comme

Φ0 = 1√2

(0v

), (1.45)

qui respecte les propriétés du vide mentionnées précédemment. En travaillant directement dans lajauge unitaire, le doublet de Higgs peut donc s’écrire comme une petite perturbation h ≡ h(x) autourde ce minimum, c’est-à-dire

Φ(x) = 1√2

(0

v + h

). (1.46)

48. Une seule composante du doublet de Higgs obtient un VEV (la composante électriquement neutre), le groupede symétrie SU(2)L est donc brisé spontanément par l’état du vide. De plus, la présence de ce champ dans le videavec une hypercharge Y 6= 0 implique que la symétrie U(1)Y est également brisée. Cependant, puisque le vide demeureélectriquement neutre, un sous-ensemble de ce groupe de symétrie est préservé, soit la symétrie U(1)Q. Le champ scalaireneutre φ0(x) du doublet de Higgs est donc le seul qui peut avoir un VEV non nul puisque le vide est électriquementneutre. De plus, le choix d’une valeur non nulle de v pour ce champ est essentiel afin de préserver le groupe de symétrieU(1)Q qui assure un photon (particule neutre) sans masse et la conservation de la charge électrique.

30

Page 41: Phénoménologie des neutrinos dans une théorie de matrices ...

L’étape final consiste alors à exprimer le lagrangien (1.42) en fonction de la perturbation (1.46).

1.3.1.1 Masse des bosons de jauge

En utilisant la définition de la dérivée covariante (1.17) et les propriétés du tableau 1.3, on obtient,

DµΦ =(I2∂µ + i

2

(gw

3∑a=1

W aµσ

a + I2g′wBµ))

Φ

= 1√2

(∂µ + i

2 (gwW 3µ + g′wBµ) igw

2 (W 1µ − iW 2

µ)igw2 (W 1

µ + iW 2µ) ∂µ − i

2 (gwW 3µ − g′wBµ)

)(0

v + h

)= 1√

2

( igw2 (W 1

µ − iW 2µ)(v + h)(

∂µ − i2 (gwW 3

µ − g′wBµ))

(v + h)

). (1.47)

À partir de ce résultat, et sachant que le potentiel prend la forme suivante V (Φ) = λv2h2 +λvh3 + λ4h

4,cela permet d’écrire

LHiggs = 12∂µh∂

µh+ g2wv

2

4 W−µ W+µ + v2(g2

w + g′2w)8 ZµZ

µ + g2wv

2 W−µ W+µh (1.48)

+v(g2w + g′2w)

4 ZµZµh+ g2

w

4 W−µ W+µh2 + (g2

w + g′2w)8 ZµZ

µh2 − λv2h2 − λvh3 − λ

4h4,

où les combinaisons linéaires (1.21) ont été utilisées, de même que

Zµ = 1√g2w + g′2w

(gwW 3µ − g′wBµ), Aµ = 1√

g2w + g′2w

(gwW 3µ + g′wBµ), (1.49)

ce qui définit les champs du boson Z0 et du photon. 49 Puisque la structure du terme de masse pourun champ bosonique réel est toujours de la forme 1

2 (masse)2 × (champ)2, on peut identifier les massessuivantes à partir du lagrangien (1.48), soit 50

mh =√

2λv, mW± = gwv

2 , mZ0 = v

2√g2w + g′2w , mA = 0. (1.50)

Les masses des bosons de jauge du secteur électrofaible, ainsi que celle du Higgs, sont donc exprimées enfonction des quatre paramètres libres de ce modèle, soit gw, g′w, µ et λ. Cependant, aucune prédictionn’est faite sur les valeurs numériques de ceux-ci à partir du modèle standard, ils doivent donc êtredéterminés expérimentalement. Enfin, il est important de garder à l’esprit que le lagrangien (1.48) estexactement le même que celui décrit à l’expression (1.42). En principe, les mêmes prédictions physiquespeuvent être obtenues dans les deux cas. Cependant, dans le but d’utiliser la théorie des perturbationspour extraire ces prédictions, le champ Φ a été développé à partir d’un minimum du potentiel oùcelui-ci adopte une valeur moyenne non nulle qui brise la symétrie de jauge, ce qui a eu pour effet demasquer cette symétrie dans l’expression (1.48). De plus, un simple décompte des degrés de liberté

49. Ces combinaisons particulières pour les champs neutres auraient également émergé des interactions de type CN sicelles-ci avaient été considérées à la section 1.2. Dans ce cas, on constate que puisque le boson Z0 se couple aux deuxtypes de chiralité (en proportion différente), celui-ci n’aurait pas pu être simplement associé au champ W 3

µ de SU(2)Lcar ce champ se couple uniquement aux particules de chiralité gauche. Ce raisonnement s’applique également au champdu photon, qui implique un courant électromagnétique se couplant aux deux types de chiralité en proportion égale.50. Il est bon de préciser que dans le cas des bosons W±, qui sont des champs bosoniques complexes (voir (1.21)), le

terme de masse est simplement m2W±

W−µ W+µ [12]. De plus, en exprimant les champs W±µ en termes des champs réels

W 1µ et W 2

µ , on retrouve bien le terme de masse usuel, soit m2W±

W−µ W+µ =

m2W±2

(W 1µW

1µ +W 2µW

2µ).

31

Page 42: Phénoménologie des neutrinos dans une théorie de matrices ...

scalaires avant et après la brisure spontanée de cette symétrie permet de constater que trois d’entreeux ont été « mangés » pour donner une composante de polarisation longitudinale aux bosons W± etau Z0 (leur masse) alors que le dernier a permis de faire émerger un boson de Higgs massif.

1.3.1.2 Masse des leptons chargés

Puisque ce mécanisme décrit convenablement les degrés de liberté physique du secteur électrofaible,on peut donc maintenant en étendre la portée aux fermions du modèle standard. Une fois de plus,l’idée est de construire un terme invariant de jauge (un singulet sous SU(2)L ⊗ U(1)Y ) qui couple lesfermions au champ de Higgs. Dans le cas des leptons chargés, celui-ci prend la forme

L`± = −∑

α,β=e,µ,τ

(Y lαβLαΦ`βR + Y l∗

βα`βRΦ†Lα), (1.51)

ce qui correspond à la cinquième ligne du lagrangien (1.13). Cette forme particulière permet de consta-ter qu’à la suite d’une brisure spontanée de la symétrie électrofaible, c’est-à-dire la substitution de(1.46) dans (1.51), on obtient

L`± = − 1√2

∑α,β=e,µ,τ

(Y lαβ`αL(v + h)`βR + Y l∗

βα`βR(v + h)`αL)

= −(`LM

l`R + `RM l†`L)− h√

2(`LY

l`R + `RY l†`L), (1.52)

où M l ≡ v√2Y

l est la matrice de masse des leptons chargés et où les définitions (1.24) ont été utilisées.Une simple comparaison permet ainsi de constater que le terme proportionnel à v de l’expressionprécédente, bien qu’écrit sous forme matricielle pour tenir compte des trois générations, possède à peude chose près la même forme que le terme de masse de l’expression (1.5). Ainsi, pour obtenir les massesil suffit de diagonaliser la matrice Y l qui contient les constantes de couplage de Yukawa. En se référantà la transformation biunitaire Y l = U l

LylU l†R discutée précédemment, cela permet d’écrire

L`± = − v√2

(`LU

lLy

lU l†R `R + `RU l

RylU l†L `L

)− h√

2

(`LU

lLy

lU l†R `R + `RU l

RylU l†L `L

)= −

(˜Lm

l˜R + ˜

Rml˜L

)− h√

2

(˜Ly

l˜R + ˜

Ryl˜L

), (1.53)

où ml est une matrice diagonale, réelle et non négative (voir annexe A), ce qui implique que les massesdes leptons chargés sont simplement données par la relation

mlα = v√

2ylα, α = e, µ, τ. (1.54)

Comme dans le cas des bosons de jauge, ces masses ne sont pas une prédiction du modèle standardpuisque les paramètres libres yl

e, ylµ et yl

τ sont inconnus et doivent donc être fixés expérimentalement.De plus, puisque la relation de proportionnalité en v est essentiellement la même que celle des bosonsW±, il serait donc naturel, par exemple, de s’attendre au même ordre de grandeur pour la masse del’électron. Cependant, la masse de l’électron est beaucoup plus petite que celle des W± (un facteur del’ordre de ∼ 106) et la constante de couplage yl

e doit être ajustée par le processus de renormalisationpour accommoder un tel résultat. Le modèle standard permet donc un électron de faible masse mais

32

Page 43: Phénoménologie des neutrinos dans une théorie de matrices ...

ne peut pas expliquer cet ordre de grandeur [8]. De façon plus générale, on constate que dans le cas desbosons de jauge comme des leptons chargés, la valeur de v fixe l’échelle d’énergie des masses résultantes.Finalement, une dernière remarque d’intérêt concerne la position de v dans le doublet (1.45). Puisque lavaleur moyenne du champ de Higgs dans le vide occupe la position inférieure, cela implique qu’il s’avèreimpossible de générer un terme de masse à partir de ce champ pour les neutrinos où les quarks de type« up ». De plus, en regardant les propriétés d’un produit de la forme Qjqu

β (tableau 1.1), on constateque dans le cas des quarks de type « up », le champ requis pour obtenir cette combinaison particulièredoit avoir une hypercharge de −1 pour générer un singulet. Ainsi, il faut pouvoir construire un champqui se transforme comme un doublet d’isospin et dont les composantes inférieure et supérieure sontinversées par rapport au champ d’origine (Φ). Pour ce faire, il s’avère possible d’utiliser le champ deHiggs conjugué [1, 3], défini comme Φ ≡ iσ2Φ∗. Sous la transformation (1.14), on obtient que

Φ→ Φ′ = iσ2e− i2 (α(x)·σ∗+η(x))Φ∗ = iσ2e− i

2 (α(x)·σ∗+η(x))σ2σ2Φ∗

= (σ2e− i2 (α(x)·σ∗+η(x))σ2)iσ2Φ∗ = e− i

2σ2(α(x)·σ∗+η(x))σ2

Φ

= e− i2 (α(x)·σ2σ∗σ2+η(x))Φ = e i

2 (α(x)·σ−η(x))Φ, (1.55)

où les relations (σ2)2 = I2, V eXV −1 = eV XV −1avec V inversible et σ2σ∗σ2 = −σ ont été utilisées. Àpartir du résultat (1.55), on peut donc constater que ce champ se transforme bien comme un doubletd’isospin faible avec une hypercharge Y = −1, ce qui correspond au résultat souhaité. Le champ Φpeut donc s’écrire, dans la jauge unitaire

Φ =(φ0∗

−φ−)

= 1√2

(v + h

0

), (1.56)

ce qui permet de générer le terme de la dernière ligne du lagrangien (1.13). Naturellement, une telleprocédure ne peut être employée pour le neutrino puisque celui-ci ne possède pas de composante dechiralité droite, ce qui est essentiel pour obtenir un terme de masse de Dirac de la forme (1.53).

1.3.2 Neutrinos massifs et extension minimale du modèle standard

Les notions théoriques survolées jusqu’à présent sont suffisantes, en principe, pour entreprendre laconstruction d’extensions viables du modèle standard offrant une description plus réaliste des neutrinos.En considérant uniquement le contenu et les symétries du modèle standard original, cela a permis deconstater qu’un terme de masse de Dirac pour les neutrinos est impossible sans la présence de neutrinosdroits. Il s’agit, en fait, de l’obstacle le plus apparent et le plus souvent évoqué dans la littérature pourexpliquer l’absence de masse. Cependant, cette approche ne constitue pas la seule façon de donnerune masse aux neutrinos puisqu’en admettant une violation du nombre leptonique, un terme de massede Majorana, qui ne requiert qu’une seule chiralité, serait en principe envisageable pour les neutrinosgauches. En se référant au contenu en champs du modèle standard actuel, qui implique que le secteurdu Higgs contient seulement un doublet ayant les propriétés définies au tableau 1.3, la combinaison dechamps possédant la dimension la plus basse qu’il s’avère possible de construire pour atteindre ce but(tout en préservant l’invariance de jauge) est de la forme

LνL = − 1Λ

∑α,β=e,µ,τ

(KαβLcαΦ∗Φ†Lβ +K∗βαLβΦΦTLcα

), (1.57)

33

Page 44: Phénoménologie des neutrinos dans une théorie de matrices ...

ce qui permet de constater que ce nouveau couplage entre les champs est de dimension 5. 51 Ici, Kαβ

sont des constantes de couplage sans unité et Λ est un paramètre ayant des unités d’énergie pour as-surer que la densité lagrangienne soit de dimension 4 au total (ce paramètre peut donc être interprétécomme l’échelle d’énergie à laquelle la conservation du nombre leptonique n’est plus respectée). Bienque le terme (1.57), à la suite d’une brisure spontanée de la symétrie électrofaible, produise un termede masse ayant la structure (1.12), celui-ci n’est pas permis dans le modèle standard puisqu’il ne res-pecte pas le critère de renormalisation (les couplages de dimension d > 4 ne sont pas renormalisables).La présence d’un tel terme dans le lagrangien (1.13) rabaisserait ainsi le modèle standard au statutde théorie efficace et pour cette raison, ce type de contribution est rarement considéré. Ces quelquesexemples permettent ainsi d’illustrer le rôle des contraintes présentes et de mieux cerner les obstaclesqui doivent être contournés pour donner une masse aux neutrinos. Comme mentionné précédemment,en raison du contenu en particules, de la symétrie de jauge et du critère de renormalisation, les neu-trinos demeurent sans masse. Par ailleurs, ce résultat tient à tous les ordres perturbatifs et égalementlorsque des effets non perturbatifs sont pris en compte puisque ce modèle possède la symétrie globale« accidentelle » B − L, ce qui suggère en quelque sorte que la masse des neutrinos est connectée à labrisure de cette symétrie [44]. Comme le contenu en particules constitue l’unique contrainte qui peutêtre assouplie et modifiée sans déclencher une profonde révolution en physique des particules, seules lesextensions qui peuvent tirer profit de l’ajout de nouveaux degrés de liberté tout en préservant les deuxdernières contraintes sont considérées comme « réalistes » dans le contexte de ce travail. Finalement,des constantes de couplage complexes sont considérées pour l’ensemble des extensions étudiées, ce quiconstitue un scénario plus réaliste et permet une violation explicite de la symétrie CP dans le secteurdes neutrinos (de façon analogue à celle observée dans le secteur des quarks du MS). 52

1.3.2.1 Masse de Dirac

Il semble donc que la première étape permettant d’introduire une masse pour les neutrinos est d’in-corporer trois générations de neutrinos droits au modèle standard. Ceux-ci sont étiquetés ν1R, ν2R etν3R dans la base des masses et νs1R, νs2R et νs3R dans la base des saveurs. Cela génère ce qui estappelé l’extension minimale, où l’asymétrie entre le secteur des quarks et des leptons est éliminée.Comme ces nouvelles contributions, dites stériles, 53 ne sont pas requises par les interactions connuesdu modèle standard, celles-ci peuvent être introduites en tant que singulets sous toutes les chargesde ce modèle (isospin nul, hypercharge nulle, etc.), soit la représentation la plus simple possible. Celaimplique, dans le cas présent, que les neutrinos droits interagissent avec la matière seulement par leursinteractions gravitationnelles. Le modèle standard admet maintenant de nouveaux couplages de Yu-kawa pour les trois générations de neutrinos, ce qui permet d’ajouter au lagrangien (1.13) un terme51. Il est important de préciser ici que la notation utilisée au lagrangien (1.57) implique Lcα = CLTα , ce qui est différent

de la définition du doublet conjugué Φ introduite à l’expression (1.55). Comme ce fut le cas jusqu’à présent, les opérationsqui concernent les champs spinoriels, lorsqu’appliquées sur un multiplet de SU(2)L, affectent seulement les composantesde ce multiplet (les champs de Weyl).52. À ce jour, la question à savoir si la symétrie CP est préservée ou non dans le secteur leptonique des interactions

faibles demeure un problème ouvert [21]. Cependant, la mesure d’une phase de Dirac (δ) non nulle, qui est un paramètrede la matrice PMNS (voir tableau 1.2), suggère en effet que le secteur des neutrinos pourrait être une source de brisurede la symétrie CP , ce qui implique des paramètres complexes pour la matrice de Yukawa. Par ailleurs, il est importantde garder à l’esprit que dans des théories au-delà du MS, il faut également considérer la possibilité que la violation dela symétrie CP puisse être un phénomène confiné uniquement aux basses énergies, impliquant que la théorie à hauteénergie serait invariante sous cette transformation (des extensions du MS pourraient être construites avec des couplagesde Yukawa réels pour les leptons par exemple). Dans ce cas, on parle plutôt de la nécessité d’introduire un mécanismede brisure spontanée de la symétrie CP dans des modèles de saveur plus élaborés [21].53. En opposition à actifs pour les neutrinos gauches, qui participent aux interactions faibles.

34

Page 45: Phénoménologie des neutrinos dans une théorie de matrices ...

ayant la même structure que celui des quarks de type « up ». La combinaison invariante de jauge pourles trois générations de neutrinos s’écrit ainsi comme

LD = −∑α,β

(Y ναβLαΦνβR + Y ν∗βανβRΦ†Lα

), (1.58)

où α = e, µ, τ , β = s1, s2, s3 et où Y ν est une matrice complexe 3 × 3 contenant les constantesde couplage de Yukawa pour le secteur des neutrinos. En suivant le même raisonnement que celuiprésenté dans le cas des leptons chargés et en considérant seulement la partie proportionnelle à v, celapermet d’écrire le terme de masse suivant

LD 3 −v√2∑α,β

(Y ναβναLνβR + Y ν∗βανβRναL

)= −(νLMDνR + νRMD†νL). (1.59)

Ici, l’expression (1.59) tire profit de la notation matricielle, où l’on définit le vecteur νR de la mêmemanière que ceux introduits précédemment (voir éq. (1.24)). De plus, la notation standard qui impliquede définir MD ≡ v√

2Yν est utilisée, où MD est la matrice de masse de Dirac (bien entendu, ce

terme de masse préserve le nombre leptonique total L dû à la présence d’une symétrie globale U(1)dans le lagrangien). Afin de pouvoir identifier les masses des champs physiques νk, il faut donc dansun premier temps diagonaliser la matrice de couplage Y ν par une transformation biunitaire de laforme Y ν = UνLy

νUν†R , où yν est une matrice diagonale, réelle et non négative. En substituant cettetransformation dans (1.59), on obtient

LD 3 −v√2

(νLU

νLy

νUν†R νR + νRUνRyνUν†L νL

)= −

(νLm

DνR + νRmDνL). (1.60)

Par conséquent, la matriceMD a bien été diagonalisée et les valeurs propresmDk = v√

2yνk définissent les

masses des neutrinos. Il s’agit donc d’un terme de masse parfaitement viable et la matrice Y ν permetd’obtenir une base dans laquelle les neutrinos ont une masse bien définie. Ceci dit, le modèle n’offreaucune prédiction sur les constantes de couplage de Yukawa yνk . De plus, il est possible de constaterque la relation de proportionnalité en v est la même que celle des leptons chargés et des quarks. Celaimplique donc, en principe, que l’on doit s’attendre à ce que la masse des neutrinos soit du même ordrede grandeur que celle des quarks de type « up », à moins que le modèle puisse expliquer naturellementle faible couplage requis yνk ' 10−13 pour obtenir le bon ordre de grandeur, ce qui n’est pas le cas. 54

Ce terme de masse, à lui seul, n’est donc pas considéré comme un modèle complet et satisfaisant pourexpliquer la masse des neutrinos. Par ailleurs, en raison des propriétés des neutrinos droits discutéesprécédemment, il s’avère qu’un terme de masse additionnel, de type Majorana, est également possiblepour ceux-ci, ce qui offre de nouvelles possibilités qui doivent être explorées.

1.3.2.2 Masse de Majorana

Puisque les neutrinos de chiralité droite ont été introduits comme des singulets de SU(3)c ⊗ SU(2)L ⊗U(1)Y , ceux-ci ne sont pas contraints par les symétries du modèle standard. Cela implique, entre autres,que leur nombre de générations et leur masse peuvent en fait être arbitrairement grands. De plus, cela54. Le qualificatif « naturel » est utilisé fréquemment en physique des particules lors de la construction de modèles

ou de théories efficaces. En fait, ce critère formulé par ’t Hooft [45] implique que pour toute échelle d’énergie Λ, unparamètre physique ou un ensemble de paramètres physiques αi(Λ) peuvent prendre des valeurs arbitrairement petitesseulement si la substitution αi(Λ) = 0 augmente les symétries du système.

35

Page 46: Phénoménologie des neutrinos dans une théorie de matrices ...

signifie qu’un terme de masse Majorana pour les neutrinos droits ne brise aucune symétrie locale eton peut donc envisager la présence d’un tel terme dans le lagrangien de cette extension minimale aumodèle standard. En s’appuyant sur la discussion de la section 1.1, on peut écrire un terme de massepour un champ de Majorana comme

LM = −12∑β,ρ

(νcρRM

RρβνβR + νβRM

R∗βρ ν

cρR

)= −1

2(νcRM

RνR + νRMR†νcR), (1.61)

où ρ, β = s1, s2, s3. Ici, MR est une matrice symétrique complexe 3 × 3 contenant les paramètres decouplage dans la base des saveurs, ce qui produit les masses de type Majorana pour les neutrinos droitsune fois diagonalisée. Par ailleurs, puisque ces champs ne sont pas sensibles à la brisure spontanée dela symétrie électrofaible, aucun couplage avec le Higgs n’est requis et la contribution (1.61) peut êtreajoutée directement au lagrangien (1.13). Pour vérifier que la matrice MR est bien symétrique, ce quiconstitue une propriété importante lors du calcul de mesures en théorie des matrices aléatoires, onpeut débuter en prenant la transposée de l’équation (1.61) puisque d’un point de vue matricielle, cetteexpression est simplement un nombre (un scalaire de Lorentz) et que celui-ci doit demeurer inchangésous cette opération (un nombre est toujours trivialement égal à sa transposée). Par exemple, avec lacombinaison νRMR†νcR, on obtient

νRMR†νcR =

(νRM

R†νcR)T = −

(CνRT

)T (MR†)T νRT = −νRCT

(MR†)T νRT

= −νR(MR†)T CTνRT = νR

(MR†)T CνRT = νR

(MR†)T νcR, (1.62)

ce qui implique la conditionMR† =(MR†)T et donc, par le fait même, queMR est égale à sa transpo-

sée, ce qui définit une matrice symétrique. Dans un premier temps, un signe (−) a été introduit pourcompenser la permutation de champs fermioniques (qui anticommutent) sous l’opération de transpo-sée. Ensuite, l’identité CT = −C a été utilisée ainsi que le fait que C est appliqué uniquement sur lechamp fermionique, ce qui permet de le « passer au travers » de la matrice de masse, qui est constante.De plus, la présence de ce terme dans le lagrangien du modèle standard étendu implique que l’échellede grandeur des paramètres contenus dans MR (une quantité invariante de jauge) est pratiquementlibérée de toutes contraintes et par conséquent, peut être aussi élevée que l’échelle d’énergie de lathéorie de grande unification (∼ O(1016) GeV). Pour obtenir les masses, il faut donc une fois de plusappliquer le processus de diagonalisation sur MR. Dans le cas d’une matrice symétrique complexe,celle-ci peut être diagonalisée à partir d’une seule matrice unitaire, c’est-à-dire une combinaison de laforme UTRMRUR = mR, où les éléments de la diagonale mR

k sont des masses réelles et non négatives(voir l’annexe A pour la diagonalisation d’une matrice symétrique complexe). De plus, puisqu’un termede masse de Majorana ne conserve pas le nombre leptonique total (ce terme n’est pas invariant sousune transformation de jauge globale νR → ν′R = eiLθνR), la symétrie B−L est donc brisée. Par ailleurs,ce terme de masse, à lui seul, décrit un secteur où les chiralités sont donc complètement découplées etoù seulement les neutrinos droits obtiennent une masse. Une fois de plus, il ne s’agit pas d’un scénariotrès réaliste. Cependant, un phénomène intéressant se produit lorsque ce terme de masse est combinéau terme de masse de Dirac discuté précédemment, ce qui est à l’origine du mécanisme seesaw de typeI. En fait, une fois les neutrinos droits introduits, toutes les contributions à la masse qui sont permisesdoivent être considérées sur un même pied d’égalité et les deux termes de masse discutés doivent doncêtre ajoutés simultanément au lagrangien (1.13) pour obtenir un modèle adéquat.

36

Page 47: Phénoménologie des neutrinos dans une théorie de matrices ...

1.3.3 Mécanismes seesaw

En poursuivant le raisonnement amorcé à la sous-section précédente, qui a permis d’obtenir un aperçudes différentes subtilités liées à l’introduction de différents termes de masse pour les neutrinos, il s’avèremaintenant possible d’entreprendre l’élaboration d’un formalisme plus complet dédié à l’inclusion dedegrés de liberté « lourds » au modèle standard. Dans le but de générer des neutrinos actifs de faiblemasse (comparable aux limites expérimentales) de façon naturelle à l’intérieur des contraintes existantes(l’invariance de jauge et le critère de renormalisation), les mécanismes seesaw de type I, II, et III fontappel au principe selon lequel les quantités invariantes de jauge (la masse des nouvelles particules),qui ne sont protégées par aucune symétrie du MS, sont beaucoup plus grandes que l’échelle d’énergiede la brisure de la symétrie électrofaible. Dans ce contexte, la présence de ces deux échelles d’énergiefondamentales s’avère être un atout important puisqu’il devient alors possible de tirer profit du grandécart entre celles-ci pour justifier certaines approximations permettant de révéler la forme particulièredes matrices de masse dans la limite des basses énergies [6, 46].

1.3.3.1 Type I

Jusqu’à présent, seuls les neutrinos de chiralité droite ont été introduits et les propriétés des deuxtermes de masse permis par les contraintes du MS ont été examinées séparément. Comme le suggère ladiscussion précédente, le mécanisme seesaw le plus simple repose donc sur un terme de masse hybridequi contient à la fois une masse de Dirac et une masse de Majorana (dans la base des interactions, oubase des saveurs, c’est-à-dire la base où le courant chargé est diagonal). Fait intéressant, l’idée de basederrière ce mécanisme est apparue pour la première fois dans une note en bas de page d’un article deFritzsch, Gell-Mann et Minkowski en 1975 [47]. Dans cette extension minimale du MS, les couplagesinvariants de jauge les plus généraux possibles pour le secteur des neutrinos s’écrivent donc comme

LνR =∑β

νβRi/∂νβR −∑α,β

(Y ναβLαΦνβR + Y ν∗βανβRΦ†Lα

)−1

2∑β,ρ

(νcρRM

RρβνβR + νβRM

R∗βρ ν

cρR

). (1.63)

Bien entendu, lorsque de nouveaux degrés de liberté sont ajoutés au lagrangien (1.13), les termescinétiques correspondants sont également inclus pour obtenir une description complète. Cependant,comme ces termes ne jouent aucun rôle particulier dans la compréhension de ce mécanisme, ceux-cisont simplement sous-entendus dans la discussion qui suit, sans être mentionnés explicitement. Ainsi,une fois la brisure de la symétrie électrofaible accomplie, le terme de masse suivant est obtenu

LνR 3 −(νLM

DνR + νRMD†νL)− 1

2(νcRM

RνR + νRMR†νcR), (1.64)

où seulement MD est proportionnelle à v (MR demeure inchangée par cette action). De façon à bieninterpréter les conséquences phénoménologiques de ce terme de masse, l’expression (1.64) peut êtreréécrire sous une forme matricielle plus compacte. Par exemple, on peut vérifier que la construction

LνR 3 −12(νL, νcR

)( 0 MD(MD

)TMR

)(νcLνR

)+ c.h., (1.65)

37

Page 48: Phénoménologie des neutrinos dans une théorie de matrices ...

où c.h. représente les conjugués hermitiens, retombe bien sur l’expression (1.64) sachant que

νcR(MD)TνcL = (−νTRC†(MD)TCνLT )T = νLMDνR, (1.66)

car CγTµ C† = −γµ. Par ailleurs, l’élément nul de la matrice de l’expression (1.65) reflète le fait qu’auniveau fondamental, il n’y a pas de matrice de masse de Majorana pour les neutrinos gauches dansce modèle (pour les raisons évoquées précédemment). De plus, l’expression (1.65) possède la structured’un terme de masse de Majorana puisque l’on peut définir, dans cette nouvelle base

ψν ≡(νLνcR

), M ≡

( 0 MD(MD

)TMR

), ⇒ LνR 3 −

12(ψνMψcν + ψcνM

†ψν), (1.67)

où M est la matrice de masse symétrique 6 × 6 de l’équation (1.65) et ψν est le vecteur à 6 compo-santes contenant les champs qui se transforment comme un spineur de chiralité gauche. Pour être enmesure de générer un terme de masse de type Majorana pour les neutrinos gauches et ainsi obtenir lesprédictions du mécanisme seesaw de type I, l’approche conventionnelle consiste à diagonaliser M parblocs en supposant des échelles d’énergies très différentes pour les matrices de masse fondamentalesMD et MR, c’est-à-dire MD MR [1, 48]. Typiquement, MD est considérée de l’ordre de l’échelled’énergie de la brisure de la symétrie électrofaible, soit MD ∼ O(102) GeV alors que MR, qui est unequantité invariante de jauge, est plutôt considérée comme étant près de l’échelle d’énergie de la grandeunification, soit MR ∼ O(1015) GeV. Il s’agit, en fait, du scénario jugé le plus « naturel » puisquecelui-ci permet, entre autres, d’éviter d’avoir à recourir à des ajustements fins pour justifier la faiblemasse des neutrinos à partir de ce mécanisme [6]. Par ailleurs, cette supposition s’avère très importantepuisqu’elle permet de diagonaliser la matrice M seulement à l’ordre ε, où ε ≡ MD(MR)−1, ce qui apour effet de diviser les valeurs propres deM en deux blocs distincts qui dépendent de ces deux échellesd’énergie au premier ordre du développement. On souhaite donc obtenir la forme suivante

UTMU =(Mléger 0

0 Mlourd

)+O

(ε2), (1.68)

où U est une matrice unitaire appropriée alors que Mléger et Mlourd sont les matrices de masse diago-nales, réelles et non négatives résultant du processus de diagonalisation par blocs. Afin de comprendrecomment parvenir à une telle forme, il s’avère instructif d’écrire la matrice U sous la forme générale

U = eiHVSérie deTaylor−−−−−→ U =

(I6 + iH − 1

2HH +O(H3))V, (1.69)

oùH est une matrice hermitienne (H† = H) et V est une matrice unitaire. L’expression (1.68) impliquedonc qu’il faut développer U jusqu’au second ordre. En substituant ce développement dans la quantitéUTMU , cela permet d’obtenir

UTMU '(V T + iV THT − 1

2VTHTHT

)M(V + iHV − 1

2HHV)

(1.70)

' V TMV + iV TMHV − 12V

TMHHV + iV THTMV − V THTMHV

− i2V

THTMHHV − 12V

THTHTMV − i2V

THTHTMHV

+14V

THTHTMHHV. (1.71)

38

Page 49: Phénoménologie des neutrinos dans une théorie de matrices ...

Afin de simplifier les calculs subséquents, l’ansatz suivant est adopté [48], soit

H =(

0 SS† 0

), V =

(V1 00 V2

), (1.72)

où H est la matrice hermitienne par blocs la plus simple que l’on peut écrire à l’ordre ε (la matriceS est considérée d’ordre ε) tandis que V1 et V2 sont des matrices unitaires qui assurent que Mléger etMlourd sont diagonales, réelles et non négatives. Lorsque l’on garde seulement les termes à l’ordre ε2,on peut écrire une expression simplifiée qui dépend de la nouvelle matrice S, de la forme

UTMU '(f11(S) f12(S)f21(S) f22(S)

), (1.73)

où les éléments sont donnés par les expressions suivantes :

f11(S) = iV T1 MDS†V1 + iV T1 S∗(MD)TV1 − V T1 S∗MRS†V1, (1.74)

f12(S) = V T1 MDV2 −

12V

T1 M

DS†SV2 + iV T1 S∗MRV2

−V T1 S∗(MD)TSV2 −12V

T1 S∗STMDV2, (1.75)

f21(S) = V T2 (MD)TV1 + iV T2 MRS†V1 −12V

T2 (MD)TSS†V1

−V T2 STMDS†V1 −12V

T2 S

TS∗(MD)TV1, (1.76)

f22(S) = V T2 MRV2 + iV T2 (MD)TSV2 −

12V

T2 M

RS†SV2 + iV T2 STMDV2

+iV T2 STMDV2 −12V

T2 S

TS∗MRV2. (1.77)

Pour obtenir une matrice diagonale de la forme (1.68), il faut donc imposer que les éléments horsdiagonale satisfassent f12(S) = f21(S) = 0 + O(ε2), ce qui fournit les contraintes nécessaires pourtrouver la matrice S. Ce faisant, on obtient S = −iMD∗(MR)−1∗, qui peut être substituée dans f11(S)et f22(S) pour obtenir

Mléger = f11(S)∣∣∣S=−iMD∗(MR)−1∗

= −V T1 MD(MR)−1(MD)TV1, (1.78)

Mlourd = f22(S)∣∣∣S=−iMD∗(MR)−1∗

= V T2 MRV2 + V T2

12(MD)TMD∗(MR)−1∗V2

+V T212(MR)−1∗MD†MDV2. (1.79)

De plus, on peut également obtenir une expression pour la matrice U , ce qui donne

U =(I3 − 1

2MD∗ (MR

)−1∗ (MR

)−1 (MD

)TMD∗ (MR

)−1∗

−(MR

)−1 (MD

)T I3 − 12(MR

)−1 (MD

)TMD∗ (MR

)−1∗

)V +O(ε3).

Ici, un observateur aguerri est en mesure de constater que la condition d’unitarité de la matrice Un’est plus respectée à l’ordre ε2 de ce développement. Cependant, comme la déviation du produit U†Upar rapport à la matrice identité est au minimum de l’ordre de ' 1

4ε∗εT ε∗εT ∼ O(ε4), aucun effet

perceptible n’est observable dans ce contexte. Cela permet d’introduire la définition des états propresde masse sous ce formalisme, ce qui implique des états propres approximatifs dans ce cas-ci. Puisque

39

Page 50: Phénoménologie des neutrinos dans une théorie de matrices ...

la matrice M est symétrique, on obtient que

ψν = UTψν ≡(νLνcR

), ψcν = U†ψcν ≡

(νcLνR

), (1.80)

ce qui signifie que le lagrangien (1.65) s’écrit maintenant de la façon suivante

LνR 3 −12(νL, ν

cR

)(Mléger 00 Mlourd

)(νcLνR

)+ c.h. (1.81)

= −12(νLMlégerν

cL + νcLMlégerνL

)− 1

2(νRMlourdν

cR + νcRMlourdνR

). (1.82)

Une fois diagonalisés dans la base des masses, les champs physiques des neutrinos actifs et stérilesobtiennent donc une masse de type Majorana, telle qu’illustrée par l’expression (1.82). De plus, à partirdes expressions (1.78) et (1.79), on peut vérifier l’ordre de grandeur des masses des états physiques

Mléger ' −V T1 MD(MR)−1(MD)TV1 ∼ O(10−2) eV (1.83)

Mlourd ' V T2 MRV2 ∼ O(1015) GeV, (1.84)

ce qui correspond bien au résultat attendu. Cela permet de constater que l’ordre de grandeur de lamatrice MR n’a pas été choisi au hasard puisqu’il s’agit de l’échelle d’énergie qui permet de donnerune masse aux neutrinos actifs (à partir de ce mécanisme) qui se situe dans les limites expérimentalesactuellement admises. Dans la littérature, la matrice de masse des neutrinos actifs est notée

Mν ≡ −MD(MR)−1(MD)T , (1.85)

ce qui correspond à la prédiction la plus importante du mécanisme seesaw de type I. Ainsi, le mécanismeseesaw de type I fournit une explication tout à fait plausible permettant de mieux comprendre lesorigines de la faible masse des neutrinos en tirant profit du fait qu’ils sont les seuls fermions du modèlestandard qui admettent un terme de masse hybride de la forme (1.64).

1.3.3.2 Type II

Le mécanisme seesaw de type II est le scénario qui consiste à étendre le secteur du Higgs pour introduireun couplage invariant de jauge dans le lagrangien (1.13) formé du doublet Lβ et de son conjugué decharge Lcα, c’est-à-dire ∝ Lcα∆Lβ , dans le but de générer un terme de masse de type Majorana pourles neutrinos gauches [6, 49]. Pour obtenir les propriétés de base que ce nouveau Higgs massif (∆) doitposséder pour rendre possible un tel terme, il s’avère instructif d’étudier, par exemple, la combinaisonde champs νcαLνβL inclue dans ce couplage. Sachant que ναL est contenu dans un isodoublet avec lesnombres quantiques I = 1/2, I3 = 1/2 et Y = −1, une simple combinaison des isospins permet deconstater que |1/2, 1/2〉νc

αL⊗ |1/2, 1/2〉νβL = |1, 1〉νc

αLνβL

. 55 Ainsi, l’unique représentation qui contientun singulet une fois couplée à cet état est obtenue avec

|1, 1〉νcαLνβL⊗ |1, −1〉40 = 1√

6|2, 0〉νc

αLνβL40 + 1√

2|1, 0〉νc

αLνβL40 + 1√

3|0, 0〉νc

αLνβL40 . (1.86)

55. Se référer à une table de Clebsch-Gordan pour la combinaison des isospins. Ici, l’état d’une particule p (ou d’unecombinaison de particules pp′) est noté |I, I3〉p (ou |I, I3〉pp′ ).

40

Page 51: Phénoménologie des neutrinos dans une théorie de matrices ...

La combinaison νcαLνβL doit donc être couplée avec une nouvelle particule, notée ∆0 puisqu’elle doitêtre électriquement neutre, possédant les nombres quantiques I = 1, I3 = −1 et Y = 2 pour générerun singulet sous SU(2)L ⊗ U(1)Y . Cet exemple permet donc de constater que ∆0 correspond à lacomposante I3 = −1 d’un triplet d’isospin I = 1 contenant les états I3 = 1, 0, −1. Puisqu’un telchamp n’existe pas dans le modèle standard, la modification au secteur du Higgs consiste à ajouterun champ scalaire complexe qui se transforme comme un triplet de SU(2)L, soit ~∆ = (∆1, ∆2, ∆3)en coordonnées cartésiennes (représentation adjointe), où les champs complexes ∆i identifient les troisétats possibles. Dans la représentation fondamentale, celui-ci s’écrit

∆ ≡ 1√2

3∑i=1

σi∆i =(

∆3√2

∆1−i∆2√2

∆1+i∆2√2 −∆3√

2

), (1.87)

ce qui permet d’ajouter au lagrangien (1.13) une contribution de la forme

L∆ = tr((Dρ∆)†Dρ∆

)− V (Φ, ∆)− 1

2∑

α,β=e,µ,τ

(Y ∆αβL

cαiσ2∆Lβ + Y ∆∗

βα Lβ(iσ2∆)†Lcα), (1.88)

à partir de laquelle on peut identifier les combinaisons qui décrivent les champs physiques, soit

∆0 ≡ ∆1 + i∆2√2

, ∆+ ≡ ∆3, ∆++ ≡ ∆1 − i∆2√2

. (1.89)

Ici, la matrice de permutation iσ2 est nécessaire pour que les combinaisons de champs de l’expression(1.87) obtiennent une charge électrique bien définie dans le produit (1.88) sans affecter l’invariance soustransformation de jauge. Naturellement, en plus des couplages leptoniques, l’ajout d’une particule sca-laire modifie le potentiel défini à l’expression (1.42), c’est-à-dire que V (Φ)→ V (Φ, ∆). 56 L’expressionla plus générale s’écrit alors de la façon suivante :

V (Φ, ∆) = µ2Φ†Φ + λ(Φ†Φ

)2 +M2∆tr(∆†∆)− λ∆M∆

12

(Φ†∆Φ + Φ†∆†Φ

)+λ1Φ†Φtr(∆†∆) + λ2tr(∆†∆)2 + λ3tr

((∆†∆)2)+ λ4Φ†∆∆†Φ, (1.90)

qui contient l’ensemble des nouvelles interactions invariantes de jauge et renormalisables. Il va sansdire que l’analyse de ce potentiel est considérablement plus laborieuse que dans le cas du modèlestandard original (voir [49, 50] pour une analyse détaillée). Puisque dans le cadre de ce travail, uneattention particulière est portée aux conséquences d’une brisure spontanée de la symétrie électrofaiblepour la masse des neutrinos, il suffit de mentionner que M∆ ≥ 0, λ∆ ≥ 0 et que les paramètres sansdimension λ1, λ2, λ3 et λ4 sont considérés réels (aucune violation de la symétrie CP ) et qu’ils doiventobéir à certaines contraintes pour assurer la stabilité du minimum [50]. Conséquemment, par analogieavec le mécanisme de Higgs discuté précédemment, on considère que l’état d’énergie minimale descomposantes électriquement neutres des champs scalaires ∆ et Φ développent une valeur moyenne nonnulle dans le vide telle que

∆0 = 1√2

(0 0v∆ 0

), Φ0 = 1√

2

(0v

). (1.91)

56. Notons que ce triplet possède également un couplage avec les bosons de jauge de SU(2)L grâce à son terme cinétiquetr((Dρ∆)†Dρ∆

), ce qui implique qu’une correction aux masses (1.50) est introduite à la suite de la brisure spontanée

de la symétrie électrofaible.

41

Page 52: Phénoménologie des neutrinos dans une théorie de matrices ...

La minimisation du potentiel (1.90), qui implique nécessairement les conditions

∂ΦV (Φ, ∆)∣∣∣∣∆=∆0,Φ=Φ0

=(

00

),

∂∆V (Φ, ∆)∣∣∣∣∆=∆0,Φ=Φ0

=(

0 00 0

), (1.92)

où les dérivées sont données par (voir [51] pour le calcul des dérivées)

∂ΦV (Φ, ∆) = µ2Φ∗ + 2λΦ†ΦΦ∗ + λ∆M∆12(iσ2∆† −∆∗iσ2)Φ

+λ1Φ∗tr(∆†∆) + λ4∆∗∆TΦ∗, (1.93)∂

∂∆V (Φ, ∆) = M2∆∆∗ − λ∆M∆

12Φ∗ΦT + λ1Φ†Φ∆∗ + 2λ2tr(∆†∆)∆∗

+2λ3∆∗∆T∆∗ + λ4Φ∗ΦT∆∗, (1.94)

permet donc d’obtenir une contrainte sur la masse M∆ et le paramètre µ2, soit

−2µ2 = 2λv2 −√

2λ∆M∆v∆ + (λ1 + λ4)v2∆, (1.95)

M∆ = λ∆v2

4√

2v∆± v2

4√

2v∆

√λ2

∆ − 16v2∆v2 (λ1 + λ4)− 32v

4∆v4 (λ2 + λ3). (1.96)

Dans un premier temps, en se référant aux résultats (1.50), qui impliquent m2h = −2µ2, on constate

que la relation (1.95) est simplement une contrainte sur la masse du doublet. En second lieu, puisque lavaleur de v∆ est fortement contrainte par la valeur expérimentale du paramètre ρ du modèle standard(qui relève de mesures de haute précision du secteur électrofaible), cela implique une borne supérieurede l’ordre de v∆ . 3 GeV. 57 Ainsi, l’expression (1.96) peut être simplifiée en considérant la limitev∆ v. La solution qui donne un terme non nul à l’ordre dominant du développement permet doncd’obtenir la relation suivante :

v∆ 'λ∆v

2

2√

2M∆, (1.97)

ce qui implique que la faible valeur de v∆ peut être expliquée naturellement à partir de la grande massedu triplet M∆. De plus, il est possible de constater que les termes proportionnels à λ1, λ2, λ3 et λ4

ne sont pas des contributions dominantes et pour cette raison, un potentiel approximatif est souventconsidéré dans la littérature, où seulement les termes proportionnels à M2

∆ et λ∆ sont présents. Biensûr, ce développement est valide ∀ v∆ 6= 0 car dans le cas contraire, la contrainte (1.96) est simplement14λ∆M∆v

2 = 0. Les conséquences pour le terme de couplage leptonique peuvent donc être étudiées en

57. Ce paramètre, défini à l’ordre dominant comme ρ =m2W±

m2Z0 cos2(θw) , où tan(θw) = g′w

gwcorrespond à l’angle de

Weinberg du secteur électrofaible, constitue un test de validité pour le secteur du Higgs du modèle standard. En effet, àpartir des relations (1.50), on trouve la valeur exacte ρ = 1, qui peut être directement comparée à la mesure expérimentale(à 1σ), soit ρexp = 1.00037 ± 0.00023 [4]. De plus, la généralisation de ce paramètre pour une extension arbitraire au

secteur du Higgs contenant plusieurs multiplets s’écrit ρ =∑

k

[Ik(Ik+1)−(Ik3 )2

]v2k

2∑

k(Ik3 )2v2

k

, où vk est le VEV de la composante

neutre d’un multiplet d’isospin Ik et de troisième composante Ik3 . Puisque ρ = 1 peu importe le nombre de doubletsajoutés, on constate que la déviation δρ de ce paramètre par rapport à sa valeur d’origine (ρ = 1− δρ) est entièrementattribuable à l’ajout du triplet. Ce faisant, comme ∆ contribue aux masses des trois bosons de jauge à l’ordre dominant,le paramètre ρ est modifié selon ρ = 1+2x2

1+4x2 = 1− 2x2 +O(x4), où x = v∆v. En considérant l’intervalle de 3σ pour ρexp,

cela place une forte contrainte sur la valeur de x puisque x2 ' δρ2 , ce qui implique x . 0.013 ou v∆ . 3 GeV.

42

Page 53: Phénoménologie des neutrinos dans une théorie de matrices ...

développant le dernier terme de l’expression (1.88), ce qui donne

L∆ 3 −12

∑α,β=e,µ,τ

[Y ∆αβ

(νcαL∆0νβL −

√2νcαL∆+`βL − `cαL∆++`βL

)+Y ∆∗

βα

(νβL∆0†νcαL −

√2`βL∆−νcαL − `βL∆−−`cαL

)], (1.98)

où ∆− = (∆+)† et ∆−− = (∆++)†. On constate donc qu’une fois la brisure de symétrie accomplie,seules les contributions proportionnelles à la composante neutre du triplet survivent puisque celle-ciest la seule qui acquiert un VEV (c’est-à-dire que ∆0 = v∆√

2 , voir (1.91)). Conséquemment, l’expression(1.98) prend la forme d’un terme de masse et la partie proportionnelle à v∆ s’écrit

L∆ 3 −12(νcLM

LνL + νLML†νcL), ML ≡ v∆√

2Y ∆, (1.99)

ce qui correspond bien à une masse de Majorana pour les neutrinos gauches, où Y ∆ est une matricesymétrique complexe. La forme de la matrice de masse obtenue est donc donnée par

Mν = ML ' λ∆v2

4M∆Y ∆. (1.100)

Une fois de plus, la faible masse des neutrinos gauches est donc attribuable à la grande masse du tripletintroduit et la matrice Mν constitue la prédiction maîtresse du mécanisme seesaw de type II.

1.3.3.3 Type III

Finalement, le dernier scénario considéré pour donner une masse aux neutrinos consiste à introduiretrois triplets fermioniques Σa (où a = 1, 2, 3, soit un pour chaque génération) de chiralité droiteet d’hypercharge nulle au modèle standard [52, 53]. L’idée ici est simplement de pouvoir reproduirela structure d’un terme de masse de Dirac à partir de ces nouveaux triplets, c’est-à-dire un terme∝ LΣaΦ. Afin de vérifier la validité d’un tel couplage, il s’avère instructif, une fois de plus, d’étudier lacombinaison des isospins des champs formant le terme de masse de Dirac pour les neutrinos. Dans cecas, puisque l’on doit travailler avec, par exemple, le couplage de base ναLφ0∗, où φ0∗ est la composanteneutre du champ Φ qui acquiert un VEV, cela implique

|1/2, −1/2〉ναL ⊗ |1/2, 1/2〉φ0∗ = 1√2|1, 0〉ναLφ0∗ + 1√

2|0, 0〉ναLφ0∗ . (1.101)

On constate que ce couplage engendre deux états possibles, ce qui signifie qu’il existe deux façonsd’obtenir un singulet à partir de cette combinaison, soit

|0, 0〉ναLφ0∗ ⊗ |0, 0〉νβR = |0, 0〉ναLφ0∗νβR, (1.102)

|1, 0〉ναLφ0∗ ⊗ |1, 0〉Σ0a =√

23 |2, 0〉ναLφ0∗Σ0a −

1√3|0, 0〉ναLφ0∗Σ0a . (1.103)

Bien entendu, le résultat (1.102) correspond simplement au mécanisme seesaw de type I discuté pré-cédemment, où la composante de chiralité droite νβR est un singulet du groupe de jauge. La secondeoption est donc celle qui est à l’origine du mécanisme seesaw de type III, où le champ Σ0a (de chargeélectrique nulle), qui joue le rôle du neutrino droit dans ce modèle, correspond à la composante I3 = 0

43

Page 54: Phénoménologie des neutrinos dans une théorie de matrices ...

d’un triplet Σa (d’isospin I = 1) contenant les états I3 = 1, 0, −1. Donc, en introduisant la notation~Σa = (Σa

1 , Σa2 , Σ

a3 ) pour les trois états possibles des trois triplets appartenant à la représentation

adjointe de SU(2)L (représentation réelle de dimension trois), on peut écrire, dans la représentationfondamentale

Σa ≡ 1√2

3∑i=1

σiΣai =

(Σa3√

2Σa1−iΣa2√

2Σa1 +iΣa2√

2 −Σa3√2

), (1.104)

où les charges électriques des champs physiques doivent être fixées telles que

Σ−a ≡ Σa1 + iΣa

2√2

, Σ0a ≡ Σa3 , Σ+a ≡ Σa

1 − iΣa2√

2. (1.105)

Cela permet d’introduire les termes contenant les couplages suivants dans le lagrangien (1.13)

LΣ =3∑a=1

tr(Σai /DΣa)−√

2∑α, a

(Y ΣαaLαΣ

aΦ + Y Σ∗aα Φ†ΣaLα

)−1

2∑a, b

tr(

(Σa)cMΣabΣ

b +ΣbMΣ∗ba (Σa)c

), (1.106)

où (Σa)c ≡ CΣaT et où la matrice correspondante dans l’espace d’isospin est définie telle que

(Σa)c ≡( (Σ0a)c√

2 (Σ−a)c

(Σ+a)c − (Σ0a)c√2

). (1.107)

Cette structure invariante de jauge permet en effet de générer l’ensemble des combinaisons de champspermises dans ce modèle (il est sous-entendu qu’une barre sur la matrice Σa ou (Σa)c implique quecelle-ci doit être transposée pour obtenir un produit matriciel adéquat). Le premier terme corresponddonc au terme cinétique, alors que le deuxième terme contient les couplages de Yukawa et que letroisième représente une masse de Majorana pour les triplets. La contribution (1.106) possède doncune structure très similaire à celle obtenue avec le mécanisme seesaw de type I (voir (1.63)) en plusde contenir de nouvelles interactions propres aux composantes des triplets Σa. Puisque l’on s’intéresseprincipalement au terme de masse des neutrinos obtenu après la brisure de la symétrie électrofaible,il s’agit maintenant de substituer (1.56) dans (1.106) et de développer les deux derniers termes dece lagrangien en fonction des champs physiques de la théorie. Ignorant la contribution des termesproportionnels à h (qui ne sont pas requis pour les besoins de cette discussion), on obtient

LΣ 3 − v√2∑α, a

[Y Σαa

(ναLΣ

0a +√

2`αLΣ−a)

+ Y Σ∗aα

(Σ0aναL +

√2Σ−a`αL

)](1.108)

−12∑a, b

[(Σ0a)cMΣ

abΣ0b +Σ0bMΣ∗

ba (Σ0a)c + 2(

(Σ+a)cMΣabΣ

−b +Σ−bMΣ∗ba (Σ+a)c

)],

où les termes contenant les champs de charges opposées à la dernière ligne du résultat (1.108) ont puêtre combinés en utilisant un raisonnement similaire à (1.66), de même que la propriété (MΣ)T = MΣ .À partir du résultat (1.108) on peut donc extraire la quantité

LΣ 3 −(νLMDΣ0 +Σ0MD†νL)− 12

((Σ0)cMΣΣ0 +Σ0MΣ†(Σ0)c

), (1.109)

44

Page 55: Phénoménologie des neutrinos dans une théorie de matrices ...

ce qui correspond bien à la structure d’un terme de masse pour les neutrinos. Ici, MD ≡ v√2Y

Σ

et Σ0, Σ−, Σ+ sont les vecteurs contenant les trois composantes neutres, négatives et positivesrespectivement. Puisque le résultat (1.109) est identique au terme de masse obtenu avec le mécanismeseesaw de type I, soit l’expression (1.64), celui-ci peut être réécrit de la façon suivante :

LΣ 3 −12

(νL, (Σ0)c

)( 0 MD(MD

)TMΣ

)(νcLΣ0

)+ c.h.. (1.110)

Conséquemment, en reproduisant la procédure de diagonalisation par blocs détaillée précédemment,cela permet d’obtenir le résultat suivant pour la matrice de masse des neutrinos actifs

Mν = −MD(MΣ)−1(MD)T . (1.111)

Il s’agit, bien entendu, de la même structure matricielle que celle obtenue pour le type I, à la différenceque les couplages de Yukawa contenus dans MD ne sont pas les mêmes et que les paramètres deMΣ (qui est également une matrice symétrique complexe) diffèrent de ceux de MR. Les distinctionsmajeures entre les mécanismes I et III ne se situent donc pas au niveau de la masse des neutrinos, maisplutôt dans le fait que les composantes des triplets Σa possèdent des interactions de jauge grâce àleur terme cinétique et qu’elles introduisent de nouveaux couplages impliquant un faible mélange entrecelles-ci et les leptons chargés, tel qu’illustrés à l’expression (1.108). En ce qui concerne les interactionsde jauge, celles-ci impliquent un couplage avec les bosons W± et le Z0 et rendent possible, de cefait, de nouvelles désintégrations et des interactions de type CN impliquant un changement de saveurà l’ordre dominant pour les leptons chargés (de même que pour les neutrinos, bien que dans le casdes courants neutres, la saveur de ceux-ci n’est pas un concept bien défini) [53]. Enfin, les termes demélange ont comme effet de modifier la matrice de masse des leptons chargés, ce qui peut être démontréen reproduisant une procédure de diagonalisation par blocs analogue à celle des neutrinos. 58

1.3.3.4 Synthèse

Il a été question dans cette sous-section des trois principales avenues permettant de donner une massede type Majorana aux neutrinos gauches dans la limite des basses énergies en misant sur une extensiondu contenu en particules du modèle standard. Fait intéressant, les résultats obtenus dans cette limitepour les trois matrices de masse symétriques, c’est-à-dire

Mν =

−MD(MR)−1 (MD

)T type I,

ML type II,

−MD(MΣ)−1(MD)T type III,

(1.112)

(où les matrices MD des types I et III n’ont pas les mêmes couplages de Yukawa) auraient égalementpu être obtenus en considérant que dans cette limite, une approche alternative dans laquelle les effets58. Voir [53] pour une analyse plus complète où ces nouvelles interactions sont détaillées. Cependant, en développant

le résultat explicite obtenu dans [53] (éq.(4)) pour le lagrangien (1.106), il faut garder à l’esprit que ce ne sont pas tousles termes présents qui contribuent au résultat final. Par exemple, une contribution du type (Σ+a)c`αLφ0∗, qui possèdela structure générale (ψR)cϕL, ne contribue pas au lagrangien total pour des raisons de chiralité. En effet, en utilisant lespropriétés des opérateurs de projection PR,L on peut montrer que ψL = ψPR et que (ψR)c = CPTL ψ

T = PLCψT = PLψc

puisque Cγ5T C−1 = γ5. Ce faisant, on a que (ψR)cϕL = ψcPRPLϕ = 0 car PRPL = 0. En fait, ces contributionsexcédentaires sont simplement un artifice de la notation utilisée dans ce cas-ci.

45

Page 56: Phénoménologie des neutrinos dans une théorie de matrices ...

de la théorie à haute énergie (Λ) sont encodés dans un lagrangien efficace contenant des termes dedimension d > 4 (non renormalisables) est également valide [6, 54]. La théorie qui en résulte, qui estcomplètement découplée de la dynamique à haute énergie, est rendue possible grâce au fait que lesdegrés de liberté « lourds » peuvent être intégrés en considérant un développement perturbatif à partirde la configuration statique (suivant le formalisme développé à partir de l’intégrale de chemin) [55],ce qui permet d’obtenir une action efficace qui ne dépend plus de ces nouveaux degrés de liberté etdont le domaine de validité est restreint aux basses énergies (c’est-à-dire < Λ, soit la limite où le termecinétique devient négligeable devant le terme de masse). La matrice de masse Mν est donc obtenue enidentifiant le coefficient de la contribution dominante de ce développement, qui correspond à un termede dimension 5 dans le lagrangien efficace (qui est du type Majorana dans les trois cas, c’est-à-dire dela forme (1.57)).

Par ailleurs, il existe maintenant plusieurs variations de ces mécanismes dans la littérature et ceux-cipeuvent également être combinés (I+II ou II+III) pour former des modèles plus élaborés menant àdes prédictions différentes concernant la forme des matrices de masse Mν . Bien que ces mécanismesoffrent une approche intéressante pour explorer les origines de la masse des neutrinos en proposantl’existence d’une nouvelle échelle de masse fondamentale en physique des particules (les masses MR,M∆, MΣ), ceux-ci introduisent également bon nombre de questions qui demeurent sans réponses :• Quelle est l’échelle d’énergie absolue des massesMR,M∆ etMΣ et quel mécanisme ou processus

physique permet de la déterminer ?• Quels sont les attributs des nombreux paramètres libres de ces modèles, tels que les couplages deYukawa Y ν , Y ∆ et Y Σ et les éléments de MR et MΣ (réels, complexes, structurés, anarchiques,etc.) ?

• Outre la nécessité de donner une masse aux neutrinos, existe-t-il une explication plausible pourjustifier l’existence des nouvelles particules introduites (théories de grande unification, modèlessupersymétriques, matière sombre, etc.) ?

• Les mécanismes seesaw sont-ils suffisants pour expliquer, à eux seuls, l’ensemble des propriétésdes neutrinos (masses, mélange, etc.) ?

Quelles qu’en soient les réponses, les répercussions associées sont susceptibles d’entraîner une modifica-tion considérable de la structure actuelle du modèle standard. Comme on peut maintenant le constater,étant donné le grand nombre de paramètres libres et l’absence totale d’information les concernant, ildevient alors difficile d’obtenir des prédictions concrètes à partir de ces mécanismes sans avoir à for-muler certaines hypothèses au préalable.

Dans le cadre de ce travail, seuls les trois mécanismes de base sont considérés et les matrices demasse identifiées par (1.112) constituent le point de départ de ce projet de recherche. Comme discutéprécédemment, l’hypothèse anarchique est adoptée en ce qui concerne les couplages fondamentauxet les conséquences pour le spectre de masse des matrices Mν sont étudiées dans le contexte d’unethéorie de matrices aléatoires. Le prochain chapitre a donc pour but d’entreprendre une justificationapprofondie de l’hypothèse anarchique développée dans le secteur des neutrinos tout en présentant uneintroduction sommaire à la théorie des matrices aléatoires.

46

Page 57: Phénoménologie des neutrinos dans une théorie de matrices ...

Chapitre 2

Principe anarchique et matricesaléatoires

Considérant les éléments de théorie introduits au chapitre précédent, qui ont permis d’entrevoir lesdifférentes étapes menant à des extensions viables du modèle standard (les trois mécanismes seesaw), ils’avère maintenant possible d’introduire et de détailler la procédure utilisée pour obtenir des prédictionsplus tangibles permettant d’aller au-delà du simple postulat de base reposant sur l’effet de balancierentre les différentes échelles d’énergies. Ce chapitre a donc pour but de présenter les arguments àl’origine du principe anarchique, qui constituent le lien entre les mécanismes de masse du chapitreprécédent et la théorie des matrices aléatoires, de même que les différentes propriétés qui caractérisentcertains des ensembles matriciels aléatoires les plus étudiés, soit les ensembles gaussiens. Les conceptsabordés dans ce chapitre, qui incluent les notions de changement de base, de produit extérieur et lecalcul de mesures (jacobiens), constituent également des outils essentiels pour l’analyse des ensemblesseesaw faisant l’objet du chapitre suivant.

2.1 Une approche alternative qui repose sur le hasard

Les mécanismes considérés au chapitre précédent ont donc permis d’obtenir trois expressions pourles matrices de masse des neutrinos actifs (Mν) qui sont fonctions de matrices de masse élémentairesde type Dirac et Majorana relevant des nouveaux couplages à haute énergie. Ces matrices de masseélémentaires constituent ainsi le point de départ de toute analyse concrète du secteur des neutrinos.Cependant, comme les mécanismes seesaw laissent le contenu de ces matrices complètement libre,les seules informations « connues » sur celles-ci (ou de façon plus spécifique, sur leurs éléments) se ré-sument donc à considérer des éléments complexes pour justifier une violation de la symétrie CP dans cesecteur et au fait que les matrices de type Majorana (MR, ML, MΣ) doivent être symétriques, contrai-rement aux matrices de type Dirac (MD), qui peuvent être quelconques. La nécessité de contraindredavantage la structure de ces matrices de masse élémentaires (pour obtenir des prédictions concrètessur la phénoménologie des neutrinos) est donc aujourd’hui la source de plusieurs modèles et hypothèsesfaisant l’objet de recherches actives. Naturellement, comme le phénomène d’oscillation des neutrinos nepeut pas être dissocié de leurs masses, les mesures expérimentales du secteur électrofaible (les résultatsde la sous-section 1.2.3 et plus spécifiquement, ceux du tableau 1.2) jouent un rôle important dans

47

Page 58: Phénoménologie des neutrinos dans une théorie de matrices ...

l’élaboration et la formulation d’hypothèses de travail réalistes pouvant contribuer à révéler certainséléments de la théorie sous-jacente. Les principales tendances pouvant être extraites de ces résultats,soit des masses de l’ordre de l’électronvolt, un mélange important entre les différents états de saveur(comparativement au secteur des quarks) 59 et la faible hiérarchie entre les deux différences de masses4m2

21/4m232 ' 1

30 (hiérarchie normale), constituent en réalité les seuls points d’ancrages auxquelspeuvent (et doivent) se rattacher toutes constructions non triviales des matrices de masse.

2.1.1 Motivations

Bien que ces tendances ne puissent être expliquées directement (dans leur entièreté) à partir de patronssimples et élégants pour ces matrices de masse (se répercutant au niveau de la matrice PMNS), celasuggère que de telles particularités devraient tout de même se refléter dans la structure des matrices demasse, se traduisant par une certaine forme d’ordre permettant une hiérarchie au niveau des valeurspropres. Conséquemment, quoique difficilement perceptibles, certaines constructions ou « textures »pour ces matrices s’avèrent possibles (voire même suggérées) à partir de considérations s’appuyant surles mesures actuellement admises du secteur leptonique. Ainsi, dès les tout premiers modèles élaboréspour tenter d’expliquer les particularités des masses et du mélange des états, un intérêt considérable aété voué à la recherche de symétries de saveur discrètes, ce qui constitue encore aujourd’hui l’approchela plus souvent privilégiée dans la littérature [19, 21]. 60 Bien entendu, le fait de postuler des symétriessupplémentaires ou patrons particuliers pour ces matrices de masse permet de réduire le nombre deparamètres libres et ainsi d’obtenir un pouvoir prédictif important une fois ces matrices diagonalisées.

L’idée de base derrière cette approche repose donc essentiellement sur la prémisse selon laquelle la théo-rie fondamentale à haute énergie est suffisamment simple pour pouvoir être sondée directement (ouen partie) à partir des observables physiques présentes dans la limite des basses énergies, permettantainsi d’obtenir un aperçu des symétries fondamentales privilégiées par la nature. Cependant, ce typed’approche est désormais confronté à des défis importants. En effet, le niveau de précision atteint dansla mesure des paramètres fondamentaux du secteur des neutrinos permet aujourd’hui de confirmer lavaleur non nulle (mais relativement petite) de l’angle de mélange θ13, la déviation de l’angle θ23 parrapport au mélange maximal (< 45) et suggère la présence d’une phase de Dirac non triviale [57].Ces détails notables, combinés au fait que ce type de construction peut difficilement être étendu ausecteur des quarks dans le but d’obtenir un modèle de saveur unifié, représentent de sérieux obstaclesà l’implémentation de symétries discrètes (qui favorisent naturellement des patrons de mélange exactset réguliers). Cela explique donc, en partie, l’absence de consensus et le fait que malgré certains déve-loppements intéressants, aucun modèle de ce genre n’ait réussi à se distinguer de façon significative etconvaincante, laissant alors la porte ouverte à de nouvelles approches.

Dans la perspective d’aborder cette problématique sous un regard nouveau tout en mettant l’accentsur l’aspect plutôt irrégulier et désordonné des paramètres fondamentaux associés aux saveurs lepto-niques, l’idée que ceux-ci puissent émerger de matrices de masse élémentaires sans structure ou patron59. À l’aide du tableau 1.2, on constate que deux des angles de mélange sont grands, soit θ12 et θ23, alors que le

troisième, θ13, est relativement petit. Cependant, comme la valeur de θ13 est comparable à la valeur du plus grand anglede mélange du secteur des quarks, le mélange est donc considéré beaucoup plus important dans le secteur des neutrinos.60. Cette approche a également été motivée par les développements survenus dans le secteur des quarks et par le fait

que les premières mesures tangibles du phénomène d’oscillation étaient beaucoup plus favorables à la présence d’unesymétrie discrète, comme le démontrent les succès prématurés du modèle de mélange tri bimaximal [56].

48

Page 59: Phénoménologie des neutrinos dans une théorie de matrices ...

intrinsèque a ainsi progressivement fait son chemin dans la littérature. Présentée pour la première foisau tournant des années 2000 [23], cette nouvelle approche a permis de constater que les tendancesainsi observées pouvaient être adéquatement décrites en étudiant les propriétés d’un échantillon dematrices de masse générées aléatoirement (à partir de différents mécanismes de masse), suggérant dumême coup que la nécessité d’être en mesure de distinguer un patron clair au niveau de ces matricesn’était peut-être pas aussi importante qu’anticipée à l’origine (pour reproduire les résultats connus).L’analyse numérique présentée dans [23], somme toute rudimentaire, a ainsi ouvert la voie à l’implé-mentation de méthodes d’analyses statistiques qui ont par la suite été investiguées plus en profondeur[24, 25, 28, 29, 30, 58]. Conséquemment, bien que les grandes différences de masses et le phénomènede mélange pour les quarks et les leptons chargés impliquent certainement des matrices de massestructurées et « hiérarchiques », cette nécessité devient beaucoup moins apparente dans le secteur desneutrinos, ce qui engendre une plus grande liberté en ce qui a trait à l’architecture des modèles desaveur. Dans la littérature, cette approche est donc proposée comme une alternative à la constructionde matrices de masse « ordonnées » possédant des textures particulières et elle est habituellementprésentée sous la forme d’un ensemble d’arguments qui sont explorés plus en détail à la sous-sectionsuivante.

2.1.2 Le principe anarchique

De prime abord, la nécessité d’introduire des quantités aléatoires en physique survient lorsque lesystème étudié ne possède pas (ou ne semble pas posséder) de structure précise et que les paramètresqu’il contient prennent des valeurs qui ne sont pas directement prévisibles (ceux-ci sont donc considéréscomme des évènements aléatoires individuels). Dans ce cas, la notion de prédictibilité se limite à uneprobabilité d’observation lorsqu’un grand nombre d’évènements se réalisent. En ce qui concerne lesneutrinos, les objets en question (qui sont supposés sans structure particulière) sont donc les matrices demasse élémentaires. Dans ce contexte, des coefficients aléatoires sont introduits d’une part pour refléterl’aspect hétéroclite des paramètres physiques de ce secteur (révélé par les mesures expérimentales) maiségalement pour rendre compte du manque d’information sur la théorie fondamentale derrière les massesdes neutrinos et le mélange des états, ce qui permet d’obtenir des résultats quantitatifs sans avoir àrecourir aux détails de la dynamique proposée par une théorie sous-jacente. Cette approche particulièreest appelée le principe anarchique et repose sur l’hypothèse suivante.

Hypothèse 1 (Murayama et coll.). [23] La théorie sous-jacente à la physique des neutrinos possèdeune dynamique permettant de produire une matrice de masse pour les neutrinos qui, selon le point devue d’une théorie de champs efficace à basse énergie, manifeste un caractère anarchique : toutes lesentrées sont comparables, il n’existe pas de patron ou structure facilement discernable et il n’y a pas deratios spécifiques qui sont privilégiés entre les entrées.

L’idée est donc d’imposer le moins de contraintes possibles sur les paramètres libres du lagrangien quisont permis par les symétries du modèle. Ces coefficients, qui n’ont pas de raison particulière d’êtrepetits, sont donc considérés comme des constantes aléatoires qui doivent être tirées d’une distributionparticulière déterminée en fonction de lignes directrices préétablies. Ainsi, les quantités qui aparaissentaléatoires du point de vue d’une théorie de champs efficace à basse énergie correspondent aux para-mètres du lagrangien tels que les éléments de MR, ML, MΣ (en gardant à l’esprit que ces matricessont symétriques) et ceux des matrices MD et non les observables physiques tels que les masses ou les

49

Page 60: Phénoménologie des neutrinos dans une théorie de matrices ...

angles de mélange (qui sont définis après la diagonalisation des matrices Mν). De ce point de vue, onconstate donc que dans le cas des mécanismes I et III,Mν est obtenue à partir d’un produit particulierde deux matrices générées aléatoirement alors que dans le cas du mécanisme de type II, une seulematrice est générée aléatoirement (équations (1.112)). Par ailleurs, une fois qu’une matrice de masseMν est obtenue, tous les paramètres physiques de ce secteur peuvent être calculés. L’information surces paramètres est alors extraite à partir d’analyses statistiques propres à la théorie des matrices aléa-toires et à la physique statistique lorsqu’un grand nombre de ces matrices sont générées. 61 Pour cefaire, trois hypothèses de travail sont adoptées dans le cadre de ce projet, qui correspondent à cellesutilisées dans [30].

1. Au niveau des interactions de jauge, il n’y a pas de distinction physique possible entre les troisgénérations de doublets leptoniques [24]. Plus précisément, il n’y a pas de nombre quantique(de jauge) qui permet de distinguer les états de saveur des trois générations de neutrinos, c’est-à-dire que des particules de génération différente possèdent les mêmes interactions. Les seulesdistinctions entre les générations demeurent la saveur et la masse.

2. Les éléments de matrice sont générés selon une distribution aléatoire indépendante de la basechoisie. Cela signifie que la distribution ne doit pas changer sous une rotation du système decoordonnées (transformation biunitaire quelconque). La mesure associée (l’élément de volumequi caractérise la distribution) ne doit donc pas dépendre du choix de la base à partir de laquelleles éléments de matrice sont définis [24].

3. Les éléments de matrice sont distribués indépendamment les uns des autres. Autrement dit, iln’y a pas d’influence ou de corrélation entre les éléments de matrice.

En d’autres mots, la première hypothèse fait appel aux préceptes de la mécanique quantique, qui sug-gèrent qu’il est plus probable pour des états de mêmes nombres quantiques de posséder des énergiescomparables et qu’il y ait mélange entre ceux-ci [24, 59]. Cela permet de considérer que les matricesde masse élémentaires soient a priori sans structure apparente puisque dans ce cas, on peut s’attendreintuitivement à ce que la force des différents couplages avec les nouvelles particules introduites soitdu même ordre de grandeur pour les trois générations (il ne devrait pas y avoir de ratios spécifiquesprivilégiés entre les constantes de couplages correspondantes et celles-ci devraient être du même ordrede grandeur). Pour ce qui est de la seconde hypothèse, celle-ci s’avère essentielle pour tenir comptedu fait que les trois générations de neutrinos ne peuvent être distinguées par leurs interactions. Elles’impose donc comme un choix naturel puisqu’au niveau des éléments de matrice, cela implique queceux-ci doivent être distribués aléatoirement à partir d’une même distribution, peu importe la basechoisie pour les définir. Finalement, la dernière hypothèse, qui peut sembler quelque peu arbitraire,représente l’une des façons les plus intuitives pour construire une matrice de masse de façon aléatoire[30]. De plus, lorsque combinée à la contrainte précédente, celle-ci a pour effet de restreindre le choixde mesures possible (avec lesquelles on balaie l’espace des éléments de matrice, ce qui permet ensuited’obtenir les valeurs propres de celles-ci) à la mesure gaussienne, ce qui est un résultat bien connu enRMT [30]. En somme, bien qu’à première vue ces trois hypothèses puissent sembler plutôt restrictives,il n’en résulte pas moins que celles-ci sont équivalentes à maximiser l’entropie des matrices aléatoiresainsi générées [26, 27], ce qui correspond à la prescription mathématique adéquate pour tenir compte dufait qu’aucune information n’est connue sur les paramètres libres des matrices de masse élémentaires. 62

61. Les distributions des paramètres physiques peuvent être prédites avec confiance. Cependant, il faut demeurervigilant lorsque l’on tente d’extraire certaines informations à partir de celles-ci. Par exemple, le mode n’est pas unequantité invariante sous changement de base et par conséquent, ne doit pas être interprété comme une prédiction fermede l’approche anarchique [58].62. Cela implique que cette condition génère les objets les plus aléatoires possibles dans les contraintes actuelles.

50

Page 61: Phénoménologie des neutrinos dans une théorie de matrices ...

Ce cadre de travail fournit ainsi une approche complémentaire aux méthodes de construction plus« traditionnelles » discutées précédemment pour reproduire la hiérarchie des masses et la structure dumélange observé. Lorsque comparées à l’approche anarchique, ces dernières apparaissent ainsi beaucoupplus restrictives, ce qui implique des modèles de saveurs fortement contraints par le choix des symétriesimposées (et nécessite dans certains cas un ajustement fin des paramètres correspondants). Une fois deplus, le peu de liberté qui en découle est cependant compensé par un pouvoir prédictif plus important. 63

En contrepartie, on peut penser que l’approche dite anarchique, bien que fondamentalement moinsprédictive, est naturellement plus probable pour des particules de mêmes nombres quantiques et quede ce point de vue, la structure hautement hiérarchique du secteur des quarks et des leptons chargésest celle qui paraît inusitée et « anormale », nécessitant de ce fait une explication plus précise. Leprincipe anarchique, combiné aux mécanismes seesaw de type I, II et III discutés précédemment,définissent ainsi une nouvelle classe d’ensembles matriciels aléatoires appelés ensembles seesaw [29].Dans ce contexte, l’analyse de ces ensembles constitue ainsi une approche fort attrayante et prometteusepour extraire les tendances et mieux comprendre les conséquences de ces mécanismes relativement auxpropriétés des neutrinos dans la limite des basses énergies (le spectre des masses et les paramètresd’oscillation). Cependant, avant de pouvoir entreprendre une étude détaillée de ces ensembles, il fautd’abord introduire quelques concepts de base en théorie des matrices aléatoires, ce qui fait l’objet dela section suivante.

2.2 Introduction à la théorie des matrices aléatoires : L’en-semble gaussien orthogonal

La théorie des matrices aléatoires constitue une branche importante des mathématiques et possèdeaujourd’hui des applications dans des domaines aussi variés que la finance, la physique nucléaire (et laphysique des particules), la détection de signaux et plus récemment, dans le domaine de l’apprentis-sage machine. À première vue, celle-ci peut être décrite comme un mélange entre l’algèbre linéaire et lathéorie des probabilités et fournit donc un cadre de travail simple et élégant pour l’étude de systèmesphysiques complexes. En fait, lorsqu’un phénomène de nature stochastique peut être décrit par deséquations linéaires ou un système matriciel, celui-ci peut en principe être étudié à l’aide d’outils déve-loppés avec la RMT, ce qui explique en partie la grande versatilité de cette plateforme de recherche.En termes plus spécifiques, une matrice aléatoire est donc définie comme une matrice dont les élémentssont des variables aléatoires, c’est-à-dire générés aléatoirement selon une distribution qui est fixée enfonction de la problématique étudiée. Dans ce contexte, les vecteurs propres et les valeurs propres deces matrices sont donc également des variables aléatoires et le but principal de la RMT est donc, àla base, de pouvoir calculer et analyser les propriétés statistiques de ces quantités (le spectre) souscertaines décompositions particulières (tels que les factorisations de Cholesky, de Schur, la factorisationQR ou la décomposition en valeurs singulières).

Comme la discussion précédente fait naturellement le lien entre la physique des neutrinos et la théoriedes matrices aléatoires, il convient donc maintenant d’introduire certaines notions élémentaires propresaux types de matrices qui forment la base de ce champ de recherche, c’est-à-dire celles comprises dans63. Il est intéressant de mentionner que dans [24], les auteurs qualifient ce type d’approche de « monarchique ».

51

Page 62: Phénoménologie des neutrinos dans une théorie de matrices ...

des ensembles spécifiques appelés ensembles gaussiens. 64 Puisque ces ensembles sont construits enfonction des mêmes principes de base que ceux des ensembles seesaw introduits précédemment, leuranalyse s’avère donc très utile pour dresser un portrait représentatif des différentes étapes à accomplirafin de pouvoir caractériser le spectre des matrices de masse. De plus, cette analyse permet d’intro-duire et de détailler certaines méthodes de calculs propres à ce type d’étude pouvant être généraliséesdirectement à des cas plus complexes tels que les ensembles seesaw.

Dans la littérature [26, 27, 60], on distingue trois types d’ensembles gaussiens et ceux-ci sont caracté-risés par des matrices hermitiennes dont les éléments, qui sont distribués indépendamment selon uneloi gaussienne, peuvent être réels, complexes ou quaternioniques. On retrouve ainsi l’ensemble gaussienorthogonal (GOE, Gaussian orthogonal ensemble), l’ensemble gaussien unitaire (GUE, Gaussian uni-tary ensemble) et l’ensemble gaussien symplectique (GSE, Gaussian symplectic ensemble), définis enfonction de leur invariance respective sous une transformation orthogonale (éléments réels), unitaire(éléments complexes) et symplectique (éléments quaternioniques). Ces ensembles, introduits vers lemilieu du vingtième siècle à la suite des travaux de Wigner et Dyson, font maintenant partie des en-sembles matriciels aléatoires les plus simples et les plus étudiés. 65 Pour les besoins de cette discussion,un intérêt particulier est porté à l’ensemble GOE, qui est utilisé à titre d’exemple pour développerles différents outils nécessaires à la compréhension des calculs subséquents. L’attrait particulier de cetensemble réside bien entendu dans sa simplicité, ce qui permet d’adopter une approche plus intuitivepour le calcul des quantités d’intérêt. Les ensembles GUE et GSE, qui requièrent un traitement si-milaire (mais plus laborieux dû à la nature complexe et quaternionique des éléments), ne seront pasdétaillés davantage dans cette section.

Ainsi, le point de départ de la démarche présentée dans cette section consiste à introduire les deuxcritères de base qui définissent l’ensemble gaussien orthogonal de façon formelle et rigoureuse. Suivantle raisonnement présenté dans [26, 61], l’ensemble GOE est donc défini comme la famille de matricesréelles et symétriques de dimension N ×N qui satisfont les conditions suivantes, c’est-à-dire que pourtoute matrice H faisant partie de cette famille, on a que :

1. L’ensemble doit être invariant sous toute transformation orthogonale de la formeH → H ′ = OTHO,

où O est une matrice orthogonale réelle, c’est-à-dire OTO = OOT = IN .2. Tous les éléments Hkj , k ≤ j sont stochastiquement indépendants.

Ces deux critères sont donc suffisants pour obtenir les quantités qui caractérisent complètement cetensemble, 66 soit la densité de probabilité jointe des éléments de matrice et des valeurs propres.64. Ceux-ci sont également connus sous le nom « ensembles de Wigner-Dyson ».65. Les premiers travaux en lien avec les matrices aléatoires remontent à Wishart en 1928. Cependant, ce concept n’a

été popularisé que plusieurs années plus tard à la suite des travaux de Wigner dans les années 1950, qui proposa unedescription statistique des spectres nucléaires de noyaux lourds (qui contiennent un grand nombre d’états possibles et deniveaux d’énergie) d’une séquence simple de niveaux d’énergie (une séquence simple correspond à une séquence où lesniveaux d’énergie ont tous le même spin et la même parité, de même que pour toute autre quantité conservée) reposantsur la distribution des valeurs propres de matrices aléatoires réelles et symétriques (l’ensemble GOE) [26]. Par ailleurs,la classification actuelle des ensembles gaussiens est due à Dyson, au début des années 1960, et relève des symétries del’hamiltonien (matrice hermitienne) du système concerné et de la théorie des groupes.66. De façon formelle, un ensemble matriciel aléatoire consiste en une matrice aléatoire M munie d’une mesure de

probabilité P (M) dM . En d’autres mots, ce type d’ensemble est défini par deux quantités : i) La collection de matricespartageant les mêmes propriétés et symétries formée des différentes valeurs que peut prendre la matrice aléatoire M ;ii) La mesure de probabilité sur cet espace, soit P (M) dM [62]. Dans ce contexte, un ensemble matriciel aléatoire peutdonc être utilisé pour offrir une description statistique d’un système ayant des interactions complexes.

52

Page 63: Phénoménologie des neutrinos dans une théorie de matrices ...

2.2.1 Distribution jointe des éléments de matrice

De façon plus spécifique, la première condition implique que la probabilité P (H) dH d’observer une

matrice H dont les éléments sont compris dans l’élément de volume dH =N∏k≤j

dHkj (seulement les

éléments indépendants sont considérés) est invariante sous une transformation orthogonale, soit

P (H ′) dH ′ = P (H) dH. (2.1)

Autrement dit, la densité de probabilité jointe (ou distribution jointe) des éléments de matrice ne doitpas dépendre de l’orientation du système d’axes utilisé pour définir les éléments (la base choisie pourexprimer H), ce qui définit l’invariance sous rotation. Cette condition permet donc une connexiondirecte avec les valeurs propres de H puisque dans ce cas-ci, celles-ci sont définies à partir d’une trans-formation orthogonale. 67 La seconde condition, introduite principalement pour simplifier l’analyse, 68

permet d’écrire la distribution jointe comme le produit des distributions de chaque élément, c’est-à-dire

P (H) =N∏k≤j

fkj (Hkj) , (2.2)

où fkj est la densité de probabilité de l’élément Hkj . Afin de vérifier que ces deux conditions sont belet bien suffisantes pour fixer la forme des fkj et ainsi connaître la distribution P (H) des élémentsde matrice (qui s’avère être gaussienne), une transformation orthogonale particulière est considérée[26, 61, 63], soit

O =

cos(θ) − sin(θ) 0 · · · 0sin(θ) cos(θ) 0 · · · 0

0 0 1...

...... . . . 0

0 0 · · · 0 1

, (2.3)

correspondant à une rotation dans le plan d’un angle θ. En se référant à la transformation décrite à lapremière condition, on peut trouver la relation entre les éléments de H et H ′, ce qui donne

H11 =(H ′11 +H ′22

2

)+(H ′11 −H ′22

2

)cos(2θ)−H ′12 sin(2θ) (2.4)

H12 =(H ′11 −H ′22

2

)sin(2θ) +H ′12 cos(2θ) (2.5)

H22 =(H ′11 +H ′22

2

)−(H ′11 −H ′22

2

)cos(2θ) +H ′12 sin(2θ) (2.6)

Hkj = H ′kj pour tout autre k, j. (2.7)

La densité de probabilité (éq. (2.2)) devient donc

P (H) = f11(H11(θ))f12(H12(θ))f22(H22(θ))N∏

tout autre k≤jfkj (Hkj) . (2.8)

67. Cet aspect important se manifeste clairement lors du calcul de la densité de probabilité jointe des valeurs propres.68. Ici également, l’argument qui consiste à maximiser l’entropie de la densité de probabilité résultante pour les

éléments de H peut être utilisé, ce qui est démontré à la fin de cette sous-section.

53

Page 64: Phénoménologie des neutrinos dans une théorie de matrices ...

Il faut maintenant imposer l’invariance sous rotation, qui implique que P (H) ne doit pas dépendre duparamètre θ. Cela se traduit donc nécessairement par la contrainte

∂P∂θ

= 0, (2.9)

de laquelle il résulte que

∂P∂f11

∂f11

∂H11

∂H11

∂θ+ ∂P∂f12

∂f12

∂H12

∂H12

∂θ+ ∂P∂f22

∂f22

∂H22

∂H22

∂θ= 0. (2.10)

Le calcul de ces dérivées (à l’aide des équations (2.4) à (2.6)) permet de réécrire la condition précédentecomme

Pf11

∂f11

∂H11(−2H12) + P

f12

∂f12

∂H12(H11 −H22) + P

f22

∂f22

∂H22(2H12) = 0. (2.11)

Puisque l’on souhaite résoudre pour f11, f12 et f22, l’idée est donc de considérer une séparation devariables afin d’isoler chacune des contributions. En divisant de chaque côté par −PH12 (H11 −H22),on obtient

2f11

∂f11

∂H11

(1

H11 −H22

)− 2f22

∂f22

∂H22

(1

H11 −H22

)= 1f12

∂f12

∂H12

(1H12

)= −C1, (2.12)

où la constante C1 (qui doit être positive afin que la distribution résultante puisse être proprementnormalisée) est introduite car les deux côtés de l’égalité dépendent de variables distinctes, c’est-à-direque lorsque l’on résout pour un des côtés de l’égalité (2.12), l’autre agit comme une constante. Onpeut maintenant utiliser (2.12) pour résoudre dans un premier temps pour f12, ce qui donne

f12(H12) = B1e−C12 H2

12 , (2.13)

où B1 est une constante. En utilisant ensuite les termes restants de l’équation (2.12), on peut écrire

1f11

∂f11

∂H11+ C1

2 H11 = 1f22

∂f22

∂H22+ C1

2 H22 = C2, (2.14)

ce qui donne, selon le même raisonnement,

f11(H11) = B2e−C14 H2

11+C2H11 , f22(H22) = B3e−C14 H2

22+C2H22 . (2.15)

À partir des résultats (2.13) et (2.15), on peut donc constater que ces éléments sont bien distribuésselon une gaussienne. De plus, en imposant une moyenne nulle pour les éléments de (2.15), cela permetde simplifier les expressions obtenues puisque C2 = 0. Bien entendu, l’argument présenté dans cettesection peut être généralisé en choisissant différentes transformations O de façon à couvrir tous leséléments de H. 69 Ce faisant, en utilisant le patron général pour les éléments d’une transformation O69. Ceci relève du fait que l’on peut toujours paramétriser les éléments d’une rotation dans un plan arbitraire d’un

espace à d dimensions comme Oij =

Oaa = cos(θ), Oab = − sin(θ)Oba = sin(θ), Obb = cos(θ)Ojj = 1 j 6= a et j 6= b

Oij = 0 ailleurs

, avec 1 ≤ a < b ≤ d. Ici, les valeurs a et b

déterminent le plan de rotation défini par les axes xa et xb de cet espace. Conséquemment, les indices 1 et 2 de (2.12)peuvent être remplacés par a et b respectivement pour obtenir une expression générale qui couvre tous les éléments deH selon le patron précédemment déterminé [61].

54

Page 65: Phénoménologie des neutrinos dans une théorie de matrices ...

et la symétrie Hkj = Hjk, on peut écrire une expression pour la distribution de tous les éléments deH puisque ceux-ci suivent le patron précédemment obtenu (éq. (2.13) et (2.15)), c’est-à-dire que

P (H) = Ce−14σ2

(∑k

H2kk+2

∑k<j

H2kj

)= Ce

−14σ2

(∑k

H2kk+∑k<j

H2kj+∑k>j

H2kj

)= Ce

−14σ2

∑k,j

H2kj

, (2.16)

où σ2 est la variance. 70 Finalement, il s’avère que l’on peut réécrire l’expression (2.16) sous une formeplus simple en utilisant les relations

∑kj H

2kj =

∑k

∑j HkjHjk =

∑k

(H2)

kk, ce qui donne

P (H) dH = Ce−14σ2 tr(H2)dH. (2.17)

Le résultat (2.17) décrit bien une distribution gaussienne invariante sous transformations orthogonales.Afin de vérifier que cette forme particulière maximise bien l’entropie de la densité de probabilitéjointe des éléments de matrice P (H), il faut d’abord introduire le résultat bien connu pour l’entropiedifférentielle S(P) d’un système continu [27], soit

S(P) = −ˆ ∞−∞P (H) ln (P (H)) dH. (2.18)

Il s’agit ensuite d’imposer les contraintesˆ ∞−∞P (H) dH = 1,

ˆ ∞−∞

tr(H2)P (H) dH = 2σ2, (2.19)

pour s’assurer que la distribution P (H) soit bien normalisée et que le second moment de chaqueélément indépendant correspond à la variance précédemment définie. Cela permet alors d’écrire lafonctionnelle

S(P) = −ˆ ∞−∞P (H) ln (P (H)) dH − η

(ˆ ∞−∞

tr(H2)P (H) dH − 2σ2

)+(ln(C) + 1)

(ˆ ∞−∞P (H) dH − 1

), (2.20)

où η et C sont des multiplicateurs de Lagrange. Comme la condition d’entropie maximale est δS = 0,où la variation est faite en fonction de P, cela implique qu’il faut d’abord calculer

δS(P (H))δP (H ′) = −

ˆ ∞−∞

(δP (H)δP (H ′) ln (P (H)) + δP (H)

δP (H ′)

)dH − η

ˆ ∞−∞

tr(H2) δP (H)

δP (H ′)dH

+(ln(C) + 1)ˆ ∞−∞

δP (H)δP (H ′)dH

= −ˆ ∞−∞

(ln (P (H)) + 1) δ(H −H ′)dH − ηˆ ∞−∞

tr(H2) δ(H −H ′)dH

+(ln(C) + 1)ˆ ∞−∞

δ(H −H ′)dH

= − ln (P (H ′))− ηtr(H ′2

)+ ln(C),

70. Selon cette définition [61], les éléments hors diagonale ont une variance de σ2 alors que celle des éléments de ladiagonale est de 2σ2.

55

Page 66: Phénoménologie des neutrinos dans une théorie de matrices ...

où δ(H − H ′) est la fonction delta de Dirac. En renommant H = H ′ et en imposant la conditionδS = 0, cela permet d’obtenir l’égalité

− ln (P (H))− ηtr(H2)+ ln(C) = 0 ⇒ P (H) = Ce−ηtr(H2). (2.21)

Il suffit ensuite de substituer ce résultat dans les deux contraintes de départ pour fixer la valeur desmultiplicateurs de Lagrange η et C et ainsi retrouver la forme (2.17). À partir de ce calcul, on peutdonc conclure que la forme gaussienne est bien celle qui maximise l’entropie de P. Par conséquent,cette approche procure un point de vue alternatif reposant sur la théorie de l’information pour obtenirP (H), c’est-à-dire que la matrice H doit être la plus aléatoire possible considérant les contraintesqu’elle doit satisfaire (matrice réelle et symétrique de variance finie pour l’ensemble GOE). Ainsi,parmi toutes les distributions P (H) possibles qui satisfont les propriétés de H, cela revient à choisircelle qui maximise l’entropie S(P). Autrement dit, la distribution résultante ne doit pas contenir plusd’information que ce qui est requis par les contraintes [26].

2.2.2 Distribution jointe des valeurs propres

On s’intéresse ensuite à la densité de probabilité jointe (distribution jointe) des valeurs propres de cesmatrices, ce qui consiste essentiellement à faire un changement de variables à partir du résultat (2.17).Naturellement, il s’agit d’une étape importante dans l’étude de tout système stochastique puisque lesvaleurs propres sont généralement associées à des observables physiques. Pour ce faire, il faut d’abordpréciser qu’une matrice H réelle et symétrique de dimensions N ×N possède N valeurs propres réellesque l’on note λk (k = 1, . . . , N). À chaque valeur propre est alors associée un vecteur propre Vk selon larelation HVk = λkVk, d’où il en résulte que l’on peut définir Vk = (A1k, A2k, . . . , ANk)T , c’est-à-direque les vecteurs propres (normalisés) forment les colonnes d’une matrice A qui diagonalise H.

Pour passer de l’espace des éléments de matrice à celui des valeurs propres, il faut donc s’assurer d’avoirle même nombre de degrés de liberté de chaque côté pour que le jacobien de la transformation soitbien défini. Puisque la matrice H possède N(N + 1)/2 éléments indépendants et seulement N valeurspropres, il faut donc considérer N(N−1)/2 paramètres additionnels pour caractériser complètement latransformation, ce qui correspond précisément au nombre de paramètres libres qui sont nécessaires pourdécrire une matrice orthogonale réelle (il s’agit ici de la matrice A). 71 Ces paramètres supplémentaires,notés αl pour la suite du calcul, sont généralement associés à des angles et des phases qui paramétrisentla rotation. Considérant la notation précédemment introduite, on peut écrire l’équation aux valeurspropres sous une forme plus compacte, soit

HA = AΛ, où Λ = diag(λ1, λ2, . . . , λN ). (2.22)

Ensuite, en multipliant l’équation (2.22) par la droite avec AT , on obtient que

H = AΛAT , ⇒ Hij =N∑k=1

λkAikAjk, (2.23)

71. Puisqu’une matrice orthogonale N × N respecte OTO = OOT = IN , celle-ci est soumise à N contraintes denormalisation (la diagonale de IN ) et N(N −1)/2 contraintes supplémentaires pour s’assurer que celle-ci est orthogonale(les 0 du triangle supérieur de IN par exemple). Il y a donc N(N + 1)/2 contraintes possibles pour un total de N2

éléments dans O. Cela correspond donc à un système sous-déterminé, avec N(N − 1)/2 paramètres libres.

56

Page 67: Phénoménologie des neutrinos dans une théorie de matrices ...

ce qui définit la transformation orthogonale qui diagonalise H. Les points importants ici sont, d’unepart, que les éléments de H ont une dépendance linéaire en fonction des valeurs propres et, d’autrepart, que les éléments de A dépendent uniquement des nouveaux paramètres introduits (αl). Il s’agitalors d’appliquer ce changement de variables à l’expression (2.17), ce qui permet de constater, dans unpremier temps, que

P (H) = Ce−14σ2 tr(H2) → Ce

−14σ2 tr(AΛATAΛAT ) = Ce

−14σ2 tr(Λ2) = Ce

−14σ2

N∑i=1

λ2i

. (2.24)

Ainsi, comme P (H) est invariante sous transformations orthogonales, cela signifie que celle-ci dépenduniquement des valeurs propres λi. L’élément de volume dH (la mesure) doit ensuite être calculé,c’est-à-dire que

dH =N∏k≤j

dHkj → |det(J)|N∏i=1

dλi

N(N−1)2∏l=1

dαl, (2.25)

où la matrice jacobienne J associée au changement de variables (2.23) est partitionnée selon [26]

J(λi, αl) =(

∂Hjj∂λi

∂Hjj∂αl

∂Hjk∂λi

∂Hjk∂αl

), (2.26)

pour i = 1, . . . , N , l = 1, . . . , N(N − 1)/2 et 1 ≤ j < k ≤ N (seulement les éléments du trianglesupérieur de H sont utilisés). La matrice J(λi, αl) est donc de dimensions N(N + 1)/2×N(N + 1)/2.Pour être en mesure d’obtenir le déterminant de cette matrice, la première étape correspond donc aucalcul des dérivées partielles. En utilisant la version matricielle de (2.23) et en dérivant par rapportaux paramètres αl, on a que

∂H

∂αl= ∂A

∂αlΛAT +AΛ∂A

T

∂αl. (2.27)

En multipliant par la gauche avec AT et par la droite avec A, le résultat précédent devient

AT∂H

∂αlA = AT

∂A

∂αlΛ + Λ∂A

T

∂αlA. (2.28)

Ensuite, en utilisant la condition d’orthogonalité ATA = IN , on trouve la relation

∂AT

∂αlA = −AT ∂A

∂αl, (2.29)

que l’on peut substituer dans (2.28) pour obtenir

AT∂H

∂αlA = AT

∂A

∂αlΛ− ΛAT ∂A

∂αl. (2.30)

Pour simplifier la notation, posons D(l) ≡ AT ∂A∂αl

, ce qui donne, en fonction des éléments de matrice

∑j,k

Ajm∂Hjk

∂αlAkn =

∑j

∂Hjj

∂αlAjmAjn + 2

∑j<k

∂Hjk

∂αlAjmAkn = D(l)

mn (λn − λm) . (2.31)

De façon équivalente, en inversant la relation matricielle de (2.23), on trouve une expression pour les

57

Page 68: Phénoménologie des neutrinos dans une théorie de matrices ...

dérivées partielles par rapport aux valeurs propres λi, soit∑j,k

Ajm∂Hjk

∂λiAkn =

∑j

∂Hjj

∂λiAjmAjn + 2

∑j<k

∂Hjk

∂λiAjmAkn = ∂Λmn

∂λi= δmnδmi. (2.32)

Ainsi, pour calculer le déterminant de (2.26), la stratégie consiste ensuite à introduire une nouvellematrice V que l’on multiplie à J dans le but d’obtenir une forme simplifiée en tirant profit des équations(2.31) et (2.32). Avec la définition

V =(

AjmAjn2AjmAkn

), (2.33)

où 1 ≤ j < k ≤ N et 1 ≤ m ≤ n ≤ N , cela permet de prendre la multiplication suivante (on peutvérifier que V a bien les mêmes dimensions que J)

V TJ =(

∂Hjj∂λi

AjmAjn + 2∂Hjk∂λiAjmAkn

∂Hjj∂αl

AjmAjn + 2∂Hjk∂αlAjmAkn

)T=(

δmnδmi

D(l)mn (λn − λm)

)T. (2.34)

Ici, une somme sur les indices j et k, avec j < k, est sous-entendue dû au produit matriciel. Il suffitensuite de prendre le déterminant de chaque côté de l’égalité (en utilisant la propriété det(BT ) =det(B)) pour obtenir

det(V )det(J) = det((

δmnδmi

D(l)mn (λn − λm)

)). (2.35)

Selon cette notation, les indices i et l identifient les différentes rangées (le bloc supérieur contient doncN rangées alors que le bloc inférieur en contientN(N−1)/2) et les indicesm et n, avec 1 ≤ m ≤ n ≤ N ,indiquent comment se déplacer sur ces rangées (ils identifient les colonnes). De plus, il s’avère que lamatrice du côté droit de l’expression (2.35) peut toujours être ramenée à une forme diagonale par blocssans changer le déterminant. Pour développer une certaine intuition avec cette notation, vérifions lecas N = 3. Cette matrice peut alors s’écrire

1 0 0 0 0 00 1 0 0 0 00 0 1 0 0 00 0 0 D

(1)12 (λ2 − λ1) D

(1)13 (λ3 − λ1) D

(1)23 (λ3 − λ2)

0 0 0 D(2)12 (λ2 − λ1) D

(2)13 (λ3 − λ1) D

(2)23 (λ3 − λ2)

0 0 0 D(3)12 (λ2 − λ1) D

(3)13 (λ3 − λ1) D

(3)23 (λ3 − λ2)

, (2.36)

où seulement des permutations de colonnes ont été nécessaires pour obtenir ce résultat. 72 Le détermi-nant de la matrice (2.36) est donc égal au déterminant du bloc inférieur droit. De plus, notons que cebloc contient trois facteurs différents qui multiplient trois colonnes différentes. Un théorème bien connud’algèbre linéaire stipule que si une matrice M1 de dimension N ×N peut être obtenue en multipliantune colonne (ou une rangée) d’une seconde matriceM2 (de même dimension) par un facteur non nul c,alors leurs déterminants sont liés par la relation det(M1) = cdet(M2). En appliquant ce raisonnementtrois fois de façon successive, on peut donc extraire le produit (λ2−λ1)(λ3−λ1)(λ3−λ2)det(. . .) dansle calcul du déterminant du bloc inférieur droit de (2.36). Bien sûr, les opérations décrites pour le casN = 3 se généralisent directement au cas où les matrices sont de dimensions arbitraires, ce qui signifie72. Dans le cas d’un nombre impair de permutations de colonnes (ou de rangées), il faut introduire un signe (−) dans

le calcul du déterminant. Cependant, au final ce signe est toujours absorbé par la valeur absolue de l’expression (2.25).

58

Page 69: Phénoménologie des neutrinos dans une théorie de matrices ...

que la forme générale de ce déterminant s’écrit

det(J) =∏m<n

(λn − λm) g (αl) , (2.37)

où g (αl) est une fonction des paramètres contenus dans A. En substituant cette expression dans (2.25)pour ensuite marginaliser (intégrer) sur les αl (ce qui ne fait que modifier la constante de normalisation),on obtient que la distribution finale prend la forme

P(λ1, . . . , λN )dλ1 . . . dλN = CNe−14σ2

∑i

λ2i ∏m<n

|λn − λm|dλ1 . . . dλN . (2.38)

La présence du facteur |λn − λm| contenu dans le jacobien (2.37) est nécessaire pour que celui-cidevienne nul dans le cas où λn = λm. Ceci est dû au fait que dans une telle situation, les vecteurspropres associés à ces deux valeurs propres ne sont pas bien définis (ils ne sont pas déterminés defaçon unique) et la relation (2.23) n’est pas unique, alors le déterminant doit être nul pour tous lescas où λn = λm. Finalement, la démarche présentée dans cette sous-section s’applique également auxensembles GUE et GSE en tenant compte de la nature complexe et quaternionique de leurs élémentsrespectifs. Par ailleurs, une fois que les densités de probabilité jointes pour les valeurs propres de cestrois ensembles sont calculées, il s’avère possible de les réécrire sous une forme compacte en utilisantl’indice β de Dyson, soit

P(λ1, . . . , λN )dλ1 . . . dλN = CβNe−β4σ2

∑i

λ2i ∏m<n

|λn − λm|β dλ1 . . . dλN . (2.39)

où β = 1, 2, 4 pour l’ensemble GOE, GUE et GSE respectivement (notons que le facteur β doitégalement apparaître devant la trace pour ce qui est de la distribution (2.17)) [26]. Pour trouver laconstante de normalisation CβN , il faut recourir à une intégrale multidimensionnelle sur les valeurspropres λn. Pour le cas spécifique des ensembles gaussiens, qui implique des valeurs propres réellescomprises dans l’intervalle −∞ < λn < ∞ (matrices hermitiennes), cette intégrale est obtenue enregardant un cas limite de l’intégrale de Selberg (voir (A.2)), ce qui permet d’écrire [26]

CβN =(

12π

)N/2(β

2σ2

)N/2+βN(N−1)/4 Γ(1 + β/2)N∏Nj=1 Γ(1 + βj/2)

. (2.40)

À partir de ces résultats, on peut donc constater que malgré le fait que les éléments de matrice soientgénérés aléatoirement et de façon indépendante, les valeurs propres, elles, sont des variables aléa-toires fortement corrélées entre elles dues à la présence du module du déterminant de Vandermonde∏m<n |λn − λm| dans la distribution (2.39). En fait, ce facteur est responsable d’un comportement

plutôt inusité, c’est-à-dire que les valeurs propres se repoussent mutuellement telles des particules demême charge électrique.

Ainsi, la densité de probabilité des valeurs propres, bien qu’obtenue en considérant des éléments dematrice générés aléatoirement, permet de mettre en évidence des patrons et une certaine régularité dansle spectre des observables physiques que l’on souhaite étudier. En fait, pour les ensembles gaussiens,cette remarque est d’autant plus vraie dans la limite N →∞, où la distribution résultante possède un

59

Page 70: Phénoménologie des neutrinos dans une théorie de matrices ...

comportement complètement déterminé par la loi du semicercle de Wigner [26]. Bien que cette limitene joue pas de rôle majeur dans le cadre de ce projet de recherche, il est tout de même intéressantde mentionner que celle-ci peut être obtenue en considérant la limite thermodynamique d’un gaz departicules chargées en interaction (gaz de Coulomb) possédant une distribution macroscopique continue[26]. Enfin pour étendre le type d’analyse présenté dans cette sous-section à des ensembles matricielsaléatoires plus élaborés, il devient nécessaire de passer en revue certaines techniques de calcul etrésultats couramment utilisés dans le domaine de l’analyse statistique multivariée, ce qui constituel’étape finale avant de pouvoir entreprendre l’étude des ensembles seesaw.

2.3 Éléments d’analyse statistique multivariée

La section précédente a donc permis de se familiariser avec certains outils constituant l’arsenal de based’une théorie de matrices aléatoires tels que les distributions multivariées et le calcul de jacobiens. Enfait, pour étudier le spectre des matrices d’intérêt, un effort considérable a dû être fourni pour obtenirle jacobien de la transformation associée, ce qui a constitué l’objectif principal de la sous-section pré-cédente. Cependant, comme la méthode utilisée nécessite de calculer le déterminant d’une matrice dedérivées partielles (ce qui représente sans doute l’approche la plus intuitive pour le calcul de jacobiens),celle-ci peut rapidement devenir lourde et ardue lorsqu’appliquée à des systèmes à plusieurs variables(de même que pour des éléments de matrice complexes et quaternioniques).

Pour cette raison, une méthode alternative est également couramment employée dans la littérature, quifait appel à la notion de produit extérieur [64]. 73 Cette méthode, qui peut être directement généraliséeà d’autres types de transformations (décomposition en valeurs singulières, factorisations de Choleskyou de Schur, décomposition QR) et d’ensembles matriciels aléatoires (pour une matrice aléatoire réelle,complexe, symétrique, etc.) [65, 66, 67, 68], possède ainsi un avantage clair par rapport à la méthode« force brute » introduite précédemment. Comme la méthode du produit extérieur est celle qui a étéprivilégiée pour l’étude des ensembles seesaw, la sous-section suivante a donc pour but d’élaborer surcette technique particulière.

2.3.1 Propriétés du produit extérieur

Puisque cette méthode repose sur la multiplication de forme différentielle et plus particulièrement,sur le fait que cette multiplication est anticommutative, il s’avère instructif dans un premier tempsd’étudier le cas d’une transformation bivariée. Ainsi, par simplicité, considérons l’intégrale suivante

I =ˆD

f(x1, x2)dx1dx2, (2.41)

où D ∈ R2. Pour les besoins du calcul, appliquons ensuite un changement de variables de la forme

x1 = x1(y1, y2) et x2 = x2(y1, y2). (2.42)

73. Cette méthode est bien connue en mathématique et plus particulièrement, dans le domaine des matrices aléatoireset de l’analyse statistique multivariée. Cependant, jusqu’à tout récemment [31], celle-ci était complètement absente dela littérature existante associée au principe anarchique en lien avec la phénoménologie des neutrinos.

60

Page 71: Phénoménologie des neutrinos dans une théorie de matrices ...

Afin d’obtenir l’intégrale résultante à la suite de cette transformation tout en procédant de façonusuelle, considérons la définition standard d’une matrice jacobienne, soit

J =

∂x1∂y1

. . . ∂x1∂ym

... . . . ...∂xm∂y1

. . . ∂xm∂ym

, (2.43)

qui implique le calcul des dérivées partielles et où m représente le nombre de variables considérées. Àla suite du calcul de |det(J)|, l’intégrale (2.41) prend donc la forme

I =ˆD′f(x1(y1, y2), x2(y1, y2))

∣∣∣∣∂x1

∂y1

∂x2

∂y2− ∂x1

∂y2

∂x2

∂y1

∣∣∣∣dy1dy2, (2.44)

où D′ est l’image de D. Pour faire le parallèle avec la multiplication de formes différentielles, rappelonsque pour toute fonction xi = xi(y1, . . . , ym), la différentielle s’écrit

dxi = ∂xi∂y1

dy1 + . . .+ ∂xi∂ym

dym (i = 1, . . . ,m). (2.45)

Donc, en supposant que ces différentielles sont multipliées selon les règles usuelles d’associativité et dedistributivité, le produit dx1dx2 donne

dx1dx2 = ∂x1

∂y1

∂x2

∂y1dy1dy1 + ∂x1

∂y1

∂x2

∂y2dy1dy2 + ∂x1

∂y2

∂x2

∂y1dy2dy1 + ∂x1

∂y2

∂x2

∂y2dy2dy2. (2.46)

Cependant, en comparant ce résultat au résultat (2.44), cela permet de constater que dans le cas oùdy1dy2 = −dy2dy1 et où dy1dy1 = dy2dy2 = 0, ces deux résultats deviennent équivalents. En fait, cespropriétés particulières définissent ce qui est appelé le produit extérieur (identifié par le symbole ∧),où la multiplication de deux formes différentielles dyi et dyj est anticommutative et se note

dyi ∧ dyj = −dyj ∧ dyi, (2.47)

de telle sorte que dyi∧dyi = −dyi∧dyi = 0. Il va sans dire que cet exemple simple, à partir duquel onpeut déduire les propriétés du produit extérieur, se généralise naturellement à un système où le nombrede variables est arbitraire [64]. Plus précisément, si dy est un vecteur m×1, le calcul des différentielless’écrit dx = Jdy, ce qui correspond simplement à la forme matricielle de (2.45), où J est une matricem×m donnée par (2.43). Dans ce cas, le produit extérieur satisfait la relation suivante

m∧i=1

dxi = det(J)m∧i=1

dyi. (2.48)

Cette procédure formelle pour multiplier les différentielles est donc équivalente à calculer le jacobiende la transformation (sans oublier qu’il faut ensuite prendre la valeur absolue du résultat obtenu).Par ailleurs, dans le cas plus général où une transformation est écrite sous forme matricielle, ce quiconstitue le principal sujet d’étude de ce travail, la notation suivante est adoptée

[dX] ≡m∧j=1

n∧k=1

dXjk = dX11 ∧ dX12 ∧ . . . ∧ dXmn, (2.49)

61

Page 72: Phénoménologie des neutrinos dans une théorie de matrices ...

où le symbole [dX] est donc défini comme le produit extérieur de tous les mn éléments distincts d’unematrice arbitraire dX de dimensions n ×m. Cela implique également que pour des matrices m ×msymétriques (X = XT ) ou antisymétriques (X = −XT ), le produit extérieur des m(m + 1)/2 (oum(m− 1)/2) éléments distincts (indépendants) est plutôt

[dX] =m−1∧j=1

m∧k=j

dXjk ou [dX] =m−1∧j=1

m∧k=j+1

dXjk, (2.50)

respectivement. De plus, dans le cas où X est une matrice complexe, soit X = Re(X) + i Im(X),les parties réelles et imaginaires doivent être traitées séparément, ce qui permet d’écrire dXjk =Re(dX)jk ∧ Im(dX)jk, où la différentielle résultante est donc constituée du produit extérieur des par-ties réelles et imaginaires respectivement. Finalement, à partir de ces propriétés, plusieurs identitéscouramment utilisées pour le calcul de transformations appliquées à des distributions multivariéespeuvent être démontrées [64]. Parmi celles-ci, une identité particulièrement utile dans le cas de trans-formations hermitiennes de la forme X = BY B† (matrices complexes) est donnée par

[dX] = det(B)2m [dY ] , (2.51)

où X et Y sont des matrices hermitiennes (ou antihermitiennes) m ×m alors que B est une matriceconstante et non singulière (de déterminant non nul) également de dimensions m×m [66]. Ce résultatpeut être mis à profit pour calculer, par exemple, le jacobien de la décomposition en valeurs proprespour l’ensemble GUE. Dans ce travail, plusieurs identités de ce genre sont utilisées et celles-ci peuventêtre trouvées, en grande partie, dans [64, 66].

2.3.2 Calcul de mesures : l’ensemble gaussien unitaire

Ainsi, afin d’illustrer la force de cette technique et de pouvoir la comparer avec celle qui a été employéedans le cas de l’ensemble GOE, il s’avère intéressant de regarder le cas de l’ensemble GUE plus en détail.Puisque l’on connait déjà la forme résultante pour cet ensemble, qui est donnée (sans démonstration)par la relation (2.39) avec β = 2, celle-ci peut être directement comparée avec la mesure obtenuedans cette sous-section. Pour ce faire, considérons une matrice H (hermitienne) de dimensions N ×Ndiagonalisée par la transformation H = UΛU†, où U est une matrice unitaire (U ∈ U(N)) appropriéetelle que Λ = diag(λ1, λ2, . . . , λN ). La différentielle de ce produit matriciel peut donc s’écrire

dH = (dU)ΛU† + U(dΛ)U† + UΛdU†. (2.52)

En multipliant par la droite avec U et par la gauche avec U†, on obtient

U†dHU = U†(dU)Λ + dΛ + Λ(dU†)U

= (U†dU)Λ− Λ(U†dU) + dΛ, (2.53)

où la dernière ligne est obtenue en utilisant la condition d’unitarité U†U = IN , c’est-à-dire que

(dU†)U + U†dU = 0 ⇒ U†dU = −(dU†)U = −(U†dU)†. (2.54)

62

Page 73: Phénoménologie des neutrinos dans une théorie de matrices ...

Puisque la quantité que l’on souhaite calculer est [dH], on peut prendre le produit extérieur de chaquecôté de l’égalité (2.53). En utilisant le résultat (2.51) et en prenant la valeur absolue, le côté gauchedonne simplement 74 [

U†dHU]

=∣∣det(U†)

∣∣2N [dH] = [dH] , (2.55)

ce qui implique que le produit extérieur du côté droit de l’expression (2.53) donne directement laquantité souhaitée. Il faut donc, à présent, s’attarder aux propriétés des éléments de matrice du côtédroit. Pour simplifier la notation, on pose T = (U†dU)Λ − Λ(U†dU) + dΛ, ce qui implique que leséléments de T sont donnés par

Tjk =

dλj j = k

(U†dU)jkλk − λj(U†dU)jk j 6= k.

Ensuite, due à la dernière égalité de (2.54), on a que U†dU = −(U†dU)†, ce qui définit une matriceantihermitienne. Cela implique donc que Re(U†dU) = −Re(U†dU)T et que Im(U†dU) = Im(U†dU)T ,soit une matrice antisymétrique (avec des éléments nuls sur la diagonale) et symétrique respectivement.Le produit extérieur des éléments indépendants donne alors

[dH] =N∧j≤k

Tjk =N∧j=1

Tjj

N∧j<k

Tjk =N∧j=1

dλjN∧j<k

Re(T )jk ∧ Im(T )jk

=N∧j=1

dλjN∧j<k

(Re(U†dU)jkλk − λjRe(U†dU)jk

)∧(Im(U†dU)jkλk − λjIm(U†dU)jk

)=

N∧j=1

dλjN∧j<k

(λk − λj)2 Re(U†dU)jk ∧ Im(U†dU)jk

=N∏j<k

|λk − λj |2N∧j=1

dλjN∧j<k

(U†dU)jk, (2.56)

ce qui correspond bien au résultat attendu. Cet exemple permet donc de constater que cette méthodede calcul est beaucoup plus directe que celle employée précédemment pour l’ensemble GOE. Souscette forme, la propriété de factorisation du jacobien en deux parties distinctes associées aux valeurspropres et aux variables impliquant les vecteurs propres, 75 soit les éléments de (U†dU)jk, est clairementvisible (cette factorisation est présente pour les trois ensembles gaussiens et découle de l’invariance souschangements de base de la distribution). Les éléments (U†dU)jk, présents pour les mêmes raisons queles paramètres αl de l’ensemble GOE, peuvent donc toujours être intégrés pour obtenir une constantequi doit être prise en compte dans la normalisation de la mesure obtenue pour les valeurs propres.Finalement, comme les matrices impliquées dans la construction des ensembles seesaw (MD,MR,ML)sont des matrices qui ne sont pas hermitiennes (dans le cas complexe), les mesures résultantes ne sontdonc pas aussi simples à obtenir et la méthode du produit extérieur peut être utilisée avantageusement74. Le déterminant d’une matrice unitaire peut toujours être paramétrisé sous une forme exponentielle, ce qui n’est

pas égal à 1 en général. Cependant, puisque l’on s’intéresse uniquement à la valeur absolue du déterminant lorsque l’oncalcule des jacobiens, la quantité |det(U)| est donc toujours égale à 1 pour une matrice unitaire. Une façon de s’enconvaincre est de considérer la relation U†U = IN pour ensuite prendre le déterminant de chaque côté, ce qui donnedet(U†U) = 1. Ce faisant, en utilisant les propriétés du déterminant, cette expression se simplifie à det(U†) det(U) =det(U)∗ det(U) = |det(U)|2 = 1. Un raisonnement similaire peut être utilisé pour une matrice orthogonale.75. Il s’agit des variables associées au groupe de symétrie auquel appartient la matrice U qui définit la transformation,

soit le groupe unitaire U(N) dans ce cas.

63

Page 74: Phénoménologie des neutrinos dans une théorie de matrices ...

dans ce contexte. De plus, cette méthode permet de mettre en évidence un patron intéressant en ce quiconcerne la mesure sur les variables du groupe pour ces cas spécifiques. En fait, il s’avère qu’en raisondes propriétés de ces matrices et de la factorisation du jacobien correspondant, la mesure obtenue peutêtre identifiée à la mesure de Haar du groupe de Lie correspondant (O(N) ou U(N)) pour la majoritédes cas d’intérêt. Cette particularité influence donc directement les prédictions des ensembles seesawen ce qui concerne les angles de mélange et des phases complexes.

2.3.3 Variété de Stiefel et mesure de Haar

Dans l’analyse des ensembles matriciels présentée jusqu’à maintenant, où l’accent a été mis sur ladistribution des valeurs propres, la mesure sur les variables du groupe a simplement été trivialementintégrée et la constante résultante a été absorbée dans la normalisation de la distribution finale. Cepen-dant, comme démontré au chapitre 3, cette partie de la mesure contient de l’information importantesur les paramètres physiques associés aux angles de mélange et aux phases complexes dans le cas desensembles seesaw. Par ailleurs, puisque la mesure de Haar est une quantité récurrente dans la construc-tion de ces ensembles, au même titre que la constante de normalisation associée à cette mesure (levolume de la variété de Stiefel correspondante), cette sous-section a donc pour but d’introduire et dedéfinir les quantités propres à cette mesure particulière.

De façon générale, l’ensemble de toutes les matrices U de dimensions n×m (n ≥ m) dont les colonnessont orthonormées est appelé la variété de Stiefel et se note CVm,n [66], c’est-à-dire que

CVm,n = U ∈M(n, m, F); U†U = Im, (2.57)

où F = R, C, H et M(n, m, F) représente l’espace vectoriel de toutes les matrices n×m ayant deséléments réels, complexes ou quaternioniques. Dans ce qui suit, on s’intéresse principalement aux casspécifiques où les éléments de matrice sont réels ou complexes avec n = m = N , ce qui définit lesvariétés orthogonales et unitaires. Ce faisant, l’un des buts premier de cette sous-section est donc decalculer les volumes suivants :

Vol(O(N)) ≡ˆ

O(N)[U†dU ], où [U†dU ] ≡

N∧j<k

(U†dU)jk pour U ∈ O(N), (2.58)

Vol(U(N)) ≡ˆ

U(N)[U†dU ], où [U†dU ] ≡

N∧j≤k

(U†dU)jk pour U ∈ U(N). (2.59)

Ici, la quantité [U†dU ], qui implique de prendre le produit extérieur de tous les éléments indépendantsde la matrice U†dU , correspond à la définition de la mesure de Haar du groupe en question. Parsimplicité, considérons le cas de matrices réelles pour la suite de ce calcul. Le point de départ consistealors à introduire l’intégrale suivante (voir également (A.1))

ˆ ∞−∞

. . .

ˆ ∞−∞

e− 12 tr(ZTZ)dZ = (2π)N

22 , (2.60)

qui signifie que Z est une matrice réelle N × N dont les éléments sont des variables aléatoires indé-pendantes générées selon une loi normale N (0, 1). Afin d’extraire la quantité d’intérêt, considérons la

64

Page 75: Phénoménologie des neutrinos dans une théorie de matrices ...

transformation Z = UT , où U ∈ O(N) et T est une matrice triangulaire supérieure (où les élémentsde la diagonale sont définis positivement tjj > 0 de telle sorte que U et T soient uniques), c’est-à-direque Z est décomposée en une partie orthogonale et une partie triangulaire (soit une décomposition detype QR). En se référant ensuite au théorème 2.1.13 de [64], la quantité [dZ] est donnée par

[dZ] =N∏j=1

tN−jjj

N∧j≤k

dtjkN∧j<k

(U†dU)jk, (2.61)

alors que tr(ZTZ) = tr(T TT ) =∑j≤k |tjk|

2. Sous ce changement de variable, l’intégrale (2.60) devient

ˆRN

e−12

∑j≤k|tjk|2

N∏j=1

tN−jjj

N∏j≤k

dtjkˆ

O(N)[U†dU ] = (2π)N

22 .

L’idée ici est donc de résoudre l’intégrale sur dtjk pour être en mesure d’isoler une expression concernantl’intégrale sur les variables du groupe. Pour ce faire, on peut réécrire l’intégrale précédente comme

(2π)N2

2 =N∏j<k

ˆ ∞−∞

e− 12 |tjk|

2dtjk

N∏j=1

ˆ ∞0

e− 12 |tjj |

2tN−jjj dtjj

ˆO(N)

[U†dU ]

=N∏j<k

√2π

N∏j=1

2 12 (N−j−1)Γ

(N − j + 1

2

)ˆO(N)

[U†dU ],

ce qui implique ˆO(N)

[U†dU ] = 2NπN(N+1)/4∏Nj=1 Γ( j2 )

(2.62)

en renommant (N−j+1)→ j dans le produit de fonctions gamma. En utilisant le même raisonnementpour le cas complexe (voir [66]), le volume final pour ces deux variétés peut donc s’écrire sous la formecompacte suivante :

Vol(CV βN,N ) =ˆU∈CV β

N,N

[U†dU ] = 2NπβN(N+1)/4∏Nj=1 Γ(βj2 )

, (2.63)

où β = 1, 2 dans les cas réel et complexe respectivement, ce qui signifie que CV 1N,N = O(N) et

que CV 2N,N = U(N). Ayant cette quantité en main, il s’avère maintenant possible de normaliser la

mesure de Haar de façon appropriée de telle sorte que celle-ci puisse correspondre à une densité deprobabilité. Finalement, cette mesure est dite « spéciale » en ce sens qu’il s’agit de l’unique mesurequi est invariante sous une action par la gauche ou par la droite du groupe de Lie correspondant surlui-même [60]. Cela signifie que, par exemple, pour le cas complexe où U → V0U avec U, V0 ∈ U(N),on a que

U†dU → U†V †0 V0dU = U†dU, ⇒ [U†dU ]→ [U†dU ] (2.64)

alors que pour U → UV0, on obtient plutôt

U†dU → V †0 (U†dU)V0, ⇒ [U†dU ]→∣∣det(V †0 )

∣∣2N [U†dU ] = [U†dU ] (2.65)

en utilisant le résultat (2.51) et en prenant la valeur absolue. Puisque la forme différentielle est inva-riante, il va de soi que le volume résultant est aussi invariant sous ces transformations. En raison de

65

Page 76: Phénoménologie des neutrinos dans une théorie de matrices ...

cette invariance, la mesure de Haar sur la variété CV βN,N peut donc être inteprétée comme une généra-lisation de la mesure de Lebesgue sur RN . En fait, cette invariance sous « translation » correspond aucritère d’uniformité de la mesure sur CV βN,N , ce qui implique, pour les cas étudiés, que la mesure deHaar est une façon de mesurer l’uniformité dans les groupes O(N) et U(N). 76 Celle-ci joue donc unrôle important en mathématiques et en physique. Enfin, la mesure de Haar peut prendre différentesformes selon la paramétrisation choisie pour les matrices orthogonales ou unitaires. Par exemple, pourles besoins de ce travail, le cas U(3) avec la paramétrisation (1.37) (incluant les phases de MajoranaΨM et les phases non physiques ϕj) s’avère particulièrement important et donne, une fois normalisé,

[U†νdUν ]Vol(U(3)) = 1

16π6 sin(2θ12) sin(θ13) cos3(θ13) sin(2θ23)dθ12dθ13dθ23dδdα21dα31dϕ1dϕ2dϕ3, (2.66)

où les angles de mélange θij sont restreints à l’intervalle [0, π2 ] alors que les phases physiques (δ, α21

et α31) et non physiques (ϕ1, ϕ2 et ϕ3) sont comprises dans l’intervalle [0, 2π]. Puisque le résultat(1.37) correspond à la paramétrisation standard de la matrice PMNS, les trois phases non physiquesn’apparaissent pas explicitement car celles-ci sont toujours absorbées dans une redéfinition des champsdu lagrangien associé. Il faut donc les réintroduire afin de pouvoir calculer la mesure de Haar, ce quiimplique de multiplier le résultat (1.37) par la gauche avec une matrice de phases diagonale [38]. Deplus, il faut choisir une convention appropriée pour ces phases de façon à préserver la normalisation de(2.66), ce qui définit alors la matrice unitaire complète Uν . Ayant exploré la mesure sur les variablesdu groupe plus en détail, il s’avère maintenant possible d’entreprendre le calcul des jacobiens d’intérêtpropres aux ensembles seesaw.

2.3.4 Décomposition en valeurs singulières et mesures associées

Puisque dans le cadre de ce travail on s’intéresse à la diagonalisation de matrices de type Dirac etMajorana (voir (1.112)), qui sont des matrices complexes arbitraires et complexes symétriques, leursvaleurs propres sont, en général, dispersées dans le plan complexe (contrairement aux matrices hermi-tiennes, qui ont toujours des valeurs propres réelles). Ainsi, bien que le terme « valeurs propres » aitété utilisé tout au long du premier chapitre pour parler des masses des neutrinos, il s’agit, en fait, d’unléger abus de langage couramment employé en physique. La terminologie appropriée est plutôt, dans cecontexte, « valeurs singulières », qui implique des valeurs strictement réelles et non négatives. Commementionné au chapitre 1, la décomposition en valeurs singulières d’une matrice complexe arbitraireM consiste à factoriser cette matrice selon M = UΛV †, où U et V sont des matrices unitaires (onparle alors de transformation biunitaire) appropriées telles que Λ est une matrice diagonale, réelle etnon négative contenant les valeurs singulières. Dans le cas d’une matrice M symétrique et complexe,la décomposition en valeurs singulières s’écrit plutôt M = UΛUT , où une seule matrice unitaire estnécessaire en raison de la symétrie présente (voir annexe A). Dans cette sous-section, les principalesmesures nécessaires à la construction des ensembles seesaw sont donc redérivées à partir de ces trans-formations. Par souci de généralité et parce que la méthode du produit extérieur permet un calculdirect de ces quantités, les mesures d’intérêt sont calculées à la fois pour les cas réels et complexes76. En utilisant une notation alternative pour définir la mesure de Haar, qui correspond à dµ(U), le critère d’uniformité

peut être écrit comme dµ(UV0) = dµ(U), avec V0 une matrice fixe appartenant à O(N) ou U(N) par exemple. Pourdévelopper une certaine intuition avec ce concept, le cas U(1) (N = 1) peut s’avérer instructif. Dans ce cas, on a queU = eiφ et dµ(U) = dφ mesure le périmètre d’un cercle de rayon unitaire (0 ≤ φ ≤ 2π). En définissant V0 = eiφ0 , onpeut vérifier que cette mesure est bien uniforme puisque d(φ+ φ0) = dφ pour tout changement de phase fixe φ0.

66

Page 77: Phénoménologie des neutrinos dans une théorie de matrices ...

[31]. Dans ce qui suit, une attention particulière est portée à la propriété de factorisation des mesuresrésultantes et plus précisément, à la mesure obtenue sur les variables du groupe.

2.3.4.1 Matrices symétriques réelles et complexes

Pour une matrice M réelle (complexe) et symétrique de dimensions N × N , le théorème de décom-position en valeurs propres (valeurs singulières) stipule qu’il existe une matrice U réelle (complexe)satisfaisant U†U = IN (U ∈ O(N), U(N)) telle que M = UΛUT , où Λ est réelle et correspond àΛ = diag(λ1, λ2, . . . , λN ). De plus, l’ordre peut être fixé selon λN ≥ λN−1 ≥ . . . ≥ λ1 avec λ1 > −∞dans le cas réel et λ1 ≥ 0 dans le cas complexe. 77 La différentielle de cette transformation est

dM = (dU)ΛUT + U(dΛ)UT + UΛdUT , (2.67)

que l’on peut ensuite multiplier par la gauche avec U† et par la droite avec U∗ pour obtenir

U†dMU∗ = U†(dU)Λ + dΛ + Λ(dUT )U∗

= (U†dU)Λ + dΛ + Λ(U†dU)T

= (U†dU)Λ− Λ(U†dU)∗ + dΛ, (2.68)

où la dernière ligne est obtenue à partir de la condition d’unitarité (ou d’orthogonalité) de façonsimilaire à (2.54). Bien entendu, ce résultat est écrit en adoptant la forme la plus générale qui supposedes éléments complexes. La forme résultante pour le cas réel, plus simple, est donc obtenue lorsque lessimplifications appropriées sont appliquées. Par conséquent, le produit extérieur du côté gauche peutêtre obtenu en se référant à une identité analogue à (2.51), soit [64]

[U†dMU∗] =

∣∣det(UT )

∣∣N+1 [dM ] = [dM ] (Réel)∣∣det(U†)∣∣2(N+1) [dM ] = [dM ] (Complexe), (2.69)

ce qui correspond aux résultats souhaités. Pour ce qui est du côté droit, les éléments de la matriceT = (U†dU)Λ− Λ(U†dU)∗ + dΛ sont donc donnés par

Tjk =

dλj + λj((U†dU)jj − (U†dU)∗jj

)j = k

(U†dU)jkλk − λj(U†dU)∗jk j 6= k.(2.70)

Dans un premier temps, calculons le produit extérieur pour le cas réel. On obtient que

[dM ] =N∧j≤k

Tjk =N∧j=1

dλjN∧j<k

(λk − λj)(U†dU)jk

=N∏j<k

|λk − λj |N∧j=1

dλjN∧j<k

(U†dU)jk, (2.71)

77. Dans le cas réel, il s’avère impossible de restreindre λ1 à des valeurs non négatives puisque seulement une seulematrice orthogonale est présente dans la transformation. Il ne s’agit donc pas de valeurs singulières mais bien de valeurspropres. Pour illustrer ce point, prenons le cas N = 1. En inversant la décomposition M = UΛUT , on obtient queU2

11M11 = λ1, où λ1 doit être définie tel que λ1 ≡ |M11|. Ainsi, pour M11 < 0, il n’existe aucune valeur réelle de U11satisfaisant U2

11M11 = |M11|. Dans le cas complexe cependant, puisque la transformation inverse s’écrit (U∗11)2M11 = λ1,où λ1 ≡

√|M11|2, on peut toujours trouver une valeur de U11 satisfaisant cette relation, soit U11 = (M11/M∗11)1/4.

67

Page 78: Phénoménologie des neutrinos dans une théorie de matrices ...

ce qui correspond, bien entendu, au résultat obtenu pour le jacobien des valeurs propres de l’ensemblegaussien orthogonal (ce qui n’est pas surprenant puisque cette transformation définit l’ensemble GOE,voir (2.37)). Pour ce qui est du cas complexe, le produit extérieur prend plutôt la forme

[dM ] =N∧j≤k

Re(T )jk ∧ Im(T )jk

=N∧j=1

dλj ∧ 2λjIm(U†dU)jjN∧j<k

(λk − λj)Re(U†dU)jk ∧ (λk + λj) Im(U†dU)jk

= 2NN∏j=1

λj

N∏j<k

(λ2k − λ2

j

) N∧j=1

Im(U†dU)jjdλjN∧j<k

Re(U†dU)jk ∧ Im(U†dU)jk

= 2NN∏j=1|λj |

N∏j<k

∣∣λ2k − λ2

j

∣∣ N∧j=1

dλjN∧j≤k

(U†dU)jk. (2.72)

À partir de ces résultats, une première observation qu’il s’avère important de souligner est que dans lesdeux cas, le produit extérieur de la quantité (U†dU)jk est réalisé sur l’ensemble des éléments distinctsde U†dU (dans le cas réel, cette matrice est antisymétrique alors que dans le cas complexe, elle estantihermitienne (2.54)), contrairement au résultat (2.56) par exemple. Ainsi, cette mesure particulièrecorrespond bien à la mesure de Haar introduite précédemment et celle-ci se retrouve donc au coeurdes prédictions associées aux ensembles seesaw. 78 Les deux résultats obtenus dans cette sous-sectionpeuvent être combinés pour obtenir

[dM ] = CβSN

N∏j<k

∣∣∣λβk − λβj ∣∣∣ N∏j=1|λj |β−1 dλj [U†dU ], (2.73)

avec β = 1, 2 (selon la définition de l’indice de Dyson) et où la constante de normalisation est donnéepar

CβSN = 2(β−1)N

2NN ! = 12(2−β)NN ! . (2.74)

Conséquemment, la région d’intégration est −∞ < λj < ∞ pour l’ensemble des valeurs propresdans le cas réel et 0 ≤ λj < ∞ pour l’ensemble des valeurs singulières dans le cas complexe (ce quiexplique le facteur de N ! au dénominateur pour les deux cas, c’est-à-dire que l’ordre des valeurs propres(singulières) n’est pas fixé). 79 En ce qui concerne le facteur additionnel de 2N au dénominateur pour lescas réel et complexe, celui-ci s’explique par le fait que la décomposition en valeurs propres (singulières)n’est pas unique (et que l’on suppose des valeurs propres (singulières) distinctes), c’est-à-dire qu’enremplaçant U → US dans la décompositionM = UΛUT , où S = diag(±1, . . . ,±1), le résultat demeureinchangé. Ce facteur implique également que la constante d’intégration pour la mesure sur les variablesdu groupe (mesure de Haar) correspond au volume de Stiefel (2.63) dans les cas réel et complexe.

78. Comme on peut maintenant le constater, dans le cas des ensembles gaussiens, seul l’ensemble gaussien orthogonalpossède une mesure sur les variables du groupe (O(N) dans ce cas) qui correspond à la mesure de Haar. Pour les ensemblesGUE et GSE, ces variables se combinent simplement aux valeurs propres pour former l’unique mesure invariante soustransformation unitaire ou symplectique. Ceci est dû au fait que le produit extérieur de la quantité (U†dU)jk n’est pasréalisé sur tous les éléments distincts pour ces ensembles en raison de leurs symétries particulières.79. En définissant la région d’intégration de cette façon, cela implique que toutes les façons possibles d’ordonner les

N valeurs singulières (valeurs propres) sont comptabilisées dans le résultat final. Pour que la distribution résultanteP(M)dM soit proprement normalisée une fois intégrée sur l’élément de volume complet (l’ensemble des variables d’in-tégration), il faut donc diviser par le nombre total de permutations.

68

Page 79: Phénoménologie des neutrinos dans une théorie de matrices ...

2.3.4.2 Matrices arbitraires réelles et complexes

La procédure pour obtenir les mesures dans le cas d’une matrice arbitraire est sensiblement la même. Lethéorème de décomposition en valeurs singulières pour une matrice arbitraire M réelle (complexe) dedimensions N ×N implique qu’il existe des matrices réelles (complexes) U et V satisfaisant U†U = INet V †V = IN (U, V ∈ O(N), U(N)) de telle sorte que M = UΛV †, où Λ = diag(λ1, λ2, . . . , λN ) estune matrice diagonale réelle qui peut être ordonnée selon λN ≥ λN−1 ≥ . . . ≥ λ1, avec λ1 ≥ 0 pour lescas réel et complexe. Pour cette transformation, la différentielle s’écrit

dM = (dU)ΛV † + U(dΛ)V † + UΛdV †. (2.75)

En multipliant ensuite par la gauche avec U† et par la droite avec V , on obtient

U†dMV = U†(dU)Λ + dΛ + Λ(dV †)V

= (U†dU)Λ− Λ(V †dV ) + dΛ, (2.76)

où la propriété d’antihermiticité (ou d’antisymétrie) de V †dV a été utilisée. Suivant le même raison-nement qu’introduit précédemment, le produit extérieur du côté gauche est simplement [64]

[U†dMV ] =

∣∣det(UT )

∣∣N ∣∣det(V )∣∣N [dM ] = [dM ] (Réel)∣∣det(U†)∣∣2N ∣∣det(V )∣∣2N [dM ] = [dM ] (Complexe)

. (2.77)

En définissant ensuite une matrice T telle que T = (U†dU)Λ−Λ(V †dV ) + dΛ, les éléments de matricedu côté droit s’obtiennent à partir de

Tjk =

dλj + λj((U†dU)jj − (V †dV )jj

)j = k

(U†dU)jkλk − λj(V †dV )jk j 6= k.(2.78)

Cette fois, le produit extérieur du côté droit doit être fait sur tous les éléments de matrice puisqueceux-ci sont a priori distincts. Considérons dans un premier temps le cas d’une matrice réelle. Leproduit extérieur donne donc

[dM ] =N∧j=1

N∧k=1

Tjk =N∧j=1

Tjj

N∧j<k

Tjk ∧ Tkj

=N∧j=1

dλjN∧j<k

((U†dU)jkλk − λj(V †dV )jk

)∧((U†dU)kjλj − λk(V †dV )kj

)=

N∧j=1

dλjN∧j<k

λ2k(U†dU)jk ∧ (V †dV )jk + λ2

j (V †dV )jk ∧ (U†dU)jk

=N∏j<k

∣∣λ2k − λ2

j

∣∣ N∧j=1

dλjN∧j<k

(U†dU)jk ∧ (V †dV )jk, (2.79)

où la propriété d’antisymétrie des matrices U†dU et V †dV a été utilisée. Ici également, la mesuresur les variables du groupe correspond à la mesure de Haar puisque tous les éléments distincts appa-raissent dans le produit extérieur. La mesure se factorise donc en un produit de deux mesures de Haar

69

Page 80: Phénoménologie des neutrinos dans une théorie de matrices ...

impliquant les paramètres de U et V respectivement. Finalement, le dernier cas d’intérêt implique deséléments de matrice complexes et le produit extérieur de tous les éléments distincts est [67]

[dM ] =N∧j=1

N∧k=1

Tjk =N∧j=1

Re(T )jj ∧ Im(T )jjN∧j<k

Re(T )jk ∧ Im(T )jk ∧ Re(T )kj ∧ Im(T )kj

=N∧j=1

dλj ∧ λj(Im(U†dU)jj − Im(V †dV )jj

) N∧j<k

(Re(U†dU)jkλk − λjRe(V †dV )jk

)∧(Re(U†dU)kjλj − λkRe(V †dV )kj

)∧(Im(U†dU)jkλk − λjIm(V †dV )jk

)∧(Im(U†dU)kjλj − λkIm(V †dV )kj

)=

N∧j=1

dλj ∧ λj(Im(U†dU)jj − Im(V †dV )jj

) N∧j<k

(λ2k − λ2

j

)2 Re(U†dU)jk ∧ Re(V †dV )jk

∧ Im(U†dU)jk ∧ Im(V †dV )jk

=N∏j=1|λj |

N∏j<k

∣∣λ2k − λ2

j

∣∣2 N∧j=1

dλj ∧(Im(U†dU)jj − Im(V †dV )jj

) N∧j<k

(U†dU)jk ∧ (V †dV )jk,

où la propriété d’antisymétrie de Re(U†dU)jk et Re(V †dV )jk, de même que la propriété de symétriede Im(U†dU)jk et Im(V †dV )jk ont été utilisées. De plus, tout signe (−) global a été ignoré puisquel’on prend toujours la valeur absolue du résultat final. Le résultat précédent permet donc de constaterque la mesure sur les variables du groupe pour les deux matrices unitaires n’est pas directement lamesure de Haar pour ce cas précis. Conséquemment, afin d’obtenir la constante de normalisationassociée, il devient alors nécessaire d’examiner les propriétés de cette mesure plus en détail. Puisqu’ils’avère beaucoup plus simple de normaliser la distribution résultante sachant que l’on peut intégrerdirectement sur la mesure de Haar [U†dU ] et [V †dV ] (comme pour le cas réel (2.79), ce qui donnesimplement un produit de deux volumes de Stiefel), l’idée est donc de trouver la quantité permettantde réécrire le résultat précédent sous la forme d’un produit de deux mesures de Haar et d’étudierles conséquences de cette modification pour la mesure d’origine. Par inspection, il s’avère possible deconclure que la quantité 1

2(Im(U†dU)jj + Im(V †dV )jj

), une fois insérée dans la partie diagonale de

la mesure précédente, permet d’obtenir le résultat souhaité, c’est-à-dire que

N∧j=1

dλj ∧(Im(U†dU)jj − Im(V †dV )jj

)∧1

2(Im(U†dU)jj + Im(V †dV )jj

)=

N∧j=1

dλj ∧ Im(U†dU)jj ∧ Im(V †dV )jj . (2.80)

En ajoutant cette contribution additionnelle, on peut donc écrire la mesure modifiée [dM ]? comme

[dM ]? =N∏j=1|λj |

N∏j<k

∣∣λ2k − λ2

j

∣∣2 N∧j=1

dλjN∧j≤k

(U†dU)jk ∧ (V †dV )jk, (2.81)

où le produit extérieur sur les variables du groupe est maintenant fait sur tous les éléments distincts, cequi correspond bien à un produit de deux mesures de Haar comme dans le cas réel. Cette modification,réalisée uniquement dans le but de trouver une façon adéquate d’exprimer et de normaliser la mesure

70

Page 81: Phénoménologie des neutrinos dans une théorie de matrices ...

d’origine, n’est évidemment pas sans conséquence sur le nombre de paramètres indépendants du côtédroit de l’expression (2.81). Afin de comprendre l’impact de cet ajout, il est important de se rappelerque dans le cas complexe, la décomposition en valeurs singulièresM = UΛV † admet une symétrie par-ticulière, c’est-à-dire qu’en définissant une matrice de phases diagonale D = diag(eiφ1 , eiφ2 , . . . , eiφN )et en multipliant par la droite tel que U → UD et V → VD, on peut vérifier que le résultat demeureinchangé, soit M = UDΛD†V † = UΛV †. Bien entendu, cela implique que ces phases communes nesont pas présentes dans la mesure d’origine, ce qui se vérifie directement à partir des relations

U†dU → D†(U†dU)D + D†dD, V †dV → D†(V †dV )D + D†dD. (2.82)

En effet, celles-ci peuvent être substituées, par exemple, dans la partie diagonale de la mesure sur lesvariables du groupe pour obtenir

N∧j=1

Im(D†(U†dU)D +D†dD−D†(V †dV )D−

D†dD)jj =N∧j=1

Im(U†dU − V †dV )jj , (2.83)

puisque l’on s’intéresse uniquement aux éléments de la diagonale. En ce qui concerne la partie horsdiagonale, celle-ci prend plutôt la forme

N∧j<k

D†j(U†dU)jkDk ∧D†j(V †dV )jkDk =∣∣∣ N∏j<k

e−2i(φj−φk)∣∣∣ N∧j<k

(U†dU)jk ∧ (V †dV )jk

=N∧j<k

(U†dU)jk ∧ (V †dV )jk (2.84)

car la matrice D†dD est diagonale et que le produit des phases disparaît sous la valeur absolue.Cependant, la quantité ajoutée pour compléter les deux mesures de Haar, soit 1

2 Im(U†dU + V †dV )jj ,se transforme de la façon suivante

12 Im(D†(U†dU)D + D†(V †dV )D + 2D†dD)jj = 1

2 Im(U†dU + V †dV + 2D†dD)jj . (2.85)

Ces phases communes sont donc contenues dans le produit des deux mesures de Haar, alors qu’ellessont absentes de la mesure d’origine sur les variables du groupe dues à la symétrie particulière discutéeprécédemment. Pour corriger cette situation, il suffit de constater que ces N phases peuvent toujoursêtre trivialement intégrées (Im(D†dD)jj = dφj avec 0 ≤ φj ≤ 2π), générant ainsi un facteur de (2π)N .Revenant maintenant à la constante de normalisation obtenue lorsqu’on intègre sur les variables dugroupe, cela signifie que le produit des deux volumes de Stiefel est trop gros d’un facteur de (2π)N

dans le cas complexe dû aux N phases communes excédentaires qui sont présentes dans le produit desdeux mesures de Haar. Ces observations permettent ainsi d’écrire la mesure finale comme

[dM ] = CβAN

N∏j<k

∣∣λ2k − λ2

j

∣∣β N∏j=1|λj |β−1 dλj [U†dU ]′[V †dV ], (2.86)

avec β = 1, 2 et où la constante de normalisation est donnée par

CβAN = 12(2−β)NN ! . (2.87)

71

Page 82: Phénoménologie des neutrinos dans une théorie de matrices ...

Dans ce cas, la constante de normalisation CβAN est obtenue en considérant une région d’intégrationcorrespondant à 0 ≤ λj <∞ pour toutes les valeurs singulières des cas réel et complexe, ce qui expliquele facteur de N ! au dénominateur. De plus, pour le cas réel seulement, le facteur de 2(2−β)N au déno-minateur tient compte de la liberté engendrée par l’invariance de cette décomposition sous l’échangeU → US et V → V S, où S = diag(±1, . . . ,±1) (la décomposition n’est pas unique). 80 Finalement, lanotation utilisée dans (2.86), qui implique un prime sur une des deux mesures de Haar, constitue sim-plement un rappel que pour le cas complexe, ce ne sont pas tous les éléments sur la diagonale de U†dUet V †dV qui contribuent à cette mesure mais seulement la combinaison spécifique Im(U†dU−V †dV )jj .Néanmoins, pour trouver la constante de normalisation associée, il s’avère toujours possible de fairecomme si la mesure sur les variables du groupe correspond à un produit de deux mesures de Haaret compenser en divisant le résultat obtenu par le volume associé aux paramètres excédentaires ainsiintroduits, soit un facteur de (2π)(β−1)N (voir [31]). Autrement dit, la liberté engendrée par l’inva-riance sous les transformations combinées U → UD et V → VD permet, par exemple, de fixer lesphases de la matrice D de telle sorte que Im(U†dU +D†dD)jj = 0 pour j = 1, . . . , N dans l’expression(2.83), ce qui a pour effet d’éliminer les éléments sur la diagonale de la matrice U†dU . Cependant,en fixant les phases de cette façon, une contribution de la forme Im(V ′†dV ′)jj où V ′ = VD demeureprésente, ce qui permet d’écrire la mesure sur les variables du groupe de la matrice V ′ comme une me-sure de Haar complète (V ′ est simplement renommée V dans l’expression (2.86)). 81 Enfin, notons quecertaines des mesures présentées dans cette sous-section ont déja été discutées dans [24]. Cependant,comme les démonstrations qui y sont présentées pour le cas de matrices N ×N s’appuyent en partiesur des arguments heuristiques, les résultats ainsi obtenus sont introduits à titre de conjectures. Danscette sous-section, des preuves complètes ont été présentées à l’aide de la méthode du produit extérieur.

Ceci complète le survol entrepris dans ce chapitre afin de couvrir certains éléments de théories concer-nant le principe anarchique, la théorie des matrices aléatoires et le calcul de mesures. Le messageprincipal de ce chapitre peut donc être résumé en quelques points. Premièrement, en ce qui concernele secteur des neutrinos dans la limite des basses énergies, le fait de générer les matrices de masse ob-tenues de façon aléatoire constitue une approche viable et prometteuse pour extraire de l’informationpertinente sur les paramètres physiques de ce secteur. Deuxièmement, bien que les éléments de matricesoient générés aléatoirement et de façon indépendante, les valeurs singulières (valeurs propres) sontdes variables aléatoires fortement corrélées entre elles possédant des distributions non triviales. Pourobtenir ces distributions, il s’agit de faire un changement de variable permettant de passer de l’espacedes éléments de matrice à celui des valeurs singulières (valeurs propres) et des variables du groupesuivant la décomposition appropriée. Finalement, il va sans dire que la théorie des matrices aléatoiresest un sujet beaucoup plus vaste que ce qui a été abordé dans ce chapitre. Néanmoins, tous les outilsnécessaires sont maintenant en place pour entreprendre la construction des ensembles seesaw et ainsiobtenir des résultats concrets pour le secteur des neutrinos.

80. La seule exception correspond au cas spécifique N = 1, pour lequel aucune décomposition (ou procédure dediagonalisation) n’est nécessaire. Dans ce cas précis, il faut donc éviter de diviser par 2 et la constante de normalisationdoit être modifiée en conséquence. Ce raisonnement, uniquement valide pour le cas réel, s’applique également à laconstante CβSN obtenue précédemment. Quoi qu’il en soit, ce cas ne sera pas discuté davantage dans ce travail.81. Le prime de [U†dU ]′, qui signifie que les éléments diagonaux de U†dU ont été éliminés dans le cas complexe (ce

qui implique de prendre le produit extérieur des éléments indépendants de la partie hors diagonale seulement), permetd’extraire N phases de la mesure finale seulement si une paramétrisation spécifique (telle que (A.13)) est utilisée, où cesphases apparaissent complètement à droite dans le produit matriciel caractérisant U . Celui-ci aurait pu être placé surl’une où l’autre des deux mesures de Haar présentes et le choix [U†dU ]′ est motivé par certains résultats du chapitre 3.

72

Page 83: Phénoménologie des neutrinos dans une théorie de matrices ...

Chapitre 3

Ensembles seesaw

Finalement, après avoir passé en revue les trois mécanismes de masse au chapitre 1 et présenté laméthodologie propre à ce projet de recherche au chapitre 2, il est maintenant temps d’introduire et dedécortiquer les résultats obtenus à partir des ensembles seesaw. Ce chapitre regroupe donc l’essentieldes résultats originaux obtenus dans le cadre de cette thèse, qui peuvent également être trouvés dans[31, 32, 33]. Ainsi, une attention particulière est portée aux densités de probabilité multivariées quicaractérisent ces ensembles. Puisque celles-ci sont fonction des masses et des paramètres d’oscillationpour chaque ensemble considéré, l’information sur les paramètres physiques d’intérêt peut donc êtreextraite de leur distribution marginale respective. Le secteur des neutrinos du modèle standard étenduest donc étudié en profondeur et les prédictions des différents mécanismes de masse sous l’hypothèseanarchique sont comparées.

3.1 Définitions et concepts de base

Comme mentionné précédemment, bien que le principe anarchique ait été présent dans la littératuredepuis quelque temps déjà, peu d’analyses détaillées ont été réalisées selon cet axe de recherche. Enfait, ce n’est qu’à partir de 2012 qu’une définition plus précise des ensembles seesaw a été proposée etétudiée [29]. 82 Cependant, l’approche adoptée dans [29], c’est-à-dire de préconiser un développementdans la limite N →∞ afin d’obtenir une approximation pour le cas N = 3 (où N correspond au nombrede générations du modèle standard étendu) 83 à partir d’un ansatz jugé « adéquat » pour représenterles densités de probabilité multivariées qui caractérisent ces ensembles, a amené les auteurs à avancercertaines conclusions qui sont aujourd’hui remises en question. Outre le fait que ceux-ci n’ont pas offertde preuve rigoureuse indiquant que ce type d’approximation puisse représenter une bonne descriptiondu cas N = 3, l’ingrédient clé absent de cette analyse est, bien entendu, une expression analytiquecomplète pour les densités de probabilité multivariées. En fait, étant donné la forme des matrices demasse des mécanismes seesaw de type I et III, l’obtention d’une telle expression constitue un défiremarquable à relever (le mécanisme seesaw de type II s’avère être beaucoup plus simple) et pour cetteraison, ce type de calcul a toujours été ignoré au profit d’analyses numériques (ou d’approximationsanalytiques) plus simples, mais beaucoup moins riches en information. Conséquemment, l’objectifprincipal de ce projet de recherche est d’obtenir une forme analytique pour les densités de probabilité82. En fait, cette définition était limitée au mécanisme de type I seulement.83. Cette approche est analogue au développement en 1/N de QCD, où N est le nombre de couleurs.

73

Page 84: Phénoménologie des neutrinos dans une théorie de matrices ...

multivariées qui caractérisent les ensembles seesaw. Dans cette section, les différentes étapes permettantd’obtenir les quantités souhaitées sont donc détaillées, en commençant par une définition formelle desensembles seesaw.• L’ensemble seesaw de type I-IIIIl s’agit de la matrice aléatoire Mν satisfaisant un produit matriciel de la forme

Mν = MD(MR)−1 (MD)T,

et munie de la mesure de probabilité appropriée Pν(Mν)dMν . Ici, MD est une matrice aléatoiresans structure (arbitraire) de dimensions N×N dont les éléments peuvent être réels ou complexeset MR est une matrice aléatoire symétrique et inversible de dimensions N ×N dont les élémentspeuvent être réels ou complexes.

• L’ensemble seesaw de type IIIl s’agit de la matrice aléatoire Mν satisfaisant l’égalité

Mν = ML,

et munie de la mesure de probabilité appropriée Pν(Mν)dMν . Ici, ML est une matrice aléatoiresymétrique de dimensions N ×N dont les éléments peuvent être réels ou complexes.

Le premier constat que l’on peut faire à partir de ces définitions est que bien qu’il existe trois mé-canismes de masse, seulement deux ensembles matriciels peuvent être définis car du point de vueanarchique, les mécanismes seesaw de type I et III sont indiscernable (même structure matricielle).Cela implique que l’on aurait pu choisir, par exemple, de définir l’ensemble seesaw de type I-III avecla matrice MΣ au lieu de MR puisque ce choix n’affecte pas la structure ou les propriétés du produitmatriciel qui définissent cet ensemble. De plus, le signe négatif (voir (1.112)) a été omis puisqu’il peuttoujours être absorbé par une rotation appropriée lors de la diagonalisation de la matrice Mν (ons’intéresse aux valeurs singulières). Finalement, l’ensemble seesaw de type II, beaucoup plus simple,est introduit pour permettre une comparaison des résultats obtenus et il est sous-entendu que les ma-trices sont générées aléatoirement selon les lignes directrices définies au chapitre 2 (d’emblée, on peutdonc constater que la mesure caractérisant l’ensemble seesaw de type II est simplement celle associéeaux matrices symétriques). Il va sans dire que les principaux résultats de cette section concernent l’en-semble seesaw de type I-III, qui est beaucoup plus intéressant du point de vue d’une théorie de matricesaléatoires et pour lequel un calcul de la distribution complète n’a jamais été tenté dans la littérature.Dans ce qui suit, les distributions de ces deux ensembles sont calculées de façon générale en fonctionde N et β à partir des résultats du chapitre 2. Bien sûr, comme le cas du modèle standard étendu faitl’objet d’une attention particulière dans ce travail, l’idée ici est simplement de poser N = 3 et β = 2dans les résultats obtenus dans cette section afin de pouvoir étudier cette distribution spécifique.

3.1.1 Ensembles de base de type Dirac et Majorana

La première étape consiste donc à fixer les mesures de probabilité des matrices de masse élémentaires detype Dirac et Majorana qui forment la base des deux ensembles seesaw. Suivant les critères définissantle principe anarchique (voir chapitre 2 et [30, 31]), celles-ci sont donc de forme gaussienne et s’écrivent

PD(MD)dMD =(

12πΛ2

D

) βN22

e− 1

2Λ2D

tr(MD†MD) N∏j, k

dMDjk (3.1)

PR(MR)dMR =(

1πΛ2

R

) βN(N−1)4

(1

2πΛ2R

) βN2

e− 1

2Λ2R

tr(MR†MR) N∏j≤k

dMRjk, (3.2)

74

Page 85: Phénoménologie des neutrinos dans une théorie de matrices ...

où la distribution (3.2) est également valide pour les matrices ML et MΣ . Ici, les distributions ontété proprement normalisées à partir de leur écart type respectif ΛD et ΛR (dans le cas de MR, cettedéfinition est valide pour les éléments de la diagonale seulement, les éléments hors diagonale ont plutôtun écart type de ΛR/

√2) suivant le résultat bien connu pour une intégrale gaussienne (voir (A.1)). De

plus, afin de simplifier les calculs subséquents, il s’avère utile d’introduire les variables sans dimensionMD = MD

/(√

2ΛD) et MR = MR/(√

2ΛR), de telle sorte que les distributions deviennent

PD(MD)dMD =(

) βN22

e−tr(MD†MD)N∏j, k

dMDjk, (3.3)

PR(MR)dMR = 2βN(N−1)

4

πβN(N+1)

4

e−tr(MR†MR)N∏j≤k

dMRjk. (3.4)

Ainsi, à partir du théorème de décomposition en valeurs singulières (valeurs propres) et des résultatsdu chapitre 2, les distributions des valeurs singulières (valeurs propres) s’obtiennent directement àpartir de (2.86) et (2.73). Les masses associées à ces deux types de matrices sont donc distribuées selon

PD(mD1 , . . . , m

DN )dmD

1 . . . dmDN = CβDN

∏j<k

∣∣(mDk )2 − (mD

j )2∣∣β N∏j=1

∣∣mDj

∣∣β−1 e−(mDj )2dmD

j , (3.5)

PR(mR1 , . . . , m

RN )dmR

1 . . . dmRN = CβRN

∏j<k

∣∣(mRk )β − (mR

j )β∣∣ N∏j=1

∣∣mRj

∣∣β−1 e−(mRj )2dmR

j , (3.6)

où mDk sont les valeurs singulières (masses) associées à la matrice MD et où mR

k sont les valeurs singu-lières (valeurs propres dans le cas β = 1) associées à la matrice MR. Comme les résultats précédentsconcernent uniquement les distributions des masses, les constantes de normalisation sont données par

CβDN =(

) βN22

CβAN

ˆU∈CV ′ β

N,N

V ∈CV βN,N

[U†dU ]′[V †dV ] =(

) βN22(

12(2−β)NN !

) Vol(CV βN,N )2

(2π)(β−1)N ,

CβRN = 2βN(N−1)

4

πβN(N+1)

4

CβSN

ˆU∈CV β

N,N

[U†dU ] = 2βN(N−1)

4

πβN(N+1)

4

(1

2(2−β)NN !

)Vol(CV βN,N ),

ce qui donne, une fois simplifié

CβDN = 2NπN(1− β2 )N !

N∏j=1

1Γ(βj2 )2

, CβRN = 2N(β(N+3)−4)

4

N !

N∏j=1

1Γ(βj2 )

. (3.7)

Ici, le prime de CV ′ βN,N signifie que dans le cas complexe, les N phases « excédentaires » ne sont pasprésentes dans l’intégrale, comme discuté au chapitre 2. Par ailleurs, ces constantes de normalisationpeuvent également être obtenues à partir d’une intégrale de type Selberg sur les valeurs singulières (voir(A.3)). On peut donc constater que pour le cas de l’ensemble seesaw de type II, la majorité du travail estmaintenant fait. Comme la distribution de cet ensemble est simplement donnée par l’expression (3.4),le résultat (3.6) avec R → L, combiné à la mesure sur les variables du groupe [U†dU ] de (2.73) (quidoit être normalisée) et la constante de normalisation (3.7), constituent en réalité les seuls ingrédients

75

Page 86: Phénoménologie des neutrinos dans une théorie de matrices ...

nécessaires pour en étudier les propriétés. En contrepartie, l’ensemble seesaw de type I-III impliqueun développement beaucoup plus laborieux et plusieurs étapes supplémentaires sont nécessaires avantd’arriver au résultat souhaité. À la sous-section suivante, ce calcul est entrepris et il est montré qu’unchangement de variable est nécessaire afin d’obtenir la distribution des masses. Ce faisant, l’un desrésultats clés de ce travail est obtenu, soit le jacobien de la transformation associée.

3.1.2 L’ensemble seesaw de type I-III

Pour obtenir la distribution caractérisant l’ensemble seesaw de type I-III [31], le point de départcorrespond bien entendu aux distributions PD(MD)dMD et PR(MR)dMR obtenues précédemment(les résultats (3.3) et (3.4)). De plus, la quantité sans dimension Mν = Mν

/(√

2Λν) est introduite, oùΛν correspond à l’échelle d’énergie des masses et est donnée par la relation Λν = Λ2

D/ΛR puisque

Mν =√

2ΛνMν =√

2Λ2D

ΛRMD(MR)−1(MD)T . (3.8)

Comme Mν = Mν(MR, MD), la première étape consiste donc à obtenir la densité de probabilité jointede MR et MD pour ensuite extraire la densité de probabilité marginale de Mν . En supposant que cesdistributions sont statistiquement indépendantes, on peut écrire la densité de probabilité jointe comme

PR,D(MR, MD)dMRdMD = PR(MR)PD(MD)dMRdMD. (3.9)

Considérant que le but premier est d’obtenir Pν(Mν)dMν , il faut donc introduire une dépendance enMν dans l’expression (3.9). En inversant l’expression (3.8), on trouve que MR = (MD)T (Mν)−1MD,ce qui implique le changement de variable (MR, MD)→ (Mν , MD). 84 On obtient alors que

PR,D(MR, MD)dMRdMD → Pν,D(Mν , MD)dMνdMD, (3.10)

ce qui génère une densité de probabilité jointe pour Mν et MD de la forme

Pν,D(Mν , MD)dMνdMD = PR(

(MD)T (Mν)−1MD)PD(MD) |det (J)|dMνdMD. (3.11)

Ici, J = J(MR, MD → Mν , MD) est la matrice jacobienne associée à ce changement de variables.Pour obtenir la quantité souhaitée, il suffit ensuite de recourir à la loi des probabilités marginales, cequi donne

Pν(Mν)dMν ≡

−∞

Pν,D(Mν , MD)dMD

dMν

=

−∞

PR(

(MD)T (Mν)−1MD)PD(MD) |det (J)|dMD

dMν . (3.12)

On obtient donc l’expression générale pour le calcul de la densité de probabilité des éléments de Mν . Àprésent, la seule quantité qui demeure inconnue est le jacobien de la transformation |det (J)|, qui s’avèrejouer un rôle essentiel dans les calculs subséquents. Il devient donc important de pouvoir obtenir une

84. Ce choix est motivé par le fait que MR et Mν ont le même nombre de paramètres indépendants.

76

Page 87: Phénoménologie des neutrinos dans une théorie de matrices ...

expression générale (en fonction de N et β) pour cette quantité. Pour ce faire, rappelons que commela matrice MR est une fonction de Mν et MD dans ce changement de variables, la matrice jacobiennecomplète peut être écrite (de façon schématique) comme

J =

∂MD

∂MD

∂MD

∂Mν

∂MR

∂MD

∂MR

∂Mν

=

IβN2 0∂MR

∂MD

∂MR

∂Mν

, (3.13)

ce qui implique que |det (J)| =∣∣det(∂MR

∂Mν

)∣∣. Une fois de plus, ce jacobien peut être calculé à l’aidede la méthode du produit extérieur. En suivant le raisonnement présenté dans [64], tout en tenantcompte du fait que la quantité ∂MR

∂Mνdéfinit la matrice jacobienne obtenue à partir de la transformation

MR = (MD)T (Mν)−1MD, cela suggère que l’on peut mettre à profit une transformation matricielledu type X = CY CT pour trouver le déterminant requis. Ici, il est sous-entendu que C est une matriceN×N constante non singulière alors que X et Y sont des matrices N×N symétriques, ce qui impliqueégalement que la différentielle s’écrit dX = CdY CT . Dans un premier temps, des matrices réelles sontconsidérées. Dans ce cas, le produit extérieur des éléments indépendants donne

[dX] ≡N∧j≤k

dXjk =N∧j≤k

(CdY CT )jk = [CdY CT ] = p(C)[dY ], (3.14)

où p(C) est un polynôme qui est fonction des éléments de C et qui satisfait la relation

p(C1C2) = p(C1)p(C2). (3.15)

Afin de vérifier cette affirmation, on utilise l’identité (3.14), avec C → C1C2, pour écrire

p(C1C2)[dY ] = [C1C2dY (C1C2)T ] = [C1C2dY CT2 CT1 ]

= p(C1)[C2dY CT2 ] = p(C1)p(C2)[dY ], (3.16)

où une application répétée de cette identité est donc nécessaire pour obtenir le résultat souhaité. Parailleurs, il se trouve que le seul polynôme qui est à la fois une fonction des éléments de matrice etqui satisfait cette propriété pour tout C1 et C2 correspond à une puissance entière et positive dudéterminant [64], soit

p(C) = det(C)k, k ∈ Z+. (3.17)

Pour trouver cette puissance, il s’agit simplement d’adopter une forme particulière pour C, soit parexemple C = diag(c, 1, . . . , 1), ce qui permet rapidement d’obtenir

CdY CT =

c2dY11 cdY12 . . . c dY1N

cdY12 dY22 . . . dY2N...

... . . . ...

cdY1N dY2N . . . dYNN

. (3.18)

Ainsi, pour ce cas particulier, le produit extérieur des éléments indépendants de la différentielle dX

77

Page 88: Phénoménologie des neutrinos dans une théorie de matrices ...

s’écrit

[CdY CT ] =N∧j≤k

(CdY CT )jk = cN+1N∧j≤k

dYjk = cN+1[dY ], (3.19)

ce qui implique nécessairement la relation suivante pour une matrice réelle, soit

[dX] = |det(C)|N+1 [dY ]. (3.20)

Suivant ce résultat, on peut obtenir directement la puissance k dans le cas complexe. En effet, dans lecas où X = Re(X) + i Im(X) et Y = Re(Y ) + i Im(Y ), on a que

[dX] =N∧j≤k

Re(dX)jk ∧ Im(dX)jk

=N∧j≤k

|det(C)|N+1 Re(dY )jk ∧ |det(C)|N+1 Im(dY )jk

= |det(C)|2(N+1)N∧j≤k

Re(dY )jk ∧ Im(dY )jk, (3.21)

puisque Re(X), Im(X), Re(Y ) et Im(Y ) sont des matrices réelles et symétriques, ce qui permet d’écrire[dX] = |det(C)|2(N+1) [dY ]. Il s’agit, en fait, de la preuve derrière deux des identités utilisées auchapitre précédent, soit les résultats (2.69). Sous une forme plus compacte, on peut donc écrire

[dX] = |det(C)|β(N+1) [dY ], (3.22)

où β = 1, 2 dans les cas réel et complexe respectivement, ce qui implique que k = β(N + 1). Deretour à la transformation d’intérêt, comme celle-ci est de la forme X = CY −1CT , ce qui impliquela différentielle dX = CdY −1CT , on constate que cela ne fait qu’ajouter une étape supplémentairepuisqu’il faut d’abord obtenir cette différentielle en fonction de la variable appropriée, c’est-à-dire que

dMR = (MD)Td(Mν)−1MD = −(MD)T (Mν)−1dMν(Mν)−1MD, (3.23)

où l’identité générale dM−1 = −M−1(dM)M−1 a été utilisée [51, 64]. Ainsi, puisque les propriétés duproduit extérieur impliquent, par définition, la relation [dMR] =

∣∣det(∂MR

∂Mν

)∣∣[dMν ], une applicationdirecte de (3.22) sur le résultat précédent permet d’obtenir la quantité souhaitée, soit

[dMR] =∣∣∣det

((MD)T (Mν)−1

)∣∣∣β(N+1)[dMν ], (3.24)

ce qui signifie que la mesure finale s’écrit [31]

dMRdMD =∣∣∣∣∣det(MD)

det(Mν)

∣∣∣∣∣β(N+1)

dMνdMD. (3.25)

À présent, il ne reste plus qu’à vérifier que la nouvelle mesure dMν est bien invariante sous toute trans-formation de la forme Mν → Mν ′ = U†MνU∗, où U ∈ O(N), U(N) pour β = 1, 2 respectivement.Pour ce faire, comme dMR ′ = dMR et que dMD ′ = dMD sous les transformations MR ′ = V †MRV ∗

78

Page 89: Phénoménologie des neutrinos dans une théorie de matrices ...

et MD ′ = U†MDV (ce qui peut être vu en appliquant (2.69) et (2.77)), cela permet d’écrire

0 = dMR ′dMD ′ − dMRdMD

=∣∣∣∣∣det(U†MDV ∗)

det(Mν ′)

∣∣∣∣∣β(N+1)

dMν ′dMD ′ −

∣∣∣∣∣det(MD)det(Mν)

∣∣∣∣∣β(N+1)

dMνdMD

=∣∣∣∣∣det(MD)

det(Mν)

∣∣∣∣∣β(N+1) (

dMν ′ − dMν)

dMD, (3.26)

où Mν ′ satisfait bien la transformation souhaitée puisque

MR ′ = V †(MD)T (Mν)−1MDV ∗ = V †(MD)TU∗UT (Mν)−1UU†MDV ∗

= (U†MDV ∗)T (U†MνU∗)−1(U†MDV ∗). (3.27)

Dans le cas complexe, la transformation obtenue sur la matrice MD ne correspond pas directement àMD ′ pour ce changement de variables particulier, ce qui n’est d’aucune conséquence sur le résultat final(3.26). Ainsi, dMν ′ = dMν pour toutes transformations appartenant aux groupes appropriés, ce quiimplique que la mesure dMν , lorsqu’écrite en fonction des valeurs singulières (valeurs propres) de cettematrice, est exactement de la même forme que celle obtenue pour dMR (le résultat (2.73)). Une fois cejacobien obtenu, on peut donc maintenant finaliser le calcul de la distribution caractérisant l’ensembleseesaw de type I-III. En effet, une simple substitution des quantités d’intérêt permet d’obtenir

Pν(Mν)dMν =

−∞

PR(

(MD)T (Mν)−1MD)PD(MD) |det (J)|dMD

dMν

= 2βN(N−1)

4

πβN(3N+1)

4

−∞

e−tr((MD)†(Mν)−1†MD∗(MD)T (Mν)−1MD)

× e−tr(MD†MD)∣∣∣∣∣det(MD)

det(Mν)

∣∣∣∣∣β(N+1)

dMD

dMν . (3.28)

Tous les résultats nécessaires sont donc maintenant en place pour analyser les deux ensembles seesaw.

3.1.3 Distribution jointe des valeurs singulières et des variables du groupe

Dans un premier temps, l’ensemble seesaw de type I-III est considéré. Afin de résoudre l’intégrale(3.28) et, bien entendu, puisque l’on souhaite connaître comment les masses sont distribuées dans cetensemble, l’étape suivante consiste donc à exprimer cette forme matricielle en fonction des valeurssingulières (valeurs propres) et des variables du groupe pour chacune des matrices présentes (MD etMν) suivant le raisonnement présenté au chapitre 2. Pour ce faire, la première chose qu’il faut réaliserest que sous la substitution Mν = Uνm

νUTν , où mν = diag(mν1 , . . . , m

νN ) est une matrice diagonale

contenant les valeurs singulières (valeurs propres) et où Uν est la matrice contenant les variables dugroupe de cette décomposition, aucune dépendance angulaire n’est introduite dans l’intégrale (3.28).Cette propriété particulière s’explique par le fait que la matrice Uν peut être absorbée dans la définitionde la matrice MD de telle sorte que l’intégrale résultante puisse être écrite seulement en fonction de

79

Page 90: Phénoménologie des neutrinos dans une théorie de matrices ...

MD ′ (en introduisant des produits V V † de matrices V ∈ O(N), U(N) au besoin comme dansl’exemple (3.27)). Puisque dMD ′ = dMD et qu’il s’agit simplement d’une variable d’intégration (dueà la procédure de marginalisation), le résultat de l’intégrale demeure inchangé. Cela signifie que ladépendance en fonction des variables du groupe pour la matrice Mν se retrouve donc uniquementdans la mesure dMν . En contrepartie, cela implique également que lorsque la matrice MD est à sontour décomposée en valeurs singulières par une transformation de la forme MD = UmDV †, comme ilne reste plus aucune façon d’absorber les variables du groupe pour cette matrice (Mν est maintenantdans une base précise fixée par le processus de diagonalisation), une dépendance angulaire persistedans l’exponentielle résultante. Plus précisément, la distribution ainsi obtenue prend la forme

PI-IIIν (mν

1 , . . . , mνN )dmν

1 . . . dmνN

[U†νdUν ]Vol(CV βN,N )

= CI-IIIβνN IβN (mν

1 , . . . , mνN )∏j<k

∣∣(mνk)β − (mν

j )β∣∣

×N∏j=1

∣∣mνj

∣∣−(βN+1) dmνj

[U†νdUν ]Vol(CV βN,N )

, (3.29)

où l’intégrale sur les valeurs singulières mDj de la matrice MD s’écrit [31]

IβN (mν1 , . . . , m

νN ) = 2N

ˆU∈CV ′ β

N,N

V ∈CV βN,N

ˆ ∞0

e−∑j,k

(mDj )2(mDk )2|(UT (mν)−1U)jk|2 N∏j<k

∣∣(mDk )2 − (mD

j )2∣∣β

×N∏j=1

e−(mDj )2 ∣∣mDj

∣∣β(N+2)−1 dmDj

[U†dU ]′[V †dV ]Vol(CV βN,N )2/(2π)(β−1)N

(3.30)

= (2π)(β−1)NˆU∈CV ′ β

N,N

ˆ ∞0

N∏j<k

|xk − xj |β e−2xjxk|(UT (mν)−1U)jk|2

×N∏j=1

e−xj(xj|(UT (mν)−1U)jj|2+1

)xβ(N+2)/2−1j dxj

[U†dU ]′

Vol(CV βN,N ). (3.31)

Ici, le facteur de 2N à la première ligne est inclus dans la définition de IβN en prévision du changementde variable xj = (mD

j )2 menant à l’expression (3.31). De plus, la propriété de symétrie du produitmatriciel UT (mν)−1U a été utilisée pour séparer la somme de la première exponentielle en une sommesur la partie diagonale et la partie hors diagonale. Également, l’intégrale sur [V †dV ] a été réaliséede façon triviale puisqu’il n’y a aucune dépendance en fonction des éléments de V dans l’expression(3.30) (seulement les éléments de U sont présents en raison de leur couplage compliqué avec les massesmνk), ce qui introduit simplement un facteur Vol(CV βN,N ) au numérateur. 85 Enfin, la dernière ligne du

résultat (3.31) peut être simplifiée davantage en utilisant (UT (mν)−1U)jj =∑k(mν

k)−1U2kj [31]. À

partir de cette définition pour IβN , la constante de normalisation finale s’écrit

CI-IIIβνN = 2

βN(N−1)4

πβN(3N+1)

4

CβSNCβAN

2NVol(CV βN,N )3

(2π)(β−1)N = 2N(β(N+3)−4)

4

N !

N∏j=1

Γ(β2 + 1)Γ(βj2 + 1)Γ(βj2 )2

, (3.32)

85. Il est bon de rappeler que [U†dU ]′ ≡∧N

j<k(U†dU)jk ne correspond pas à la mesure de Haar complète pour le cas

complexe et que son volume est Vol(CV ′ βN,N ) = Vol(CV βN,N )/(2π)(β−1)N . Ainsi, il s’avère toujours possible de trouverune paramétrisation adéquate (voir (A.13)) telle que les phases non physiques n’entrent pas dans [U†dU ]′ et qu’ellesn’apparaissent jamais explicitement dans l’intégrale (3.31). Le facteur de (2π)N tient alors compte de leur volume.

80

Page 91: Phénoménologie des neutrinos dans une théorie de matrices ...

ce qui permet d’obtenir une forme intégrale complète décrivant la distribution des masses, des angles demélange et des phases complexes dans l’ensemble seesaw de type I-III. Bien entendu, il faut maintenantêtre en mesure de résoudre l’intégrale (3.31) pour obtenir la distribution finale, ce qui devient alors unproblème purement mathématique d’un niveau de complexité remarquablement élevé. Ainsi, après biendes tentatives infructueuses pour tenter d’obtenir une solution analytique générale (pour tout N et toutβ), il a été convenu de se limiter à l’étude des cas spécifiques N = 1, 2, 3 avec β = 2. Toutefois, mêmedans ces cas particuliers, la seule solution analytique complète qui a pu être obtenue est pour le casN = 1. Pour les cas N = 2 et N = 3, des intégrateurs numériques ont dû être employés pour obtenirles distributions marginales d’intérêt. Finalement, comme discuté précédemment, la distribution del’ensemble seesaw de type II peut être obtenue directement à partir des résultats (3.4) et (3.6) avecR→ L et du changement de variables trivial Mν = ML (qui implique Λν = ΛL), ce qui donne

PIIν (mν

1 , . . . , mνN )dmν

1 . . . dmνN

[U†νdUν ]Vol(CV βN,N )

= CIIβνN

∏j<k

∣∣(mνk)β − (mν

j )β∣∣

×N∏j=1

∣∣mνj

∣∣β−1 e−(mνj )2dmν

j

[U†νdUν ]Vol(CV βN,N )

, (3.33)

avec

CIIβνN = CβLN = 2

N(β(N+3)−4)4

N !

N∏j=1

1Γ(βj2 )

. (3.34)

Comme on peut maintenant le constater de par la forme des distributions obtenues, la raison pourlaquelle les distributions (3.29) et (3.33) sont normalisées de cette façon relève du fait que celles-cisont séparables. Comme la distribution des masses (mν

j ) est complètement découplée de la distributiondes variables du groupe [U†νdUν ] pour ces deux ensembles, 86 cela permet d’étudier les propriétésde ces distributions spécifiques de façon indépendante, ce qui implique que chacune d’elle doit êtreproprement normalisée. En ce qui concerne la mesure sur les variables du groupe, celle-ci est la mêmedans les deux cas et elle correspond à la mesure de Haar. Cela signifie qu’au niveau des prédictionsconcernant les angles de mélange et les phases complexes, il n’y a pas de distinction possible entreces deux ensembles. Les seules distinctions possibles entre ceux-ci se situent donc au niveau de ladistribution des valeurs singulières (valeurs propres). En ce qui concerne ces distributions, on constateque pour les deux ensembles considérés, celles-ci sont invariantes sous la permutation des valeurssingulières (valeurs propres), ce qui est une conséquence du découplage mentionné précédemment.Cela se vérifie directement dans le cas de l’ensemble seesaw de type II alors que pour l’ensemble seesawde type I-III, la fonction IβN doit être examinée plus attentivement. Ce faisant, on constate que cespermutations ne font que remanier les colonnes et les rangées de la matrice U sur laquelle on intègre(ces permutations peuvent également être absorbées par une permutation appropriée des variablesd’intégration xj), ce qui implique que cette fonction est également invariante sous la permutation desmasses. Ces observations ont des répercussions importantes pour le cas physique du modèle standardétendu puisque cela implique un découplage (ou une absence de corrélation) entre les masses et lesétats propres de masse (les colonnes normalisées de Uν) des neutrinos. La probabilité d’obtenir unspectre de masse particulier n’est donc pas plus de 1/N !, soit d’un sur le nombre de permutationstotales. Ces points importants sont discutés plus en détail aux sections suivantes.

86. La dépendance en fonction des variables du groupe Uν est uniquement contenue dans la mesure dMν dans les deuxcas (dû à l’invariance sous changement de base de (3.3) et (3.4)) et cette mesure est factorisable.

81

Page 92: Phénoménologie des neutrinos dans une théorie de matrices ...

3.2 Propriétés des ensembles seesaw

Avant d’entreprendre l’étude détaillée du modèle standard étendu, il s’avère instructif d’analyser lespropriétés générales de ces ensembles à partir des comportements asymptotiques et de quelques cas plussimples dans le but de développer une certaine intuition concernant ces distributions. Ici également,une attention particulière est portée à l’ensemble seesaw de type I-III puisqu’il s’agit du seul ensembleoù la forme analytique complète de la distribution n’est pas connue (seulement la forme intégrale).

3.2.1 Comportements asymptotiques

Cette analyse est donc amorcée en étudiant les cas limites mνi → ±∞ et mν

i → 0 de la distributiondes valeurs singulières (valeurs propres) de l’expression (3.29). Bien que cette distribution soit difficileà étudier analytiquement pour toute valeur de N en raison de l’intégrale présente (la fonction IβN ), lescas limites peuvent tout de même être obtenus sans problème [31]. En effet, considérant la distribution

ˆ ∞mνmin

IβN (mν1 , . . . , m

νN )∏j<k

∣∣(mνk)β − (mν

j )β∣∣ N∏j=1

∣∣mνj

∣∣−(βN+1) dmνj = 1

CI-IIIβνN

, (3.35)

mνmin =

−∞, β = 1 (valeurs propres)

0, β = 2 (valeurs singulières), (3.36)

on obtient que le comportement limite pour mνi → ±∞ avec i fixe est

PI-IIIν (mν

1 , . . . , mνN ) ∼ k∞ |mν

i |β(N−1)−(βN+1) (1 +O(|mν

i |−1))

= k∞ |mνi |−(β+1) (1 +O(|mν

i |−1)), (3.37)

où k∞ est une constante qui dépend des autres valeurs singulières (valeurs propres) et de N , ce quila rend difficile à évaluer analytiquement. Ce résultat, obtenu principalement en factorisant la plushaute puissance du déterminant de Vandermonde (la fonction IβN donne simplement une constantequi est absorbée dans k∞) permet de constater que tant que ce comportement asymptotique convergeuniformément, la valeur moyenne 〈

∣∣mνi

∣∣〉 et tout moment plus grand que 1 ne sont pas bien définispour β = 1 (par exemple, le comportement logarithmique est problématique lorsqu’évalué à l’infinipour le premier moment, comme prescrit par l’intégrale (3.35)). De façon analogue, pour le cas β = 2,la valeur moyenne existe mais la variance, et tout moment plus grand que 2, ne sont pas bien définis.On peut ensuite se tourner vers le comportement asymptotique dans la limite mν

i → 0. Dans ce cas,en utilisant un changement de variables de la forme xj = |mν

i | yj dans l’intégrale IβN , on obtient

IβN (mν1 , . . . , m

νN ) ∼ |mν

i |βN(2N+1)/2

ˆU∈CV ′ β

N,N

ˆ ∞0

N∏j<k

|yk − yj |β e−2(mνi )2yjyk|∑

l(mνl )−1UljUlk|2

×N∏j=1

e−|mνi |yj(|mνi |yj|

∑k(mνk)−1U2

kj|2+1)yβ(N+2)/2−1j dyj [U†dU ]′. (3.38)

Dans la première exponentielle, tous les termes de la somme sur l’indice l tombe dans cette limite saufpour le cas l = i et il en va de même pour la seconde exponentielle avec le terme k = i. De plus, dans

82

Page 93: Phénoménologie des neutrinos dans une théorie de matrices ...

cette limite, la contribution dominante du Vandermonde de l’expression (3.35) est celle d’ordre 0 (lestermes qui ne contiennent pas mν

i ). Avec ces résultats, le comportement limite s’obtient directementet donne

PI-IIIν (mν

1 , . . . , mνN ) ∼ k0 |mν

i |βN(2N+1)/2−(βN+1) (1 +O(|mν

i |))

= k0 |mνi |βN(2N−1)/2−1 (1 +O(|mν

i |)), (3.39)

où k0 est une fonction des autres valeurs singulières (valeurs propres) et de N difficile à évaluer ana-lytiquement. Cela permet donc de conclure que la distribution PI-III

ν (mν1 , . . . , m

νN ) est nulle à mν

i = 0sauf pour le cas N = 1, où le comportement est divergent avec β = 1 alors qu’il correspond à uneconstante non nulle pour β = 2. Ainsi, avec ces deux comportements limites, il s’avère possible deconclure que la valeur singulière (valeur propre) la plus probable (le mode de la distribution) est unnombre fini différent de 0, sauf si N = 1. En d’autres mots, pour N ≥ 2, l’ensemble seesaw de typeI-III favorise une masse non nulle pour le neutrino le plus léger.

Pour finir, les cas limites pour l’ensemble seesaw de type II sont discutés. Considérant la distribution

ˆ ∞mνmin

∏j<k

∣∣(mνk)β − (mν

j )β∣∣ N∏j=1

∣∣mνj

∣∣β−1 e−(mνj )2dmν

j = 1CIIβνN

, (3.40)

où mνmin est défini par (3.36), on obtient que le comportement limite pour mν

i → ±∞ avec i fixe est

PIIν (mν

1 , . . . , mνN ) ∼ k′∞ |mν

i |β(N−1)+(β−1) e−(mνi )2

(1 +O(|mνi |−1))

= k′∞ |mνi |βN−1 e−(mνi )2

(1 +O(|mνi |−1)). (3.41)

Comme ce comportement est dominé par l’exponentielle, il n’y a donc aucun problème de conver-gence dans cette limite et tous les moments sont bien définis. En ce qui concerne le cas mν

i → 0, lecomportement limite est plutôt

PIIν (mν

1 , . . . , mνN ) ∼ k′0 |mν

i |β−1 (1 +O(|mν

i |3)), (3.42)

ce qui implique que la distribution PIIν (mν

1 , . . . , mνN ) est toujours nulle à mν

i = 0 dans le cas complexe(β = 2), alors que pour le cas réel (β = 1), ce comportement limite est décrit par une constante.Ce faisant, l’ensemble seesaw de type II favorise également une masse non nulle pour le neutrinole plus léger (dans le cas complexe). Ayant ainsi une meilleure compréhension de la distribution desvaleurs singulières (valeurs propres) pour ces deux ensembles, leurs propriétés peuvent maintenant êtreillustrées et étudiées plus en détail à l’aide d’exemples concrets, soit les cas N = 1 et N = 2.

3.2.2 Les cas N = 1 et N = 2

Bien que très limités d’un point de vue physique, ces cas particuliers s’avèrent être d’une grande aidepour visualiser adéquatement les propriétés des ensembles seesaw. Comme mentionné précédemment,dans ce qui suit et pour le reste de ce chapitre, on s’intéresse à présent uniquement au cas de matricescomplexes (β = 2), ce qui permet de laisser tomber la notion de valeurs propres pour le cas de matricesréelles et symétriques.

83

Page 94: Phénoménologie des neutrinos dans une théorie de matrices ...

3.2.2.1 N = 1

En ce qui concerne la distribution des valeurs singulières pour le cas N = 1, une forme analytiquecomplète peut être obtenue pour les deux ensembles [31]. Dans le cas de l’ensemble seesaw de typeI-III, une intégration directe de (3.31) s’avère possible alors que pour l’ensemble seesaw de type II, ilsuffit de poser N = 1 dans (3.33). On obtient alors que

PI-IIIν (mν

1)dmν1 = 1

2U(

32 ,

12 ,

(mν1)2

4

)dmν

1 , (3.43)

PIIν (mν

1)dmν1 = 2 |mν

1 | e−(mν1 )2dmν

1 , (3.44)

où U(a, b, z) est la fonction hypergéométrique confluente du deuxième ordre. Les densités de probabilitéainsi obtenues peuvent ensuite être tracées et comparées aux histogrammes obtenus à partir d’unéchantillon de matrices générées aléatoirement pour chacun de ces ensembles. Par ailleurs, en ce quiconcerne la convention utilisée pour l’ensemble des figures présentées dans ce chapitre, les courbes enrouge sont identifiées aux résultats analytiques alors que les histogrammes (en bleu) correspondent auxrésultats numériques. Par « résultat analytique », il est sous-entendu qu’il s’agit des fonctions obtenuesà partir des expressions (3.29) et (3.33) (qui sont dans la majorité des cas le résultat d’une intégrationnumérique), alors que le terme « résultat numérique » correspond aux histogrammes obtenus à partird’un échantillon de matrices de masse générées aléatoirement. Ainsi, la figure (3.1) correspond auxrésultats obtenus pour le cas complexe avec N = 1.

0 1 2 3 4 50.0

0.5

1.0

mν1

PI-I

IIν

(mν 1)

Ensemble seesaw de type I-III

0 1 2 30.0

0.5

1.0

mν1

PII ν

(mν 1)

Ensemble seesaw de type II

Figure 3.1 – Distributions des valeurs singulières (masses) des ensembles seesaw pour le cas N = 1.Les histogrammes ont été obtenus à partir d’un échantillon de 5×104 matrices de masse sans dimension.

La première observation qui peut être faite à partir de cette figure est l’accord remarquable entreles courbes analytiques et les résultats numériques pour les deux ensembles. De plus, un simple coupd’oeil permet de constater que les cas limites obtenus précédemment sont bel et bien respectés par cescourbes. Par exemple, le mode de la première distribution est nul, alors que le mode de la deuxièmedistribution correspond à 1√

2 . En ce qui concerne les moments, comme seul le premier moment existepour le cas de l’ensemble seesaw de type I-III, celui-ci peut être comparé à celui obtenu pour l’ensembleseesaw de type II. Dans le premier cas, à l’aide d’une transformée de Mellin de la forme

ˆ ∞0

zλ−1U(a, b, z)dz = Γ(λ)Γ(a− λ)Γ(λ− b+ 1)Γ(a)Γ(a− b+ 1) , max(b− 1, 0) < λ < a, (3.45)

84

Page 95: Phénoménologie des neutrinos dans une théorie de matrices ...

on obtient que le premier moment est⟨mν

1⟩I-III =

√π, alors que pour le deuxième cas, l’intégrale

gaussienne donne⟨mν

1⟩II =

√π

2 . En ce qui concerne la distribution de la phase associée à chaqueensemble (comme Uν = eiφ, on a que U†νdUν = idφ, ce qui implique que la seule contribution auproduit extérieur est Im(U†νdUν) = dφ, définissant ainsi la mesure de Haar pour le cas N = 1), celle-ciest distribuée uniformément entre 0 et 2π (histogramme plat) et donc peu intéressante (voir égalementla note 76), ce qui conclut l’analyse du cas N = 1.

3.2.2.2 N = 2

Pour entreprendre le cas N = 2, il faut d’abord choisir une paramétrisation adéquate pour la matriceU contenant les variables du groupe dans l’intégrale (3.31) de même que pour la matrice Uν de lamesure de Haar [U†νdUν ] commune aux deux ensembles. De plus, comme la distribution des variablesdu groupe peut être étudiée séparément de celle des valeurs singulières et que celle-ci est beaucoup plussimple, le point de départ de cette sous-section consiste donc à obtenir les distributions marginales desparamètres contenus dans la mesure de Haar. En utilisant la paramétrisation (A.13) avec N = 2, quia été développée à l’origine dans [69, 70] et qui permet d’obtenir la matrice unitaire suivante

Uν =(

eiϕ1 cos(θ12) eiϕ2 sin(θ12)−ei(φ12+ϕ1) sin(θ12) ei(φ12+ϕ2) cos(θ12)

), (3.46)

on a que

U†νdUν =(

i(sin2(θ12)dφ12 + dϕ1) e−i(ϕ1−ϕ2)(dθ12 − i2 sin(2θ12)dφ12)

−ei(ϕ1−ϕ2)(dθ12 + i2 sin(2θ12)dφ12) i(cos2(θ12)dφ12 + dϕ2)

), (3.47)

ce qui correspond bien à une matrice antihermitienne. En définissant la distribution de la partieangulaire comme

PΘ(θ12, φ12, ϕ1, ϕ2)dθ12dφ12dϕ1dϕ2 ≡[U†νdUν ]Vol(U(2)) = 1

4π3

2∧j≤k

(U†νdUν)jk, (3.48)

le calcul du produit extérieur permet d’obtenir

14π3

2∧j≤k

(U†νdUν)jk = 14π3

2∧j=1

Im(U†νdUν)jj2∧j<k

Re(U†νdUν)jk ∧ Im(U†νdUν)jk

= 14π3 (sin2(θ12)dφ12 + dϕ1) ∧ (cos2(θ12)dφ12 + dϕ2)

∧ (cos(ϕ1 − ϕ2)dθ12 −12 sin(2θ12) sin(ϕ1 − ϕ2)dφ12)

∧ (− sin(ϕ1 − ϕ2)dθ12 −12 sin(2θ12) cos(ϕ1 − ϕ2)dφ12)

= 18π3 sin(2θ12) dθ12 ∧ dφ12 ∧ dϕ1 ∧ dϕ2, (3.49)

ce qui implique que 87

PΘ(θ12, φ12, ϕ1, ϕ2) = 18π3 sin(2θ12). (3.50)

87. Ce résultat peut être comparé au résultat (A.16) avec N = 2 en ne tenant pas compte de la constante de normali-sation.

85

Page 96: Phénoménologie des neutrinos dans une théorie de matrices ...

Ce résultat, qui est commun aux deux ensembles, correspond donc à la mesure de Haar normaliséeexprimée en fonction de la paramétrisation (3.46). Les deux quantités d’intérêt ici sont donc l’angle demélange θ12 et la phase « physique » (pour autant que le cas N = 2 soit physique...) φ12, les phasesnon physiques ϕ1 et ϕ2 ne sont pas discutées davantage. Les distributions marginales de ces deuxquantités sont donc obtenues en intégrant de façon appropriée la mesure (3.50), soit

PΘ(θ12)dθ12 = dθ12

ˆ 2π

0dφ12

ˆ 2π

0dϕ1

ˆ 2π

0dϕ2PΘ(θ12, φ12, ϕ1, ϕ2) = sin(2θ12)dθ12 (3.51)

PΘ(φ12)dφ12 = dφ12

ˆ π/2

0dθ12

ˆ 2π

0dϕ1

ˆ 2π

0dϕ2PΘ(θ12, φ12, ϕ1, ϕ2) = 1

2πdφ12. (3.52)

Ces densités de probabilité peuvent maintenant être tracées et comparées aux résultats numériques,ce qui permet de générer la figure 3.2.

0 π/4 π/20.0

0.5

1.0

θ12

(θ12

)=sin

(2θ 1

2)

Angle de mélange

0 π 2π0.0

0.1

φ12

(φ12

)=1 2π

Phase

Figure 3.2 – Distributions de l’angle de mélange et de la phase complexe des deux ensembles seesawpour le cas N = 2. Les histogrammes ont été obtenus à partir d’un échantillon de 2.5 × 104 matricesunitaires provenant de la décomposition en valeurs singulières des matrices de masse.

La comparaison permet donc de conclure que les résultats numériques sont bien représentés par lamesure de Haar normalisée. De plus, toutes les phases (y compris ϕ1 et ϕ2) ont une distributionuniforme (plate) alors que l’angle θ12 possède une distribution non triviale favorisant un angle demélange quasi maximal. Comme ces distributions sont relativement simples à analyser et qu’elles sontbien connues dans la littérature, les paramètres les caractérisant (soit par exemple la moyenne, lamédiane ou le mode) ne sont pas discutés davantage. Ayant présenté les résultats concernant la partiesur les variables du groupe, on peut maintenant s’intéresser à la distribution des valeurs singulièrespour ces deux ensembles. À partir de la paramétrisation (3.46), le résultat suivant est obtenu pourl’ensemble seesaw de type I-III [32], 88 soit

PI-IIIν (mν

1 , mν2) = 2|(mν

2)2 − (mν1)2|

(mν1)5(mν

2)5

׈ ∞

0dx1dx2

ˆ π/2

0dθ′12(x1 − x2)2x3

1x32 sin(2θ′12)I0

((x1 − x2)2 sin2(2θ′12)

2mν1m

ν2

)× e−(mν1 )−2(x1 cos2(θ′12)+x2 sin2(θ′12))2−(mν2 )−2(x1 sin2(θ′12)+x2 cos2(θ′12))2−x1−x2 , (3.53)

88. Comme la même paramétrisation est utilisée pour la matrice U de l’expression (3.31) et la matrice Uν de lamesure de Haar [U†νdUν ], un prime a été ajouté sur les angles de l’expression (3.53) pour indiquer qu’il s’agit des anglesappartenant à U . Cette distinction est nécessaire afin d’éviter toute confusion avec les distributions marginales des anglesde la mesure de Haar présentées à la figure 3.2.

86

Page 97: Phénoménologie des neutrinos dans une théorie de matrices ...

où I0(z) est la fonction de Bessel modifiée du premier ordre qui découle de l’intégrale sur la phase dφ′12

(qui génère également un facteur de 2π). Il est important de préciser ici que le facteur de (2π)2 quirésulterait de l’intégrale sur les phases ϕ′1 et ϕ′2 (qui n’apparaissent pas dans l’exponentielle) est déjàpris en compte par la normalisation définie précédemment (selon cette convention, l’intégrale n’est pasréalisée sur la mesure complète, ce qui implique d’exclure les différentielles dϕ′1 et dϕ′2 associées auxphases non physiques de la mesure finale, voir la note 85). Il s’agit, en fait, du plus loin où l’on peutse rendre analytiquement avec cette forme intégrale. Pour obtenir les distributions finales des masses,il faut donc avoir recours à un intégrateur numérique (dans ce cas-ci, l’algorithme général inclus avecla fonction NIntegrate de Mathematica, complémenté de la stratégie d’intégration LocalAdaptive estsuffisant). En contrepartie, l’ensemble seesaw de type II est encore une fois beaucoup plus simple et ladistribution obtenue pour les valeurs singulières est

PIIν (mν

1 , mν2) = 4|(mν

2)2 − (mν1)2|mν

1mν2e−(mν1 )2−(mν2 )2

. (3.54)

La prochaine étape est donc de tracer les densités de probabilité résultantes décrivant les distributionsmarginales de chacune des masses à des fins de comparaison, ce qui mène ultimement à la figure 3.3.

0 1 2 3 4 50.0

0.5

1.0

1.5

mν1

PI-I

IIν

(mν 1)

Ensemble seesaw de type I-III

0 1 2 3 4 50.0

0.5

1.0

mν1

PII ν

(mν 1)

Ensemble seesaw de type II

0 2 4 6 8 10 12 140.0

0.1

0.2

mν2

PI-I

IIν

(mν 2)

0 1 2 3 4 50.0

0.4

0.8

mν2

PII ν

(mν 2)

Figure 3.3 – Distributions des valeurs singulières (masses) des ensembles seesaw pour le casN = 2. Leshistogrammes ont été obtenus à partir d’un échantillon de 2.5× 104 matrices de masse sans dimensiondans les deux cas. Les valeurs singulières sont ordonnées selon 0 ≤ mν

1 ≤ mν2 et un facteur de 2! est

introduit pour corriger la constante de normalisation des distributions.

Cependant, pour être en mesure d’obtenir ces courbes, un point important doit maintenant être dé-veloppé plus en détail. Comme les deux distributions sont invariantes sous l’échange mν

1 ↔ mν2 dû

au découplage mentionné précédemment, ces deux masses ont donc la même distribution marginale(pour un même ensemble) lorsqu’intégrée sur tout l’intervalle permis (c’est-à-dire de 0 à ∞ pour dmν

1

ou dmν2). Ce résultat peut être vérifié, par exemple, à la suite d’une intégration directe de (3.53) sur

dmν2 pour obtenir PI-III

ν (mν1) ou sur dmν

1 pour obtenir PI-IIIν (mν

2) (le raisonnement est le même pour

87

Page 98: Phénoménologie des neutrinos dans une théorie de matrices ...

la distribution (3.54)). Cependant, la quantité qui est d’un réel intérêt pour l’analyse du spectre et quipermet, par exemple, d’étudier l’écart de masse entre les générations (pertinent pour le cas N = 3),consiste à obtenir les distributions marginales de la plus petite et de la plus grande masse (que l’onnote mν

min et mνmax). Le problème ici est qu’en raison du découplage entre les masses et les états

propres de masse, il s’avère impossible de savoir laquelle de mν1 ou mν

2 correspond à la plus petite (oula plus grande) masse. Par conséquent, il faut donc fixer un ordre particulier pour obtenir les distri-butions marginales souhaitées. Par simplicité, on pose 0 ≤ mν

1 ≤ mν2 de telle sorte que mν

1 ≡ mνmin et

mν2 ≡ mν

max, ce qui permet de définir les distributions marginales

PΩν (mν1) = 2!

ˆ ∞mν1

PΩν (mν1 , m

ν2)dmν

2 , PΩν (mν2) = 2!

ˆ mν2

0PΩν (mν

1 , mν2)dmν

1 , (3.55)

pour les deux ensembles (i.e. Ω = I-III ou II), tout en gardant à l’esprit que ce choix est complètementarbitraire. Finalement, comme les définitions (3.55) impliquent de choisir un ordre particulier pour lesmasses, il faut alors multiplier par N ! pour que les distributions soient proprement normalisées. Cesprécisions permettent ainsi de mieux comprendre l’information présentée à la figure 3.3.

Par ailleurs, bien que le comportement exact de la distribution (3.53) soit difficile à voir en raisonde la forme intégrale obtenue (contrairement à la distribution (3.54), qui implique des distributionsmarginales complètement analytiques sous forme de simples exponentielles), la figure 3.3 permet toutde même une comparaison directe avec les résultats numériques. Ici également, ces résultats confirmentl’exactitude des distributions (3.55) lorsque comparées à un échantillon de matrices générées aléatoi-rement. De plus, les comportements limites sont conformes à ce qui a été établi précédemment. Parexemple, bien que difficilement perceptible en raison de la taille finie des boites de l’histogramme cor-respondant, la distribution PI-III

ν (mν1) est bien nulle dans la limite mν

1 → 0. Ainsi, pour compléterla comparaison entre les deux ensembles, il faut maintenant être en mesure de caractériser complète-ment les courbes de la figure 3.3. Conséquemment, le premier moment (la moyenne), la médiane et lemode sont calculés pour chaque distribution, ce qui correspond aux paramètres de localisation d’unedistribution statistique. Les résultats de chaque ensemble sont présentés au tableau 3.1.

Tableau 3.1 – Paramètres de localisation des distributions marginales de la figure 3.3.

Moyenne Médiane ModePI-IIIν (mν

1) 0.59 0.39 0.0064PI-IIIν (mν

2) 5.39 3.41 1.85PIIν (mν

1) 12√

π2 ' 0.63 0.58 1

2

PIIν (mν

2)√π

4(2 +√

2)' 1.51 1.48 1.42

Finalement, une dernière figure d’intérêt que l’on peut obtenir pour les distributions des massesconcerne les courbes de densité en deux dimensions. Celles-ci sont intéressantes puisqu’elles permettentd’obtenir une vue d’ensemble de ces distributions sans avoir à fixer un ordre précis. À la figure 3.4,la symétrie des distributions sous l’échange mν

1 ↔ mν2 a été exploitée pour faciliter la comparaison

entre les résultats numériques et analytiques. Comme les deux figures ont été séparées selon l’axe desymétrie, le triangle inférieur (caractérisé par une surface plus granuleuse pour les deux ensembles) re-présente les résultats numériques alors que le triangle supérieur (caractérisé par une surface plus lisse)

88

Page 99: Phénoménologie des neutrinos dans une théorie de matrices ...

représente les résultats analytiques, soit les courbes PI-IIIν (mν

1 , mν2) et PII

ν (mν1 , m

ν2). Donc, en montrant

seulement la moitié des données pour les résultats analytiques (mν1 < mν

2) et numériques (mν1 > mν

2),une simple réflexion selon l’axe de symétrie permet une comparaison directe des résultats obtenus [32].

0

0.05

0.10

0.15

0.20

0

0.2

0.4

0.6

Figure 3.4 – Courbes de densité PI-IIIν (mν

1 , mν2) et PII

ν (mν1 , m

ν2) des valeurs singulières (masses) des

ensembles seesaw pour le cas N = 2. Les deux figures sont séparées selon l’axe de symétrie afin que lestriangles inférieurs et supérieurs représentent les résultats numériques et analytiques respectivement.

Une fois de plus, la correspondance entre les deux approches est manifestement visible et celle-ci offreun outil de comparaison supplémentaire permettant de bien visualiser le comportement de chaqueensemble. Par ailleurs, la figure 3.4 permet également d’apprécier le phénomène de répulsion des valeurssingulières brièvement discuté au chapitre 2, ce qui est typique d’une théorie de matrices aléatoires. Enfait, en comparant la distance entre les modes des deux distributions, il devient possible de déterminerlequel des deux ensembles possède la répulsion la plus forte. On trouve alors que les modes sont 1.7 foisplus éloignés dans l’ensemble seesaw de type I-III, signifiant du même coup qu’une répulsion plus forteest observée entre les valeurs singulières de cet ensemble. Malheureusement, l’origine de cette propriétéintéressante est difficile à retracer sans une forme analytique complète pour PI-III

ν (mν1 , m

ν2). Cependant,

une explication possible pour justifier le fait que les valeurs singulières sont plus proches les unes desautres dans l’ensemble seesaw de type II peut être suggérée en comparant les distributions (3.53) et(3.54). Par inspection, on constate que les effets de la contribution du Vandermonde |(mν

2)2 − (mν1)2|

(qui est responsable de la dispersion des valeurs singulières par rapport à l’axe de symétrie) sontfortement atténués par un produit de masses à la puissance 5 dans l’expression (3.53), ce qui tendà restreindre les valeurs singulières dans une bande étroite le long des deux axes. Éventuellement,afin d’obtenir une meilleure compréhension de l’ensemble seesaw de type I-III, les données associéesà cette courbe de densité pourraient être utilisées pour obtenir une forme analytique approximativede PI-III

ν (mν1 , m

ν2) en effectuant une régression sur les paramètres libres d’une fonction appropriée

des valeurs singulières. Naturellement, pour le cas N = 3 de telles courbes ne sont pas réellementenvisageables puisque celles-ci requièrent de lourds calculs numériques et qu’elles sont plutôt difficilesà représenter de façon appropriée. Néanmoins, les mêmes conclusions et raisonnements s’appliquentpour ce cas également. Ainsi, cela conclut la présentation des résultats pour le cas N = 2. Les résultats

89

Page 100: Phénoménologie des neutrinos dans une théorie de matrices ...

obtenus dans cette section concernant les comportements asymptotiques et l’étude des cas « simples »N = 1 et N = 2 ont donc permis de constater, entre autres, que seul le premier moment existe dans lecas complexe pour l’ensemble seesaw de type I-III et que dans cet ensemble, seul le cas N = 1 possèdeune solution analytique complète. Finalement, la comparaison avec les résultats numériques pour lescas N = 1 et N = 2 illustre la validité des distributions obtenues dans ce travail pour les paramètresd’intérêt et vient ainsi solidifier les fondations sur lesquels repose le cas N = 3 qui demeure, bienentendu, le principal sujet d’étude de cette thèse.

3.3 Le secteur des neutrinos du modèle standard étendu (lecas N = 3)

À partir des outils et des résultats présentés aux sections précédentes, qui ont permis de développer unecertaine intuition quant aux propriétés des ensembles seesaw, il s’avère maintenant possible d’analyseren détail les conséquences de cette approche pour le cas du modèle standard étendu (N = 3), quiest beaucoup plus riche en information d’un point de vue physique. Dans ce cas, il est important degarder à l’esprit que les mesures expérimentales du secteur des neutrinos (les résultats du tableau1.2) sont appelées à jouer un rôle important en ce qui a trait à la comparaison des résultats obtenusentre les deux ensembles et des conclusions que l’on peut en tirer. Cette section contient donc lesprincipaux résultats obtenus dans le cadre de cette thèse et une attention particulière est donc portéeà la présentation de ces résultats. L’analyse que l’on peut en faire est ensuite réservée à la section 3.4.

3.3.1 Paramètres angulaires et masses

Comme les cas N = 1 et N = 2 ont été utilisés principalement pour définir les quantités importanteset attirer l’attention sur certaines subtilités propres à ces ensembles de façon à bien préparer le terrainpour l’étude du cas N = 3, cette section reprend donc essentiellement l’approche qui a été utiliséepour le cas N = 2 tout en mettant l’accent sur les conséquences pour les propriétés des neutrinos.Ainsi, la première étape consiste donc à choisir une paramétrisation adéquate pour les matrices Uνet U appartenant à U(3). Pour la matrice Uν , il serait toujours possible d’utiliser (A.13) avec N = 3par analogie avec le cas précédent. Cependant, pour rendre manifeste la connexion avec les paramètresmesurés du secteur des neutrinos, la paramétrisation qui a été choisie est celle de la matrice PMNSdiscutée précédemment (la plus utilisée dans la littérature). La forme usuelle est donc

Uν =

1 0 00 cos(θ23) sin(θ23)0 − sin(θ23) cos(θ23)

cos(θ13) 0 sin(θ13)e−iδ

0 1 0− sin(θ13)eiδ 0 cos(θ13)

×

cos(θ12) sin(θ12) 0− sin(θ12) cos(θ12) 0

0 0 1

1 0 0

0 eiα212 0

0 0 eiα312

, (3.56)

ce qui inclut les phases de Majorana α21 et α31 (les neutrinos sont des fermions de Majorana dans lesmécanismes seesaw) et exclut les trois phases non physiques ϕ1, ϕ2 et ϕ3 puisqu’elles peuvent toujoursêtre éliminées par une redéfinition des champs des leptons chargés dans le lagrangien correspondant[38]. Pour la matrice U de (3.31), la paramétrisation (A.13) est utilisée puisqu’il s’agit simplement de

90

Page 101: Phénoménologie des neutrinos dans une théorie de matrices ...

variables d’intégration sans signification physique. De plus, comme discuté précédemment, cette para-métrisation implique que les phases non physiques ϕj n’apparaissent pas explicitement dans l’intégrale(3.31) et qu’elles sont compatibles avec la définition de [U†dU ]′ (voir le chapitre 2 et la note 85).Leur effet est donc déja pris en compte dans la constante de normalisation (ce qui concerne seulementl’ensemble seesaw de type I-III). Ainsi, par analogie avec le cas N = 2, la distribution sur les variablesdu groupe est d’abord considérée en raison de sa simplicité. Une fois la paramétrisation (3.56) fixée,les étapes présentées dans le cas N = 2 peuvent être répétées afin d’obtenir la distribution des anglesde mélange et des phases complexes. À partir du résultat (2.66), on trouve

PΘ(θ12, θ13, θ23, δ, α21, α31) = 12π3 sin(2θ12) sin(θ13) cos3(θ13) sin(2θ23), (3.57)

où un facteur de (2π)3 a été inclus pour tenir compte du volume des phases non physiques (celles-ciont donc déjà été intégrées au résultat (3.57) contrairement au résultat (3.50), voir également (2.66)et la discussion y étant rattachée). À partir de ce résultat et en définissant les distributions marginalesdes paramètres d’intérêt de façon analogue à (3.51) et (3.52), on obtient les courbes de la figure 3.5.

0 π/4 π/20.0

1.0

θ12

(θ12

)=sin

(2θ 1

2)

Angles de mélange

0 π 2π0.0

0.05

0.10

0.15

δ

(δ)=

1 2π

Phases

0 π/6 π/3 π/20.0

1.0

θ13PΘ

(θ13

)=4c

os3 (θ 1

3)sin

(θ13

)

0 π 2π0.0

0.05

0.10

0.15

α21

(α21

)=1 2π

0 π/4 π/20.0

1.0

θ23

(θ23

)=sin

(2θ 2

3)

0 π 2π0.0

0.05

0.10

0.15

α31

(α31

)=1 2π

Figure 3.5 – Distributions des angles de mélange et des phases complexes des deux ensembles seesawpour le cas N = 3. Les histogrammes ont été obtenus à partir d’un échantillon de 2.5 × 104 matricesunitaires provenant de la décomposition en valeurs singulières des matrices de masse.

91

Page 102: Phénoménologie des neutrinos dans une théorie de matrices ...

Ainsi, un simple coup d’oeil permet de constater que les ensembles seesaw de type I-III et de type IIfavorisent des valeurs autour de π/4 pour les angles de mélange θ12 et θ23 alors que l’angle θ13 est plutôtprès de π/6. Ici également, les phases complexes δ, α21 et α31 ont une distribution uniforme (plate),impliquant du même coup que toutes les valeurs possibles pour ces trois phases sont équiprobables.Des conclusions similaires au cas N = 2 peuvent donc être tirées de ces distributions, c’est-à-dire queles résultats numériques concordent avec les distributions marginales obtenues à partir de la mesure deHaar et que le mélange maximal est naturellement favorisé pour deux des angles de mélange. De plus,la seule distribution qui n’est pas symétrique est associée à l’angle de mélange θ13 et celle-ci favoriseune plus petite valeur pour cet angle (en comparant les valeurs moyennes par exemple) [32].

Ensuite, comme ces distributions sont communes aux deux ensembles, une comparaison des résultatsobtenus entre les deux ensembles n’est évidemment pas possible. Cependant, il s’avère tout de mêmeintéressant de voir comment ces ensembles se comportent lorsque comparés aux prédictions obtenues àpartir d’un scénario hypothétique où une mesure uniforme normalisée est imposée à tous les paramètresangulaires. Ainsi, en ayant recours aux valeurs expérimentales des paramètres angulaires du tableau1.2, un test de probabilité peut être développé dans le but d’obtenir des quantités invariantes souschangement de base pouvant être comparées entre elles. Cela permet ainsi de comparer les prédictionsde la mesure de Haar à une autre mesure beaucoup plus simple (voire triviale), la mesure uniforme, etd’obtenir un point de référence quant à la portée des prédictions obtenues. Pour ce faire, il s’agit d’in-tégrer la distribution (3.57) et la distribution PΘ(θ12, θ13, θ23, δ, α21, α31) = 1/π6 (la mesure uniformenormalisée) sur un volume Vexp définit en fonction des valeurs expérimentales et leurs incertitudes pourles deux hiérarchies (les phases de Majorana α21 et α31 sont intégrées de 0 à 2π car aucune informationn’est connue à leur sujet). Cela permet d’obtenir les probabilités présentées au tableau 3.2.

Tableau 3.2 – Test de probabilité pour les angles de mélange et les phases complexes générés à partirde la mesure de Haar et de la mesure uniforme. Les probabilités PHaar et PUniforme sont obtenues enintégrant ces mesures sur le volume expérimental Vexp défini par les données à 1σ (voir tableau 1.2).

Hiérarchie normale Hiérarchie inversePHaar 1.042× 10−6 7.510× 10−7

PUniforme 5.160× 10−7 3.736× 10−7

PHaar/PUniforme 2.019 2.010

Il va sans dire que dû à la façon dont ce test de probabilité a été conçu, la valeur de la probabilitéobtenue ne peut que diminuer plus les valeurs expérimentales sont connues avec précision. Pour cetteraison, les valeurs exactes des probabilités PHaar et PUniforme ne sont pas particulièrement révélatrices,mais les ratios entre ces différentes valeurs sont considérés comme des quantités intéressantes puisqueceux-ci ne sont pas sujets à de grandes variations (l’ordre de grandeur reste le même en principe). Ainsi,la première conclusion pouvant être tirée de ces résultats est que considérant le niveau de précisionaccordé à ce test (celui-ci demeure sensible au choix du volume d’intégration), il n’y a pas de distinctionpossible entre les deux hiérarchies. Les deux régions explorées sont donc équiprobables de ce point devue. Cependant, lorsque l’on regarde les ratios obtenus, il s’avère possible de constater que ceux-ci sontrévélateurs d’une tendance intéressante pour les ensembles seesaw. En effet, les ratios PHaar/PUniforme

indiquent que la probabilité de générer des paramètres dans la région permise par les valeurs expéri-mentales est environ deux fois plus grande lorsque ceux-ci sont générés à partir de la mesure de Haar

92

Page 103: Phénoménologie des neutrinos dans une théorie de matrices ...

(comparativement à la mesure uniforme) et ce, pour les deux hiérarchies. Autrement dit, la mesurede Haar émergeant des ensembes seesaw constitue une réelle amélioration en comparaison au scénarioélémentaire et plutôt naïf impliquant la mesure uniforme [32]. Enfin, il est important de mentionnerque les distributions marginales des paramètres angulaires de la figure 3.5 (la mesure de Haar dugroupe U(3)) jouent un rôle important en ce qui a trait à l’étude et la caractérisation de la brisure dela symétrie CP sous cette hypothèse de travail (le principe anarchique) et cette discussion est réservéeà la sous-section 3.3.2, où une brève introduction aux invariants sous rephasage est également présentée.

Ayant présenté les résultats obtenus pour les distributions des paramètres angulaires gouvernant lephénomène d’oscillation des neutrinos, on peut donc maintenant entreprendre le calcul des distributionsmarginales des valeurs singulières (les masses) des deux ensembles étudiés, ce qui représente une tâchecolossale en comparaison à ce qui a été accompli jusqu’à présent. En effet, bien que pour le cas del’ensemble seesaw de type II, cette distribution demeure relativement simple

PIIν (mν

1 , mν2 , m

ν3) = 16

3 |(mν2)2 − (mν

1)2||(mν3)2 − (mν

1)2||(mν3)2 − (mν

2)2|

× mν1m

ν2m

ν3e−(mν1 )2−(mν2 )2−(mν3 )2

, (3.58)

il en est tout autrement en ce qui concerne l’ensemble seesaw de type I-III. Les relations (3.29) et(3.31), complémentées de la paramétrisation (A.13), permettent de constater que la forme résultantepour cette distribution ne peut pas être manipulée aussi facilement que (3.53) dans le cas N = 2 (enfait, la forme explicite remplie quelques pages et n’est pas particulièrement révélatrice). Pour cetteraison, la distribution résultante est laissée sous la forme suivante

PI-IIIν (mν

1 , mν2 , m

ν3) = 2

9Iβ=2N=3(mν

1 , mν2 , m

ν3)

(mν1)7(mν

2)7(mν3)7 |(m

ν2)2 − (mν

1)2||(mν3)2 − (mν

1)2||(mν3)2 − (mν

2)2|, (3.59)

où il va sans dire que la fonction Iβ=2N=3(mν

1 , mν2 , m

ν3) provenant de (3.31) doit être évaluée numérique-

ment. Ici également, comme les distributions (3.58) et (3.59) sont invariantes sous une permutation desvaleurs singulières mν

1 , mν2 et mν

3 , il faut donc fixer un ordre particulier pour obtenir les distributionsdes masses mν

min, mνmed et mν

max. Naturellement, cela a comme conséquence directe que le spectre demasse des neutrinos (normal ou inverse) du modèle standard étendu ne peut être prédit (ou contraint)sous l’hypothèse anarchique. Le seul commentaire pouvant être fait se résume simplement à mention-ner que tous les scénarios possibles concernant la hiérarchie du spectre de masse (les 3! permutationspossibles des trois valeurs singulières) sont équiprobables pour une différence de masses donnée (pardifférence de masses, on sous-entend un ordre particulier entre les quantités (mν

med)2 − (mνmin)2 et

(mνmax)2 − (mν

med)2). En conséquence, on pose 0 ≤ mν1 ≤ mν

2 ≤ mν3 de telle sorte que mν

1 ≡ mνmin,

mν2 ≡ mν

med et mν3 ≡ mν

max, tout en gardant à l’esprit que les masses mν1 , m

ν2 et mν

3 ne peuvent pasêtre directement reliées aux masses expérimentales des neutrinos (une fois de plus, ce choix est com-plètement arbitraire). Ayant fixé l’ordre des valeurs singulières, les distributions marginales suivantes

PΩν (mν1) = 3!

ˆ ∞mν1

dmν2

ˆ ∞mν2

dmν3PΩν (mν

1 , mν2 , m

ν3), (3.60)

PΩν (mν2) = 3!

ˆ ∞mν2

dmν3

ˆ mν2

0dmν

1PΩν (mν1 , m

ν2 , m

ν3), (3.61)

93

Page 104: Phénoménologie des neutrinos dans une théorie de matrices ...

PΩν (mν3) = 3!

ˆ mν3

0dmν

2

ˆ mν2

0dmν

1PΩν (mν1 , m

ν2 , m

ν3), (3.62)

peuvent être trouvées analytiquement pour le cas Ω = II alors que pour Ω = I-III, les intégralesdoivent être calculées numériquement. En fait, le cas de l’ensemble seesaw de type I-III s’est avéré êtrebeaucoup plus difficile à résoudre qu’anticipé à l’origine et une bonne partie de ce projet de doctorata consisté à extraire l’information pertinente de la distribution (3.59) à partir de calculs numériquesrelativement lourds [32]. De ces calculs s’en suit une panoplie de résultats intéressants concernant lespectre de masse des neutrinos et ceux-ci peuvent maintenant être présentés de façon successive. Dansun premier temps, les courbes de la figure 3.6 ont été obtenues.

0 1 2 3 4 50.0

0.6

1.2

1.8

2.4

mν1

PI-I

IIν

(mν 1)

Ensemble seesaw de type I-III

0 1 2 3 4 50.0

0.4

0.8

1.2

mν1

PII ν

(mν 1)

Ensemble seesaw de type II

0 1 2 3 4 50.0

0.2

0.4

mν2

PI-I

IIν

(mν 2)

0 1 2 3 4 50.0

0.4

0.8

1.2

mν2

PII ν

(mν 2)

0 5 10 15 20 250.0

0.06

0.12

mν3

PI-I

IIν

(mν 3)

0 1 2 3 4 50.0

0.4

0.8

mν3

PII ν

(mν 3)

Figure 3.6 – Distributions des valeurs singulières (masses) des ensembles seesaw pour le casN = 3. Leshistogrammes ont été obtenus à partir d’un échantillon de 2.5× 104 matrices de masse sans dimensiondans les deux cas. Les valeurs singulières sont ordonnées selon 0 ≤ mν

1 ≤ mν2 ≤ mν

3 et un facteur de 3!est introduit pour corriger la constante de normalisation des distributions.

Pour bien visualiser l’ampleur du problème que pose le calcul des courbes de la colonne de gauche de lafigure 3.6, il suffit de faire un simple décompte des variables d’intégration. L’intégrale Iβ=2

N=3(mν1 , m

ν2 , m

ν3),

qui constitue le principal obstacle à surmonter pour obtenir des résultats tangibles pour le secteur desneutrinos (en ce qui concerne l’ensemble seesaw de type I-III), contient à elle seule un total de neuf pa-ramètres qui doivent être intégrés (comme les phases non physiques ne sont pas incluses dans [U†dU ]′,

94

Page 105: Phénoménologie des neutrinos dans une théorie de matrices ...

on doit intégrer sur les variables x1, x2 et x3, sur les trois angles θ′12, θ′13 et θ′23 de même que surles trois phases complexes φ′12, φ′13 et φ′23 de la paramétrisation (A.13)). À cela s’ajoute par la suitel’intégrale sur deux des masses due à la marginalisation, soit les intégrales présentes aux expressions(3.60) à (3.62). Au final, pour chacune des trois distributions, il faut donc résoudre une intégrale en11 dimensions d’une fonction difficilement manipulable où tous ces paramètres sont couplés de façonnon triviale et particulièrement compliquée. De prime abord, il n’y a donc aucune garantie que mêmedu point de vue numérique, le calcul d’une telle intégrale puisse être mené de façon satisfaisante avecun degré de précision acceptable (de plus, la présence de fonctions transcendantales introduit un com-portement oscillatoire difficilement contrôlable pour bien des algorithmes numériques).

Ainsi, après avoir testé plusieurs stratégies d’intégration numérique, il a été convenu d’utiliser un al-gorithme adaptif (qui isole les régions d’intégration problématiques telles que des singularités ou uncomportement hautement oscillatoire et concentre l’effort de calcul, soit la méthode d’échantillonnagede la région, sur celles-ci) reposant sur la méthode Monte Carlo implémenté à l’aide de Mathematica.Plus précisément, la méthode AdaptiveMonteCarlo a été utilisée conjointement avec la règle d’intégra-tion MonteCarloRule, qui permet de spécifier la méthode de partition des axes dans le cas d’intégralesmultidimensionnelles (la méthode aléatoire a été choisie dans notre cas plutôt que d’avoir recours à uneminimisation de la variance du résultat estimé de chaque moitié lors de la bissection des sous-régionsd’intégration) et le nombre de points voulus dans l’échantillonnage des sous-régions (dans ce cas, il aété estimé que de 2× 106 à 3× 106 points sont nécessaires pour obtenir une précision acceptable, soitd’au moins trois chiffres significatifs). Cette méthode, qui a été jugée la plus efficace et la plus précise,a ainsi permis d’obtenir l’ensemble des résultats désirés à partir de cette distribution (après plusieursmois de calcul sur un ordinateur relativement modeste), à commencer par ceux de la figure 3.6. Dansce cas, l’accord toujours aussi frappant entre les courbes analytiques et les histogrammes numériquespermet de conclure d’une part que la distribution (3.59) est bel et bien correcte et, d’autre part, quela méthode d’intégration numérique utilisée est suffisamment précise pour permettre une comparai-son adéquate des résultats. Cette méthode est par la suite utilisée pour calculer les paramètres delocalisation de ces distributions (pour l’ensemble seesaw de type I-III), ce qui donne le tableau 3.3.

Tableau 3.3 – Paramètres de localisation des distributions marginales de la figure 3.6.

Moyenne Médiane ModePI-IIIν (mν

1) 0.36 0.26 0.03PI-IIIν (mν

2) 1.93 1.65 1.17PI-IIIν (mν

3) 9.65 6.55 4.09PIIν (mν

1) 12√

π3 ' 0.51 0.48 1√

6 ' 0.41PIIν (mν

2) 1516√

π2 ' 1.17 1.15

√5

2 ' 1.12PIIν (mν

3)√π

96(72 + 45

√2− 16

√3)' 1.99 1.96 1.91

Toujours dans le but d’extraire un maximum d’information à partir des distributions des masses, onconsidère ensuite une autre quantité tout aussi importante pour le secteur des neutrinos, soit l’écartde masse entre les trois générations. En effet, bien que la hiérarchie (normale ou inverse) du spectre demasse ne puisse être déterminée à partir de cette méthode, il n’en demeure pas moins que la distributionde l’écart de masse entre les générations peut être prédite à partir des résultats (3.58) et (3.59). Plus

95

Page 106: Phénoménologie des neutrinos dans une théorie de matrices ...

précisément, la quantité d’intérêt ici est le ratio R discuté brièvement au chapitre 2, soit par exemple

R = (mνmed)2 − (mν

min)2

(mνmax)2 − (mν

med)2 = (mν2)2 − (mν

1)2

(mν3)2 − (mν

2)2 ≡∆m2

21∆m2

32, (3.63)

ce qui correspond à la définition traditionnellement réservée à la hiérarchie normale (la même analysepeut être faite avec le ratio inverse pour le cas de la hiérarchie inverse et les mêmes conclusions sontobtenues). Pour obtenir la distribution de cette quantité, il suffit de faire un changement de variablesur l’une des masses des expressions (3.58) et (3.59), par exemple mν

3 , et de calculer le jacobiencorrespondant à cette transformation. Ainsi, avec le changement de variables

mν1 → mν

1 , mν2 → mν

2 , mν3 →

√(R+ 1)(mν

2)2 − (mν1)2

R, (3.64)

ce qui implique le jacobien

det(JR) = (mν1 − mν

2)(mν1 + mν

2)2R 3

2√

(R+ 1)(mν2)2 − (mν

1)2, (3.65)

où JR est la matrice usuelle contenant les dérivées partielles, la distribution

PΩν (R) = 3!ˆ ∞

0dmν

1

ˆ ∞mν1

dmν2 |det(JR)|PΩν (mν

1 , mν2 , m

ν3(R, mν

1 , mν2)) (3.66)

peut être calculée pour les deux ensembles. De plus, comme le ratio R ne dépend pas du paramètred’échelle Λν , il s’avère possible de travailler directement avec les « masses » sans dimension (voir(3.63)). Ainsi, à partir de la distribution (3.66), les courbes de la figure 3.7 sont obtenues [32].

0.0 0.5 1.0 1.50.0

3.0

6.0

9.0

12.0

R

PI-I

IIν

(R)

Ensemble seesaw de type I-III

0 1 2 3 40.0

0.4

0.8

1.2

R

PII ν

(R)

Ensemble seesaw de type II

Figure 3.7 – Distributions des ratios R des ensembles seesaw pour le cas N = 3. Les histogrammesont été obtenus à partir d’un échantillon de 2.5× 104 matrices de masse sans dimension dans les deuxcas. Les valeurs singulières sont ordonnées selon 0 ≤ mν

1 ≤ mν2 ≤ mν

3 et un facteur de 3! est introduitpour corriger la constante de normalisation des distributions.

Ici également, dans le cas de l’ensemble seesaw de type I-III, il faut résoudre une intégrale en 11dimensions à partir de la méthode numérique discutée précédemment. Ainsi, la figure 3.7 permet deconstater que les courbes obtenues sont en accord avec les résultats numériques, ce qui offre un argu-ment supplémentaire quant à la validité de l’approche utilisée pour les obtenir. Pour les besoins de cetravail, l’information pertinente contenue dans ces courbes est la probabilité que le ratio R soit comprisdans les intervalles 0 ≤ R ≤ 1 et 1 ≤ R <∞, ce qui permet de préciser laquelle des deux différences de

96

Page 107: Phénoménologie des neutrinos dans une théorie de matrices ...

masses entre les trois générations (∆m221 < ∆m2

32 ou ∆m221 > ∆m2

32) est la plus probable et d’obtenirun élément de comparaison supplémentaire entre les deux ensembles seesaw.

Enfin, pour accentuer la comparaison avec les résultats expérimentaux et contribuer à mettre enévidence les différences entre ces deux ensembles à partir de la distribution jointe des valeurs singulières,un test de probabilité analogue à celui introduit pour les distributions angulaires peut être implémentéà l’aide des valeurs expérimentales du tableau 1.2. En intégrant les distributions obtenues ((3.58) et(3.59)) sur le volume « expérimental » complet défini à partir des valeurs expérimentales et leurs erreursassociées (1σ), cela permet d’obtenir de l’information sur la capacité (ou la propension) de ces deuxensembles à générer des valeurs pour ces paramètres qui sont comprises dans l’intervalle actuellementpermis par les mesures expérimentales. Le test de probabilité prend donc la forme suivante [32]

PΩHN(Λν) =ˆ (7.50+0.19)×10−5 eV2

2Λ2ν

(7.50−0.17)×10−5 eV2

2Λ2ν

d∆m221

ˆ (2.457+0.047)×10−3 eV2

2Λ2ν

(2.457−0.047)×10−3 eV2

2Λ2ν

d∆m231

׈ 4.5 eV√

2Λν

0dmν

1 |det(JHN)|PΩν (mν1 , m

ν2 , m

ν3), (3.67)

PΩHI(Λν) =ˆ (7.50+0.19)×10−5 eV2

2Λ2ν

(7.50−0.17)×10−5 eV2

2Λ2ν

d∆m221

ˆ (−2.449+0.048)×10−3 eV2

2Λ2ν

(−2.449−0.047)×10−3 eV2

2Λ2ν

d∆m232

׈ 4.5 eV√

2Λν

√−(∆m2

21+∆m232)

dmν1 |det(JHI)|PΩν (mν

1 , mν2 , m

ν3), (3.68)

où mν2 ≡ mν

2(∆m221, m

ν1) et mν

3 ≡ mν3(∆m2

31, mν1) dans (3.67) alors que mν

2 ≡ mν2(∆m2

21, mν1) et

mν3 ≡ mν

3(∆m221, ∆m2

32, mν1) dans (3.68). Cela signifie qu’un changement de variables de la forme

mν1 → mν

1 , mν2 →

√∆m2

21 + (mν1)2, mν

3 →√

∆m231 + (mν

1)2 (3.69)

est adopté afin d’exprimer les distributions en fonction des différences de masses mesurées pour lahiérarchie normale (HN) alors que pour la hiérarchie inverse (HI), celui-ci est plutôt de la forme

mν1 → mν

1 , mν2 →

√∆m2

21 + (mν1)2, mν

3 →√

∆m221 + ∆m2

32 + (mν1)2. (3.70)

Ainsi, les quantités |det(JHN)| et |det(JHI)| correspondent aux jacobiens des transformations relevantde la hiérarchie appropriée, soit

det(JHN) = 14√

∆m221 + (mν

1)2√

∆m231 + (mν

1)2, (3.71)

det(JHI) = 14√

∆m221 + (mν

1)2√

∆m221 + ∆m2

32 + (mν1)2

. (3.72)

Concernant les valeurs expérimentales utilisées pour ce test, un oeil aiguisé aura remarqué que celles-cidiffèrent légèrement de celles présentées au tableau 1.2 dans le cas de la hiérarchie inverse. Il est doncimportant de préciser ici que ce test a été réalisé à partir des valeurs obtenues dans [71] et que ces valeursont été mises à jour [2] seulement une fois que les calculs numériques eurent été complétés. Comme letemps de calcul est particulièrement long pour ce test et que les valeurs n’ont pas changées de façon

97

Page 108: Phénoménologie des neutrinos dans une théorie de matrices ...

significative (ce qui implique que les conclusions obtenues ne sont pas affectées par ce changement), letest n’a pas été repris en fonction des nouvelles valeurs. 89 De plus, la borne supérieure de mν

1 < 4.5 eV(à 1σ) sur la masse du neutrino (principalement) électronique a été tirée de [15] et relève de l’étudede supernova. Il s’agit d’une borne très conservatrice qui ne dépend pas d’un modèle ou mécanisme demasse en particulier et représente, en fait, la borne la plus faible lorsque comparée à (1.40) ou (1.41).Aussi, puisque ce test repose sur des mesures physiques ayant des unités d’énergie (la masse mν

1 etles deux différences de masses), il faut réintroduire le paramètre d’échelle Λν avec mν

j = mνj√2Λν

pourobtenir une comparaison adéquate (voir la sous-section 3.1.2), ce qui explique la forme des bornesaux expressions (3.67) et (3.68). On obtient donc dans les deux cas une expression pour le calcul dela probabilité qui dépend de ce paramètre d’échelle propre aux mécanismes seesaw. Comme il s’agitd’un paramètre libre dans ce modèle, l’idée ici est de tracer les courbes représentant la probabilitéobtenue en fonction de Λν sur un intervalle où ces courbes atteignent un maximum. En comparant lesvaleurs maximales atteintes (en prenant les ratios appropriés), cela permet d’obtenir une mesure dela « facilité » avec laquelle ces deux ensembles peuvent générer les valeurs observées et de déterminerlequel est le mieux adapté pour reproduire ces résultats. Une fois ces calculs complétés, les courbes dela figure 3.8 sont tracées [32].

0.0 0.5 1.0 1.5 2.0 2.5 3.00.0

0.3

0.6

0.9

1.2

1.5

Λν (10−2 eV)

PI-I

IIHN

(Λν)(×

10−

5 )

Ensemble seesaw de type I-III

Λmaxν = 0.48× 10−2 eV

P I-IIIHN (Λmax

ν ) = 1.63× 10−5

0.0 1.0 2.0 3.0 4.00.01.02.03.04.05.06.0

Λν (10−2 eV)

PII HN

(Λν)(×

10−

6 )Ensemble seesaw de type II

Λmaxν = 1.59× 10−2 eV

P IIHN (Λmax

ν ) = 6.68× 10−6

0.0 0.5 1.0 1.5 2.0 2.5 3.00.0

0.3

0.6

0.9

1.2

1.5

Λν (10−2 eV)

PI-I

IIHI

(Λν)(×

10−

8 )

Λmaxν = 1.10× 10−2 eV

P I-IIIHI (Λmax

ν ) = 1.48× 10−8

0.0 1.0 2.0 3.0 4.00.0

0.5

1.0

1.5

2.0

2.5

Λν (10−2 eV)

PII HI(Λ

ν)(×

10−

7 )

Λmaxν = 2.20× 10−2 eV

P IIHI (Λmax

ν ) = 2.67× 10−7

Figure 3.8 – Test de probabilité pour les valeurs singulières (masses) des ensembles seesaw pour lecas N = 3. La probabilité obtenue est tracée en fonction du paramètre d’échelle Λν pour les deuxscénarios possibles, soit la hiérarchie normale et inverse.

Pour ce test, les valeurs singulières mν1 , mν

2 et mν3 n’ont pas été ordonnées. De plus, le choix d’établir

une correspondance directe entre celles-ci et les masses du tableau 1.2 est complètement arbitraire,tout autre assignation parmi les 3! possibilités aurait menée aux mêmes résultats. Ainsi, parmi toutesles différences de masses ∆m2

21 et ∆m231 (ou ∆m2

32) possibles (leurs intervalles étant définis par lesrelations (3.69) et (3.70)), ce test donne la probabilité d’obtenir celles qui sont situées dans les intervallesexpérimentaux qui caractérisent les hiérarchies normale et inverse. Finalement, rappelons que commece test mesure la probabilité que les variables étudiées soient dans un volume donné délimité par89. En ce qui concerne l’ensemble seesaw de type I-III, il faut résoudre numériquement une intégrale en 12 dimensions

à partir de la méthode discutée précédemment.

98

Page 109: Phénoménologie des neutrinos dans une théorie de matrices ...

les barres d’erreurs expérimentales, les quantités d’intérêt sont donc les ratios entre les probabilitésmaximales obtenues (qui peuvent être lues directement sur la figure 3.8). Ceci complète la présentationdes résultats obtenus concernant la distribution des masses pour le casN = 3. La prochaine sous-sectionaborde maintenant le dernier sujet couvert dans le cadre de cette thèse, soit l’étude de la brisure de lasymétrie CP sous l’hypothèse anarchique, et présente les résultats qui y sont associés.

3.3.2 Symétrie CP et invariants

Ayant pour but de répondre à certaines questions fondamentales à propos de notre univers en exposantles possibles différences intrinsèques entre la matière et l’antimatière, l’étude de la symétrie CP s’avèredonc d’une grande importance pour expliquer, par exemple, l’asymétrie flagrante entre la quantitéde matière et d’antimatière présente dans l’univers observable (qui ont été produites, en principe, enproportions égales lors du big bang). En fait, la raison pour laquelle la combinaison des transformationsdiscrètes C et P revêt un caractère spécial dans le modèle standard relève essentiellement du fait qu’ils’agit d’une théorie chirale (ce qui implique que les spineurs de Weyl de chiralité gauche et droitepossèdent des nombres quantiques de jauge différents). Plus précisément, comme les transformations Cet P , lorsqu’appliquées sur un spineur de Dirac, échangent les composantes de chiralité gauche et droitede ce dernier [12], 90 cela implique que dans une théorie invariante sous ces transformations respectives,le lagrangien détaillant les interactions de jauge peut être entièrement écrit en termes de spineurs deDirac. Cela signifie donc également que tous les champs de Weyl présents dans ce modèle peuventêtre combinés pour former des spineurs de Dirac sans que les différents nombres quantiques de jaugen’entrent en conflit. Par construction, cette formulation particulière du lagrangien n’est évidemmentpas possible dans une théorie chirale puisque les spineurs de Weyl de chiralité gauche et droite possèdentdes interactions de jauge différentes. Autrement dit, le lagrangien du modèle électrofaible (1.13) n’estpas invariant sous l’échange des champs chiraux.

3.3.2.1 Brisure de la symétrie CP dans le secteur électrofaible

Ainsi, bien que les symétries discrètes C et P , prises séparément, sont brisées explicitement (et maxima-lement, c’est-à-dire brisées par le contenu en champs) par la structure même du secteur électrofaible(et donc ne peuvent pas correspondre à des symétries fondamentales de la nature), la combinaisonCP (qui préserve la chiralité, c’est-à-dire qu’un spineur de Weyl est simplement transformé en soncomplexe conjugué ou en lui-même) est a priori libre de toute contrainte théorique dans ce modèle(c’est-à-dire que le fait que cette symétrie soit brisée ou non n’est pas une conséquence de la structurechirale SU(2)L ⊗ U(1)Y ). Cette combinaison particulière permet ainsi d’établir une relation entre desparticules de charges opposées (on peut penser au nombre leptonique ou baryonique par exemple) etreprésente donc une transformation bien définie, que la théorie sous-jacente soit chirale ou non. Celle-ciest donc susceptible de correspondre à une symétrie de la nature tout en constituant un canal privilégiépour sonder la relation matière-antimatière à des échelles d’énergie arbitrairement élevées. Concrète-ment, une théorie possédant la symétrie CP implique donc que le lagrangien associé demeure inchangé

90. Pour un spineur de Dirac, la transformation P implique ψ(t, x) P→ γ0ψ(t, −x). Ainsi, en se référant aux définitions(1.2) et (1.3), on constate que la matrice γ0 échange les composantes χL ↔ χR, ce qui implique que cette opération changela chiralité d’un spineur de Weyl. En ce qui concerne la conjugaison de charge, on a plutôt que ψ(t, x) C→ iγ2ψ†T (t, x),ce qui implique également que les champs de Weyl sont échangés. Ce faisant, la transformation CP préserve la chiralitédes spineurs de Weyl puisque ψ(t, x) CP→ iγ2γ0ψ†T (t, −x).

99

Page 110: Phénoménologie des neutrinos dans une théorie de matrices ...

lorsqu’une particule est échangée par son antiparticule (la conjugaison de charge C) et que les coor-données spatiales de celle-ci sont inversées (la parité P ). Cela signifie, par exemple, que les prédictionsde cette théorie concernant l’image miroir d’une désintégration particulière impliquant les antiparti-cules correspondantes (taux de désintégration, etc.) doivent être les mêmes que pour la désintégrationd’origine. C’est le cas, en fait, pour tous les processus relevant des interactions électromagnétiques(QED) observés à ce jour de même que pour ceux relevant des interactions fortes (QCD). 91 Ce futdonc une surprise, au milieu des années 1960, lorsque les premières preuves indirectes d’une violationde cette symétrie eurent été observées (par Val Fitch et Jim Cronin) au niveau des interactions faibles,impliquant du même coup que la matière et l’antimatière avaient des comportements différents. Cettedécouverte importante a par ailleurs fait l’objet d’un prix Nobel en 1980.

Dans la limite des basses énergies, il est donc maintenant bien établi que le secteur des quarks desinteractions faibles présente une violation claire de cette symétrie (supporté par certains processus dedésintégrations associés aux kaons neutres et aux mésons B) et ce n’est qu’à partir de 1973 que cephénomène a pu être expliqué convenablement dans le contexte du modèle standard, se manifestantultimement par une matrice CKM complexe. 92 En effet, une violation directe de la symétrie CP estpossible dans le secteur électrofaible du modèle standard dans le cas où une phase complexe apparaitdans la matrice CKM paramétrisant le mélange des quarks. Par ailleurs, il ne suffit pas que cette ma-trice soit complexe pour que cette phase soit présente. En fait, celle-ci implique également l’existenced’au moins trois générations de quarks (à l’époque, seulement deux générations étaient connues, ce quia mené Kobayashi et Maskawa à postuler l’existence d’une troisième génération) puisque la matriceCKM doit être au minimum de dimensions 3 × 3 pour qu’une phase complexe soit préservée dansla paramétrisation la plus générale possible (par exemple, la paramétrisation d’une matrice unitaire2× 2 donnée par (3.46) implique que la seule phase ayant une signification physique (φ12) est du typeMajorana et celle-ci n’est donc pas présente dans ce secteur puisqu’elle peut toujours être absorbéepar une redéfinition des champs de quarks, qui sont des fermions de Dirac). Ainsi, une fois cette condi-tion remplie, il existe donc deux avenues principales pour générer cette phase dans la matrice CKM.L’approche la plus commune est bien entendu de considérer directement des couplages de Yukawacomplexes provenant de la théorie à haute énergie, ce qui correspond à une brisure explicite de lasymétrie CP . La seconde option, plus subtile, implique de considérer une phase complexe relative dansle VEV du champ de Higgs, ce qui introduit une brisure spontanée de la symétrie CP à basse énergie91. Dans le cas de QCD, le lagrangien le plus complet pouvant être écrit admet également la possibilité d’une brisure de

la symétrie CP , suggérant du même coup qu’il n’existe aucune raison particulière pour que cette symétrie soit préservéepar les interactions fortes. Cependant, comme aucune observation expérimentale ne justifie un tel apport à la théorie,la symétrie CP est donc « imposée » au lagrangien afin de reproduire les observations actuelles, ce qui est interprétécomme un problème d’ajustement fin de la théorie (strong CP problem).92. Pour obtenir les conditions nécessaires à la brisure de la symétrie CP dans ce secteur, il faut appliquer la trans-

formation LefCP→ L ′ef et trouver les conditions permettant d’obtenir l’égalité Lef = L ′ef [6], où le lagrangien du secteur

électrofaible Lef est donné par (1.13). Connaissant le résultat de cette transformation sur les différents champs de lathéorie (voir les tableaux 3.4 et 3.5 de [6] pour une synthèse des transformations d’un champ scalaire, pseudoscalaire,vectoriel et pseudovectoriel (incluant également les combinaisons construites à partir des champs spinoriels) sous lessymétries discrètes C, P et T ), la transformation de chaque terme du lagrangien peut donc être obtenue séparément [6].Ainsi, cela permet de vérifier que ce lagrangien préserve la symétrie CP sous les conditions suivantes, soit Y l = Y l∗,Y d = Y d∗ et Y u = Y u∗. En d’autres mots, les couplages de Yukawa doivent être réels. Enfin, comme ces matricespeuvent toujours être exprimées dans une base où celles-ci sont diagonales, réelles et non négatives (ce qui définit, à lasuite d’une brisure spontanée de la symétrie électrofaible, la base des états propres de masse) que les éléments de lamatrice d’origine soient réels ou complexes, cela a pour effet de transposer les conditions préservant la symétrie CP auterme d’interaction de type courant chargé pour les leptons et les quarks. Plus précisément, cela implique que la matriceCKM doit être réelle en ce qui concerne les quarks, soit V = V ∗.

100

Page 111: Phénoménologie des neutrinos dans une théorie de matrices ...

(voir également la note 52) [72]. Naturellement, ces deux options peuvent être réalisées conjointementet un processus similaire est attendu pour le secteur leptonique également.

En fait, dans le secteur leptonique des interactions faibles, la situation est tout autre en ce qui concernela brisure de la symétrie CP . Puisque les neutrinos sont sans masse dans le modèle standard, il n’existeaucune façon d’introduire une brisure de la symétrie CP analogue à celle des quarks. Comme mentionnéau chapitre 1, tout mélange étant introduit par la diagonalisation de la matrice de masse des leptonschargés (ou de façon équivalente la matrice Y l) peut être absorbé par une redéfinition des champs desneutrinos (voir la discussion suivant le résultat (1.25)). Ainsi, le secteur leptonique préserve la symétrieCP . Cependant, comme il en a été fait mention à plusieurs reprises, la découverte du phénomèned’oscillation des neutrinos, qui implique que ceux-ci ont une masse, permet certaines extensions dumodèle standard impliquant nécessairement la présence de la matrice PMNS dans le terme d’interactionde type courant chargé, ouvrant ainsi la porte à de nouvelles sources possibles pour la brisure de lasymétrie CP . Dans ce cas, la phase de Dirac δ, de même que les deux phases de Majorana α21 etα31, sont susceptibles de contribuer à la brisure de cette symétrie dans le secteur leptonique et letraitement devient alors analogue à celui des quarks. Toutefois, bien que la brisure de la symétrieCP soit gouvernée par un seul paramètre dans le secteur des quarks et par (potentiellement) troisparamètres dans le secteur des leptons, il n’en demeure pas moins que ces phases ne constituent pasune mesure adéquate de la force (ou de l’importance) de la brisure de cette symétrie dans ces secteursrespectifs. En effet, puisque ce type de mesure (de même que pour toute autre quantité physique quien dépend) ne doit pas dépendre du choix de la paramétrisation utilisée et doit demeurer invariantsous changement de base, un formalisme plus adéquat à cette mesure a été développé dans [73, 74], cequi a mené à l’introduction de quantités invariantes sous rephasage appelées « Jarlskog ».

3.3.2.2 Invariants sous rephasage

Une fois la brisure de la symétrie CP introduite, il s’avère intéressant de pouvoir quantifier ce phéno-mène ainsi que la description des processus physiques qui en découlent. Il va sans dire que ce formalismea été développé à l’origine pour le secteur des quarks et qu’il a été abondamment étudié dans la lit-térature. En ce qui concerne le secteur leptonique, l’analyse ayant été développée est beaucoup plusrécente et une construction analogue peut être trouvée pour les invariants de ce secteur [75]. Une brèveintroduction aux invariants sous rephasage est donc maintenant présentée suivant les résultats obtenusdans le secteur des quarks, qui ne contient qu’un seul invariant. Cela permet ensuite d’introduire lestrois invariants du secteur leptonique et de présenter les résultats obtenus concernant l’étude de leurcomportement sous l’hypothèse anarchique [33]. Ainsi, puisque toute quantité observable est indépen-dante de la paramétrisation choisie pour la matrice de mélange, et que cette matrice peut toujours êtremodifiée par une transformation de phase découlant d’une redéfinition des champs de quarks, il s’avèrepossible de travailler uniquement avec des quantités dites « invariantes sous rephasage » construitesà partir des éléments de la matrice CKM. 93 Plus précisément, il s’agit de construire des quantitésinvariantes sous la transformation

V → e−iφuV eiφd

, (3.73)

93. Toute observable relevant des interactions de type courant chargé dans le secteur des quarks (en particulier, toutequantité obtenue à partir de diagrammes de Feynman) contient une fonction polynomiale d’un produit des éléments deV et V ∗ (en quantité égale) car celles-ci émergent du module au carré d’une amplitude invariante |M|2. Celles-ci peuventdonc toujours s’écrire en termes de quantités « invariantes sous rephasage » [76].

101

Page 112: Phénoménologie des neutrinos dans une théorie de matrices ...

où φu = diag(φu, φc, φt) et φd = diag(φd, φs, φb) sont des matrices de phases distinctes associéesaux quarks de type « up » et de type « down » et V est la matrice CKM. Naturellement, la premièrequantité qui respecte cette contrainte correspond au module d’un élément de la matrice CKM au carré,

|Vαk|2 = VαkV∗αk, (3.74)

ce qui constitue l’invariant le plus simple permettant d’inclure les effets liés au mélange des quarks surles observables. Par la suite, on peut construire des invariants plus élaborés (contenant de l’informationsur les phases) qui relèvent d’un produit quartique d’éléments, noté

αkβj = VαkVβjV∗αjV

∗βk, (3.75)

avec α 6= β et k 6= j. La procédure qui permet d’obtenir ces quantités consiste d’abord à éliminer uneligne et une colonne de la matrice CKM, de prendre le conjugué des éléments sur la diagonale de lamatrice 2×2 résultante pour ensuite prendre le produit des quatre éléments de cette matrice [74]. Dansla littérature, ces invariants portent plusieurs noms (plaques, quartets, boîtes) et ont été introduitsdans le but d’offrir une description « standardisée » de la phénoménologie des quarks à basse énergie[76]. De plus, ceux-ci satisfont la relation de conjugaison

αkβj = βjαk = βk∗αj = αj∗βk . (3.76)

Les deux types d’invariants (quadratique et quartique) ainsi introduits sont très importants puisqu’ils’avère que ceux-ci sont suffisants pour caractériser tout produit d’ordre supérieur. En effet, on peutmontrer que ces produits peuvent toujours être ramenés à des combinaisons particulières de moduleset de produits quartiques [1, 76]. De plus, puisque le produit (3.75) est en général complexe pourune matrice V complexe, on peut extraire les parties réelle et imaginaire afin de pouvoir quantifierexplicitement la violation de la symétrie CP , soit

Im(αkβj

)= Im

(VαkVβjV

∗αjV

∗βk

), Re

(αkβj

)= Re

(VαkVβjV

∗αjV

∗βk

). (3.77)

Ainsi, on a que la partie imaginaire est antisymétrique sous l’échange α ↔ β et k ↔ j alors que lapartie réelle est symétrique sous cet échange (voir équation (3.76)). De ces deux quantités, un intérêtparticulier est maintenant porté à la partie imaginaire de (3.77), qui peut être détaillée davantage enconstatant que l’ensemble des produits qui satisfont cette relation sont tous équivalents à un signe près.En effet, puisqu’il existe neuf façons distinctes d’éliminer une ligne et une colonne de V pour construireces produits et que la matrice CKM est unitaire, les neuf combinaisons résultantes sont toutes équiva-lentes à un signe près. Cela implique qu’on peut extraire, par exemple, la quantité Im (VudVcsV ∗usV ∗cd)et définir le signe des autres combinaisons à partir de celle-ci, soit [74]

Im(VαkVβjV

∗αjV

∗βk

)= jD

∑γ,l

εαβγεjkl, jD ≡ Im (VudVcsV ∗usV ∗cd) , (3.78)

où le signe est déterminé à partir de la somme sur les indices des deux tenseurs de Levi-Civita. De plus,cette somme permet de garder automatiquement les bonnes combinaisons, c’est-à-dire qu’elle est validepour toutes valeurs de α, β, j et k. Un résultat important de cette section, démontré pour la premièrefois dans [74], est que la quantité jD de (3.78) joue un rôle de premier plan dans la caractérisation de

102

Page 113: Phénoménologie des neutrinos dans une théorie de matrices ...

la violation CP du secteur des quarks. Plus précisément, il s’agit de la quantité qui apparaît dans lecalcul du commutateur des matrices de masse des quarks de type « up » et « down » et ce déterminantregroupe l’ensemble des contraintes nécessaires à la brisure de la symétrie CP dans ce secteur, soit

det(−i[MuMu†, MdMd†]) = −2jD(m2

t −m2c)(m2

t −m2u)(m2

c −m2u)

×(m2b −m2

s)(m2b −m2

d)(m2s −m2

d). (3.79)

Par ailleurs, comme jD est une quantité mesurable, celle-ci peut être exprimée en fonction des obser-vables de la matrice CKM. En fait, à l’aide de l’expression (3.78) et de la paramétrisation standard dela matrice CKM présentée dans [4], le résultat suivant est obtenu

jD = sin(θ12) cos(θ12) sin(θ13) cos2(θ13) sin(θ23) cos(θ23) sin(δ13), (3.80)

ce qui implique que jD est l’invariant associé à la phase de Dirac δ13 et qu’il est défini sur l’in-tervalle −1/(6

√3) ≤ jD ≤ 1/(6

√3). 94 Les résultats (3.79) et (3.80) permettent donc de regrouper

l’ensemble des conditions nécessaires à la violation de la symétrie CP sous une seule équation, soitdet(−i[MuMu†, MdMd†]) 6= 0. Entre autres, il s’avère possible de conclure que si cette condition

est respectée, il devient impossible d’éliminer la phase physique δ13 par un rephasage des champs dequarks puisque la quantité jD est nécessairement non nulle. La matrice CKM est donc complexe. Ainsi,ces résultats permettent de constater que la symétrie CP est brisée dans le modèle standard tant queles conditions suivantes sont respectées :

il n’y a pas de dégénérescence au niveau des masses des quarks ; aucun angle de mélange n’est égal à 0 ou π

2 ; la phase physique δ13 est différente de 0, π ou 2π.

L’élément clé ici est de réaliser que jD est une quantité unique invariante sous changement de base quicaractérise l’ensemble des phénomènes qui violent la symétrie CP dans le modèle standard, ce qui enfait une mesure tout à fait adéquate pour évaluer la magnitude (l’échelle de grandeur) de cette brisure.La valeur numérique actuellement admise de cette quantité est [4]

jexpD = (3.04+0.21

−0.20)× 10−5, (3.81)

qui peut être directement comparée à la valeur jmaxD = 1

6√

3 ' 0.0962 attendue dans le cas où la symé-trie CP est maximalement violée. On peut donc constater que dans le secteur des quarks, la brisurede la symétrie CP est relativement petite. Ceci est principalement dû aux petits angles de mélangede ce secteur puisque jD dépend directement de ces trois angles en plus de la phase δ13. Ainsi, desinvariants quadratiques et quartiques, l’invariant quartique jD est le seul qui contient de l’informationsur le signe de la phase et sur la brisure de la symétrie CP .

Ayant introduit les motivations derrière la construction d’invariants pour le secteur des quarks, celapermet maintenant d’amorcer la discussion concernant les invariants du secteur leptonique qui peuventêtre construits dans le cadre des extensions du modèle standard présentées au chapitre 1. Comme94. Cette distinction est sans conséquence pour le secteur des quarks mais est particulièrement importante dans le

secteur leptonique, qui contient un invariant pour chaque phase complexe présente (δ, α21 et α31).

103

Page 114: Phénoménologie des neutrinos dans une théorie de matrices ...

discuté précédemment, on s’intéresse uniquement au cas des invariants quartiques pour obtenir del’information sur la brisure de la symétrie CP . Pour le cas des leptons, il faut donc élargir la définitiond’invariants sous rephasage pour inclure également ceux pouvant être construits à partir des phases deMajorana. En fait, pour le cas d’une matrice unitaire U de dimensionsN×N (contenant N2 paramètreslibres, voir la note 45) contrainte par les propriétés du contenu en champs du terme d’interaction detype courant chargé, il existe un total de N(N − 1)/2 invariants quartiques associés aux N(N − 1)/2phases physiques complexes brisant la symétrie CP (en supposant que les neutrinos sont des fermionsde Majorana, autrement les N−1 phases de Majorana doivent être considérées comme non physiques).De plus, la forme exacte des deux types d’invariants est connue pour tout N et s’écrit [75]

jD, (k−1, l−1) = Im(U11UklU∗1lU∗k1), 2 ≤ k ≤ l ≤ N − 1 (3.82)

jk−1 = Im(U1kU1kU∗11U

∗11), 2 ≤ k ≤ N (3.83)

ce qui implique qu’il existe un total de N(N − 3)/2 + 1 invariants de type Dirac (3.82) et un total deN − 1 invariants de type Majorana (3.83). Évidemment, cela signifie que pour le cas N = 1, il n’existeaucun invariant pouvant être construit alors que pour le cas N = 2, le seul invariant existant est dutype Majorana et s’écrit

j1 = Im(U12U12U∗11U

∗11) = 2 sin2(θ12) cos2(θ12) sin(φ12) cos(φ12), (3.84)

où la transposée de la paramétrisation (3.46) a été utilisée pour concorder avec la définition (3.83). 95

Cela implique également que cet invariant est défini sur l’intervalle −1/4 ≤ j1 ≤ 1/4 uniquement.Naturellement, ce résultat permet de constater que l’invariant obtenu ne dépend pas des phases nonphysiques ϕ1 et ϕ2 mais seulement de l’angle de mélange θ12 et de la phase de Majorana φ12. Consi-dérons ensuite le cas N = 3, qui correspond encore une fois au modèle standard étendu (la matricePMNS). Dans ce cas, il n’y a seulement qu’un invariant de type Dirac jD, (1, 1) (que l’on note simplementjD) et deux invariants de type Majorana et ceux-ci prennent la forme

jD = Im(U11U22U∗12U

∗21) = sin(θ12) cos(θ12) sin(θ13) cos2(θ13) sin(θ23) cos(θ23) sin(δ), (3.85)

j1 = Im(U12U12U∗11U

∗11) = sin2(θ12) cos2(θ12) cos4(θ13) sin(α21), (3.86)

j2 = Im(U13U13U∗11U

∗11) = cos2(θ12) sin2(θ13) cos2(θ13) sin(α31 − 2δ), (3.87)

où la paramétrisation standard (3.56) a été utilisée. Il va sans dire que l’invariant (3.85) est le mêmeque celui obtenu dans le secteur des quarks, soit l’expression (3.80), à la différence que les paramètresangulaires sont maintenant ceux appartenant au secteur leptonique. Ces résultats impliquent donc qued’un point de vue analytique, ces invariants sont définis sur les intervalles −1/(6

√3) ≤ jD ≤ 1/(6

√3),

−1/4 ≤ j1 ≤ 1/4 et −1/4 ≤ j2 ≤ 1/4 respectivement. Cependant, comme les valeurs des angles demélange sont maintenant connues avec précision, ce ne sont pas toutes les valeurs de ces intervallesqui sont permises par les mesures expérimentales. En fait, en substituant les valeurs des angles de95. Cette correction s’avère nécessaire puisque la définition des invariants présentée dans [75] a été introduite en

considérant une paramétrisation où les phases non physiques apparaissent complètement à gauche dans le produitmatriciel la caractérisant, contrairement à (A.13), où les phases non physiques ϕj apparaissent à droite dans le produitmatriciel. Pour ce qui est de la paramétrisation standard de la matrice PMNS, il s’avère possible de vérifier (à partirde la position de la matrice contenant les phases de Majorana) que la matrice contenant les phases non physiques doitmultiplier le produit matriciel par la gauche (voir (3.56)), ce qui concorde avec la définition de [75].

104

Page 115: Phénoménologie des neutrinos dans une théorie de matrices ...

mélange du tableau 1.2 dans les expressions (3.85) à (3.87), on obtient des intervalles plus restreintspour les invariants jD, j1 et j2. Ainsi, en considérant que le sinus de la phase associée est maximal(±1), c’est-à-dire que les phases complexes peuvent prendre toutes les valeurs possibles entre 0 et 2π,les résultats du tableau 3.4 sont obtenus.

Tableau 3.4 – Valeurs maximales des invariants |jD|, |j1| et |j2| de la matrice PMNS selon les mesuresactuelles (±1σ) des angles de mélange pour la hiérarchie normale et inverse [2].

Héirarchie normale Hiérarchie inverse|jmaxD | 0.0329+0.0007

−0.0007 0.0328+0.0007−0.0007

|jmax1 | 0.203+0.005

−0.004 0.203+0.005−0.004

|jmax2 | 0.0147+0.0006

−0.0006 0.0148+0.0006−0.0006

De plus, en considérant la mesure à ±1σ pour la phase de Dirac, une valeur expérimentale peut êtreobtenue pour l’invariant jD du secteur leptonique [2, 33], soit

jexpD ' −0.032± 0.005 (HN), jexp

D ' −0.033± 0.003 (HI), (3.88)

pour les hiérarchies normale et inverse respectivement (voir [77] pour le calcul de la propagation d’er-reur). Par construction, ces invariants peuvent donc être exprimés comme des fonctions non trivialesdes angles de mélange et des phases complexes du secteur des neutrinos, ce qui est particulièrementintéressant puisque dans le cadre de ce travail, les distributions de ces paramètres d’oscillation ont étéobtenues à partir de l’étude des ensembles seesaw (voir les figures 3.2 et 3.5). Connaissant ces distri-butions, on peut donc maintenant se demander comment les invariants (3.84) à (3.87) sont distribuéssous l’hypothèse anarchique, c’est-à-dire lorsque les angles de mélange et les phases complexes sontgénérés à partir de la mesure de Haar du groupe de Lie correspondant. Dans ce contexte, les intervallesexpérimentaux du tableau 3.4, de même que les valeurs (3.88), sont également mis à contribution afind’étoffer l’analyse des distributions statistiques ainsi obtenues.

3.3.2.3 Calcul des distributions

On s’intéresse donc au calcul des distributions des invariants du secteur leptonique et aux résultatsque l’on peut en tirer (qui sont valides pour les deux ensembles seesaw considérés) [33]. À des fins decomparaison, la mesure uniforme est à nouveau utilisée comme point de référence pour comparer lesrésultats obtenus avec la mesure de Haar, qui est motivée par le principe anarchique. Pour ce faire,il s’avère toujours possible de procéder par intégration directe des deux mesures correspondantes à lasuite de changements de variables appropriés, ce qui mène inévitablement aux distributions souhaitées.Cependant, cette technique « force brute », bien que plus intuitive, se généralise difficilement aux deuxtypes de mesures et aux trois invariants, de même que pour le cas général de matrices N ×N . Ainsi,une méthode systématique (reposant sur l’analyse des moments) est présentée pour le calcul de cesdistributions, qui est inspirée des travaux de [78]. 96 Par ailleurs, afin d’alléger la présentation dela preuve sur laquelle repose le calcul de ces distributions, il convient d’abord d’introduire quelquesrésultats préliminaires. Par exemple, étant donné la forme des invariants obtenus (qui correspond

96. L’analyse présentée dans [78] concerne seulement le secteur des quarks. La distribution de l’unique invariant jDest obtenue à partir de la mesure de Haar de U(3) et il est montré que la matrice CKM ne peut être considérée commeune matrice unitaire générique tirée au hasard selon cette mesure.

105

Page 116: Phénoménologie des neutrinos dans une théorie de matrices ...

simplement à un produit de sinus et de cosinus à différentes puissances), on considère les intégralessuivantes sous le changement de variable x = sin2(θ)

ˆ π/2

0sini(θ) cosj(θ)dθ = 1

2

ˆ 1

0x(i+1)/2−1(1− x)(j+1)/2−1dx

= Γ ((i+ 1)/2) Γ ((j + 1)/2)2Γ ((i+ j + 2)/2) , (3.89)

ˆ 2π

0sin2k(θ) cos2`(θ)dθ = 2ξkξk+`

ˆ 1

0x(k+1/2)−1(1− x)(`+1/2)−1dx

= 2ξkξk+`Γ(k + 1/2)Γ(`+ 1/2)Γ(k + `+ 1) , (3.90)

qui impliquent également les conditions Re(i) > −1, Re(j) > −1, Re(k) > −1/2, Re(l) > −1/2 etξk = (1+(−1)2k)/2. Ces intégrales, qui correspondent à des fonctions bêta, peuvent donc être utiliséespour calculer les moments non nuls des invariants de façon analytique. Ensuite, comme l’approcheadoptée dans cette section repose sur l’idée selon laquelle les distributions des invariants peuvent êtreassociées aux distributions obtenues à partir d’un produit spécifique de variables aléatoires (en misantsur la comparaison de leur moments respectifs), cela nécessite l’introduction d’une variable aléatoireX définie sur l’intervalle [0, 1] et distribuée selon une fonction bêta (normalisée)

P(α, β)(x) = Γ(α+ β)Γ(α)Γ(β)x

α−1(1− x)β−1, (3.91)

où Re(α) > 0 et Re(β) > 0. Ce faisant, les moments de X sont donnés par l’expression

〈xn〉(α, β) ≡ˆ 1

0xnP(α, β)(x)dx = (α)n

(α+ β)n, (3.92)

où n ∈ N et (α)n ≡ Γ(α+ n)/Γ(α) est le symbole de Pochhammer. Cette forme particulière, pouvantêtre obtenue à partir de la formule de duplication

(α)mn = mmnm−1∏i=0

(α+ i

m

)n

, (3.93)

où m, n ∈ N (la relation (3.93) s’avère nécessaire pour exprimer les résultats (3.89) et (3.90) en fonc-tion des symboles de Pochhammer), facilite la comparaison des différents moments obtenus pour lesinvariants du secteur leptonique. Enfin, le dernier résultat important qui doit être introduit concerne larelation bien connue permettant d’obtenir la distribution d’un produit de deux variables aléatoires indé-pendantes à partir de leur distribution respective. Ainsi, pour deux variables aléatoires indépendantesX et Y définies sur l’intervalle [0, 1] et possédant les distributions PX(x) et PY (y) respectivement, ona que

PXY (x′) =ˆ 1

x′PX(t)PY (x′/t) 1

tdt, (3.94)

qui peut être obtenu en considérant le changement de variable t = x et x′ = xy sur la densitéPX(x)PY (y) pour ensuite marginaliser (intégrer) sur dt. Pour des raisons qui deviendront clairesà la suite du calcul des moments des différents invariants, l’idée ici est maintenant d’appliquer latransformation (3.94) pour le cas de variables aléatoires distribuées selon (3.91). On trouve alors que

106

Page 117: Phénoménologie des neutrinos dans une théorie de matrices ...

pour deux variables aléatoires indépendantes possédant les distributions respectives P(α1,β1)(x) etP(α2,β2)(y), la distribution résultante prend la forme générale

P(α1,β1;α2,β2)(x′) =ˆ 1

x′P(α1,β1)(t)P(α2,β2)(x′/t)

1tdt

= Γ(α1 + β1)Γ(α2 + β2)Γ(α1)Γ(α2)Γ(β1)Γ(β2)x

′(α2−1)ˆ 1

x′tα1−α2−β2(1− t)β1−1(t− x′)β2−1dt

= Γ(α1 + β1)Γ(α2 + β2)Γ(α1)Γ(α2)Γ(β1 + β2)x

′(α2−1)(1− x′)β1+β2−1

× 2F1(β1, β2 − α1 + α2;β1 + β2; 1− x′), (3.95)

où 2F1(a, b; c; z) est la fonction hypergéométrique. Par ailleurs, on peut montrer à partir de la trans-formation 2F1(a, b; c; z) = (1−z)c−a−b2F1(c−a, c−b; c; z) que le résultat (3.95) est bien invariant sousl’échange (α1, β1)↔ (α2, β2), ce qui doit nécessairement être le cas puisque celui-ci ne doit pas dépendrede l’ordre dans lequel les distributions d’origine sont introduites dans la transformation (3.94). Ainsi,ce résultat constitue une généralisation de l’argument original présenté dans l’annexe B de [78]. Enpoussant ce raisonnement plus loin, il s’avère également possible d’obtenir une solution analytique pourla distribution résultante d’un produit de deux variables aléatoires indépendantes possédant les distri-butions P(α1,β1;α2,β2)(x) et P(1/2, 1)(y) respectivement. En effet, en imposant la contrainte β1 +β2 = 1,cela permet d’obtenir le résultat suivant [33]

P(α1,β1;α2,β2;1/2, 1)(x′) =ˆ 1

x′P(α1,β1;α2,β2)(t)P(1/2, 1)(x′/t)

1tdt

= Γ(α1 + β1)Γ(α2 + β2)2Γ(α1)Γ(α2)

√x′

ˆ 1

x′tα2−3/2

2F1(β1, β2 − α1 + α2; 1; 1− t)dt

= sin(πβ1) sin (π(β2 − α1 + α2)) Γ(α1 + β1)Γ(α2 + β2)2π2Γ(α1)Γ(α2)

√x′

×

[G2,3

3,3

(1, α2 − β1 + 1/2, α1 − β2 + 1/2

α1 − 1/2, α2 − 1/2, 0

∣∣∣∣∣ t)]t=1

t=x′, (3.96)

oùGm,np,q

(a1, . . . , ap

b1, · · · , bq

∣∣∣∣∣ z)

est la fonction G de Meijer. En somme, les résultats (3.95) et (3.96) s’avèrent

être essentiels en ce qui concerne le calcul des distributions des invariants introduits précédemment etpermettent à présent de détailler les différentes étapes nécessaires à l’obtention de ces distributions.Ainsi, comme le veut maintenant la tradition, un exemple plus simple est maintenant de mise, soitcelui du cas N = 2. Dans ce cas, le seul invariant existant (j1) est du type Majorana et est donné parla relation (3.84) alors que les distributions normalisées associées aux deux mesures d’intérêt sont

PHΘ(θ12, φ12)dθ12dφ12 = 1

πsin(θ12) cos(θ12)dθ12dφ12, PU

Θ(θ12, φ12)dθ12dφ12 = 1π2 dθ12dφ12, (3.97)

où les phases non physiques ont été intégrées. Ici, les étiquettes H (Haar) et U (uniforme) ont étéintroduites pour distinguer les mesures plus facilement. La première étape est donc de calculer lesmoments non nuls de j1 à partir des intégrales (3.89) et (3.90). Comme les moments impairs de j1sont tous nuls pour les deux mesures considérées (ce qui implique des distributions symétriques parrapport à la moyenne) et ce, pour des raisons de parité liées à l’intégrale sur φ12, il devient alors utile

107

Page 118: Phénoménologie des neutrinos dans une théorie de matrices ...

d’introduire la variable x1 = 16j21 définie sur l’intervalle [0, 1]. Le calcul des moments de cette nouvelle

variable (en utilisant (3.89) et (3.90)) permet donc d’écrire

〈xn1 〉H = 22n × 16n

π

ˆ π/2

0dθ12

ˆ 2π

0dφ12 sin4n+1(θ12) cos4n+1(θ12) sin2n(φ12) cos2n(φ12)

= 26nΓ(n+ 1/2)2Γ(2n+ 1)πΓ(4n+ 2) = (1/2)2

n

(3/4)n(5/4)n(3.98)

pour la mesure de Haar et

〈xn1 〉U = 22n × 16n

π2

ˆ π/2

0dθ12

ˆ 2π

0dφ12 sin4n(θ12) cos4n(θ12) sin2n(φ12) cos2n(φ12)

= 26nΓ(n+ 1/2)2Γ(2n+ 1/2)2

π2Γ(2n+ 1)Γ(4n+ 1) = (1/4)n(3/4)n(1)2

n

(3.99)

pour la mesure uniforme. Les expressions finales sont obtenues en utilisant la formule de duplication(3.93). Une fois les moments obtenus, l’étape clé de cette démarche peut être réalisée, c’est-à-dire qu’unecomparaison directe des résultats (3.98) et (3.99) avec la relation générale (3.92) devient possible, soit

〈xn1 〉H = (1/2)2

n

(3/4)n(5/4)n= 〈xn〉(1/2, 1/4) 〈y

n〉(1/2, 3/4) , (3.100)

〈xn1 〉U = (1/4)n(3/4)n

(1)2n

= 〈xn〉(1/4, 3/4) 〈yn〉(3/4, 1/4) . (3.101)

Dans le cas de la mesure de Haar, la comparaison (3.100) permet donc de constater que les momentssont les mêmes que ceux obtenus à partir du produit de deux variables aléatoires indépendantes X etY distribuées selon les fonctions bêta P(1/2, 1/4)(x) et P(1/2, 3/4)(y) alors que pour la mesure uniforme, lacomparaison (3.101) indique plutôt qu’il s’agit des fonctions bêta P(1/4, 3/4)(x) et P(3/4, 1/4)(y). 97 Ainsi,une simple substitution des paramètres α1 = 1/2, β1 = 1/4, α2 = 1/2 et β2 = 3/4 dans le résultat (3.95)permet d’obtenir la distribution de la variable x1 = 16j2

1 pour le cas de la mesure de Haar, soit

PH(x1) ≡ P(1/2, 1/4; 1/2, 3/4)(x1) = 12√

2x12F1(1/4, 3/4; 1; 1− x1), (3.102)

alors que pour la mesure uniforme, les paramètres à substituer sont plutôt α1 = 1/4, β1 = 3/4, α2 = 3/4

et β2 = 1/4, ce qui permet d’obtenir la distribution suivante pour cette mesure

PU(x1) ≡ P(1/4, 3/4; 3/4, 1/4)(x1) = 1π√

2x1/41

2F1(3/4, 3/4; 1; 1− x1). (3.103)

Ici, la formule de réflexion d’Euler Γ(z)Γ(1 − z) = π/ sin(πz) a été utilisée dans les deux cas poursimplifier les préfacteurs. La dernière étape consiste maintenant à obtenir ces distributions en fonctionde la variable d’intérêt j1 à la suite d’un changement de variable approprié, ce qui donne

PH(|j1|) = 2√

2 2F1(1/4, 3/4; 1; 1− 16 |j1|2), (3.104)

PU(|j1|) = 8√

2 |j1|π

2F1(3/4, 3/4; 1; 1− 16 |j1|2). (3.105)

97. Cette déduction s’avère possible puisque les moments d’un produit de deux variables aléatoires indépendantescorrespondent simplement au produit des moments respectifs de ces variables.

108

Page 119: Phénoménologie des neutrinos dans une théorie de matrices ...

Ces fonctions peuvent ensuite être tracées et comparées aux résultats numériques obtenus à partir d’unéchantillon de matrices unitaires 2× 2 pour lesquelles les angles et les phases ont été générés à partirdes mesures étudiées, ce qui donne la figure 3.9.

-1/4 -1/8 0 1/8 1/40

1

2

3

4

5

j1

PH(j

1)

Mesure de Haar

-1/4 -1/8 0 1/8 1/402468

1012

j1

PU(j

1)

Mesure uniforme

Figure 3.9 – Distributions P(j1) = P(|j1|)/2 de l’invariant sous rephasage j1 pour le cas de matricesunitaires 2×2. Les histogrammes ont été obtenus à partir d’un échantillon de 5×104 matrices généréesà partir de la mesure de Haar et de la mesure uniforme.

Une fois de plus, la correspondance entre les résultats numériques et analytiques est indéniable. Parailleurs, il faut préciser que la distribution de j1 a été tracée (au lieu de |j1|) pour illustrer la symétrieprésente, ce qui implique également que ces distributions ne contiennent aucune information sur lesigne de j1. À partir de la figure 3.9, on constate que les comportements près de |j1| = 0 et |j1| = 1/4semblent être divergents dans le premier cas alors qu’ils semblent converger à une valeur non nulledans le second cas. Ainsi, à partir de l’étude des comportements limites, qui sont donnés par

PH(|j1|) ∼

− 2π ln(j2

1/4) + · · · |j1| → 02√

2− 3√

2(|j1| − 1/4) + · · · |j1| → 1/4, (3.106)

PU(|j1|) ∼

2Γ(3/4)2

√2

π|j1| + · · · |j1| → 04√

2π −

10√

2π (|j1| − 1/4) + · · · |j1| → 1/4

, (3.107)

on obtient en effet les comportements observés dans les limites appropriées et ces résultats peuventêtre comparés directement à ceux de la figure 3.9 (sans oublier le facteur 2). Enfin, en s’appuyant sur lecalcul des deux premiers moments de ces distributions, qui donnent 〈|j1|〉H = 1/(3π) et 〈|j1|2〉H = 1/60pour la mesure de Haar ainsi que 〈|j1|〉U = 1/(4π) et 〈|j1|2〉U = 3/256 pour la mesure uniforme, cer-taines comparaisons peuvent être faites. Par exemple, le premier moment permet de constater que lavaleur moyenne obtenue pour |j1| est plus élevée lorsque les angles et les phases sont générés selon lamesure de Haar. De plus, le second moment implique une variance plus petite pour la distribution ob-tenue à partir de la mesure uniforme. En d’autres mots, cela signifie que l’écart type de la distributionPH(|j1|) est plus grand que celui de la distribution PU(|j1|). Bien sûr, comme le cas N = 2 ne possèdepas de signification physique particulière dans le contexte actuel, les résultats obtenus jusqu’à présentont donc permis de détailler et de valider la méthode utilisée pour le calcul des distributions d’intérêt.À présent, une attention particulière peut être portée au cas N = 3 et aux résultats qui en découlentconcernant la brisure de la symétrie CP dans le secteur leptonique.

Ainsi, la même logique peut être suivie pour l’étude du cas N = 3. Dans ce cas, les trois invariants

109

Page 120: Phénoménologie des neutrinos dans une théorie de matrices ...

existants sont donnés par les expressions (3.85) à (3.87) et les deux mesures d’intérêt, une fois expriméesen fonction des paramètres physiques de la matrice PMNS (3.56), prennent la forme

PHΘ(θ12, θ13, θ23, δ, α21, α31)dθ12dθ13dθ23dδdα21dα31, (3.108)

PUΘ(θ12, θ13, θ23, δ, α21, α31)dθ12dθ13dθ23dδdα21dα31, (3.109)

où les expression explicites ont été obtenues précédemment, soit

PHΘ(θ12, θ13, θ23, δ, α21, α31) = 2

π3 sin(θ12) cos(θ12) sin(θ13) cos3(θ13) sin(θ23) cos(θ23) (3.110)

PUΘ(θ12, θ13, θ23, δ, α21, α31) = 1

π6 , (3.111)

ce qui implique encore une fois que les phases non physiques ont été intégrées. Ici également, lesmoments impairs de ces trois invariants sont nuls pour les deux mesures considérées, ce qui permetde définir les variables xD = 108j2

D, x1 = 16j21 et x2 = 16j2

2 sur l’intervalle [0, 1]. Ce faisant, le calculdes moments de ces nouvelles variables peut être fait à l’aide des identités (3.89), (3.90) et (3.93)introduites précédemment, ce qui donne directement

〈xnD〉H = 22n+133nΓ(n+ 1/2)Γ(n+ 1)4√πΓ(2n+ 2)Γ(3n+ 3) = (1)2

n

(2n+ 1)(4/3)n(5/3)n, (3.112)

〈xn1,2〉H = 24n+1Γ(n+ 1/2)Γ(2n+ 1)2√πΓ(n+ 1)Γ(4n+ 3) = (1/2)2

n

(2n+ 1)(3/4)n(5/4)n, (3.113)

pour la mesure de Haar et

〈xnD〉U = 22n33nΓ(n+ 1/2)6Γ(2n+ 1/2)π7/2Γ(n+ 1)Γ(2n+ 1)2Γ(3n+ 1) = (1/2)4

n(1/4)n(3/4)n(1)4

n(1/3)n(2/3)n, (3.114)

〈xn1 〉U = 24nΓ(n+ 1/2)Γ(2n+ 1/2)2Γ(4n+ 1/2)π2Γ(n+ 1)Γ(4n+ 1)2 = (1/8)n(3/8)n(5/8)n(7/8)n

(1)3n(1/2)n

, (3.115)

〈xn2 〉U = 24nΓ(n+ 1/2)Γ(2n+ 1/2)3

π2Γ(n+ 1)Γ(2n+ 1)Γ(4n+ 1) = (1/4)2n(3/4)2

n

(1)3n(1/2)n

, (3.116)

pour la mesure uniforme [33]. Fait intéressant, les résultats obtenus pour la mesure de Haar impliquentque les variables x1 et x2 ont les mêmes moments, ce qui permet de conclure que les invariants j1 et j2possèdent la même distribution. Considérant la forme des expressions (3.86) et (3.87), ce résultat estdonc plutôt surprenant et ne semble pas particulièrement évident à première vue. Cette propriété n’estcependant pas commune aux deux mesures puisque les résultats obtenus pour la mesure uniformeimpliquent des distributions différentes pour les trois invariants. Ensuite, en se référant une fois deplus à la relation (3.92), la comparaison des différents moments permet d’obtenir les distributions desvariables xD, x1 et x2 pour les deux mesures.

En ce qui concerne la mesure de Haar, les moments obtenus correspondent à ceux d’un produit de deuxvariables aléatoires indépendantes XY , où X et Y sont distribuées selon P(1, 1/3; 1, 2/3)(x) et P(1/2, 1)(y)pour la variable xD et selon P(1/2, 1/4; 1/2, 3/4)(x) et P(1/2, 1)(y) pour les variables x1 et x2. Ainsi, commeles coefficients obtenus sont respectivement α1 = 1, β1 = 1/3, α2 = 1 et β2 = 2/3 pour la variable xDet α1 = 1/2, β1 = 1/4, α2 = 1/2 et β2 = 3/4 pour les variables x1 et x2, cela implique que β1 + β2 = 1

110

Page 121: Phénoménologie des neutrinos dans une théorie de matrices ...

dans les deux cas et que le résultat (3.96) peut être utilisé pour obtenir les distributions souhaitées defaçon analytique. Conséquemment, une simple substitution des paramètres obtenus permet d’écrire

PH(xD) ≡ P(1, 1/3; 1, 2/3; 1/2, 1)(xD)

= − 16π√

3xDG2,3

3,3

(1, 5/6, 7/61/2, 1/2, 0

∣∣∣∣∣xD)

+ 2π3√

3xD, (3.117)

PH(x1,2) ≡ P(1/2, 1/4; 1/2, 3/4; 1/2, 1)(x1,2)

= − 18π2√

2x1,2G2,3

3,3

(1, 1/4, 3/4

0, 0, 0

∣∣∣∣∣x1,2

)− π

4√x1,2, (3.118)

où la formule de réflexion d’Euler et les identités suivantes ont été utilisées

G2,33,3

(1, 5/6, 7/61/2, 1/2, 0

∣∣∣∣∣ 1)

= 4π2, G2,33,3

(1, 1/4, 3/4

0, 0, 0

∣∣∣∣∣ 1)

= −2π3√2, (3.119)

ce qui a permis de simplifier les résultats davantage. Ces identités peuvent être obtenues à partirde la définition de la fonction G de Meijer en termes de fonctions hypergéométriques. À présent, unchangement de variable approprié permet d’obtenir les distributions des invariants, c’est-à-dire que

PH(|jD|) = − 2πG2,3

3,3

(1, 5/6, 7/61/2, 1/2, 0

∣∣∣∣∣ 108|jD|2)

+ 8π, (3.120)

PH(|j1,2|) = − 1π2√

2G2,3

3,3

(1, 1/4, 3/4

0, 0, 0

∣∣∣∣∣ 16|j1,2|2)− 2π. (3.121)

Ainsi, il s’avère tout de même remarquable que les distributions des trois invariants puissent être ex-primées de façon analytique dans le cas où les angles de mélange et les phases complexes sont générésselon la mesure de Haar du groupe U(3), d’autant plus que celle-ci est motivée par l’étude des en-sembles seesaw et donc, au bout du compte, par le principe anarchique.

En ce qui concerne la mesure uniforme, les distributions obtenues ne sont pas aussi élégantes. Pour la va-riable xD, un raisonnement analogue permet de constater que la distribution résultante est équivalente àcelle d’un produit de trois variables aléatoires indépendantes XY Z distribuées selon P(1/2, 1/2; 1/2, 1/2)(x),P(1/2, 1/2; 3/4, 1/4)(y) et P(1/2, 1/6; 1/4, 1/12)(z) respectivement. Pour les variables x1 et x2, il s’agit plutôtd’un produit de deux variables aléatoires indépendantes XY distribuées selon P(1/8, 3/8; 3/8, 5/8)(x) etP(5/8, 3/8; 7/8, 1/8)(y) pour x1 et selon P(1/4, 1/4; 1/4, 3/4)(x) et P(3/4, 1/4; 3/4, 1/4)(y) pour x2. À partir de cesinformations, les distributions suivantes sont obtenues

PU(xD) = 1π3√3xD

ˆ 1

xD

2F1(1/2, 1/2; 1; 1− xD/t)t5/4

׈ 1

t

t′1/4 2F1(1/2, 1/2; 3/4; 1− t′) 2F1(1/6,−1/6; 1/4; 1− t/t′)(1− t′)1/4(t′ − t)3/4 dt′dt, (3.122)

PU(x1) = 12π2√

2x1/81

ˆ 1

x1

2F1(3/8, 7/8; 1; 1− t) 2F1(3/8, 3/8; 1/2; 1− x1/t)t√t− x1

dt, (3.123)

PU(x2) = 12π2x

1/42

ˆ 1

x2

2F1(1/4, 3/4; 1; 1− t) 2F1(1/4, 1/4; 1/2; 1− x2/t)t√t− x2

dt. (3.124)

111

Page 122: Phénoménologie des neutrinos dans une théorie de matrices ...

Pour obtenir ces expressions, il suffit d’utiliser le résultat (3.95) avec les substitutions appropriées,pour ensuite appliquer la transformation (3.94) sur ces distributions. Malheureusement, les formesintégrales obtenues ne semblent pas posséder de solution analytique. Quoi qu’il en soit, un changementde variable approprié permet tout de même d’obtenir les distributions souhaitées, soit

PU(|jD|) = 12π3

ˆ 1

108|jD|2

2F1(1/2, 1/2; 1; 1− 108|jD|2/t)t5/4

׈ 1

t

t′1/4 2F1(1/2, 1/2; 3/4; 1− t′) 2F1(1/6,−1/6; 1/4; 1− t/t′)(1− t′)1/4(t′ − t)3/4 dt′dt, (3.125)

PU(|j1|) = 8|j1|3/4π2

ˆ 1

16|j1|2

2F1(3/8, 7/8; 1; 1− t) 2F1(3/8, 3/8; 1/2; 1− 16|j1|2/t)t√t− 16|j1|2

dt, (3.126)

PU(|j2|) = 8√|j2|π2

ˆ 1

16|j2|2

2F1(1/4, 3/4; 1; 1− t) 2F1(1/4, 1/4; 1/2; 1− 16|j2|2/t)t√t− 16|j2|2

dt, (3.127)

et ces intégrales peuvent être résolues numériquement dans les trois cas [33].

−16√

3−1

12√

30 1

12√

31

6√

3

02468

1012

jD

PH(jD

)

Mesure de Haar

−16√

3−1

12√

30 1

12√

31

6√

3

05

1015202530

jD

PU(jD

)

Mesure uniforme

-1/4 -1/8 0 1/8 1/402468

101214

j1

PH(j

1)

-1/4 -1/8 0 1/8 1/402468

1012

j1

PU(j

1)

-1/4 -1/8 0 1/8 1/402468

101214

j2

PH(j

2)

-1/4 -1/8 0 1/8 1/402468

1012

j2

PU(j

2)

Figure 3.10 – Distributions P(j) = P(|j|)/2 des invariants sous rephasage jD, j1 et j2 pour le casde matrices unitaires 3 × 3. Les histogrammes ont été obtenus à partir d’un échantillon de 5 × 104

matrices générées à partir de la mesure de Haar et de la mesure uniforme.

112

Page 123: Phénoménologie des neutrinos dans une théorie de matrices ...

Ainsi, les résultats obtenus pour la mesure de Haar et la mesure uniforme permettent de tracer lescourbes de la figure 3.10. Ici également, un simple coup d’oeil permet de constater que ces distributionssont invariantes sous l’échange j → −j, c’est-à-dire qu’elles ne contiennent aucune information sur lesigne des invariants jD, j1 et j2. Concernant les comportements aux limites, un développement autourde 0 et autour des valeurs maximales de ces intervalles permet de vérifier les comportements observésà la figure 3.10. Ce faisant, on trouve que la seule distribution qui ne possède pas de comportementdivergent près de 0 correspond à PH(|jD|), pour laquelle la valeur à l’origine est de 8π (pour compareravec la figure 3.10, il faut bien sûr diviser cette valeur par 2). De plus, on obtient également que cesdistributions sont toutes nulles aux limites respectives |jD| → 1/(6

√3), |j1| → 1/4 et |j2| → 1/4 et ce,

pour les deux mesures considérées, ce qui est contraire à ce qui a été observé pour le cas N = 2. Enfin,la comparaison entre les résultats analytiques et numériques confirme une fois de plus la validité decette méthode pour le calcul des distributions.

Ces distributions permettent ensuite d’extraire certains résultats intéressants concernant les trois inva-riants et une comparaison entre les deux mesures peut être faite en se référant aux valeurs expérimen-tales (3.88) de même qu’à celles du tableau 3.4. Ceci dit, comme les distributions sont symétriques,cela signifie que seule la valeur absolue des invariants peut être utilisée pour obtenir des prédictionssensées à partir de ces distributions. Ainsi, une première comparaison peut être faite à partir des deuxpremiers moments des valeurs absolues pour chaque distribution obtenue, ce qui donne le tableau 3.5.

Tableau 3.5 – Premiers moments des invariants |jD|, |j1| et |j2| pour la mesure de Haar et la mesureuniforme.

Mesure de Haar Mesure uniforme〈|jD|〉 π/105 4/(3π4)〈|j1|〉 1/(6π) 3/(32π)〈|j2|〉 1/(6π) 1/(8π)〈|jD|2〉 1/720 1/2048〈|j1|2〉 1/180 105/32768〈|j2|2〉 1/180 9/2048

À partir de la valeur moyenne (le premier moment) de la valeur absolue de chaque invariant, uneprédiction peut ensuite être extraite concernant la valeur de la phase physique attendue. Connaissantles valeurs expérimentales des angles de mélange et leurs incertitudes tout en se limitant au premierquadrant, les phases du tableau 3.6 sont obtenues (voir [77] pour le calcul des incertitudes).

Tableau 3.6 – Valeurs prédites au premier quadrant pour les phases complexes obtenues à partirdes premiers moments 〈|j|〉 relevant de la mesure de Haar et de la mesure uniforme et ce, pour leshiérarchies normale et inverse.

Mesure de Haar Mesure uniformeHiérarchie normale Hiérarchie inverse Hiérarchie normale Hiérarchie inverse

δ [] 65.4+2.7−2.7 65.8+2.7

−2.7 24.7+0.6−0.6 24.7+0.6

−0.6

α21 [] 15.1+0.4−0.3 15.1+0.4

−0.3 8.45+0.21−0.17 8.45+0.21

−0.17

α31 [] − − − −

113

Page 124: Phénoménologie des neutrinos dans une théorie de matrices ...

Qui plus est, comme seules les valeurs absolues du sinus des phases sont contraintes par les valeurs dutableau 3.5, il est important de noter qu’il existe trois valeurs supplémentaires possibles pour chaquephase et que celles-ci sont données par la relation 180 ± 90 ± (90 − φ) où φ ∈ δ, α21, α31. Parailleurs, en ce qui concerne la phase α31, aucune prédiction ne peut être faite pour celle-ci puisquela valeur 〈|j2|〉 se situe à l’extérieur de l’intervalle permis par les mesures expérimentales des anglesde mélange (voir le tableau 3.4). De plus, ce comportement singulier soulève également un autrepoint important permettant de mettre en lumière les implications des distributions obtenues pour lesparamètres angulaires du secteur leptonique. Plus précisément, les valeurs du tableau 3.4 insinuentque d’un point de vue statistique, une quantité intéressante qui peut être obtenue est la probabilitéqu’une mesure donnée génère un invariant dans l’intervalle permis par les valeurs expérimentales.L’idée ici est donc simplement d’intégrer les distributions obtenues sur les intervalles |jD| ∈ [0, |jmax

D |],|j1| ∈ [0, |jmax

1 |] et |j2| ∈ [0, |jmax2 |] respectivement, ce qui permet d’obtenir les probabilités souhaitées.

Naturellement, ce test implique que toutes les valeurs possibles (entre 0 et 2π) des phases complexesδ, α21 et α31 sont permises. Les probabilités P (|j| ≤ |jmax|) provenant d’une intégration directe de cesdistributions jusqu’à |j| = |jmax| sont comptabilisées au tableau 3.7.

Tableau 3.7 – Probabilités P (|j| ≤ |jmax|) que les invariants quartiques générés à partir de la mesurede Haar et de la mesure uniforme soient dans l’intervalle permis par les valeurs expérimentales deshiérarchies normale et inverse.

Mesure de Haar Mesure uniformeHiérarchie normale Hiérarchie inverse Hiérarchie normale Hiérarchie inverse

P (|jD| ≤ |jmaxD |) [%] 60.7± 0.9 60.6± 0.9 86.5± 0.4 86.4± 0.4

P (|j1| ≤ |jmax1 |) [%] 98.6± 0.3 98.6± 0.3 98.8± 0.2 98.8± 0.2

P (|j2| ≤ |jmax2 |) [%] 29.8± 0.8 29.9± 0.8 49.4± 0.7 49.5± 0.7

Ces probabilités permettent donc de quantifier les différentes tendances observées et donnent uneindication supplémentaire quant à la compatibilité des deux mesures étudiées en lien avec les paramètresangulaires du secteur leptonique. Ainsi, cela conclut la présentation des résultats obtenus en ce quiconcerne l’étude du modèle standard étendu sous l’hypothèse anarchique. À présent, une analysedétaillée de ces résultats est donc de mise afin de pouvoir extraire les différentes tendances sous-jacentesaux ensembles seesaw, ce qui fait l’objet de la section suivante.

3.4 Analyse et discussion

Beaucoup de résultats ont été présentés dans ce chapitre et plus spécifiquement, à la section 3.3.Comme la nature même de ce projet de recherche concerne le calcul de distributions statistiques pour lesobservables du secteur des neutrinos (à partir de modèles de masse spécifiques), les prédictions obtenuessont donc principalement sous la forme de paramètres statistiques caractérisant ces distributions.Néanmoins, des conclusions importantes sur la phénoménologie des neutrinos peuvent être extraitesde l’analyse présentée dans ce travail, qui couvre les trois articles discutés précédemment [31, 32,33]. Cette analyse permet également de mettre en évidence les forces et les limitations de l’approcheanarchique ainsi que d’établir des recommandations quant aux travaux futurs qui pourraient êtreréalisés. Cette section est donc organisée comme suit. Dans un premier temps, des considérations

114

Page 125: Phénoménologie des neutrinos dans une théorie de matrices ...

générales pouvant être dégagées des distributions multivariées des deux ensembles sont présentées. Parla suite, on s’intéresse aux conséquences des résultats obtenus pour le spectre de masse des neutrinosdu modèle standard étendu (N = 3) et pour la brisure de la symétrie CP dans le secteur leptonique.

3.4.1 Retour sur les principales tendances observées

Tout d’abord, il a été démontré dans ce travail que les distributions multivariées caractérisant lesdeux ensembles seesaw (les résultats (3.29) et (3.33)) peuvent être obtenues de façon analytique.Bien qu’il s’agisse d’une forme intégrale compliquée dans le cas de l’ensemble seesaw de type I-III(dont la solution analytique complète demeure un problème ouvert), l’ensemble seesaw de type IIadmet une forme beaucoup plus simple s’apparentant aux ensembles gaussiens (en fait, on retrouvel’ensemble GOE pour le cas β = 1 alors que pour β = 2, on retrouve la classe CI d’Altland-Zirnbauer[79]). Ces formes analytiques ont ensuite permis de mettre en évidence l’une des propriétés les plusimportantes de ces distributions, soit le découplage observé entre les parties « valeurs singulières » et« variables du groupe ». En effet, il a été démontré dans ce chapitre que cette factorisation, qui étaitnaturellement attendue pour l’ensemble seesaw de type II (à partir des résultats du chapitre 2), estégalement présente dans le cas de l’ensemble seesaw de type I-III, ce qui a pour effet de restreindre lamesure sur les variables du groupe à la mesure de Haar pour les deux ensembles considérés [31, 32].

En d’autres mots, lorsqu’une décomposition particulière Mν = UνmνUTν est obtenue, cela fixe automa-

tiquement la mesure sur les variables du groupe et donc les distributions des paramètres angulaires. Deplus, cette mesure est indépendante du type de mécanisme seesaw considéré (I, II ou III), contrairementà la distribution des valeurs singulières. Ainsi, pour le cas complexe, la paramétrisation (A.13) et l’ex-pression (A.16) qui en découle pour la mesure de Haar du groupe U(N), permettent de constater que lavaleur la plus probable (le mode) pour les angles de mélange θjk est donnée par arccot(

√2(k − j)− 1)

alors que les phases restantes (les phases non physiques, de même que celles de type Dirac et Majorana)ont des distributions uniformes. Conséquemment, le mode de tous les angles de mélange satisfaisantθj, j+1 est de π/4 (le mélange maximal) alors que pour les angles de mélange satisfaisant θj, j+2, celui-ciest de π/6. Ces valeurs correspondent également aux valeurs obtenues à partir de la paramétrisationPMNS pour le cas N = 3. Le mélange quasi maximal observé expérimentalement dans le secteur desneutrinos semble donc inévitable en ce qui concerne le modèle standard étendu, comme illustré à lafigure 3.5. Cependant, comme le mode n’est pas une quantité invariante sous changement de base(contrairement à la moyenne), celui-ci ne doit pas être interprété comme une prédiction ferme de lavaleur attendue pour ces variables aléatoires [58]. De plus, afin de jauger et quantifier les résultats ob-tenus à partir de la mesure de Haar, celle-ci a pu être comparée à une mesure uniforme par le biais d’untest statistique consistant à calculer la probabilité que les paramètres angulaires soient dans un volumedonné défini par les valeurs expérimentales et leurs incertitudes. Dans ce contexte, il est importantde rappeler que la mesure uniforme, qui n’est motivée par aucun modèle ou argument physique à cejour (contrairement à la mesure de Haar, qui relève des ensembles seesaw), est simplement introduitepour obtenir un point de comparaison avec ce qui semble être l’hypothèse la plus naïve et triviale (lamesure qui ne contient aucune dépendance explicite en fonction des paramètres angulaires). De cettecomparaison, il en résulte que la probabilité de générer des valeurs pour ces paramètres comprisesdans la région permise expérimentalement (pour les hiérarchies normale et inverse) est deux fois plusgrande pour les ensembles seesaw (la mesure de Haar). Les distributions marginales de la figure 3.5,

115

Page 126: Phénoménologie des neutrinos dans une théorie de matrices ...

complémentées du test de probabilité du tableau 3.2, offrent ainsi un premier aperçu des différentestendances sous-jacentes à la mesure de Haar pour les paramètres angulaires du secteur leptonique.Cette analyse peut ensuite être complétée par une étude des invariants sous rephasage, qui dépendentde ces mêmes paramètres angulaires, afin d’obtenir un portrait plus complet incluant les effets de labrisure de la symétrie CP dans ce secteur. Cette discussion est entreprise à la fin de cette section.

En contrepartie, les conclusions pouvant être tirées de la distribution des valeurs singulières (les masses)ne sont pas aussi claires dans ce contexte. En effet, même si la décomposition est fixée, comme les dis-tributions résultantes sont invariantes sous la permutation des valeurs singulières, cela implique que lesmasses des neutrinos sont complètement indépendantes des angles de mélange et des phases complexes.Ce faisant, même si à chaque valeur singulière mν

k est associée un vecteur singulier (les colonnes normali-sées de la matrice Uν) tel que Mν(Vνk )∗ = mν

kVνk , où Vνk = ((Uν)1k, (Uν)2k, . . . , (Uν)Nk)T , la probabilitéd’obtenir un spectre de masse particulier est de 1/N !, comme mentionné précédemment. Par exemple,le spectre donné par les valeurs suivantes (mν

1 , . . . , mνN ) = (ε1, . . . , εN ), où les εj sont des nombres réels

non négatifs sans dimension, est aussi probable que le spectre (mν1 , . . . , m

νN ) = (ε2, ε1, . . . , εN ) ou que

toute autre permutation. Évidemment, ce n’est qu’à partir de N ≥ 2 que les effets de ce découplagedeviennent apparents, comme il en a été fait mention aux sections précédentes. Ainsi, afin de pouvoirfaire une analyse concrète du spectre de masse, il faut fixer (arbitrairement) un ordre particulier pourles masses mν

k de façon à obtenir une correspondance avec la définition 0 ≤ mνmin ≤ . . . ≤ mν

max, tout engardant à l’esprit que toute relation entre les masses et la matrice de mélange est maintenant perdue.De plus, le fait de fixer un ordre particulier pour les valeurs singulières implique que leur distributionsmarginales respectives doivent être multipliées par N ! pour être proprement normalisées.

Au final, pour le cas du modèle standard étendu, le fait de travailler dans une base fixe telle quementionnée précédemment implique qu’il est naturel de s’attendre à observer un mélange maximalpour certains des angles de mélange, mais que l’assignation des masses est complètement libre pourune différence de masses donnée. Autrement dit, un spectre manifestant l’une des deux hiérarchiesdéfinies par les valeurs expérimentales (normale ou inverse) est équiprobable au spectre présentant lesmêmes différences de masses (mν

med)2 − (mνmin)2 et (mν

max)2 − (mνmed)2, mais où les masses mν

k ontété assignées différemment. Ainsi, ces observations s’inscrivent dans le courant de pensée exposé dans[58] et rendent hors de portée toute étude ou prédiction concrète concernant la hiérarchie (normale ouinverse) du spectre de masse des neutrinos sous l’hypothèse anarchique, contrairement aux affirmationsde [29]. Quoi qu’il en soit, connaissant les formes analytiques des distributions des valeurs singulières,plusieurs résultats intéressants concernant les caractéristiques du spectre de masse des neutrinos ont puêtre obtenus (section 3.3). Ces résultats permettent maintenant d’entreprendre une analyse quantitativedétaillée et ainsi de tester une fois de plus la validité de l’hypothèse anarchique.

3.4.2 Spectre de masse des neutrinos

Les courbes de la figure 3.6 et les résultats du tableau 3.3 sont d’abord considérés. D’entrée de jeu,la figure 3.6 permet de constater que les ensembles seesaw préfèrent une masse non nulle pour lestrois générations de neutrinos actifs. De plus, une plus grande diversité est observée dans la forme descourbes obtenues pour l’ensemble seesaw de type I-III, comparativement à celles de l’ensemble seesawde type II. Cet aspect relève principalement du fait que l’obtention des distributions PI-III

ν (mνi ) est

116

Page 127: Phénoménologie des neutrinos dans une théorie de matrices ...

influencée par l’intégration d’un grand nombre de paramètres fondamentaux due à la présence de l’inté-grale Iβ=2

N=3(mν1 , m

ν2 , m

ν3), contrairement aux distributions de type gaussien PII

ν (mνi ). Cette complexité

prééminente, caractérisée par les couplages compliqués entre les paramètres angulaires et les valeurssingulières de la matrice MD présents dans cette intégrale, contribue de ce fait à l’émergence d’uncomportement plus riche pour ces distributions. Il s’agit, en fait, de la raison pour laquelle l’ensembleseesaw de type I-III est jugé plus intéressant du point de vue d’une théorie de matrices aléatoires.Afin de soutenir cette analyse à l’aide d’arguments plus quantitatifs, une comparaison entre les valeursmoyennes et les valeurs médianes du tableau 3.3 est maintenant réalisée, ce qui permet d’évaluer leniveau de « symétrie » des distributions présentées à la figure 3.6. Ainsi, on constate que les valeursmoyennes sont beaucoup plus près des valeurs médianes (et donc des modes) pour le cas de l’ensembleseesaw de type II, ce qui implique des distributions plus « symétriques » comparativement à l’ensembleseesaw de type I-III (cette remarque est aussi valide pour le cas N = 2 ). Enfin, les résultats du tableau3.3 démontrent que les valeurs moyennes sont étendues sur un plus grand intervalle [〈mν

min〉, 〈mνmax〉]

dans le cas de l’ensemble seesaw de type I-III. De plus, cette caractéristique peut également être obser-vée pour le cas N = 2, mais sur un intervalle plus restreint (voir tableau 3.1). Ainsi, cette observationsuggère que la portée de l’intervalle couvert par les valeurs moyennes augmente lorsque N augmente.

On peut ensuite s’attarder à l’analyse des distributions de la figure 3.7 concernant le comportement duratio R (donné par l’expression (3.63)) dans les deux ensembles seesaw. Une fois ces courbes obtenues,il devient alors possible de déterminer laquelle des deux différences de masses entre les trois générationsest la plus probable pour ces deux ensembles (selon l’ordre fixé pour les masses, qui implique la relation(3.63), les deux possibilités sont ∆m2

21 < ∆m232 ou ∆m2

21 > ∆m232). Pour ce faire, il suffit de réaliser

qu’en intégrant (numériquement) ces deux distributions sur l’intervalle 0 ≤ R ≤ 1 (1 ≤ R < ∞), onobtient la probabilité que la différence de masse ∆m2

21 < ∆m232 (∆m2

21 > ∆m232) soit réalisée. Ainsi,

pour l’ensemble seesaw de type I-III, cette probabilité est de 95.8% (4.2%) alors que pour l’ensembleseesaw de type II, celle-ci est de 79.0% (21.0%). Par ailleurs, ces probabilités sont conformes à ce quiest attendu des courbes de la figure 3.7. Ces résultats permettent donc de conclure que la tendancedominante pour ces deux ensembles est l’obtention de la différence de masse ∆m2

21 < ∆m232 entre

les trois générations, rappelant ainsi le scénario associé à la hiérarchie normale (voir la figure 1.1).De plus, en examinant les comportements distincts des deux courbes et en comparant les probabilitésainsi obtenues, on constate que l’ensemble seesaw de type I-III est mieux adapté pour générer cettedifférence de masses particulière. Dans ce contexte, cela signifie que les différences de masses généréesà partir de l’ensemble seesaw de type I-III sont plus susceptibles de correspondre à la différence demasses expérimentale associée à la hiérarchie normale, mais que l’ordre des masses demeure inconnu.En d’autres mots, puisque la valeur expérimentale de ce ratio est de Rexp ' 0.03 pour la hiérarchie nor-male (Rexp ' 32.65 pour la hiérarchie inverse), les courbes et les probabilités obtenues suggèrent quela valeur de Rexp est mieux représentée par les tendances observées dans l’ensemble seesaw de type I-III.

Enfin, la dernière partie de cette discussion concernant le spectre de masse des neutrinos porte sur letest de probabilité introduit précédemment et donc, sur l’information qui peut être extraite de la figure3.8. Premièrement, en comparant les probabilités obtenues pour les hiérarchies normale et inverse d’unmême ensemble, on constate que la hiérarchie normale est favorisée dans les deux ensembles seesawconsidérés. Plus précisément, pour l’ensemble seesaw de type I-III, les probabilités maximales résultant

117

Page 128: Phénoménologie des neutrinos dans une théorie de matrices ...

d’un balayage sur les valeurs possibles du paramètre Λν impliquent qu’il est environ ∼ 1100 fois plusprobable que les différences de masses observées proviennent de la région définie par les paramètresde la hiérarchie normale (à 1σ). Autrement dit, l’ensemble seesaw de type I-III est plus susceptiblede générer des valeurs (pour ∆m2

21 et ∆m231(2)) qui sont comprises dans l’intervalle contraint par les

données expérimentales relevant de la hiérarchie normale plutôt que dans celui contraint par les don-nées expérimentales relevant de la hiérarchie inverse. 98 Dans le cas de l’ensemble seesaw de type II,la même tendance est observée, mais avec un ratio beaucoup plus petit entre les probabilités maxi-males. En effet, on trouve à partir de la figure 3.8 qu’il est environ ∼ 25 fois plus probable que lesdifférences de masses observées proviennent de la région définie par les paramètres de la hiérarchienormale. Ainsi, on peut donc conclure que des deux régions considérées dans ce test de probabilité, lesensembles seesaw favorisent naturellement des valeurs provenant de la région définie par la hiérarchienormale (pour les deux différences de masses). Par ailleurs, cette préférence (ou cette probabilité) estfortement accentuée dans l’ensemble seesaw de type I-III. Deuxièmement, une comparaison entre lesdeux ensembles peut être faite sachant que l’une des régions est grandement favorisée par rapport àl’autre. Il devient alors intéressant de comparer les probabilités maximales obtenues pour la hiérarchienormale entre les deux ensembles. Cette fois, les conclusions pouvant être tirées de ce ratio ne sont pasaussi tranchantes. Néanmoins, celui-ci permet tout de même d’affirmer que l’ensemble seesaw de typeI-III est environ ∼ 2 fois plus susceptible (que l’ensemble seesaw de type II) de générer des différencesde masses dans cette région particulière [32]. 99 Les résultats obtenus avec ce test de probabilité sontdonc en accord avec ceux obtenus à partir des distributions du ratio R et contribuent ainsi à quantifierles différentes tendances observées dans les ensembles seesaw.

Un dernier point d’intérêt qui mérite maintenant d’être soulevé en lien avec ce test de probabilitéconcerne l’échelle d’énergie Λν . À partir de la figure 3.8, on constate que le fait de choisir une régiond’intégration bornée, qui correspond essentiellement aux différences de masses expérimentales et leursincertitudes (à 1σ) dans ce cas-ci, permet de fixer l’échelle d’énergie des mécanismes seesaw. En effet,chacune des courbes indique que la probabilité maximale est atteinte pour un paramètre Λν de l’ordrede O(10−2) eV et ce, pour les deux ensembles considérés. Comme Λν correspond à l’échelle d’énergiedes masses des neutrinos gauches (légers) dans les mécanismes seesaw et que pour ces trois mécanismes,cette échelle d’énergie prend la forme générale Λν = v2/Λn (voir chapitre 1), où v ' 246 GeV est lavaleur moyenne du champ de Higgs dans le vide, une estimation rapide de la nouvelle échelle d’énergieΛn associée au contenu en particules introduit dans le modèle standard étendu peut être faite (pourles trois mécanismes, il s’agit des singulets fermioniques de chiralité droite, du triplet de Higgs etdes triplets fermioniques de chiralité droite respectivement). En utilisant les valeurs précédemmentmentionnées, on obtient que Λn ∼ O(1015) GeV, ce qui implique que la nouvelle échelle d’énergiefondamentale obtenue pour le modèle standard étendu est très près de celle de la grande unification. Deplus, il va sans dire que Λn est directement reliée aux masses des nouvelles particules ainsi introduites.Cependant, pour en déduire l’échelle d’énergie des masses, il faut d’abord spécifier l’ordre de grandeurdes constantes de couplages présentes dans chaque mécanisme seesaw (les couplages de Yukawa). Dansla littérature, l’approche usuelle consiste à postuler des constantes de couplages d’ordre O(1) puisqu’il

98. Comme les intervalles des hiérarchies normale et inverse ont pratiquement la même grandeur (voir le tableau 1.2ou les expressions (3.67) et (3.68)), cette différence notable dans les probabilités obtenues ne peut pas être attribuée àla différence de taille entre les deux intervalles considérés.99. La tendance inverse est observée pour la hiérarchie inverse, c’est-à-dire que la probabilité maximale obtenue pour

l’ensemble seesaw de type II est environ ∼ 18 fois plus grande que celle obtenue pour l’ensemble seesaw de type I-III.

118

Page 129: Phénoménologie des neutrinos dans une théorie de matrices ...

n’existe pour l’instant aucun principe fondamental ou symétrie particulière nécessitant que la force deces couplages soit petite. En retour, cela implique que ces nouvelles particules sont très lourdes puisqueΛn devient essentiellement l’échelle d’énergie associée à leur masse. En fait, ce résultat est typiquedes mécanismes seesaw (comme discuté au chapitre 1) et est souvent considéré comme un prérequispour que ces mécanismes donnent des prédictions sensées concernant les masses des neutrinos actifs(lorsque l’argument de « naturalité » est pris en considération pour éviter des problèmes d’ajustementsfins pouvant être introduits par les mécanismes seesaw, voir également la note 54). Bien sûr, l’échelled’énergie des masses peut toujours être abaissée simplement en postulant des constantes de couplagesplus petites, déviant ainsi quelque peu de l’argument de naturalité. En somme, le test de probabilitédonne donc des résultats qui sont conformes à ce qui est attendu de la phénoménologie du modèlestandard étendu (à partir des mécanismes seesaw) à haute énergie [32].

3.4.3 Invariants quartiques du secteur leptonique

Les distributions (3.120) et (3.121) obtenues pour les trois invariants quartiques présents dans le sec-teur leptonique du modèle standard étendu sont maintenant analysées et les répercussions de celles-cisur la symétrie CP sont discutées, ce qui permet de sonder plus en profondeur les prédictions associéesà la mesure de Haar [33]. Ici également, la mesure uniforme (et les distributions (3.125) à (3.127)) estutilisée à des fins de comparaison seulement. Ainsi, en se référant à la figure 3.10, la caractéristiquela plus importante pouvant être dégagée de ces distributions est que celles-ci sont symétriques parrapport à l’origine, c’est-à-dire invariantes sous l’échange j → −j. Bien que discutée précédemment,comme cette propriété influence grandement l’analyse présentée dans cette sous-section, ses originesméritent donc d’être revisitées et examinées davantage. En fait, une façon plus intuitive de visualiserl’émergence de cette symétrie (outre le fait que les moments impairs de ces distributions soient nuls)consiste à réaliser que celle-ci relève du fait que le signe des invariants jD, j1 et j2 est déterminé uni-quement par le sinus de la phase complexe qui leur est associée (voir les expressions (3.85) à (3.87)) etque ces phases possèdent toutes des distributions uniformes (et donc symétriques par rapport à π, soitla valeur à partir de laquelle le sinus change de signe). Cette observation implique donc nécessairementque la probabilité de générer un invariant de signe négatif est égale à celle de générer un invariant designe positif pour les deux mesures étudiées. En conséquence, cela signifie que les distributions obtenuesne possèdent pas d’information utile sur le signe de ces invariants. Pour cette raison, l’analyse qui suitrepose uniquement sur les résultats obtenus à partir des valeurs absolues |jD|, |j1| et |j2|.

Ainsi, un premier point de comparaison intéressant entre les distributions obtenues à partir de ces deuxmesures concerne les moments du tableau 3.5. En effet, ce tableau indique que les valeurs moyennesdes valeurs absolues des trois invariants quartiques sont toujours plus grandes pour la mesure de Haar.De plus, ce même tableau révèle également que les seconds moments des valeurs absolues obtenues àpartir de la mesure de Haar sont toujours plus grands que ceux obtenus à partir de la mesure uniforme,ce qui implique que la dispersion autour de la moyenne est plus grande dans le cas de la mesure deHaar. Conséquemment, le fait de considérer le premier moment de ces distributions comme une pré-diction de la valeur attendue (pour la valeur absolue de ces invariants) implique que les prédictionsobtenues à partir de la mesure uniforme peuvent être considérées comme étant plus précises. Cepen-dant, comme les seconds moments demeurent relativement larges dans les deux cas, cette distinctionne joue pas de rôle majeur dans l’analyse des résultats subséquents. Ainsi, en se référant ensuite aux

119

Page 130: Phénoménologie des neutrinos dans une théorie de matrices ...

valeurs expérimentales (3.88), une comparaison directe peut être faite avec la quantité 〈|jD|〉 pourles deux mesures considérées, de même que pour les deux hiérarchies. Par exemple, dans le cas de lahiérarchie normale, puisque |jexp

D | ' 0.032±0.005 et que les premiers moments sont, respectivement,〈|jD|〉H = π/105 ' 0.030 et 〈|jD|〉U = 4/(3π4) ' 0.014, on constate que le premier moment obtenu àpartir de la mesure de Haar reproduit remarquablement bien la valeur observée. En fait, cette obser-vation cruciale est en réalité à l’origine du travail présenté dans [33]. Naturellement, le même constatpeut être fait dans le cas de la hiérarchie inverse.

Cette comparaison avantageuse suggère ensuite que les valeurs moyennes des valeurs absolues de cestrois invariants peuvent être utilisées avec les valeurs expérimentales du tableau 3.4 pour obtenir uneprédiction sur les phases complexes de ce secteur, ce qui donne le tableau 3.6. Par ailleurs, il est im-portant de réitérer que pour chaque valeur de ce tableau, il existe trois phases additionnelles donnéespar la relation 180 ± 90 ± (90 − φ) où φ ∈ δ, α21, α31 puisque seulement la valeur absolue dusinus de la phase est contrainte dans cette analyse. On considère donc dans un premier temps lesprédictions associées à la phase de Dirac δ tout en gardant à l’esprit que la valeur expérimentale quisemble se préciser pour cette phase est de (261+51

−59) pour la hiérarchie normale et de (277+40−46) pour

la hiérarchie inverse (à 1σ, voir le tableau 1.2). En ce qui concerne les résultats obtenus à partir de lamesure de Haar, on constate que pour une hiérarchie donnée, deux des quatre valeurs possibles de laphase δ sont comprises dans l’intervalle défini par la valeur expérimentale associée à cette hiérarchie.Bien sûr, cette observation vient simplement corroborer le fait que la valeur prédite pour cet invariant,soit 〈|jD|〉H, est compatible avec la valeur observée |jexp

D | pour les deux hiérarchies. En ce qui concernela mesure uniforme, la situation est quelque peu différente. Pour la hiérarchie normale, seulement uneseule des quatre phases est comprise dans l’intervalle expérimental (se situant à l’extrémité de cetintervalle) alors que pour la hiérarchie inverse, aucune des quatre phases n’est comprise dans cet inter-valle. En conséquence, les prédictions obtenues à partir de ce test statistique pour la mesure uniformene semblent pas reproduire adéquatement les valeurs expérimentales (à 1σ) pour la phase δ (du moinspour la hiérarchie inverse), ce qui s’explique par le fait que la prédiction pour cet invariant, soit 〈|jD|〉U,n’est pas représentative de la valeur observée |jexp

D | pour les deux hiérarchies. Enfin, concernant lesphases de Majorana α21 et α31, les prédictions du tableau 3.6 impliquent une petite valeur pour lesinus de la phase α21 et qu’aucune conclusion ne peut être tirée pour la phase α31. Comme discutéprécédemment, dans le cas de la phase α31, le principal obstacle à ce type d’analyse est que la valeur〈|j2|〉 est située à l’extérieur de l’intervalle défini par la valeur |jmax

2 | du tableau 3.4, c’est-à-dire que|jmax

2 | < 〈|j2|〉 pour les deux mesures. Ainsi, en considérant un intervalle d’un écart type (la racinecarrée de 〈|j2|2〉 du tableau 3.5) sur la valeur moyenne 〈|j2|〉, on constate que toutes les valeurs permisesde |j2| sont possibles, ce qui signifie simplement que la phase α31 n’est soumise à aucune contraintedans ce test statistique. Ainsi, aucune prédiction précise ne peut être faite concernant cette phase.

Ensuite, pour complémenter cette analyse, la probabilité que les distributions obtenues génèrent uninvariant se situant dans l’intervalle défini par les valeurs expérimentales du tableau 3.4 est calcu-lée, ce qui donne les résultats du tableau 3.7. Cet autre point de vue permet de constater que, parexemple, dans le cas de l’invariant j2, la probabilité d’obtenir une valeur permise pour cet invariant(et donc d’obtenir une prédiction viable pour la phase α31) est d’environ 29% pour la mesure de Haaret d’environ 49% pour la mesure uniforme (toute hiérarchie confondue). Ce raisonnement s’applique

120

Page 131: Phénoménologie des neutrinos dans une théorie de matrices ...

également aux deux autres invariants et de façon générale, on remarque que la probabilité obtenue esttoujours plus grande pour la mesure uniforme. Ainsi, la comparaison des probabilités obtenues entreles deux mesures semble indiquer que la mesure uniforme est légèrement favorisée, bien qu’il ne soitpas possible de discriminer la mesure de Haar de la mesure uniforme de façon significative à partird’un test statistique approprié [33]. Par ailleurs, puisque les probabilités du tableau 3.7 sont toutes trèsgrandes, celles-ci démontrent que l’hypothèse statistique selon laquelle la matrice PMNS est le résultatd’un processus aléatoire reposant sur la mesure de Haar ou la mesure uniforme ne peut être écartée.Ce constat, qui vient appuyer l’hypothèse anarchique dans le secteur des neutrinos, est donc complète-ment à l’opposé de ce qui est observé dans le secteur des quarks. En effet, il est important de préciserqu’une analyse équivalente a déjà été réalisée dans le secteur des quarks par [78] (voir également [80])pour l’invariant jD de la matrice CKM et que dans ce cas, la probabilité obtenue pour la mesure deHaar est plutôt P (|jD| ≤ |jexp

D |CKM) = (7.64+0.52−0.51) × 10−5 ' 0.08%, où la valeur de |jexp

D |CKM estdonnée par (3.81). Cette probabilité est donc beaucoup plus petite (d’au moins deux ordres de gran-deur) que son équivalent du tableau 3.7 pour le secteur leptonique. Ainsi, en opposition au secteur desquarks du modèle standard, qui est très hiérarchique et structuré, le secteur leptonique du modèle stan-dard étendu pourrait bien avoir comme origine le principe anarchique (du point de vue d’une théoriede champs efficace à basse énergie), ce qui constitue la motivation physique derrière la mesure de Haar.

Finalement, en ce qui concerne la symétrie CP , ces résultats permettent de conclure que la valeurcentrale de la phase δ du tableau 1.2 est selon toute vraisemblance correcte et que le sinus de cette phase,selon la tendance observée, est plus grand que celui de la phase de Majorana α21. De plus, le fait que lavaleur attendue de l’invariant j1 soit non nulle implique que la phase α21 brise également la symétrieCP , ce qui a des répercussions importantes concernant l’observation de la double désintégration bêtasans neutrino. En comparant ensuite les valeurs attendues 〈|jD|〉 et 〈|j1|〉 à leur valeur maximalethéorique respective, cela fournit une indication de la force (ou de l’importance) de la brisure de lasymétrie CP à basse énergie pour chacun de ces invariants. Ainsi, la tendance observée à partir de cesparamètres statistiques est que la violation de cette symétrie provient principalement de la phase δ etdonc de l’invariant jD puisque la valeur attendue de ce dernier est plus près de sa valeur maximalethéorique de 1/(6

√3), comparativement à j1, dont la valeur maximale théorique est de 1/4 (ce constat

est valide pour les deux mesures étudiées). Également, puisque la valeur expérimentale |jmax2 | est déjà

connue grâce à la mesure des angles de mélange, une comparaison avec la valeur maximale théoriquede 1/4 permet de déduire que si cet invariant (et donc la phase α31) contribue à la brisure de lasymétrie CP , cette contribution est beaucoup moins importante que celle des deux autres, et ce,même si la phase α31 est grande. En somme, ces observations impliquent qu’il existe plusieurs sourcesde brisure de la symétrie CP dans le secteur leptonique et que l’importance de cette brisure estbeaucoup plus grande que dans le secteur des quarks, où le seul invariant présent possède la valeur|jexpD |CKM = (3.04+0.21

−0.20)× 10−5, qui est plusieurs ordres de grandeur en dessous de la valeur maximalethéorique de 1/(6

√3). Pour finir, bien qu’il n’a pas été possible de faire une distinction claire entre les

deux hiérarchies et les deux mesures à partir de l’analyse statistique présentée dans cette sous-section,il est important de se rappeler que seule la mesure de Haar est motivée par des arguments physiques.Ayant maintenant présenté et analysé les résultats obtenus durant les quatre années de recherches surlesquelles repose cette thèse, une conclusion générale résumant les points importants et les travauxfuturs pouvant être réalisés semble donc tout à fait à-propos.

121

Page 132: Phénoménologie des neutrinos dans une théorie de matrices ...

Conclusion

Essentially all models are wrong, but some are useful.- George E. P. Box

Les neutrinos demeurent encore aujourd’hui les seules particules élémentaires « observées » capable deremettre en cause, et de façon non équivoque, les prédictions du modèle standard actuel. Même aprèsplusieurs décennies de recherches intensives (que ce soit sur le plan expérimental ou théorique), aucunconsensus clair et définitif ne peut être dégagé quant à la façon de les incorporer à ce modèle, ce quireflète simplement le fait que ceux-ci sont encore loin d’avoir révélé tous leurs secrets. Néanmoins, laquantité d’information tangible ayant été recueillie à leur sujet (sur leur propriétés fondamentales),qui est somme toute remarquable considérant les très rares interactions entre les neutrinos et la ma-tière, est plus que suffisante pour mettre en évidence les limites du modèle électrofaible. En effet, dansla limite des basses énergies, les observations expérimentales confirment que : les neutrinos oscillent,c’est-à-dire qu’ils changent de saveur durant la propagation (les nombres leptoniques individuels Le,Lµ et Lτ ne sont donc pas conservés) ; ils sont massifs (les masses sont cependant très petites, chacuneétant au moins six ordres de grandeur en dessous de la masse de l’électron) et que la hiérarchie de cespectre de masse (la différence de masses particulière entre les trois générations), qui est non dégénéré,est très faible en comparaison à celle des leptons chargés ou des quarks. De plus, l’effet de mélangeobservé entre les états propres de masse et les états propres de saveur est beaucoup plus important quecelui présent dans le secteur des quarks, comme en témoignent les paramètres de la matrice PMNS.Toutefois, bien que des progrès importants ont été réalisés à la suite de la découverte expérimentale duphénomène d’oscillation (et des mesures de haute précision qui ont pu être réalisées sur les paramètresphysiques y étant associés), le mystère persiste quant à l’origine de l’attribut déterminant derrièrecette étonnante propriété, c’est-à-dire leurs masses.

Ainsi, au coeur de ce mystère réside la clé de voûte du secteur leptonique des interactions faibles (surlaquelle repose l’ensemble des caractéristiques mentionnées précédemment), c’est-à-dire le mécanismeà partir duquel les neutrinos acquièrent leurs masses. Tout espoir de progrès significatif dans ce secteurrepose donc sur l’élaboration et l’étude de mécanismes de masse adéquats pour les neutrinos, ce quiconstitue sans doute l’un des pôles de recherche théorique les plus exploré de la recherche contempo-raine dans ce domaine. À cet égard, les mécanismes seesaw adoptés dans cet ouvrage se retrouve entête de liste des candidats potentiels proposés dans la littérature pour apporter des éléments de ré-ponse face à cette problématique. Cependant, bien que ces mécanismes fournissent un cadre de travailsimple et élégant pour expliquer la faible masse des neutrinos, ceux-ci n’apportent aucune informationadditionnelle permettant d’expliquer le mélange observé. En effet, le point important ici est que le mé-lange caractéristique observé dans ce secteur relève uniquement de la structure de la matrice de masse

122

Page 133: Phénoménologie des neutrinos dans une théorie de matrices ...

résultante pour les neutrinos actifs (Mν) et que les mécanismes seesaw, à la base, ne constituent qu’unénoncé formel sur les effets de la présence d’une nouvelle échelle d’énergie fondamentale en physiquedes particules. Puisque cette structure demeure complètement libre, il faut donc formuler certaineshypothèses supplémentaires afin de contraindre davantage les entrées de ces matrices de masse et ainsiobtenir un pouvoir prédictif plus important. Dans cette optique, deux approches de nature fonda-mentalement différentes (mais n’étant pas mutuellement exclusives) prédominent dans la littérature.On retrouve donc d’une part l’approche traditionnelle, préconisant la recherche de nouvelles symétriesfondamentales pouvant être imposées à ces matrices et, d’autre part, l’approche anarchique, prenantplutôt pour acquis que dans la limite des basses énergies, aucune symétrie ou patron spécifique ne peutêtre justifié convenablement en fonction des données expérimentales. Les différents modèles de saveurpermettant de générer la structure des matrices de masse couvrent ainsi un large spectre, allant duplus symétrique au plus anarchique.

C’est donc dans ce contexte que les travaux qui ont mené à la réalisation de cette thèse prennent place.En explorant les conséquences de l’approche anarchique pour le secteur leptonique des interactionsfaibles, plusieurs résultats intéressants ont été obtenus, permettant ainsi d’apporter un regard nouveausur certaines caractéristiques emblématiques de ce secteur. Comme ce projet de recherche repose surl’hypothèse statistique soutenant que la matrice de masse choisie par la nature est représentative d’unensemble matriciel aléatoire (les ensembles seesaw de type I-III et de type II), une quantité surpre-nante d’informations a donc été dégagée en étudiant les propriétés de ces ensembles. Pour ce faire, lesoutils de base permettant d’obtenir les distributions jointes des valeurs singulières et des variables dugroupe de symétrie caractérisant les ensembles seesaw ont été introduits au chapitre 2. Ces distribu-tions jointes ont ensuite été étayées et examinées en détail au chapitre 3, définissant du même coup lecadre de travail à partir duquel le modèle standard étendu a été investigué. Ainsi, l’analyse détailléedu cas spécifique N = 3 & β = 2, dont les différentes orientations ont été dictées par la propriétéde factorisation des distributions jointes (c’est-à-dire la factorisation en deux parties distinctes, l’unedépendant des valeurs singulières et l’autre dépendant des variables du groupe), a permis d’obtenirdes résultats concrets sur la phénoménologie des neutrinos dans la limite des basses énergies.

Parmi les points importants qui ont été mis de l’avant dans cette analyse, on retrouve donc, au pre-mier plan, le contrecoup de cette factorisation distinctive, c’est-à-dire une absence totale de corrélationsentre les masses des neutrinos (les valeurs singulières) et les paramètres angulaires (les variables dugroupe). Ce constat a donc permis d’argumenter à l’effet que les ensembles seesaw, et donc le principeanarchique, ne sont pas en mesure de contraindre la hiérarchie du spectre de masse (normale ou in-verse), mais bien seulement la différence de masses au carrée. Suivant ce raisonnement, l’analyse desdistributions jointes des valeurs singulières a permis de révéler, dans un premier temps, que la diffé-rence de masses ∆m2

21 < ∆m232 (rappelant le scénario typique de la hiérarchie normale) est nettement

favorisée par les deux ensembles. Ensuite, à l’aide d’un test de probabilité s’appuyant sur les diffé-rences de masses expérimentales, il a été démontré que parmi les deux ensembles matriciels aléatoiresconsidérés, celui qui s’harmonise le plus aisément aux résultats expérimentaux correspond à l’ensembleseesaw de type I-III. Du reste, la situation est très différente en ce qui concerne la distribution desvariables du groupe. Contrairement aux distributions jointes des valeurs singulières, qui dépendent dutype de mécanisme seesaw considéré, la distribution jointe obtenue pour les variables du groupe corres-

123

Page 134: Phénoménologie des neutrinos dans une théorie de matrices ...

pond simplement à la mesure de Haar du groupe de Lie approprié. Dans ce cas, les angles de mélangeet les phases complexes sont donc distribués selon la mesure de Haar normalisée du groupe unitaireU(3) pour les deux ensembles considérés. Puisque cette mesure détermine entièrement les propriétésstatistiques de ces paramètres physiques, celle-ci a donc permis de conclure que la notion de mélangequasi maximal fait également partie des tendances dominantes caractérisant les ensembles seesaw. Deplus, un examen subséquent de cette mesure, consistant à en vérifier les répercussions au niveau desinvariants sous rephasage de la matrice PMNS (qui constituent une mesure standardisée de la forcede la brisure de la symétrie CP dans la limite des basses énergies), a permis de tirer des conclusionsintéressantes en lien avec la brisure de la symétrie CP pour ce secteur. En effet, les observations lesplus importantes ayant été faites à partir des tests statistiques reposant sur les distributions des troisinvariants quartiques sont, d’une part, que le calcul de 〈|jD|〉H concorde étonnamment bien avec lavaleur expérimentale actuellement admise (ce qui indique que la brisure de la symétrie CP semble plusimportante dans le secteur des leptons que dans le secteur des quarks) et, d’autre part, que la matricePMNS peut être décrite comme une matrice unitaire générique représentative d’un ensemble matricielcaractérisé par la mesure de Haar (contrairement à la matrice CKM).

Au final, bien que les tenants et les aboutissants de ce projet de recherche aient permis de solidifier lesfondations sur lesquelles repose le principe anarchique propre au secteur des neutrinos, il n’en demeurepas moins que plusieurs avenues intéressantes (méritant d’être explorées davantage) sont inévitablementlaissées en suspend alors que cette aventure prend fin. Par exemple, puisqu’une solution analytiquepour l’intégrale (3.31) demeure introuvable, une façon alternative de réaliser des progrès à ce niveauserait d’explorer la limite N → ∞ afin d’obtenir une approximation analytique permettant d’étudierle cas N = 3. L’idée étant que dans cette limite, l’intégrand peut en principe être tronqué dans le butde garder seulement les termes offrant les contributions dominantes, ce qui simplifie substantiellementle problème d’origine. À cet effet, des résultats préliminaires ont été obtenus dans [31, 32], démontrant(numériquement) que ce type d’approximation est bien représentatif du cas N = 3. Dans un autreordre d’idée, on peut également regarder les effets de la variation du nombre de générations de neutri-nos actifs (de chiralité gauche) NL ou stériles (de chiralité droite) NR dans les deux ensembles. Dansle cas des neutrinos stériles, la variation de NR (avec NR ≥ 3) est toujours possible puisqu’aucunecontrainte n’est connue sur leur nombre de générations et cette modification affecte seulement l’en-semble seesaw de type I-III. Le second cas, beaucoup moins probable, qui implique la variation de NL(avec NL ≥ 3) dans les deux ensembles seesaw, est tout de même possible à condition que ces nouvellesgénérations (NL = 3 dans le MS) soient très massives (voir la note 30). Naturellement, ces deux caspeuvent être traités simultanément pour des valeurs de NR et NL différentes, ce qui signifie en généralque les matrices Mν et ML sont de dimensions NL × NL alors que les matrices MD et MR sont dedimensions NL ×NR et NR ×NR respectivement. La matrice MD devient donc rectangulaire tandisque les matrices MR et Mν n’ont plus les mêmes dimensions, ce qui implique qu’elles ne possèdentplus le même nombre de paramètres indépendants. Pour l’ensemble seesaw de type I-III, cela affecteinévitablement le calcul du jacobien (3.13) puisque celui-ci ne peut plus être réduit à

∣∣det(∂MR

∂Mν

)∣∣ carla matrice ∂MR

∂Mνest maintenant de dimensions NR(NR+1)β/2×NL(NL+1)β/2 (pour β = 1, 2). Bien

sûr, dans ce travail seul le cas spécifique NL = NR = N a été considéré, avec N = 1, 2, 3.

Par ailleurs, afin d’étendre la portée des résultats obtenus à la sous-section 3.3.2, il serait intéressant

124

Page 135: Phénoménologie des neutrinos dans une théorie de matrices ...

de développer davantage l’analyse des invariants sous rephasage en fonction de la mesure de Haar. Plusprécisément, à l’aide des expressions (3.82), (3.83) et (A.16), les distributions des invariants quartiquesde type Dirac et Majorana peuvent, en principe, être étudiées pour toute valeur de N . Ce faisant, lepatron particulier observé pour le cas N = 3, c’est-à-dire que les invariants j1 et j2 possèdent la mêmedistribution, pourrait être généralisable à tous les invariants de type Majorana pour un N donné. Encontrepartie, les invariants de type Dirac semblent se complexifier davantage lorsque N augmente. Leschances de pouvoir observer un patron similaire sont donc plutôt faibles. Également, une approchealternative pourrait être de se concentrer sur le cas N = 3 et de calculer les distributions jointesPH(jD, j1, j2) et PU(jD, j1, j2) permettant de réaliser, entre autre, un test de probabilité analogue àcelui des paramètres angulaires de la sous-section 3.3.1. En intégrant ces densités sur un volume fermédéfini par les données du tableau 3.4, les probabilités obtenues apporteraient ainsi un complémentd’information incluant simultanément la variation des trois invariants pour les deux mesures considé-rées. Cependant, puisque ces distributions ne sont pas séparables, la méthode des moments présentéeà la sous-section 3.3.2 ne semble pas pouvoir être appliquée de façon aussi directe. Il faudrait donc,en général, tenter de reconstruire ces distributions en sommant directement les moments joints. 100

Autrement, la méthode « force brute » consistant à effectuer des changements de variables successifsrisque d’être requise pour obtenir les distributions souhaitées. De plus, une analyse plus complète de-vrait aussi inclure les invariants quadratiques de ce secteur.

Mis à part ces points particuliers, qui demeurent somme toute dans les limites établies par les dé-finitions des ensembles seesaw de type I-III et de type II, quelques suggestions plus radicales sontégalement dignes de mention. Entre autres, il serait intéressant d’étudier les effets de la combinai-son de différents mécanismes seesaw sous l’hypothèse anarchique (par exemple, le type I ou le typeIII avec le type II), ce qui permettrait de créer un nouvel ensemble matriciel aléatoire. Dans ce cas,des changements significatifs sont attendus pour la distribution jointe des valeurs singulières, alorsque la distribution jointe des variables du groupe devrait rester la même (la mesure de Haar). Parailleurs, les distributions marginales des masses dans ce nouvel ensemble seraient plus difficile à ob-tenir numériquement puisqu’un plus grand nombre de paramètres devraient être intégrés (il faudraitajouter ceux de la matrice MR ou ML dépendamment du changement de variables choisi). En prin-cipe, l’analyse complète présentée au chapitre 3 devrait donc être répétée pour cet ensemble, ce quipermettrait une comparaison directe avec les résultats de cette thèse. De plus, les orientations futuresayant été suggérées jusqu’à présent pourraient aussi s’appliquer à ce nouvel ensemble. Par la suite, ens’éloignant quelque peu de la prémisse de base adoptée dans ce travail, c’est-à-dire que les matricesde masse élémentaires MD, MR et ML peuvent être générées aléatoirement, on peut également en-visager l’élaboration d’un modèle de saveur « hybride » à basse énergie. En fait, puisque la matriceMD est générée à la suite d’une brisure spontanée de la symétrie électrofaible, au même titre queles matrices de masse des quarks de type « up » et « down », cela implique qu’elle peut en principeêtre sujet au même mécanisme qui produit la structure de ces matrices (ou de façon équivalente, dela matrice CKM). Il n’est donc pas inconcevable de croire que la matrice MD puisse posséder unestructure non triviale s’apparentant à celle observée dans le secteur des quarks. Ainsi, en considérant100. La méthode de la transformée de Mellin inverse semble particulièrement intéressante pour ce type de problème.En fait, une analyse subséquente des moments calculés à la sous-section 3.3.2.3 a permis de réaliser que les distributionsqui en découlent peuvent être obtenues analytiquement (pour les deux mesures d’intérêt) en appliquant directementla transformée de Mellin inverse sur ces moments. L’un des avantages de cette méthode plus générale est donc qu’ellepermet d’éviter d’avoir à recourir à des formes intégrales du type (3.125) à (3.127) dans le cas de la mesure uniforme.

125

Page 136: Phénoménologie des neutrinos dans une théorie de matrices ...

une structure particulière pour la matrice MD (pouvant être motivée, par exemple, par des théoriesde grande unification reposant sur la supersymétrie) tout en générant MR aléatoirement, l’ensembleseesaw de type I-III s’en trouve alors grandement modifié. Puisque l’étape consistant à marginalisersur les éléments de la matrice MD n’est plus nécessaire dans ce contexte (cette matrice constante estdésormais fixée par les quelques paramètres qui définissent sa structure, ce qui implique égalementque celle-ci n’est plus invariante sous changement de base), la distribution jointe (pour les valeurssingulières et les variables du groupe) de ce nouvel ensemble « hybride » est donc beaucoup plus facileà obtenir. Par ailleurs, l’attrait particulier de cette nouvelle distribution jointe est que celle-ci sembleperdre la propriété de factorisation mentionnée à plusieurs reprises dans cet ouvrage. Ainsi, la présenced’une corrélation significative entre les masses des neutrinos et les paramètres angulaires de ce secteurpermettrait d’obtenir de l’information additionnelle sur le type de hiérarchie privilégiée dans ce modèle(normale ou inverse). De plus, la nouvelle distribution marginale caractérisant les variables du groupe(obtenue lorsque la distribution d’origine est intégrée sur les valeurs singulières), qui ne correspond plusdirectement à la mesure de Haar, peut ensuite être utilisée pour reproduire l’analyse des invariantssous rephasage de la matrice PMNS présentée à la section 3.3.2. Naturellement, les effets de cettestructure hybride pourraient également être investigués dans le cadre du nouvel ensemble résultantde la combinaison de mécanismes seesaw et la possibilité d’étudier des mécanismes de masse autresque les mécanismes seesaw (dans le contexte d’une théorie de matrices aléatoires) demeure toujoursprésente. D’un point de vue encore plus général, comme les neutrinos constituent un sujet de recherchebeaucoup plus vaste et riche que ce qui a été dépeint dans cet ouvrage, il est intéressant de mentionnerque l’on peut également étudier les répercussions de l’approche anarchique au niveau de la leptogénèse[59] et des structures cosmologiques [81], ce qui constitue un tout autre régime d’application.

En somme, ces possibles orientations de recherche illustrent la pertinence du travail accompli dans lecadre de cette thèse de même que l’importance d’approfondir l’approche anarchique pour le secteur desneutrinos. Bien sûr, comme cette approche repose sur des méthodes statistiques pour caractériser lesmatrices de masse obtenues dans la limite des basses énergies (équivalentes à maximiser l’entropie deces matrices), il faut garder à l’esprit que la portée de celle-ci est donc limitée à extraire les tendancesassociées à un mécanisme de masse en particulier pour ensuite analyser leurs conséquences. Autrementdit, cette approche n’implique aucune supposition sur la théorie fondamentale à haute énergie. En fait,comme mentionné précédemment, l’hypothèse principale soutenue dans ce travail est que l’approcheanarchique demeure applicable (dans la limite des basses énergies) peu importe le niveau de complexitéde la théorie sous-jacente, ce qui ouvre une fenêtre inusitée et particulièrement révélatrice sur le secteurdes neutrinos permettant de guider la recherche vers de nouvelles avenues. Dans une perspective pluslarge, l’attention particulière dont bénéficient aujourd’hui les neutrinos relève donc du fait que ceux-ciconstituent des ambassadeurs uniques et incontournables des interactions faibles étroitement intriqués àcertaines des questions les plus fondamentales laissées en suspend par le modèle standard (l’énigme destrois générations de fermions, l’origine des spectres de masse fermioniques particuliers, la réconciliationentre le mélange structuré du secteur des quarks et le mélange plutôt anarchique de celui des leptons,etc.). Ainsi, bien que ceux-ci ne soient toujours pas enclins à révéler tous leurs secrets, la rapideévolution de ce domaine de recherche laisse présager que les années à venir seront propices à l’éclosionde nouvelles idées entraînant à leur tour des avancées majeures susceptibles de lever le voile sur certainsdes mystères les plus persistants et intriguants de la nature.

126

Page 137: Phénoménologie des neutrinos dans une théorie de matrices ...

Annexe A

Quelques résultats utiles

Cette annexe regroupe certains résultats utiles n’ayant pas pu être insérés directement dans la partiecentrale de ce document. Quelques résultats importants concernant les intégrales multidimensionnellesrencontrées dans ce travail sont introduits, le théorème de décomposition en valeurs singulières estabordé et une paramétrisation particulière du groupe unitaire U(N) est présentée.

A.1 Intégrales multidimensionnelles

Les ensembles matriciels aléatoires étudiés dans ce travail nécessite le calcul de constantes de nor-malisation qui découlent d’intégrales multidimentionnelles. Fait remarquable, ces intégrales possèdenttoutes des solutions analytiques bien connues permettant une généralisation des résultats obtenus pourtout entier positif N et tout β ∈ 1, 2. Dans ce contexte, les premières intégrales rencontrées sont detype gaussienne et relèvent de la normalisation des distributions des éléments de matrice. Par exemple,le résultat bien connu

−∞

. . .

−∞

N∏j=1

e−ax2jdxj =

(πa

)N2, (A.1)

peut être adapté pour obtenir les constantes de normalisation aux expressions (3.1) et (3.2). Ensuite,pour normaliser les distributions des valeurs propres (ou des valeurs singulières), l’intégrale de Sel-berg et certaines variations (constituant des cas limites de cette intégrale) associées aux ensemblesde polynômes orthogonaux sont couramment utilisées [26, 27]. Par exemple, pour les ensembles gaus-siens introduits au chapitre 2, le résultat (2.40) peut être obtenu à partir de l’intégrale caractérisantl’ensemble d’Hermite [26], soit

−∞

. . .

−∞

∏i<j

|xj − xi|2γN∏j=1

e−ax2jdxj = (2π)

N2 (2a)−

N2 (γ(N−1)+1)

N∏j=1

Γ(1 + γj)Γ(1 + γ) . (A.2)

Pour ce qui est des distributions (3.5) et (3.6), comme les variables d’intégration sont des valeurssingulières (qui sont, par définition, non négatives), l’intégrale associée à l’ensemble de Laguerre peutêtre utilisée [26], soit

127

Page 138: Phénoménologie des neutrinos dans une théorie de matrices ...

0

. . .

0

∏i<j

|xj − xi|2γN∏j=1

xα−1j e−axjdxj =

(1a

)N(γN−(γ−1))+(α−1)

×N−1∏j=0

Γ(1 + γ + jγ)Γ(α+ γj)Γ(1 + γ) , (A.3)

avec a > 0. Ce résultat constitue donc une façon alternative d’obtenir les constantes de normalisation(3.7) et permet ainsi de vérifier la correspondance entre les deux méthodes.

A.2 Décomposition en valeurs singulières

Cette section présente le raisonnement derrière la décomposition en valeurs singulières de matricescomplexes arbitraires (diagonalisation biunitaire) et symétriques que l’on peut trouver dans [1]. Le casréel n’est pas discuté explicitement car celui-ci suit essentiellement la même démarche.

A.2.1 Matrice arbitraire

Une matrice complexe arbitraire M de dimensions N × N peut être factorisée selon M = UΛV †, oùΛ = diag(λ1, λ2, . . . , λN ) est une matrice diagonale réelle et non négative alors que U et V sont desmatrices unitaires appropriées (satisfaisant U†U = IN et V †V = IN ). Pour ce faire, notons dans unpremier temps que le produit MM† est hermitien, ce qui implique que ce produit possède des valeurspropres réelles et non négatives pouvant être obtenues à partir de la transformation usuelle

MM† = UΛ2U†, ⇒ (Λ2)i =N∑j=1

∣∣(U†M)ij∣∣2, (A.4)

où V est une matrice unitaire. En multipliant ce résultat par la droite avec (M†)−1, on obtient alors

M = UΛ2U†(M†)−1 = UΛΛU†(M†)−1︸ ︷︷ ︸V †

. (A.5)

Il s’agit donc maintenant de montrer que la matrice V † ainsi définie est bien unitaire. Tout d’abord,en utilisant la définition précédente, la matrice V † peut être réécrite sous la forme V −1 = Λ−1U†M

en y appliquant l’opération d’inverse suivi du conjugué hermitien. Ensuite, on peut isoler une secondeexpression pour la matrice V † en multipliant la relation (A.5) par la gauche avec Λ−1U†. Cette expres-sion peut donc être comparée directement avec celle obtenue pour V −1, ce qui permet effectivementde constater que V † = V −1. Ce faisant, il va de soi que la condition V †V = IN est satisfaite, ce qui sevérifie directement avec

V †V = Λ−1U†MM†UΛ−1 = Λ−1U†UΛ2U†UΛ−1 = IN , (A.6)

où l’expression matricielle de (A.4) a été utilisée. Dans ce cas, comme on choisit de factoriser la ma-trice Λ2 comme Λ2 = ΛΛ, ce qui implique Λ =

√Λ2, la matrice Λ est bien réelle et non négative. La

transformation finale peut donc s’écrire comme M = UΛV †, correspondant alors au résultat souhaité.

128

Page 139: Phénoménologie des neutrinos dans une théorie de matrices ...

Naturellement, cette approche implique que la matrice M est inversible (c’est-à-dire non singulière),ce qui ce traduit par la condition det(M) 6= 0. Ainsi, bien que cette démonstration ne soit pas complè-tement générale puisqu’elle exclue la possibilité de valeurs singulières nulles, cette condition ne poseaucun problème en ce qui concerne l’analyse présentée dans ce travail.

A.2.2 Matrice symétrique

Une matrice complexe symétrique M de dimensions N ×N peut être factorisée selon M = UΛUT , oùΛ = diag(λ1, λ2, . . . , λN ) est une matrice diagonale réelle et non négative alors que U est une matriceunitaire appropriée (satisfaisant U†U = IN ). Pour vérifier cette affirmation, le point de départ consisteà utiliser le résultat de la sous-section précédente, soit M = UΛV † pour une matrice M quelconque, etensuite d’ajouter la contrainte M = MT pour tenir compte du fait que cette matrice est symétrique.Ainsi, on peut d’abord calculer les produits suivants :

MM† = UΛV †V ΛU† = UΛ2U†, (A.7)

MT (MT )† = V †TΛUTUT†ΛV T = V †TΛ2V T . (A.8)

Naturellement, ces produits permettent de vérifier que l’on retombe bien sur le point de départ de lasous-section précédente. Ensuite, puisque M = MT pour une matrice symétrique, cela signifie que cesdeux produits doivent être égaux, ce qui implique l’égalité

UΛ2U† = V †TΛ2V T . (A.9)

En multipliant par la gauche avec V T et par la droite avec U , on obtient

V TUΛ2 = Λ2V TU, (A.10)

d’où il en découle que le produit V TU commute avec Λ2. Comme ce produit est unitaire, c’est-à-direque (V TU)†V TU = U†V T†V TU = IN , cela signifie que Λ2 = (V TU)†Λ2V TU et donc que le produitV TU correspond à une matrice de phases diagonale, soit V TU ≡ D où D = diag(eiφ1 , eiφ2 , . . . , eiφN ).De retour à la transformation de départ, on peut donc écrire, pour une matrice symétrique,

M = UΛV † = V T†V TUΛV † = V T†DΛV †. (A.11)

Par ailleurs, puisque D est diagonale, la matrice D1/2 l’est également, ce qui implique qu’elle commuteavec Λ. Le résultat précédent prend donc la forme

M = V T†DΛV † = V T†D1/2ΛD1/2V † = (D1/2V †)TΛD1/2V †. (A.12)

Ainsi, il devient claire qu’en posant W ≡ (D1/2V †)T on obtient la forme souhaitée, soit M = WΛWT .Bien sûr, on peut vérifier queW †W = (D1/2V †)∗(D1/2V †)T = IN , ce qui correspond bien à une matriceunitaire. En remplaçant W par U , on obtient finalement la transformation voulue, soit M = UΛUT .

129

Page 140: Phénoménologie des neutrinos dans une théorie de matrices ...

A.3 Paramétrisation du groupe unitaire U(N)Une paramétrisation fort utile du groupe unitaire U(N) peut être trouvée dans [69, 70]. Dans cettesection, une brève revue des principaux éléments est présentée. Pour une preuve formelle, se référer auxarticles d’origine. En se référant aux travaux précédemment cités, on a que pour une matrice unitaireU de dimension N ×N , la paramétrisation suivante demeure valide pour tout N , soit

U =∏j<k

eiφjkPkeiθjkΣjkN∏j=1

eiϕjPj . (A.13)

Ici, le projecteur unidimentionnelle Pj et la matrice antisymétrique Σjk sont respectivement donnéspar

(Pj)ik = δjiδjk, et (Σjk)il = −iδjiδkl + iδjlδki, (A.14)

où δij est le delta de Kronecker usuel. Par ailleurs, les N2 angles de mélange (θjk) et phases (φjk etϕj) sont compris dans les intervalles suivants :

θjk ∈ [0, π/2] , φjk ∈ [0, 2π] , ϕj ∈ [0, 2π] . (A.15)

Ce faisant, l’un des principaux résultats pouvant être obtenu à partir de cette paramétrisation est uneforme explicite pour la mesure de Haar (valide pour tout N), c’est-à-dire

[U†dU ] =N∏j=1

dϕj∏j<k

sin(θjk) (cos(θjk))2(k−j)−1 dφjkdθjk. (A.16)

Ce résultat, qui montre clairement que la mesure de Haar dépend uniquement des angles de mélange,s’avère particulièrement utile pour analyser les distributions des angles de mélange et des phases com-plexes pour une valeur de N arbitraire.

Par ailleurs, cette paramétrisation spécifique est bien adaptée pour exprimer de façon simple et élé-gante la mesure sur les variables du groupe relevant de la décomposition en valeurs singulières d’unematrice complexe arbitraire (voir la sous-section 2.3.4). En effet, puisque la multiplication des matricesunitaires U et V par la droite avec une matrice de phases diagonale D n’affecte pas le résultat de la dé-composition M = UΛV †, on peut toujours choisir les phases de D de façon à éliminer les éléments surla diagonale de la matrice U†dU ou V †dV . Ainsi, pour une paramétrisation où les phases ϕj (qualifiéesde « non physiques ») apparaissent complètement à droite (comme c’est le cas dans le produit (A.13)),cela revient les éliminer de la mesure finale (car dans ce cas particulier, leur contribution à la mesureest contenue uniquement dans les éléments diagonaux de U†dU ou V †dV ). Les phases ϕj ne sont doncpas présentes dans la mesure [U†dU ]′ (voir les notes 81 et 85). De plus, en se référant à l’intégrale(3.31), on constate que pour une matrice U paramétrisée selon (A.13), les phases ϕj n’apparaissentjamais explicitement dans les exponentielles (ce qui n’aurait pas été le cas pour une paramétrisationoù les phases ϕj sont situées à gauche telle que (3.56)).

130

Page 141: Phénoménologie des neutrinos dans une théorie de matrices ...

Bibliographie

[1] C. Giunti et C. Kim, Fundamentals of Neutrino Physics and Astrophysics. Oxford UniversityPress, 2007.

[2] I. Esteban, M. C. Gonzalez-Garcia, M. Maltoni, I. Martinez-Soler et T. Schwetz, Updated fit tothree neutrino mixing : exploring the accelerator-reactor complementarity, JHEP 01 (2017) 087,[1611.01514].

[3] M. Thomson, Modern particle physics. Cambridge University Press, 2013.[4] Particle Data Group collaboration, C. Patrignani et al., Review of Particle Physics, Chin.

Phys. C40 (2016) 100001.[5] C. Kim et A. Pevsner, Neutrinos in physics and astrophysics, vol. 8 of Contemporary concepts in

physics. Harwood Academic, 1993.[6] Z.-z. Xing et S. Zhou, Neutrinos in particle physics, astronomy and cosmology. Advanced Topics

in Science and Technology in China. Zhejiang University Press and Springer, 2011.[7] G. Altarelli, The Standard model of particle physics, arXiv e-prints (2005) , [hep-ph/0510281].[8] M. E. Peskin et D. V. Schroeder, An Introduction to quantum field theory. Addison-Wesley, 1995.[9] A. Zee, Quantum Field Theory in a Nutshell : Second Edition. In a Nutshell Series. Princeton

University Press, 2010.[10] T. Lancaster et S. Blundell, Quantum Field Theory for the Gifted Amateur. Oxford University

Press, 2014.[11] D. Haidt, The neutrino’s 50th birthday, Third NO-VE International Workshop on Neutrino Os-

cillations in Venice : Fifty years after the neutrino esperimental discovery (2006) 1–21.[12] P. Labelle, Supersymmetry DeMYSTiFied. The Demystified Series. McGraw-Hill Education, 2010.[13] T. Ohlsson, Special Issue on "Neutrino Oscillations : Celebrating the Nobel Prize in Physics 2015"

in Nuclear Physics B, Nucl. Phys. B908 (2016) 1–466.[14] Y. Grossman, TASI 2002 lectures on neutrinos, Particle physics and cosmology : The quest for

physics beyond the standard model(s). Proceedings, Theoretical Advanced Study Institute, TASI(2003) 5–48, [hep-ph/0305245].

[15] G. Pagliaroli, F. Rossi-Torres et F. Vissani, Neutrino mass bound in the standard scenario forsupernova electronic antineutrino emission, Astropart. Phys. 33 (2010) 287–291, [1002.3349].

[16] S. F. King, Neutrino mass models, Rept. Prog. Phys. 67 (2004) 107–158, [hep-ph/0310204].[17] S. F. King, Models of Neutrino Mass, Mixing and CP Violation, J. Phys. G42 (2015) 123001,

[1510.02091].[18] H. Fritzsch et Z.-z. Xing, Mass and flavor mixing schemes of quarks and leptons, Prog. Part. Nucl.

Phys. 45 (2000) 1–81, [hep-ph/9912358].[19] G. Altarelli et F. Feruglio, Discrete flavor symmetries and models of neutrino mixing, Rev. Mod.

Phys. 82 (2010) 2701–2729, [1002.0211].[20] L. Wolfenstein, Parametrization of the Kobayashi-Maskawa Matrix, Phys. Rev. Lett. 51 (1983)

1945.

131

Page 142: Phénoménologie des neutrinos dans une théorie de matrices ...

[21] S. F. King, Unified Models of Neutrinos, Flavour and CP Violation, Prog. Part. Nucl. Phys. 94(2017) 217–256, [1701.04413].

[22] Daya Bay collaboration, F. P. An et al., Observation of electron-antineutrino disappearance atDaya Bay, Phys. Rev. Lett. 108 (2012) 171803, [1203.1669].

[23] L. J. Hall, H. Murayama et N. Weiner, Neutrino mass anarchy, Phys. Rev. Lett. 84 (2000) 2572–2575, [hep-ph/9911341].

[24] N. Haba et H. Murayama, Anarchy and hierarchy : An approach to study models of fermion massesand mixings, Phys. Rev. D63 (2001) 053010, [hep-ph/0009174].

[25] A. de Gouvea et H. Murayama, Statistical test of anarchy, Phys. Lett. B573 (2003) 94–100,[hep-ph/0301050].

[26] M. Mehta, Random Matrices. Pure and Applied Mathematics. Elsevier Science, 2004.[27] P. Forrester, Log-Gases and Random Matrices (LMS-34). London Mathematical Society Mono-

graphs. Princeton University Press, 2010.[28] A. de Gouvea et H. Murayama, Neutrino Mixing Anarchy : Alive and Kicking, Phys. Lett. B747

(2015) 479–483, [1204.1249].[29] Y. Bai et G. Torroba, Large N (=3) Neutrinos and Random Matrix Theory, JHEP 12 (2012) 026,

[1210.2394].[30] X. Lu et H. Murayama, Neutrino Mass Anarchy and the Universe, JHEP 08 (2014) 101,

[1405.0547].[31] J.-F. Fortin, N. Giasson et L. Marleau, Probability density function for neutrino masses and

mixings, Phys. Rev. D94 (2016) 115004, [1609.08581].[32] J.-F. Fortin, N. Giasson et L. Marleau, Anarchy and Neutrino Physics, JHEP 04 (2017) 131,

[1702.07273].[33] J.-F. Fortin, N. Giasson et L. Marleau, Probability Density Functions for CP-Violating Rephasing

Invariants, Nucl. Phys. B930 (2018) 384–398, [1801.10165].[34] H. K. Dreiner, H. E. Haber et S. P. Martin, Two-component spinor techniques and Feynman rules

for quantum field theory and supersymmetry, Phys. Rept. 494 (2010) 1–196, [0812.1594].[35] P. B. Pal, Dirac, Majorana and Weyl fermions, Am. J. Phys. 79 (2011) 485–498, [1006.1718].[36] I. Aitchison et A. Hey, Gauge Theories in Particle Physics : QCD and the Electroweak Theory,

Third Edition, vol. II of Graduate Student Series in Physics. Taylor & Francis Group, 2004.[37] H. J. Lipkin, Quantum mechanics of neutrino oscillations : Hand waving for pedestrians, arXiv

e-prints (1999) , [hep-ph/9901399].[38] J. Heeck, Seesaw parametrization for n right-handed neutrinos, Phys. Rev. D86 (2012) 093023,

[1207.5521].[39] R. Mohapatra et P. Pal, Massive Neutrinos in Physics and Astrophysics : Third Edition, vol. 72

of Lecture Notes in Physics. World Scientific Publishing, 2004.[40] S. M. Bilenky, Neutrino in Standard Model and beyond, Phys. Part. Nucl. 46 (2015) 475–496,

[1501.00232].[41] R. N. Mohapatra et A. Y. Smirnov, Neutrino Mass and New Physics, Ann. Rev. Nucl. Part. Sci.

56 (2006) 569–628, [hep-ph/0603118].[42] S. M. Bilenky et C. Giunti, Neutrinoless Double-Beta Decay : a Probe of Physics Beyond the

Standard Model, Int. J. Mod. Phys. A30 (2015) 1530001, [1411.4791].[43] Planck collaboration, P. A. R. Ade et al., Planck 2015 results. XIII. Cosmological parameters,

Astron. Astrophys. 594 (2016) A13, [1502.01589].[44] R. N. Mohapatra, Seesaw mechanism and its implications, Seesaw mechanism. Proceedings, In-

ternational Conference SEESAW25 (2004) 29–44, [hep-ph/0412379].[45] G. ’t Hooft, Naturalness, chiral symmetry, and spontaneous chiral symmetry breaking, NATO Sci.

Ser. B 59 (1980) 135–157.

132

Page 143: Phénoménologie des neutrinos dans une théorie de matrices ...

[46] A. Strumia et F. Vissani, Neutrino masses and mixings and..., arXiv e-prints (2006) ,[hep-ph/0606054].

[47] H. Fritzsch, M. Gell-Mann et P. Minkowski, Vector - Like Weak Currents and New ElementaryFermions, Phys. Lett. 59B (1975) 256–260.

[48] J. Schechter et J. W. F. Valle, Neutrino Decay and Spontaneous Violation of Lepton Number,Phys. Rev. D25 (1982) 774.

[49] A. Arhrib, R. Benbrik, M. Chabab, G. Moultaka, M. C. Peyranere, L. Rahili et al., The HiggsPotential in the Type II Seesaw Model, Phys. Rev. D84 (2011) 095005, [1105.1925].

[50] N. Haba, H. Ishida, N. Okada et Y. Yamaguchi, Vacuum stability and naturalness in type-IIseesaw, Eur. Phys. J. C76 (2016) 333, [1601.05217].

[51] K. B. Petersen et M. S. Pedersen, The Matrix Cookbook. Technical University of Denmark, 2012.[52] R. Foot, H. Lew, X. G. He et G. C. Joshi, Seesaw Neutrino Masses Induced by a Triplet of Leptons,

Z. Phys. C44 (1989) 441.[53] A. Abada, C. Biggio, F. Bonnet, M. B. Gavela et T. Hambye, µ → eγ and τ → lγ decays in the

fermion triplet seesaw model, Phys. Rev. D78 (2008) 033007, [0803.0481].[54] A. Broncano, M. B. Gavela et E. E. Jenkins, The Effective Lagrangian for the seesaw model of

neutrino mass and leptogenesis, Phys. Lett. B552 (2003) 177–184, [hep-ph/0210271].[55] A. M. Patricio, Low-Energy Phenomenology of Neutrino Mass Mechanisms, Master’s thesis, Uni-

versity of Lisbon, 2014.[56] P. F. Harrison, D. H. Perkins et W. G. Scott, Tri-bimaximal mixing and the neutrino oscillation

data, Phys. Lett. B530 (2002) 167, [hep-ph/0202074].[57] F. Feruglio, Are neutrino masses modular forms ?, arXiv e-prints (2017) , [1706.08749].[58] J. R. Espinosa, Anarchy in the neutrino sector ?, arXiv e-prints (2003) , [hep-ph/0306019].[59] K. S. Jeong et F. Takahashi, Anarchy and Leptogenesis, JHEP 07 (2012) 170, [1204.5453].[60] B. Eynard, T. Kimura et S. Ribault, Random matrices, arXiv e-prints (2018) , [1510.04430].[61] C. Porter et N. Rosenzweig, Statistical Properties of Atomic and Nuclear Spectra, vol. 44 of Annales

Academiae Scientiarum Fennicae. Series A VI. Physica. Helsinki : Suomalainen tiedeakatemia,1960.

[62] F. D. Cunden, P. Facchi et P. Vivo, A shortcut through the coulomb gas method for spectral linearstatistics on random matrices, Journal of Physics A: Mathematical and Theoretical 49 (2016)135202, [1510.05438].

[63] C. Porter, Statistical Theories of Spectra : Fluctuations : a Collection of Reprints and OriginalPapers. Perspectives in physics : A series of reprint collections. Acad. Press, 1965.

[64] R. Muirhead, Aspects of Multivariate Statistical Theory. Wiley Series in Probability and Statistics.Wiley, 2009.

[65] H. Uhlig, On singular wishart and singular multivariate beta distributions, The Annals of Statistics22 (1994) 395–405.

[66] T. Ratnarajah, R. Vaillancourt et M. Alvo, Jacobians and hypergeometric functions in complexmultivariate analysis, Canadian Applied Mathematics Quarterly 12 (2004) 213–239.

[67] T. Ratnarajah et R. Vaillancourt, Complex singular wishart matrices and applications, Computers& Mathematics with Applications 50 (2005) 399–411.

[68] J. A. Diaz-Garcia et R. Gutierrez-Sanchez, Jacobians of singular matrix transformations : Exten-sions, arXiv e-prints (2012) , [1207.1993].

[69] C. Spengler, M. Huber et B. C. Hiesmayr, A composite parameterization of unitary groups, densitymatrices and subspaces, Journal of Physics A: Mathematical and Theoretical 43 (2010) .

[70] C. Spengler, M. Huber et B. C. Hiesmayr, Composite parameterization and haar measure for allunitary and special unitary groups, Journal of Mathematical Physics 53 (2012) .

133

Page 144: Phénoménologie des neutrinos dans une théorie de matrices ...

[71] M. C. Gonzalez-Garcia, M. Maltoni et T. Schwetz, Updated fit to three neutrino mixing : statusof leptonic CP violation, JHEP 11 (2014) 052, [1409.5439].

[72] G. C. Branco, R. G. Felipe et F. R. Joaquim, Leptonic CP Violation, Rev. Mod. Phys. 84 (2012)515–565, [1111.5332].

[73] C. Jarlskog, A Basis Independent Formulation of the Connection Between Quark Mass Matrices,CP Violation and Experiment, Z. Phys. C29 (1985) 491–497.

[74] C. Jarlskog, Commutator of the Quark Mass Matrices in the Standard Electroweak Model and aMeasure of Maximal CP Violation, Phys. Rev. Lett. 55 (1985) 1039.

[75] E. E. Jenkins et A. V. Manohar, Rephasing Invariants of Quark and Lepton Mixing Matrices,Nucl. Phys. B792 (2008) 187–205, [0706.4313].

[76] J. D. Bjorken et I. Dunietz, Rephasing Invariant Parametrizations of Generalized Kobayashi-Maskawa Matrices, Phys. Rev. D36 (1987) 2109.

[77] J. Taylor, An Introduction to Error Analysis : The Study of Uncertainties in Physical Measure-ments. Physics - chemistry - engineering. University Science Books, 1997.

[78] C. Dunkl et K. Zyczkowski, Volume of the set of unistochastic matrices of order 3 and the meanJarlskog invariant, J. Math. Phys. 50 (2009) 123521, [0909.0116].

[79] A. Altland et M. R. Zirnbauer, Nonstandard symmetry classes in mesoscopic normal-superconducting hybrid structures, Phys. Rev. B 55 (1997) 1142–1161.

[80] G. W. Gibbons, S. Gielen, C. N. Pope et N. Turok, Measures on Mixing Angles, Phys. Rev. D79(2009) 013009, [0810.4813].

[81] A. J. Long, M. Raveri, W. Hu et S. Dodelson, Neutrino Mass Priors for Cosmology from RandomMatrices, Phys. Rev. D97 (2018) 043510, [1711.08434].

134