Algebre` - FACSA...t e ´ CHAPITRE 1. CALCUL MATRICIEL. 5 EXEMPLE 1.4 La matrice A= 2 3 −2 4 0 1 1...

174
Usage limit ´ e LG L G Facult´ e des Sciences Appliqu ´ ees Alg ` ebre Premi ` ere partie Calcul matriciel et alg ` ebre lin ´ eaire ´ Eric J.M. DELHEZ Juillet 2008

Transcript of Algebre` - FACSA...t e ´ CHAPITRE 1. CALCUL MATRICIEL. 5 EXEMPLE 1.4 La matrice A= 2 3 −2 4 0 1 1...

  • Usag

    elim

    it́eL G

    L G

    Faculté des Sciences Appliquées

    AlgèbrePremière partie

    Calcul matriciel et algèbre linéaire

    Éric J.M. DELHEZJuillet 2008

  • Usag

    elim

    it́eAvant-propos

    Ces notes constituent le support écrit de la partieAlgèbre Lińeaire- Calcul Matricieldu cours d’Algèbrede la première année d’études debachelier en Sciences de l’Ingénieur.

    En raison de l’importance du formalisme matriciel dans denombreux domaines des mathématiques, du calcul numérique et, plusgénéralement, des sciences de l’ingénieur, le cours fait une largeplace au calcul matriciel. Il vient ainsi en appui des cours d’analysemathématique et d’analyse numérique. Les bases de l’alg`ebre linéairesont développées en parallèle afin d’ouvrir une porte vers l’abstractionet la généralisation des concepts introduits.

    Même si l’étudiant doit également maı̂triser les techniques decalcul proprement dites, le but du cours est aussi de mener àlacompréhension des concepts d’algèbre linéaire et de calcul matriciel.En effet, si l’ingénieur dispose d’outils informatiques de plus en plusperformants lui évitant des calculs lourds et fastidieux,il lui appartientpar contre de mettre en équations les problèmes et d’interprétercorrectement les résultats fournis par les outils de calcul. Les logicielsMathematicaetMatlabsont parmi les plus utilisés. Aussi, la plupart desexemples traités dans ces notes servent à une introduction rapide à cesdeux logiciels en présentant les commandes permettant de résoudre lesproblèmes posés. Le logiciel gratuitOctavepeut être utilisé à la place deMatlabpuisqu’il est très largement compatible avec ce dernier etutilisela même syntaxe.

  • Usag

    elim

    it́eChapitre 1Calcul matriciel.

    1.1 Définitions.

    On appellematriceun ensemble descalaires, i.e. des nombres réels ou complexes,ordonnés sous la forme d’un tableau rectangulaire dem lignes etn colonnes. On note lamatrice1

    A =

    a11 a12 · · · a1na21 a22 · · · a2n...

    ......

    am1 am2 · · · amn

    (1.1)

    On écrit parfois aussi(ai j)

    mn.Les nombresai j (on écrit aussi(A)i j ) sont appelés leśelémentsde la matrice. Celle-ci

    est diteréellesi tous ses éléments sont réels.Les lignes et les colonnes deA sont lesrangéesde la matrice.Les nombres entiers positifsm et n sont lesdimensionsde la matrice. Sim < n, la

    matrice est ditehorizontale. Si m> n, elle estverticale. Une matrice dont les dimensionsmetn sont égales est unematrice carrée. La dimensionm= n est alors appelée l’ordredela matrice. L’ensemble des matrices de taillem×n dont les éléments sont complexes senoteCmn . Le sous-ensemble des matrices réelles se noteR

    mn .

    Une matrice qui ne comporte qu’une seule colonne est unematrice-colonne:

    x =

    x1x2...

    xm

    (1.2)

    La matrice qui ne possède qu’une seule ligne est quant à elle appelée unematrice-ligne.

    1Dans cet exposé, on désigne les matrices par des majuscules A, B, C, . . . (à l’exception des matrices-colonnes et des matrices-lignes qui sont désignées par des minusculesx, y, . . . ). Les éléments des matricessont désignés par les minuscules correspondantes écrites en italique. Les lettres minuscules de l’alphabetgrecα, β, γ, . . . sont utilisées pour représenter des scalaires.

    3

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 4

    Les élémentsaii (i = 1, . . . ,n) d’une matrice carrée forment ladiagonale principaledecette matrice. Leur somme est latracede la matrice :

    traceA =n

    ∑i=1

    aii (1.3)

    L’autre diagonale d’une matrice carrée est ladiagonale secondaire.Une matrice carréeA est ditediagonalesi ai j = 0 pour i 6= j, i.e. si les éléments en

    dehors de la diagonale principale sont tous nuls. Une matrice diagonale est généralementreprésentée par la liste de ses éléments diagonaux.

    EXEMPLE 1.1

    A =

    1 0 00 4 00 0 −5

    = diag(1,4,−5)

    est une matrice diagonale d’ordre 3. La trace deA est nulle. ⋄

    Une matrice est ditetriangulaire supérieure(resp.inférieure) si tous les éléments situésen-dessous (resp. au-dessus) de la diagonale principale sont nuls.

    EXEMPLE 1.2

    A =

    1 4 00 −4 −60 0 3

    est une matrice triangulaire supérieure. ⋄

    1.1.1 Sous-matrices et partitions d’une matrice.

    Toute matrice obtenue en supprimant une ou plusieurs ligne(s) et/ou colonne(s) d’unematriceA est appelée unesous-matricedeA.

    EXEMPLE 1.3 Si

    A =

    2 3 −2 40 1 1 02 −1 0 0

    alors les matrices (2 30 1

    )

    , (1),

    (2 42 0

    )

    sont des sous-matrices deA. ⋄

    On peut également faire apparaı̂tre des sous-matrices oublocs d’une matriceAen introduisant des lignes de séparation entre les lignes et/ou les colonnes deA. Cesséparations déterminent unepartition de la matriceA qui est alors ditecomposée. Unetelle matrice peut être notée sous la forme d’une matrice dont les éléments sont lesblocsde la partition.

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 5

    EXEMPLE 1.4 La matrice

    A =

    2 3 −2 40 1 1 02 −1 0 0

    peut être partitionnée de différentes façons. Par exemple,

    A =

    2 3 −2 40 1 1 02 −1 0 0

    =

    (A11 A12A21 A22

    )

    où

    A11 =

    (2 30 1

    )

    , A12 =

    (−2 41 0

    )

    , A21 =(2 −1

    ), A22 =

    (0 0

    )

    On peut encore introduire les notions de matrice triangulaire supérieure (resp.inférieure) par blocs ou de matrice diagonale par blocs si les blocs forment les élémentsd’une matrice triangulaire supérieure (resp. inférieure) ou d’une matrice diagonale.

    EXEMPLE 1.5 La matrice

    A = diag(A11,A22) =

    (A11 0

    0 A22

    )

    =

    2 3 0 00 1 0 00 0 1 20 0 2 1

    où

    A11 =

    (2 30 1

    )

    , A22 =

    (1 22 1

    )

    est diagonale par blocs. ⋄

    1.2 Opérations élémentaires sur les matrices.

    On dit que deux matrices sontégalessi elles sont de mêmes dimensions et si leséléments correspondants des deux matrices sont égaux.

    Comme les matrices sont constituées de nombres complexes,on pourrait croire quel’arithmétique des matrices est semblable à celle des nombres complexes. Cependant, iln’en est rien et l’arithmétique des matrices se distingue de celle des nombres à plus d’unégard.

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 6

    1.2.1 Addition et multiplication par un scalaire.'

    &

    $

    %

    La sommede deux matricesA etB de mêmes dimensionsm×n est la matricem×n dont les éléments sont donnés par

    (A+B)i j = ai j +bi j (1.4)

    D’après cette définition, on voit que l’addition matricielle est commutative

    A+B = B+A (1.5)

    et associative(A+B)+C = A+(B+C) = A+B+C (1.6)'

    &

    $

    %

    Le produit d’une matricem× n par un scalaireλ (réel ou complexe) est lamatricem×n dont les éléments sont donnés par

    (λA)i j = λai j (1.7)

    On en déduit que la multiplication d’une matrice par un scalaire est distributive

    λ(A+B) = λA+λB (1.8)

    et associativeλ(µA) = (λµ)A = λµA (1.9)

    EXEMPLE 1.6 Soient

    A =

    (1 3 52 4 6

    )

    et B =

    (0 7 23 0 −1

    )

    On a

    2A+B =

    (2 6 104 8 12

    )

    +

    (0 7 23 0 −1

    )

    =

    (2 13 127 8 11

    )

    = B+2A

    MATHEMATICA : In:= A = {{1, 3, 5 }, {2, 4, 6 }} ; B = {{0, 7, 2 }, {3, 0, -1 }} ;In:= 2A+B → Out:= {{2, 13, 12 }, {7, 8, 11 }}In:= B+2A → Out:= {{2, 13, 12 }, {7, 8, 11 }}

    MATLAB : >> A=[1 3 5 ; 2 4 6] ; B=[0 7 2 ; 3 0 -1] ;>> 2*A + B → ans= 2 13 12

    7 8 11>> B + 2*A → ans= 2 13 12

    7 8 11⋄

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 7

    1.2.2 Multiplication matricielle.'

    &

    $

    %

    Le produitAB d’une matriceA de dimensionsm× r et d’une matriceB dedimensionsr ×n est la matrice de dimensionsm×n dont les éléments sontdonnés par

    (AB)i j =r

    ∑k=1

    aikbk j (1.10)

    Pour effectuer pratiquement le produit de deux matrices, onnotera que l’élémenti j duproduitP = AB est la somme des produits des éléments correspondants de la i-èmelignedeA et de laj -èmecolonne deB, i.e. le produit matriciel s’effectue ligne par colonne :

    (

    p11 p12

    p21 p22

    )

    =

    (

    a11 a12

    a21 a22

    )

    b11 b12

    b21 b22

    avecp11 = a11b11+a12b21

    La multiplication d’une matriceA par une matriceB n’est possible que si le nombrede colonnes deA est égal au nombre de lignes deB. On dit alors que les deux matricessontconformables.

    Si A est une matricem×n etB une matricen×m, deux produits peuvent être formés,P = AB et Q = BA. Ces deux matrices ne sont manifestement pas égales puisque P estune matricem×m tandis queQ est une matricen×n ! Même siA et B sont carrées, engénéral,

    AB 6= BA, (1.11)i.e. la multiplication de deux (ou plusieurs) matrices n’est pascommutative.

    EXEMPLE 1.7 Soient

    A =

    (1 23 4

    )

    et B =

    (5 67 8

    )

    On a

    AB =

    (19 2243 50

    )

    et

    BA =

    (23 3431 46

    )

    et doncAB 6= BA.MATHEMATICA : In:= A = {{1, 2 }, {3, 4 }} ; B = {{5, 6 }, {7, 8 }} ;

    In:= A ·B → Out:= {{19, 22 }, {43, 50 }}In:= B ·A → Out:= {{23, 34 }, {31, 46 }}

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 8

    MATLAB : >> A=[1 2 ; 3 4] ; B = [5 6 ; 7 8] ;>> A*B → ans= 19 22

    43 50>> B*A → ans= 23 34

    31 46⋄

    La multiplication matricielle est distributive par rapport à l’addition

    (A+B)C = AC+BC (1.12)

    etC(A+B) = CA+CB (1.13)

    La multiplication matricielle est aussi associative. Par exemple,

    A(BC) = (AB)C (1.14)

    à condition, bien sûr, que les dimensions des matrices permettent de définir chacundes produits. En effet, supposons que les dimensions des matrices A, B et C soientrespectivementm× p, p× q et q× n. Alors, le produit des trois matrices fournit unematricem×n telle que

    (A(BC))i j =p

    ∑k=1

    aik(BC)k j =p

    ∑k=1

    aik

    (q

    ∑l=1

    bklcl j

    )

    =p

    ∑k=1

    q

    ∑l=1

    aikbklcl j

    =q

    ∑l=1

    p

    ∑k=1

    aikbklcl j =q

    ∑l=1

    (p

    ∑k=1

    aikbkl

    )

    cl j =q

    ∑l=1

    (AB)il cl j

    = ((AB)C)i j

    Notons également que le produit de deux matrices diagonales A et B est encore unematrice diagonale dont les éléments sont les produits deséléments correspondants desdiagonales principales deA et deB. Dans ce cas, évidemment, le produit est commutatif.

    EXEMPLE 1.8(

    λ1 00 λ2

    )(µ1 00 µ2

    )

    =

    (λ1µ1 0

    0 λ2µ2

    )

    =

    (µ1 00 µ2

    )(λ1 00 λ2

    )

    MATHEMATICA : In:= DiagonalMatrix [ {a,b }] · DiagonalMatrix [ {c,d }]→ Out:= {{ac, 0 }, {0, bd }}

    MATLAB : >> diag([1 2])* diag([3 4]) → ans= 3 00 8

    (2)

    ⋄2On notera que Matlab ne permet pas les manipulations symboliques.

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 9

    1.2.3 Matrices nulle et identit́e.

    Afin de poursuivre la comparaison avec les nombres complexes, on peut encoreintroduire les notions de matrice nulle et de matrice identité, c’est-à-dire de neutre pourl’addition et de neutre pour la multiplication matricielle.

    Une matrice nulle0 est une matrice dont tous les éléments sont égaux à zéro. On aalors

    A+0 = 0+A = A (1.15)

    A0 = 0 et 0A = 0 (1.16)

    Remarquons que l’on peut avoirAB = 0 avecA 6= 0 etB 6= 0.

    EXEMPLE 1.9 (1 2−4 −8

    )(−2 61 −3

    )

    =

    (0 00 0

    )

    Notons cependant que(−2 61 −3

    )(1 2−4 −8

    )

    =

    (−26 −5213 26

    )

    MATHEMATICA : In:= {{1, 2 }, {-4, -8 }}· {{-2, 6 }, {1, -3 }}→ Out:= {{0, 0 }, {0, 0 }}In:= {{-2, 6 }, {1, -3 }}· {{1, 2 }, {-4, -8 }}→ Out:= {{-26, -52 }, {13, 26 }}

    MATLAB : >> [1 2 ;-4 -8]*[-2 6 ;1 -3] → ans= 0 00 0

    >> [-2 6 ;1 -3]*[1 2 ;-4 -8] → ans= -26 -5213 26

    Unematrice identité, notéeI ou In où l’indicen indique l’ordre de la matrice identité,est une matrice carrée de la forme

    In =

    1 0 00 1 0

    ...0 0 1

    (1.17)

    Une matrice identité est caractérisée par la propriét´e (neutre à droite et à gauche pour lamultiplication)

    AI = A IA = A (1.18)

    quelle que soit la matriceA (et où, dans chaque relation,I représente la matrice identitéde taille compatible avec celle deA).

    Remarquons, ici aussi, que l’on peut avoirAB = A avecB 6= I.

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 10

    EXEMPLE 1.10 (−1 0.25−8 2

    )(−1 0.25−8 2

    )

    =

    (−1 0.25−8 2

    )

    MATHEMATICA : In:= {{-1, 0.25 }, {-8, 2 }}· {{-1, 0.25 }, {-8, 2 }}→ Out:= {{-1, 0.25 }, {-8, 2 }}

    MATLAB : >> [-1 0.25 ;-8 2]*[-1 0.25 ;-8 2] → ans= -1.0000 0.2500-8.0000 2.0000

    1.2.4 Fonction d’une matrice.

    La combinaison des opérations d’addition et de multiplication de deux ou plusieursmatrices permet de définir des opérations plus complexes.Ainsi, si A est une matricecarrée, on peut définir lespuissances entièresdeA (k entier positif) par

    Ak = A A A . . . A︸ ︷︷ ︸

    k facteurs

    (1.19)

    et lespolynômesdeA par

    Pk(A) = αkAk +αk−1Ak−1 + · · ·+α1A+α0I (1.20)

    où lesαk, . . . ,α0 sont des nombres complexes.De même, en se basant sur le développement en série de Taylor d’une fonction d’une

    variable scalaire, on peut définir une fonction d’une matrice par son développement ensérie de Taylor (pour autant que celui-ci converge). Par exemple, comme

    ex = 1+x+x2

    2+

    x3

    6+ · · ·+ x

    k

    k!+ · · · ∀x∈ C (1.21)

    on définit l’exponentielle d’une matrice carréepar le développement en série

    eA = I+A+A2

    2+

    A3

    6+ · · ·+ A

    k

    k!+ · · · (1.22)

    Dans le cas particulier d’une matrice diagonaleA = diag(λ1,λ2, . . . ,λn), on obtient plussimplement

    Ak = diag(

    λk1,λk2, . . . ,λ

    kn

    )

    (1.23)

    Pk(A) = diag(Pk(λ1),Pk(λ2), . . . ,Pk(λn)) (1.24)

    eteA = diag

    (

    eλ1,eλ2, . . . ,eλn)

    (1.25)

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 11

    EXEMPLE 1.11 Soit

    A =

    (1 00 4

    )

    On a

    A4 =

    (1 00 44

    )

    et eA =

    (e 00 e4

    )

    MATHEMATICA : In:= A= {{1, 0 }, {0, 4 }} ;In:= MatrixPower[A,4] → Out:= {{1, 0 }, {0, 256 }}In:= MatrixExp[A] → Out:= {{e, 0 }, {0, e 4}}

    MATLAB : >> A=[1 0 ;0 4] ;>> A4→ ans= 1 0

    0 256>> expm(A) → ans= 2.7183 0

    0 54.5982⋄

    EXEMPLE 1.12 Soit

    A =

    (0 1−1 0

    )

    On a

    A2 =

    (−1 00 −1

    )

    A3 =

    (0 −11 0

    )

    A4 =

    (1 00 1

    )

    A5 =

    (0 1−1 0

    )

    = A

    de sorte que

    eA =

    1− 12!

    +14!

    −·· · 1− 13!

    +15!

    −·· ·

    −1+ 13!

    − 15!

    −·· · 1− 12!

    +14!

    −·· ·

    =

    ∑k=0

    (−1)k(2k)!

    ∑k=0

    (−1)k(2k+1)!

    −∞

    ∑k=0

    (−1)k(2k+1)!

    ∑k=0

    (−1)k(2k)!

    =

    (cos1 sin1−sin1 cos1

    )

    MATHEMATICA : In:= MatrixExp[ {{0, 1 }, {-1, 0 }}]→ Out:= {{cos [1], sin [1] }, {-sin [1], cos [1] }}

    MATLAB : >> expm([0 1 ;-1 0]) → ans= 0.5403 0.8415-0.8415 0.5403

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 12

    1.2.5 Matrice transpośee, conjugúee et adjointe.'

    &

    $

    %

    La transposéed’une matriceA (m×n) est la matrice3 AT de dimensionsn×mdont les éléments sont donnés par

    (AT)i j = a ji (1.26)

    La matriceAT est donc obtenue en échangeant les colonnes et les lignes deA. Latransposée d’une matrice-colonne est une matrice-ligne et inversement.

    EXEMPLE 1.13 Si

    A =

    (1 2 3i

    1+ i 1 0

    )

    alors

    AT =

    1 1+ i2 13i 0

    MATHEMATICA : In:= Transpose[ {{1, 2, 3I }, {1+I, 1, 0 }}]→ Out:= {{1, 1+I }, {2, 1 }, {3I, 0 }}

    MATLAB : >> [1 2 3i ;1+i 1 0].’→ ans= 1.0000 1.0000 + 1.0000i

    2.0000 1.00000 + 3.0000i 0

    La transposée du produit de deux matrices(AB)T est donnée par le produit destransposées prises dans l’ordre inverse,i.e.

    (AB)T = BTAT (1.27)

    En effet,

    (AB)Ti j = (AB) ji = ∑k

    a jkbki

    = ∑k

    (AT)k j(BT)ik = ∑

    k

    (BT)ik(AT)k j = (B

    TAT)i j

    Cette propriété peut être aisément étendue au produitde plusieurs matrices de sorte que

    (ABC · · ·G)T = GT · · ·CTBTAT (1.28)3Dans certains textes, la transposée deA est notéẽA.

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 13

    '

    &

    $

    %

    La matrice conjuguéeA d’une matriceA est la matrice obtenue en prenant lecomplexe conjugué de chacun des éléments deA, i.e.

    (A)i j = ai j (1.29)

    Si A est réelle, alors, évidemment,A = A.

    EXEMPLE 1.14 Reprenant la matriceA de l’exemple (1.13), il vient

    A =

    (1 2 −3i

    1− i 1 0

    )

    MATHEMATICA : In:= Conjugate[ {{1, 2, 3I }, {1+I, 1, 0 }}]→ Out:= {{1, 2, -3I }, {1-I, 1, 0 }}

    MATLAB : >> conj([1 2 3i ;1+i 1 0])→ ans= 1.0000 2.0000 0 - 3.0000i

    1.0000 - 1.0000i 1.0000 0⋄'

    &

    $

    %

    La matrice adjointeA∗ (ou hermitienne conjuguée) est la transposée dela conjuguée deA ou, de façon équivalente, la matrice conjuguée de latransposée,i.e.

    A∗ = (A)T

    = (AT) (1.30)

    EXEMPLE 1.15 Reprenant la matriceA de l’exemple (1.13), il vient

    A∗ =

    1 1− i2 1

    −3i 0

    MATHEMATICA : In:= Transpose [Conjugate[ {{1, 2, 3I }, {1+I, 1, 0 }}]]→ Out:= {{1, 1-I }, {2, 1 }, {-3I, 0 }}

    MATLAB : >> [1 2 3i ;1+i 1 0]’→ ans= 1.0000 1.0000 - 1.0000i

    2.0000 1.00000 - 3.0000i 0

    Évidemment, selon la règle écrite précédemment,

    (ABC · · ·G)∗ = G∗ · · ·C∗B∗A∗ (1.31)

    Notons que siA est réelle alorsAT = A∗.

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 14

    1.2.6 Oṕerations élémentaires et formeśechelonńees.

    On dit qu’il existe unerelation linéaireentre les rangéesr1, r2, . . . , rn d’une matriceAlorsque l’on peut trouvern nombresλ1,λ2, . . . ,λn non tous nuls tels que

    n

    ∑l=1

    λl rl = 0 (1.32)

    Les rangées sont alors diteslinéairement dépendantes. Sinon elles sont linéairementindépendantes.

    Pour mettre en évidence d’éventuelles relations linéaires entre les lignes (resp. lescolonnes) d’une matriceA (m×n), il est intéressant d’appliquer une suited’opérationsélémentairesaux lignes (resp.aux colonnes) de cette matrice. Ces opérations élémentairessont de trois types :

    i. permutation de deux lignes (resp.de deux colonnes),

    ii. multiplication d’une ligne (resp.d’une colonne) par une constante non nulle,

    iii. addition aux éléments d’une ligne (resp.d’une colonne) des éléments d’une autreligne (resp.d’une autre colonne).

    �Les opérations élémentaires opérées sur les lignes (resp.les colonnes) d’unematriceA ne modifient pas les relations linéaires existant éventuellement entreles colonnes (resp.les lignes) de celle-ci.

    Considérons le cas des opérations élémentaires sur leslignes.La propriété est évidente pour la permutation de deux lignes.Montrons que la propriété est également vraie pour les deux autres types d’opérations

    en considérant le remplacement de lap-ème ligne lp deA parαlp+βlq oùα 6= 0 etβ sontdes constantes et oùp 6= q. SoitA′ la nouvelle matrice ainsi formée. Les éléments de cettematrice sont donnés par

    {

    a′i j = ai j i = 1, . . . ,m, i 6= p, j = 1, . . . ,na′p j = αap j +βaq j j = 1, . . . ,n

    Si on suppose qu’une relation linéaire existe entre les colonnesc1,c2, . . .cn deA, ceci setraduit par l’existence de constantesλ1, . . . ,λn non toutes nulles telles que

    λ1c1+λ2c2 + . . .+λncn = 0

    ou encoren

    ∑j=1

    λ jai j = 0 i = 1, . . . ,m

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 15

    Évaluant la même expression avec les éléments deA′, il vient– pour touti 6= p

    n

    ∑j=1

    λ ja′i j =n

    ∑j=1

    λ jai j = 0

    – de même pour lap-ème ligne,

    n

    ∑j=1

    λ ja′p j =n

    ∑j=1

    λ j(αap j +βaq j

    )

    = αn

    ∑j=1

    λ jap j +βn

    ∑j=1

    λ jaq j

    = 0

    La même relation linéaire existe donc entre les colonnes deA′.Inversement, si une relation linéaire existe entre les colonnes deA′ alors la même

    relation existe entre les colonnes deA puisque l’on peut passer deA′ àA par les opérationsinverses de celles utilisées pour transformerA.

    Remarquons que les transformations élémentaires appliquées aux lignes (resp.auxcolonnes) deA modifient les coefficientsλi apparaissant dans l’expression (1.32) d’uneéventuelle relation linéaire entre les lignes (resp. les colonnes) deA. Cependant, ellesn’introduisent pas de nouvelles relations linéaires. Dès lors, si les lignes (resp. lescolonnes) d’une matriceA sont linéairement indépendantes, il en est de même des lignes(resp.des colonnes) de toute matriceA′ obtenue en appliquant une suite d’opérationsélémentaires aux lignes (resp.aux colonnes) deA. De même, il existe une correspondancebiunivoque entre les relations linéaires existant entre les rangées (lignes ou colonnes) deA et deA′.

    Par une suite de transformations élémentaires des lignesd’une matriceA (m× n)quelconque, on peut toujours amener celle-ci à uneforme échelonnéeA′ telle que

    i. le premier élément non nul de chaque ligne deA′ est égal à 1 ;

    ii. le premier 1 d’une ligne non nulle apparaı̂t à droite du premier 1 de toute lignesituée plus haut dans la matrice ;

    iii. les lignes formées uniquement de 0 occupent les derni`eres lignes de la matrice.

    Ces trois propriétés impliquent que la matriceA′ ne possède aucun élément non nulsitué à gauche ou en-dessous des élémentsa′ii . Si A

    ′ est carrée, elle est donc triangulairesupérieure.

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 16

    EXEMPLE 1.16 La matrice

    1 ∗ ∗ ∗ ∗ ∗ ∗ ∗0 1 ∗ ∗ ∗ ∗ ∗ ∗0 0 0 1 ∗ ∗ ∗ ∗0 0 0 0 1 ∗ ∗ ∗0 0 0 0 0 0 1 ∗0 0 0 0 0 0 0 0

    (où∗ désigne un scalaire quelconque) est sous forme échelonn´ee. ⋄

    Comme le montre l’exemple suivant, pour amenerA à une forme échelonnée, il suffitde considérer successivement les colonnes deA en y faisant apparaı̂tre les 0 recherchéspar des opérations élémentaires opérées sur les lignes de la matrice.

    EXEMPLE 1.17 Soit

    A =

    2 4 2 4 −63 6 4 −1 24 8 5 1 −1−2 −4 −3 3 −5

    Effectuons d’abord les transformations élémentaires

    l′1 = l1/2

    l′2 = l2−3l1/2l′3 = l3−2l1l′4 = l4 + l1

    pour amener la première colonne à la forme voulue. Il vient

    1 2 1 2 −30 0 1 −7 110 0 1 −7 110 0 −1 7 −11

    La deuxième colonne ne doit donc plus être modifiée. Si on introduit les nouvelles opérationsélémentairesl′′3 = l

    ′3− l′2 et l′′4 = l′3+ l′4, on a finalement

    1 2 1 2 −30 0 1 −7 110 0 0 0 00 0 0 0 0

    qui est bien sous forme échelonnée. ⋄

    En poursuivant les transformations au moyen de transformations élémentaires portantsur les lignes des matrices successives, on peut encore faire en sorte que chaque colonnecontenant un premier élément non nul (égal à 1) d’une ligne de la matrice présente deszéros à toutes les autres positions. On obtient alors uneforme réduite échelonnée. Unetelle forme permet de mettre en évidence les relations lin´eaires éventuelles entre lescolonnes de la matrice.

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 17

    EXEMPLE 1.18 Par la transformation élémentairel′′′1 = l′′1− l′′2, la matrice de l’exemple précédent

    devient

    1 2 0 9 −140 0 1 −7 110 0 0 0 00 0 0 0 0

    qui est une forme réduite échelonnée.

    MATHEMATICA : In:= RowReduce[ {{2, 4, 2, 4, -6 }, {3, 6, 4, -1, 2 },{4, 8, 5, 1, -1 }, {-2, -4, -3, 3, -5 }}]→ Out:= {{1, 2, 0, 9, -14 }, {0, 0, 1, -7, 11 }, {0, 0, 0, 0, 0 },{0, 0, 0, 0, 0 }}

    MATLAB : >> rref([2 4 2 4 -6 ;3 6 4 -1 2 ;4 8 5 1 -1 ;-2 -4 -33 -5])→ ans= 1 2 0 9 -14

    0 0 1 -7 110 0 0 0 00 0 0 0 0

    Notantc1,c2,c3,c4,c5 les colonnes de la matrice initiale, on en déduit que

    c2 = 2c1c4 = 9c1−7c3c5 = −14c1 +11c3

    Par un échange éventuel des colonnes d’une matrice sous forme réduite échelonnée,on peut encore amener toute matrice rectangulaire à uneforme normale échelonnée, c’est-à-dire telle que

    1 0 · · · 0 a1(p+1) . . . a1n0 1 · · · 0 a2(p+1) . . . a2n...

    .... . .

    ......

    ...0 0 · · · 1 ap(p+1) . . . apn0 0 . . . 0 0 . . . 0...

    ......

    ......

    0 0 . . . 0 0 . . . 0

    =

    (Ip B

    0 0

    )

    (1.33)

    où Ip est la matrice identité d’ordrep.

    EXEMPLE 1.19 En permutant les deuxième et troisième colonnes de lamatrice obtenue dansl’exemple précédent, on obtient une forme normale échelonnée

    1 0 2 9 −140 1 0 −7 110 0 0 0 00 0 0 0 0

    =

    (I2 B

    0 0

    )

    où B =

    (2 9 −140 −7 11

    )

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 18

    De même, par des opérations élémentaires sur les colonnes de la matrice, on peutfinalement amener celle-ci à la forme

    (Ip 00 0

    )

    (1.34)

    appelée laforme normalede la matrice. Contrairement aux précédentes, cette forme estunique.

    La forme normale (ou une forme normale échelonnée) d’une matriceA ne permetpas de déterminer les coefficients des relations linéaires existant entre les lignes ou lescolonnes deA (à moins de garder la trace des permutations et multiplications effectuéespour arriver à cette forme). Cependant, comme les opérations élémentaires quelconquesne modifient pas le nombre de relations linéaires entre les rangées d’une matrice, laforme normale permet de mettre en évidence le nombre de relations linéaires entre lesrangées de la matrice initiale. Si la forme normale est (1.34), alors on peut en conclureque la matrice de départ possédaitp lignes linéairement indépendantes etp colonneslinéairement indépendantes. Autrement dit, il existem− p combinaisons linéaires entreles lignes de la matrice intialeA(m×n) etn− p combinaisons linéaires entre les colonnesdeA.

    Incidemment, le passage à la forme normale permet de démontrer que le nombrede lignes linéairement indépendantes d’une matrice est toujours égal au nombre de sescolonnes linéairement indépendantes.

    EXEMPLE 1.20 Dans le cas de la matrice des exemples précédents, il vient, en effectuant lestransformations élémentaires sur les colonnes de la dernière matrice obtenue,

    1 0 0 0 00 1 0 0 00 0 0 0 00 0 0 0 0

    Cette dernière expression constitue la forme normale de lamatrice initiale. ⋄

    1.2.7 D́eterminant d’une matrice carr ée.'

    &

    $

    %

    Le déterminantd’une matrice carréeA est le nombre - complexe en généralpour une matrice complexe mais réel pour une matrice réelle - noté detA ou|A| et défini par les deux règles suivantes :

    i. le déterminant d’une matrice 1× 1 est égal au seul élément de cettematrice,

    det(a11) = a11 (1.35)

    ii. le déterminant d’une matricen× n (n > 1) est égal à la somme desproduits des éléments d’une rangée de la matrice par les cofacteurscorrespondants (première loi des mineurs).

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 19

    Dans cette définition, on appellemineur mi j correspondant à l’élémentai j d’unematriceA de dimensionsn×n le déterminant de la sous-matrice(n−1)×(n−1) obtenueen supprimant la ligne et la colonne deA qui se croisent enai j . Le cofacteur∆i j associéest quant à lui égal au mineurmi j multiplié par(−1)i+ j . La matrice des cofacteurs deAest généralement notée∆A ou plus simplement∆ lorsqu’aucune confusion n’est possible.

    Explicitant le deuxième point de la définition, on a, par exemple, choisissant dedévelopper le déterminant selon lai-èmeligne de la matrice,

    detA =n

    ∑k=1

    (−1)k+iaikmik =n

    ∑k=1

    aik∆ik (1.36)

    Comme les mineurs sont eux-mêmes des déterminants de matrices(n−1)× (n−1), ladéfinition du déterminant est récursive.

    On pourrait croire que le déterminant ainsi défini dépendde la ligne ou de la colonnede la matrice choisie pour effectuer le développement. On démontre, mais nous ne leferons pas ici, qu’il n’en est rien et que la définition donn´ee conduit bien à un résultatunique.

    Remarquons trois cas très souvent rencontrés.– Le déterminant d’une matrice diagonale ou triangulaire (supérieure ou inférieure)

    est égal au produit des éléments de la diagonale principale. En particulier, ledéterminant d’une matrice identité est égal à un.

    – Déterminant d’une matrice 2×2 :∣∣∣∣

    a11 a12a21 a22

    ∣∣∣∣= a11a22−a12a21 (1.37)

    Le déterminant d’une matrice 2×2 est la différence du produit des éléments de ladiagonale principale et du produit des éléments de la diagonale secondaire.

    – Déterminant d’une matrice 3×3 :∣∣∣∣∣∣

    a11 a12 a13a21 a22 a23a31 a32 a33

    ∣∣∣∣∣∣

    =a11a22a33+a21a32a13+a31a12a23−a13a22a31−a23a32a11−a33a12a21 (1.38)

    Une façon pratique d’obtenir ce développement consiste `a recopier les deuxpremières lignes de la matrice en-dessous de celle-ci (comme quatrième etcinquième lignes), d’additionner les produits des trois ´eléments situés sur chaqueparallèle à la diagonale principale et de soustraire les produits des éléments situéssur des parallèles à la diagonale secondaire.

    Le développement explicite d’un déterminant en fonctiondes éléments de la matricecomme dans (1.37) ou (1.38) est appelé ledéveloppement de Laplacedu déterminant. Cesexpressions font apparaı̂tre une propriété fondamentale des déterminants ; le déterminantd’une matrice carréeA d’ordren est le résultat d’une somme den! termes dont une moitiéest affectée du signe + et l’autre moitié est précédée du signe -. Chaque terme de cette

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 20

    somme est le produit den éléments deA et contient un et un seul élément de chaque ligneet de chaque colonne de la matrice4.

    Les mineursmi j apparaissant dans la définition (1.36) du déterminant d’une matriced’ordre n sont parfois appelés mineurs d’ordren− 1. Plus généralement, siA désigneune matricem× n, tout déterminant d’une sous-matrice carrée d’ordrep obtenue ensupprimantm− p lignes etn− p colonnes deA est appelémineur d’ordrep de A. Unmineur d’ordrep correspond donc au déterminant d’une sous-matrice carrée obtenueen sélectionnant les éléments se trouvant à l’intersection de p lignes et dep colonnesdéterminées deA. Si les indices desp lignes et desp colonnes sélectionnées secorrespondent, alors le mineur est ditprincipal. Le mineur d’ordrep formé à partir desppremières lignes et desp premières colonnes deA est appelé lemineur diagonal principald’ordre p.

    Propri étés des d́eterminants.

    – Le déterminant d’un produit de matrices carrées est égal au produit des déterminantsde chacune d’elles5 :

    det(ABC · · ·G) = detA detB detC · · ·detG (1.39)

    Dès lors, même si le produit matriciel n’est pas commutatif, les déterminants desdifférents produits matriciels obtenus en changeant l’ordre des différents facteursdu produit sont par contre tous égaux.

    4Cette propriété, loin d’être une curiosité, est en faitla définition fondamentale du déterminant. On a

    detA = ∑P∈P (1,2,...,n)

    sign(P)n

    ∏i=1

    ai,µi

    où P (1,2, . . . ,n) désigne l’ensemble des permutations desn premiers naturels, oùP(i → µi) désigne unélément quelconque de cet ensemble et où sign(P) désigne laparitéde cette perturbation, soit sign(P) =(−1)k oùk est égal au nombre de permutations de deux éléments dansP.

    Cette expression du déterminant montre que le déterminant dépend linéairement des éléments d’unequelconque de ces rangées. Ainsi, si on noter i les éléments de lai-èmerangée, on a

    detA =n

    ∑i=1

    αir i

    où les coefficientsαi ne dépendent pas des valeurs des éléments de lai-èmerangée. Pour calculer ces derniers,on peut donc considérerr i = δi j et calculer le déterminant de la matrice ainsi obtenue. On trouve

    ∆i j =n

    ∑i=1

    αiδi j = α j

    i.e.α j est le cofacteur de l’élémentr j . On retrouve donc le développement de Laplace et l’indépendance decelui-ci par rapport à la rangée choisie pour effectuer ledéveloppement.

    5C’est une conséquence du théorème de Binet-Cauchy dont on trouvera l’énoncé général et ladémonstration, par exemple, dans [1].

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 21

    EXEMPLE 1.21 Soient

    A =

    (1 23 4

    )

    et B =

    (5 67 9

    )

    On calcule aisément par application de (1.37)

    detA = −2 et detB = 3

    D’autre part,

    AB =

    (19 2443 54

    )

    et BA =

    (23 3434 50

    )

    et on a bien les égalités

    det(AB) = −6 = detA detB = det(BA)

    MATHEMATICA : In:= A {{1, 2 }, {3, 4 }} ; B = {{5, 6 }, {7, 9 }} ;In:= Det[A] → Out:= -2In:= Det[B] → Out:= 3In:= Det[A · B] → Out:= -6In:= Det[B · A] → Out:= -6

    MATLAB : >> A=[1 2 ;3 4] ;B=[5 6 ;7 9] ;>> det(A) → ans= -2>> det(B) → ans= 3>> det(A*B) → ans= -6>> det(B*A) → ans= -6 ⋄

    – Le déterminant deAT est égal à celui deA :

    detAT = detA (1.40)

    Le déterminant de la matrice conjuguée et de l’adjointe sont quant à eux donnés par

    detA = detA∗ = detA (1.41)

    puisque le complexe conjugué du produit de plusieurs nombres complexes est égalau produit des complexes conjugués des différents termes.

    – Si tous les éléments d’une rangée sont nuls alors le déterminant de la matrice estnul.La propriété est évidente, il suffit de développer le déterminant selon cette rangéepour arriver au résultat.

    – Si on multiplie tous les éléments d’une rangée deA par un même facteurλ alors ledéterminant est aussi multiplié parλ.Ici encore, il suffit de développer le déterminant selon cette rangée pour arriver aurésultat puisque les éléments de cette rangée sont multipliés parλ alors que lescofacteurs sont inchangés.Par conséquent, siA est d’ordren, on a

    det(λA) = λndetA (1.42)

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 22

    – Si une des rangées est une combinaison linéaire de plusieurs termes, le déterminantest la combinaison linéaire correspondante des déterminants relatifs à chacun destermes. En particulier, si on notec1,c2, . . . ,ck, . . . ,cn les matrices-colonnes quicomposent la matriceA et si

    ck =p

    ∑l=1

    λlc′l (1.43)

    où lesc′l sont des matrices-colonnes de même dimension queck, alors

    detA = det(c1 c2 · · · ck · · · cn) =p

    ∑l=1

    λl det(c1 c2 · · · c′l · · · cn

    )(1.44)

    La propriété est évidente dès lors que l’on développe le déterminant selon lak-ème

    colonne.– Si on permute deux lignes ou deux colonnes d’une matrice, ledéterminant change

    de signe.La propriété est vraie pour une matrice 2×2 :

    ∣∣∣∣

    a11 a12a21 a22

    ∣∣∣∣= a11a22−a12a21 = −

    ∣∣∣∣

    a21 a22a11 a12

    ∣∣∣∣

    Elle est également aisément vérifiée dans le cas de l’échange de deux lignes ou deuxcolonnes adjacentes d’une matrice carréeA d’ordre quelconque. En effet, soitA′ lamatrice obtenue à partir deA en échangeant les colonnesp et p+1. En développantdetA selon lap-ème colonne et detA′ selon sa(p+1)-ème colonne, on obtient desexpressions qui ne diffèrent que par les signes de tous les cofacteurs. Dès lors, on abien detA′ = −detA.Enfin, la propriété se généralise à l’échange de deux lignes ou de deux colonnesquelconques puisqu’un tel échange peut être réalisé aumoyen d’un nombre impairde lignes ou de colonnes adjacentes.

    – Si deux rangées de la matrice sont identiques, alors le déterminant est nul.En effet, supposons les colonnescp etcq identiques. Il vient, par la règle précédente,

    det(c1 c2 · · · cp · · · cq · · · cn) = −det(c1 c2 · · · cq · · · cp · · · cn)

    Or, puisque les colonnes échangées sont identiques, les deux déterminants sontégaux et

    det(c1 c2 · · · cp · · · cq · · · cn) = 0– Le déterminant d’une matrice est inchangé si on ajoute àune rangée une

    combinaison linéaire des autres rangées.Soit A′ la matrice obtenue, par exemple, en remplaçant la colonnep de A parcp +λcq, il vient

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 23

    detA′ = det(c1 c2 · · · (cp+λcq) · · · cq · · · cn)= det(c1 c2 · · · cp · · · cq · · · cn)

    +λ det(c1 c2 · · · cq · · · cq · · · cn)= det(c1 c2 · · · cp · · · cq · · · cn)= detA

    1.2.8 Calcul du d́eterminant et opérations élémentaires.

    Etant donné le rapport établi par les énoncés précédents entre les opérationsélémentaires présentées au paragraphe 1.2.6 et le calcul des déterminants d’une matricecarrée, on pourra avantageusement évaluer ce dernier en introduisant des opérationsélémentaires successives (portant sur les lignes et/ou les colonnes) amenant la matricede départ à une forme triangulaire ou introduisant un maximum d’éléments nuls.

    EXEMPLE 1.22 Soit à calculer

    detA =

    ∣∣∣∣∣∣∣∣

    1 0 2 30 1 −2 13 −3 4 −2−2 1 −2 1

    ∣∣∣∣∣∣∣∣

    Extrayant un facteur 2 de la troisième colonne et additionnant la deuxième colonne à latroisième, on a

    detA = 2

    ∣∣∣∣∣∣∣∣

    1 0 1 30 1 −1 13 −3 2 −2−2 1 −1 1

    ∣∣∣∣∣∣∣∣

    = 2

    ∣∣∣∣∣∣∣∣

    1 0 1 30 1 0 13 −3 −1 −2−2 1 0 1

    ∣∣∣∣∣∣∣∣

    Si on soustrait la deuxième colonne de la quatrième, on a ensuite

    detA = 2

    ∣∣∣∣∣∣∣∣

    1 0 1 30 1 0 03 −3 −1 1−2 1 0 0

    ∣∣∣∣∣∣∣∣

    Il suffit alors de développer ce déterminant selon la deuxième ligne pour avoir successivement

    detA = 2(−1)2+2∣∣∣∣∣∣

    1 1 33 −1 1−2 0 0

    ∣∣∣∣∣∣

    = 2(−2)(−1)1+3∣∣∣∣

    1 3−1 1

    ∣∣∣∣= (−4)(1+3) = −16

    MATHEMATICA : In:= det[ {{1, 0, 2, 3 }, {0, 1, -2, 1 }, {3, -3, 4, -2 },{-2, 1, -2, 1 }}]→ Out:= -16

    MATLAB : >> det([1 0 2 3 ;0 1 -2 1 ;3 -3 4 -2 ;-2 1 -2 1])→ ans= -16 ⋄

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 24

    1.2.9 D́eterminant et indépendance lińeaire.

    Le calcul du déterminant d’une matriceA permet de tester l’indépendance linéaireentre les lignes et les colonnes deA.��

    ��

    Le déterminant d’une matriceA(n×n) est nul si et seulement s’il existe unerelation linéaireentre les lignes ou les colonnes deA.

    La condition est suffisante. En effet, si on supposeλk 6= 0, il suffit de remplacer lak-ème rangée deA par

    rk +n

    ∑l=1,l 6=k

    λlλk

    rl = 0

    pour annuler tous les éléments de cette rangée. Comme cette opération ne modifie pas ledéterminant (en vertu des propriétés précédentes), on en déduit que le déterminant deAest nul.

    La condition est également nécessaire. En effet, si le déterminant deA est nul, alors ilen est de même du déterminant de la forme normaleA′ obtenue par une suite d’opérationsélémentaires appliquées aux lignes et aux colonnes deA. Si detA′ = 0, la matriceA′ estdonc de la forme

    A′ =(

    Ip 00 0

    )

    où p< n et il existen− p relations linéaires entres les colonnes etn− p relations linéairesentre les lignes deA.

    1.2.10 Inverse d’une matrice.

    Nous avons défini les opérations d’addition et de multiplication des matrices.Examinons la possibilité de définir la division par une matrice.

    Dans le cas de nombres réels, diviser un nombrex par un nombrey revient à multiplierx par l’inverse dey. Cet inverse n’est rien d’autre que le nombre (1/y) dont le produit pary restitue l’élément neutre pour la multiplication,i.e. 1. Procédons de même avec lesmatrices et recherchons donc une inverse de la matriceA, c’est-à-dire une matrice dont lamultiplication parA conduit à la matrice identitéI. Comme la multiplication matriciellen’est pas commutative, il convienta priori de définir

    – unematrice inverse à gauche(ou en avant)A−1g telle que

    A−1g A = I (1.45)

    – unematrice inverse à droite(ou en arrière)A−1d telle que

    AA−1d = I (1.46)

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 25

    Si A est une matricem× n admettant une inverse à gauche, alorsA−1g doit être dedimensionsn× m. De même,A−1d doit aussi être de dimensionsn× m. Le produitA−1g A = In est la matrice identité d’ordren tandis queAA

    −1d = Im est d’ordrem.

    Les matrices inverses à gauche et à droite peuvent ne pas exister ou ne pas être uniques.En particulier, on montrera au chapitre suivant qu’une matrice horizontale ne peut avoirde matrice inverse à gauche et qu’une matrice verticale ne peut avoir de matrice inverse àdroite.

    EXEMPLE 1.23 La matrice

    A =

    1 00 11 0

    admet pour inverse à gauche toute matrice de la forme

    A−1g =(

    α 0 1−α0 1 0

    )

    où α est une constante. En effet,

    A−1g A =(

    α 0 1−α0 1 0

    )

    1 00 11 0

    =

    (1 00 1

    )

    Par contre, elle ne possède pas d’inverse à droite. En effet, si on pose

    A−1d =(

    a b cd e f

    )

    et si on effectue le produit matriciel

    AA−1d =

    1 00 11 0

    (a b cd e f

    )

    =

    1 0 00 1 00 0 1

    alors, en identifiant les termes(AA−1d )11 et (AA−1d )31, on obtienta = 1 eta = 0 ce qui n’est pas

    possible. ⋄

    Inverse d’une matrice carrée.

    Une matrice carréeA peut avoir à la fois une matrice inverse à gaucheA−1g et unematrice inverse à droiteA−1d . Si elles existent, ces deux matrices sont nécessairementégales et de même ordre queA. En effet,

    A−1g = A−1g I = A

    −1g (AA

    −1d ) = A

    −1g AA

    −1d = IA

    −1d = A

    −1d (1.47)

    Dans ce cas, on définira donc lamatrice inversed’une matrice carrée par la relation

    A−1A = I = AA−1 (1.48)

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 26

    La matrice inverse ainsi définie est unique. En effet, siA−1 est l’inverse deA et s’ilexiste une matriceB telle queBA = I alors

    B = BI = BAA−1 = IA−1 = A−1

    Une matrice carrée possédant une inverse est diteinversible, sinon elle estnoninversible.

    Si A est inversible, on peut calculer le déterminant de son inverse à partir de (1.48), ilvient

    detA−1detA = 1 ⇒ detA−1 = 1detA

    (1.49)

    Dès lors, de la même façon qu’on ne peut calculer l’inverse 1/y d’un nombre réely que siy 6= 0, on ne peut définir l’inverse d’une matrice carrée que si son déterminant est non nul.On dit alors que la matrice estnon singulière. Si detA = 0, la matrice est ditesingulière.

    L’énoncé suivant fournit une méthode pratique pour le calcul de l’inverse.'

    &

    $

    %

    Une matriceA carrée possède une inverse si et seulement si elle est nonsingulière. Si detA 6= 0, on a

    A−1 =1

    detA∆T (1.50)

    où∆ désigne la matrice des cofacteurs6 deA.

    Nous avons déjà montré que seule une matrice non singuli`ere peut admettre uneinverse. Prouvons maintenant que, la non-singularité deA garantit l’existence de lamatrice inverse. Pour ce faire, montrons que

    A∆T = (detA) I = ∆TA

    On en déduira alors que la matrice1

    detA∆T

    est bien la matrice inverse recherchée.Formons l’élément(i, j) du produit∆TA. On a

    (∆TA)i j = ∑k

    (∆T)ik(A)k j = ∑k

    ∆kiak j

    – Si i = j, on retrouve le développement du déterminant deA selon saj -ème colonne,soit

    (∆TA) j j = detA6La transposée de la matrice des cofacteurs d’une matrice carréeA, i.e. ∆T, est généralement appelée

    la matrice complémentairedeA. Dans certains textes anglo-saxons, elle est également appelée l’adjointedeA. On rencontre couramment les notationsà et adjA. Nous n’utiliserons cependant pas ces appellationset notations afin d’éviter la confusion avec les matrices transposée et adjointe définies respectivement par(1.26) et (1.30).

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 27

    – Si i 6= j, alors considérons la matriceA′ obtenue en remplaçant lai-èmecolonnede A par sa j -èmecolonne. Le déterminant de cette matrice est nul puisqu’ellepossède deux colonnes identiques. En développant le déterminant deA′ selon lai-èmecolonne, on obtient

    0 = detA′ = ∑k

    ∆′kia′ki = ∑

    k

    ∆kiak j

    puisque lai-èmecolonne deA′ et la j -èmecolonne deA sont identiques ainsi queles mineurs correspondants à lai-èmecolonne. Ce résultat s’énonce souvent sous laforme de ladeuxième loi des mineurs: la somme des produits des éléments d’unerangée par les cofacteurs correspondants d’une rangée parallèle est nulle.Cette propriété permet donc de conclure que

    (∆TA)i j = 0 si i 6= j

    Finalement, on a donc bien la relation∆TA = (detA)I annoncée.La relationA∆T = (detA)I se démontre de la même façon.

    En passant, la démonstration précédente a permis d’établir la propriété suivante .#

    "

    !

    SECONDE LOI DES MINEURSLa somme des produits des éléments d’une rangée et des cofacteurscorrespondants d’une rangée parallèle est nulle quellesque soient les rangées(différentes) considérées.

    EXEMPLE 1.24 Cherchons l’inverse de la matrice

    A =

    1 3 43 −1 6−1 5 1

    Par la règle (1.38), on calcul aisément que

    detA = −2

    D’autre part, la matrice des cofacteurs est donnée par

    ∆ =

    −31 −9 1417 5 −822 6 −10

    Finalement, il vient donc

    A−1 =∆T

    detA=

    15.5 −8.5 −114.5 −2.5 −3−7 4 5

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 28

    MATHEMATICA : In:= Inverse[ {{1, 3, 4 }, {3, -1, 6 }, {-1, 5, 1 }}]→ Out:= {{15.5, -8.5, -11 }, {4.5, -2.5, -3 }, {-7, 4, 5 }}

    MATLAB : >> inv([1 3 4 ; 3 -1 6 ; -1 5 1])→ ans= 15.5 -8.5 -11

    4.5 -2.5 -3-7 4 5

    Propri étés de l’inverse d’une matrice carŕee.

    Les propriétés suivantes des matrices inverses sont ais´ement démontrées (en supposantles matrices non singulières) :

    (A−1)−1 = A (1.51)

    (λA)−1 =1λ

    A−1 ∀λ 6= 0 (1.52)

    (AT)−1 = (A−1)T

    (1.53)

    (A)−1 = A−1 (1.54)

    (A∗)−1 = (A−1)∗

    (1.55)

    (AB · · ·G)−1 = G−1 · · ·B−1A−1 (1.56)

    1.2.11 Matrices carŕees sṕeciales.

    Matrices symétriques et hermitiennes.

    Une matrice réelleA égale à sa transposéeAT est symétrique:

    AT = A ⇐⇒ A est symétrique (1.57)

    Une matrice réelleA égale à l’opposée de sa transposée estanti-symétrique:

    AT = −A ⇐⇒ A est anti-symétrique (1.58)

    Dans ce cas, les éléments formant la diagonale principaledeA sont nécessairement tousnuls.

    Toute matrice réelle peut être écrite comme la somme d’une matrice symétrique etd’une matrice anti-symétrique. En effet,

    A =12(A+AT)+

    12(A−AT) = B+C (1.59)

    oùB =12(A+AT) = BT est symétrique etC =

    12(A−AT) = −CT est anti-symétrique.

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 29

    EXEMPLE 1.25 La matrice

    A =

    1 2 34 5 67 8 9

    n’est ni symétrique ni anti-symétrique. On a cependant,

    A = B+C =

    1 3 53 5 75 7 9

    +

    0 −1 −21 0 −12 1 0

    oùB est symétrique etC anti-symétrique. ⋄

    EXEMPLE 1.26 En travaillant composante par composante, le déplacement des différentséléments d’un corps élastique peut être représenté par

    (u1(x1,x2,x3),u2(x1,x2,x3),u3(x1,x2,x3))

    où x1,x2 et x3 sont les trois coordonnées spatiales etu1,u2 et u3 les déplacements selon lesdirections correspondantes. Les variations spatiales du champ de déplacement sont alors donnéespar la matrice

    (∂u j∂xi

    )

    =

    ∂u1∂x1

    ∂u2∂x1

    ∂u3∂x1

    ∂u1∂x2

    ∂u2∂x2

    ∂u3∂x2

    ∂u1∂x3

    ∂u2∂x3

    ∂u3∂x3

    Cette matrice peut être décomposée en ses parties symétriquesD et anti-symétriquesΩ selon(

    ∂u j∂xi

    )

    =12

    (∂u j∂xi

    +∂ui∂x j

    )

    +12

    (∂u j∂xi

    − ∂ui∂x j

    )

    = D+Ω

    Les matricesD et Ω sont associées, respectivement, au taux de déformation ´elastique et aumouvement de rotation (comme un corps solide) du corps. ⋄

    De la même façon, une matrice esthermitiennesi elle est égale à son adjointe :

    A∗ = A ⇐⇒ A est hermitienne (1.60)Elle estanti-hermitiennesi elle est égale à l’opposée de son adjointe :

    A∗ = −A ⇐⇒ A est anti-hermitienne (1.61)Toute matrice complexe peut être écrite comme la somme d’une matrice hermitienne

    et d’une matrice anti-hermitienne. En effet,

    A =12(A+A∗)+

    12(A−A∗) = B+C (1.62)

    oùB =12(A+A∗) = B∗ est hermitienne etC =

    12(A−A∗) = −C∗ est anti-hermitienne.

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 30

    EXEMPLE 1.27 La matrice

    A =

    1 2i 3− i4i 5− i 6

    7− i 8 9i

    n’est ni hermitienne ni anti-hermitienne. On peut cependant l’écrire sous la forme

    A = B+C =

    1 −i 5i 5 75 7 0

    +

    0 3i −2− i3i −i −1

    2− i 1 9i

    oùB est hermitienne etC est anti-hermitienne. ⋄

    Matrices orthogonales et unitaires.

    Une matrice réelle est diteorthogonalelorsque son inverse est égale à sa transposée :

    AT = A−1 ⇐⇒ A est orthogonale (1.63)

    Ceci n’est évidemment possible que siA est non singulière.Pour une telle matrice, on a

    ATA = I (1.64)

    et donc(detA)2 = detATdetA = detI ⇒ detA = ±1 (1.65)

    EXEMPLE 1.28 Si

    A =

    cosθ −sinθ 0sinθ cosθ 0

    0 0 1

    alors

    ATA =

    cosθ sinθ 0−sinθ cosθ 0

    0 0 1

    cosθ −sinθ 0sinθ cosθ 0

    0 0 1

    =

    1 0 00 1 00 0 1

    La matriceA est donc orthogonale. On vérifie aisément que detA = 1. ⋄

    De même, une matrice estunitairesi son inverse est égale à son adjointe :

    A∗ = A−1 ⇐⇒ A est unitaire (1.66)

    On a alors

    detA∗ = detA = detA−1 =1

    detA⇒ |detA| = 1 (1.67)

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 31

    1.2.12 Matrice normale.

    Une matrice estnormalesi elle commute avec son adjointe :

    AA∗ = A∗A ⇐⇒ A est normale (1.68)

    On montre facilement que les matrices hermitiennes, anti-hermitiennes et unitaires,et par conséquent leurs équivalents réels, les matricessymétriques, anti-symétriques etorthogonales, sont normales. Par exemple, pour une matricehermitienneA = A∗, on a

    AA∗ = AA = A∗A

    De même, les matrices diagonales sont normales.

    1.3 Opérations sur les matrices d́efinies par blocs.

    Les opérations matricielles définies dans les sections précédentes peuvent êtreaisément appliquées aux matrices définies par blocs à condition que les tailles des blocssoient compatibles avec le type des opérations envisagées.

    L’addition de deux matrices peut être réalisée par bloc si les blocs de ces deux matricessont de mêmes tailles. Dans ce cas, si

    A =

    (A11 A12A21 A22

    )

    et B =

    (B11 B12B21 B22

    )

    alors

    λA±µB =(

    λA11±µB11 λA12±µB12λA21±µB21 λA22±µB22

    )

    (1.69)

    De même, si les dimensions des sous-matrices sont compatibles pour effectuer lamultiplication, on peut écrire, par exemple,

    AB =(A11 A12

    )(

    B11B21

    )

    = A11B11+A12B21 (1.70)

    EXEMPLE 1.29 Soit

    A =

    (2 1 30 −1 2

    )

    et B =

    3 −7 7−2 1 40 2 4

    il vient

    AB =

    (20

    )(3 −7 7

    )+

    (1 3−1 2

    )(−2 1 40 2 4

    )

    =

    (6 −14 140 0 0

    )

    +

    (−2 7 162 3 4

    )

    =

    (4 −7 302 3 4

    )

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 32

    En particulier, le produit de deux matricesA(m× r) et B(r × n) peut être obtenuen effectuant le produit deA avec chacune des colonnes deB. Notantc1,c2, . . . ,cn lescolonnes deB, il vient en effet

    AB = A(c1 c2 · · · cn

    )=(Ac1 Ac2 · · · Acn

    )(1.71)

    De même, notantl1, l2, . . . , lm, les lignes deA, on a

    AB =

    l1l2...lm

    B =

    l1B

    l2B...

    lmB

    (1.72)

    Les matrices transposées et adjointes sont aisément calculées en transposant la matriceglobale et en prenant la transposée (resp. l’adjointe) de chacun des blocs.

    EXEMPLE 1.30 Soit

    A =

    (1 2 3i

    1+ i 1 0

    )

    =(

    A11 A12)

    On a

    A∗ =(

    A∗11A∗12

    )

    =

    1 1− i2 1

    −3i 0

    Le calcul de l’inverse et du déterminant d’une matrice carrée peut aussi être effectuésur base d’une partition de celle-ci lorsque les blocs formant la diagonale principale sontcarrés. Considérons tout d’abord une matrice de la forme

    (A B

    0 D

    )

    =

    (I B

    0 D

    )(A 0

    0 I

    )

    (1.73)

    oùA etD sont des sous-matrices carrées. Il vient directement∣∣∣∣

    A B

    0 D

    ∣∣∣∣= detA detD (1.74)

    Plus généralement, on montre aisément que le déterminant d’une matriceAtriangulaire par blocs, dont la diagonale est formée de blocs carrésA1, . . . ,Ak, est donnépar

    detA = |diag(A1,A2, · · · ,Ak)| =k

    ∏i=1

    detAi (1.75)

    On déduit de (1.74) qu’une matrice de la forme (1.73) est inversible si et seulementsi A et D sont elles-mêmes inversibles. Sous cette hypothèse, recherchons l’inverse de lamatrice (1.73) en résolvant

    (A B

    0 D

    )(W X

    Y Z

    )

    =

    (Ip 00 Iq

    )

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 33

    où les dimensions deA,B,D,W,X,Y et Z sont respectivementp× p, p× q,q× q,p× p, p×q,q× p etq×q, il vient

    AW+BY = Ip

    AX+BZ = 0

    DY = 0

    DZ = Iq

    soit

    W = A−1

    X = −A−1BD−1Y = 0

    Z = D−1

    Dès lors,(

    A B

    0 D

    )−1=

    (A−1 −A−1BD−10 D−1

    )

    (1.76)

    De même, on a(

    A 0

    C D

    )−1=

    (A−1 0

    −D−1CA−1 D−1)

    (1.77)

    En particulier, siB = 0 etC = 0, alors

    (A 0

    0 D

    )−1=

    (A−1 0

    0 D−1

    )

    (1.78)

    Remarquons que les expressions (1.76) et (1.77) permettentde montrer aisément quel’inverse d’une matrice triangulaire (supérieure ou inf´erieure) est une matrice de mêmetype.

    La partition permet d’éviter l’inversion de la matrice complète au profit de l’inversiondes seuls blocsA et D et de deux multiplications matricielles. Dans le cas où la matriceest de grande taille, ceci constitue une diminution importante du nombre d’opérations.

    EXEMPLE 1.31 Soit

    M =

    1 2 2 −11 3 1 −20 0 1 20 0 1 3

    On calcule aisément

    detM =

    ∣∣∣∣

    1 21 3

    ∣∣∣∣

    2

    = 1

    Utilisant les notations de cette section, on a aussi

    A−1 = D−1 =

    (1 21 3

    )−1=

    (3 −2−1 1

    )

    et

    −A−1B D−1 = −(

    3 −2−1 1

    )(2 −11 −2

    )(3 −2−1 1

    )

    =

    (−11 7

    2 −1

    )

  • Usag

    elim

    it́eCHAPITRE 1. CALCUL MATRICIEL. 34

    de sorte que

    1 2 2 −11 3 1 −20 0 1 20 0 1 3

    −1

    =

    3 −2 −11 7−1 1 2 −10 0 3 −20 0 −1 1

    Dans le cas plus général d’une matrice de la forme(

    A B

    C D

    )

    (1.79)

    oùA etD sont des sous-matrices carrées, on peut écrire, siA est non singulière,(

    A B

    C D

    )

    =

    (I 0

    CA−1 I

    )(A 00 D−CA−1B

    )(I A−1B0 I

    )

    (1.80)

    et donc ∣∣∣∣

    A B

    C D

    ∣∣∣∣= detA det(D−CA−1B) (1.81)

    où la matriceF = D−CA−1B est connue sous le nom decomplément de SchurdeA.Si A etF sont inversibles, on a alors, par application des résultats précédents

    (A B

    C D

    )−1=

    (I A−1B0 I

    )−1 (A 0

    0 F

    )−1(I 0

    CA−1 I

    )−1

    =

    (I −A−1B0 I

    )(A−1 0

    0 F−1

    )(I 0

    −CA−1 I

    )

    =

    (A−1 +A−1BF−1CA−1 −A−1BF−1

    −F−1CA−1 F−1)

    (1.82)

    En procédant de la même façon, on peut également montrerque, siD est inversible,alors ∣

    ∣∣∣

    A B

    C D

    ∣∣∣∣= detD det(A−BD−1C) (1.83)

    Si G = A−BD−1C est aussi inversible, alors(

    A B

    C D

    )−1=

    (G−1 −G−1BD−1

    −D−1CG−1 D−1+D−1CG−1BD−1)

    (1.84)

    Les expressions (1.82) et (1.84) sont connues sous le nom deformules de Frobenius-Schur.

  • Usag

    elim

    it́eChapitre 2Algèbre linéaire.

    2.1 Espace vectoriel.

    En physique, on introduit un vecteur chaque fois que l’on désire représenter unegrandeur qui possède une intensité et une direction déterminées. On figure alors cettegrandeur dans l’espace par une flèche. On parle aussi des composantes de ce vecteur dansun repère donné. Cependant, on sait que ces composantes d´ependent du repère choisi alorsque le vecteur lui-même est indépendant de ce choix. Dans ce chapitre, on définira unestructure mathématique abstraite qui permet de décrire globalement les propriétés de toutensemble d’objets qui se comportent comme ces vecteurs. Ainsi, on peut démontrer, unefois pour toutes, les propriétés communes d’ensembles d’éléments aussi divers que desvecteurs géométriques, des matrices, des fonctions, desnombres,. . .

    On dit qu’un ensemble d’objets, appelésvecteurs, a, b, c, ... forment unespacevectoriel linéaireE (ou plus simplement un espace vectoriel) si

    i. on définit une opération d’addition entre ces vecteurs telle que

    ∀a,b ∈ E,a+b ∈ E (2.1)

    et jouissant des propriétés decommutativité

    a+b = b+a (2.2)

    et d’associativitéa+(b+c) = (a+b)+c = a+b+c (2.3)

    ii. on définit une opération de multiplication par un scalaire (complexe) telle que

    ∀a∈ E,∀λ ∈ C,λa∈ E (2.4)

    et jouissant des propriétés dedistributivité

    λ(a+b) = λa+λb (2.5)

    35

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 36

    (λ+µ)a = λa+µa (2.6)et d’associativité

    λ(µa) = (λµ)a= λ µ a (2.7)iii. il existe un vecteur neutre0∈ E tel que

    a+0 = a (2.8)

    iv. à tout vecteura deE, on peut faire correspondre sonopposé, noté−a, tel quea+(−a) = 0 (2.9)

    v. la multiplication d’un vecteur par l’unité laisse ce vecteur inchangé :

    1a = a (2.10)

    Dans cette définition, les scalairesλ et µ sont complexes. On dit alors que l’espacevectoriel est défini sur le corps des nombres complexes et qu’il s’agit d’un espace vectorielcomplexe. Si, par contre, on ne considère que des scalairesréels, alors l’espace vectorielest dit réel et défini sur le corps des réels.

    Remarquons que l’élément neutre0 est unique. En effet, s’il y avait deux élémentsneutres0 et 0′, alors il viendrait,∀a,b ∈ E,

    a+0 = a et 0′ +b = b

    et donc, en particulier poura = 0′ et b = 0,

    0′ = 0′+0 = 0

    2.1.1 Exemples d’espaces vectoriels.

    La notion d’espace vectoriel couvre un grand nombre d’ensembles d’objets différents.On vérifie aisément que l’ensemble habituel des vecteurs utilisés en physique muni des

    lois d’addition des vecteurs et de multiplication par un scalaire réel répond bien à chacundes points de la définition d’un espace vectoriel. Il s’agitdonc d’un espace vectoriel réel.

    De même, l’ensembleCmn des matrices complexes àm lignes etn colonnes muni desopérations d’addition et de multiplication par un scalaire (définies au premier chapitre) etcomprenant l’élément neutre0 définit bien un espace vectoriel complexe. En particulier,l’ensemble des vecteurs-colonnes àn composantesCn est un espace vectoriel sur le corpsdes nombres complexes.

    Les fonctions réelles continues sur un intervalle[a,b]⊂R forment un espace vectorielréelF([a,b],R) pour les lois d’addition et de multiplication par un réel d´efinies,∀ f ,g∈F([a,b],R), ∀x∈ [a,b] et∀λ ∈ R, par

    ( f +g)(x) = f (x)+g(x) (2.11)

    et(λ f )(x) = λ f (x) (2.12)

    L’ensemble des nombres réels avec les définitions classiques de l’addition et de lamultiplication forme un espace vectoriel réel.

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 37

    2.1.2 Sous-espace vectoriel.

    Si E est un espace vectoriel etE′ une partie non vide deE, on dit queE′ est unsous-espace vectorieldeE si la restriction des lois deE aux éléments deE′ fait deE′ un espacevectoriel.

    En principe, pour montrer queE′ est un sous-espace vectoriel, il faudrait vérifier tousles axiomes de la définition d’un espace vectoriel. Cependant, les opérations d’additionde deux vecteurs et de multiplication par un scalaire sont identiques à celles définies surE et possèdent donc les mêmes propriétés de commutativité, associativité et distributivité.Dès lors,E′ est un sous-espace vectoriel deE si et seulement si

    • E′ est non vide• a,b ∈ E′ ⇒ a+b ∈ E′,

    a∈ E′,λ ∈ C ⇒ λa∈ E′ou, ce qui est équivalent,

    a,b ∈ E′;λ,µ∈ C ⇒ λa+µb ∈ E′ (2.13)Les conditions sont évidemment nécessaires. Elles sont aussi suffisantes puisque, si (2.13)est vérifiée,

    – le neutre0 deE appartient aussi àE′ (il suffit de prendreλ = µ= 0),– l’opposé−a de tout élémenta deE′ appartient aussi àE′ (il suffit de prendreλ =−1

    et µ= 0).En particulier, l’enveloppe linéaired’un ensemble de vecteursa1, a2, ....,an (n > 0)

    deE, c’est-à-dire l’ensemble des vecteursx qui peuvent s’écrire sous la forme

    x = λ1a1+λ2a2+ · · ·+λnan (2.14)(oùλ1,λ2, . . . ,λn sont des scalaires quelconques), constitue un sous-espacevectorielE′ deE. On dit des vecteursa1, a2, ....,an qu’ils sontgénérateursou qu’ils forment unepartiegénératricedeE′.

    EXEMPLE 2.1 Deux vecteurs non alignés deR3 génèrent un plan dans l’espace. Ce plan est unsous-espace vectoriel deR3. ⋄

    EXEMPLE 2.2 Les fonctions puissancesx0,x1, . . . ,xn sont des vecteurs particuliers de l’espacevectoriel des fonctions réelles continues sur[a,b], F([a,b],R). Leurs combinaisons linéaires

    λnxn + λn−1xn−1 + · · ·+ λ1x+ λ0 où λn,λn−1, . . . ,λ1,λ0 ∈ Rforment l’espace vectoriel des polynômes réels de degréinférieur ou égal àn, Pn, qui est un sous-espace vectoriel deF([a,b],R). ⋄

    2.1.3 Base et dimension d’un espace vectoriel.

    Des vecteursa1,a2, . . . ,an sont dits linéairement dépendants, on dit aussi qu’ilsforment unefamille liée, si on peut trouvern scalairesλ1,λ2, . . . ,λn non tous nuls telsque

    λ1a1+λ2a2+ · · ·+λnan = 0 (2.15)

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 38

    Dans ce cas, au moins un des vecteurs peut être exprimé comme une combinaison linéairedes autres vecteurs. Inversement, si

    n

    ∑i=1

    λiai = 0 ⇒ λi = 0, i = 1,2, . . . ,n (2.16)

    les vecteurs sont ditslinéairement indépendants. On dit aussi que les vecteurs forment unefamille libre.

    Les vecteurs d’une famille infinie{ai}(i = 1,2, . . .) sont linéairement indépendants sion ne peut en extraire aucune sous-famille finie de vecteurs linéairement dépendants. Lesvecteurs sont linéairement dépendants si, au contraire,la famille contient une sous-famillefinie de vecteurs linéairement dépendants.

    En fonction de cette définition, on obtient les résultats suivants.

    i. Des vecteurs parmi lesquels se trouve0 sont linéairement dépendants.

    ii. Si quelques-uns des vecteurs d’un ensemble sont linéairement dépendants, tous lesvecteurs de cet ensemble sont linéairement dépendants.

    iii. Tout sous-ensemble d’un ensemble de vecteurs linéairement indépendants necontient lui-même que des vecteurs linéairement indépendants.

    iv. Parmi les combinaisons linéaires dep vecteurs linéairement indépendants, on nepeut trouver au plus quep vecteurs linéairement indépendants.

    Un espace vectorielE est dit dedimension finies’il existe dansE une partie génératricefinie. Dans le cas contraire, il est dit dedimension infinie.

    Les n vecteursa1, a2, . . . , an générateurs d’un sous-espace vectorielE′ ne sont pasforcément linéairement indépendants. Supposons que seulementm (m< n) d’entre euxsoient linéairement indépendants. Lesn−m vecteurs restants peuvent donc être expriméscomme des combinaisons linéaires desm premiers et le sous-espace vectoriel peut êtreconsidéré comme engendré par les seulsm vecteurs linéairement indépendants. Pourdécrire le plus simplement possible un espace vectoriel quelconque, on introduit doncla notion de base.

    On appellebase d’un espace vectorielE toute famille{e1,e2, . . . ,en} de vecteurs deE qui est à la fois libre et génératrice deE. Les vecteurse1,e2, . . . ,en sont alors appelésvecteurs de base.

    Dans un espace vectorielE de dimension finie, toutes les bases possèdent le mêmenombre d’éléments. En effet, siei (i = 1,2, . . . ,m) et e′j ( j = 1,2, . . . ,n) désignent deuxbases d’un même espace vectorielE avecm> n, alors, tous les vecteursei (i = 1,2, . . . ,m)peuvent être obtenus par des combinaisons linéaires des vecteurs dee′j ( j = 1,2, . . . ,n) etne peuvent donc pas être linéairement indépendants en vertu du point (iv.) ci-dessus. Onen déduit quem= n.

    Il est donc légitime de définir ladimensiondimE d’un espace vectoriel (ou d’unsous-espace vectoriel)E de dimension finie comme étant le nombre d’éléments d’unebase quelconque deE. De ce fait, dimE représente le nombre maximum de vecteurs

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 39

    linéairement indépendants que l’on peut trouver dansE. C’est aussi le nombre minimumde vecteurs générateurs deE.

    En particulier, la dimension d’un sous-espace vectorielE′ engendré parn vecteurs estégale au nombremdes vecteurs linéairement indépendants qui peuvent être trouvés parmiceux-ci. On notera que tout sous-espaceE′ d’un espace vectorielE de dimension finie estlui-même de dimension finie et on a

    dimE′ ≤ dimE (2.17)

    L’égalité dans cette relation a lieu si et seulement siE = E′.

    EXEMPLE 2.3 DansCn, l’ensemble desn-uples de nombres rangés dans une matrice-colonne,

    x =

    x1x2...

    xn

    ,

    les vecteurs

    e1 =

    10...0

    e2 =

    01...0

    · · · en =

    00...1

    forment une base particulière que l’on appelle labase naturelleoubase canonique.En effet, la famille des{e1,e2, . . . ,en} est libre et génératrice : tout vecteur deCn peut être

    exprimé sous la forme d’une combinaison linéaire

    x =

    x1x2...

    xn

    =n

    ∑i=1

    xiei

    La dimension deCn est égale àn. ⋄

    EXEMPLE 2.4 L’ensemble des fonctions réelles continues sur l’intervalle [a,b] est de dimensioninfinie. On ne peut trouver de famille finie de fonctions continues qui génèrent l’ensemble desfonctions réelles continues sur[a,b]. ⋄

    EXEMPLE 2.5 L’ensemblePn(x) des polynômes de degré inférieur ou égal àn∈ N constitue unespace vectoriel de de dimensionn+1 puisque chacun des polynômes de cet espace peut être écritcomme une combinaison linéaire desn+1 éléments linéairement indépendants

    x0,x1,x2, . . . ,xn

    Ceux-ci forment une base dePn(x). ⋄

    Dans la suite de ce cours, on se limitera aux espaces vectoriels de dimension finie.

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 40

    2.1.4 Base et composantes d’un vecteur.

    Une base deE est un ensemble de vecteurs linéairement indépendants qui engendrentE. Dès lors, six est un vecteur arbitraire deE, x peut être exprimé comme une combinaisonlinéaire des vecteurs de base :

    x = x1e1+x2e2 + · · ·+xnen =n

    ∑i=1

    xiei (2.18)

    Les coefficientsxi de cette combinaison linéaire sont lescomposantesdex dans la basedesei .

    La représentation dex dans une base donnée est unique. En effet, s’il n’en était pasainsi, on pourrait écrire

    x =n

    ∑i=1

    xiei et x =n

    ∑i=1

    x′iei

    Par différence, on aurait alors

    0 =n

    ∑i=1

    (xi −x′i)ei

    Or, comme lesei sont linéairement indépendants, cela n’est possible quesi xi = x′i pouri = 1, · · · ,n.

    N’importe quel ensemble den vecteurs linéairement indépendants peut formerune base d’un espace vectoriel de dimensionn. Si on choisit des vecteurs différentse′1,e

    ′2, . . . ,e

    ′n, on peut aussi écrirex comme une combinaison linéaire de ces vecteurs :

    x = x′1e′1+x

    ′2e

    ′2 + · · ·+x′ne′n =

    n

    ∑i=1

    x′ie′i (2.19)

    Insistons sur le fait que le vecteurx lui-même est indépendant de la base. Seules sescomposantes en dépendent. Dès lors, il convient de faire la différence, aussi bien au niveaude la notation que de l’interprétation, entre le vecteurx et les matrices-colonnesx oux′ desesn composantes dans les bases desei et dese′i .

    Remarquons pour conclure cette présentation du concept debase que, si on choisitm < n vecteurs linéairement indépendants dans un espaceE de dimensionn, certainsvecteurs deE ne pourront pas être exprimés comme une combinaison linéaire desm vecteurs choisis. On dit que la base formée par ces vecteursn’est pas complète.Cependant, il sera toujours possible de leur adjoindren−mvecteurs de façon à compléterla base.À l’inverse, si on tente de déterminer l’expression d’un vecteur x commecombinaison linéaire dep > n vecteurs (qui ne sont donc pas linéairement indépendants),le développement ne sera pas unique.

    EXEMPLE 2.6 Dans la basex0,x1,x2, . . . ,xn de l’espacePn des polynômes de degrén, toutélémentPn(x) dePn peut s’écrire

    Pn(x) =n

    ∑i=0

    λixi

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 41

    où lesλi sont les composantes dePn(x) dans la base choisie. Dans la base choisie, on peut doncreprésenter le polynôme par la matrice-colonne de ses composantes

    λ0λ1...

    λn

    2.1.5 Produit scalaire.

    On introduit généralement une opération supplémentaire dans un espace vectorielen définissant, outre l’addition et la multiplication par un scalaire, leproduit scalaireou produit internede deux vecteurs. Le produit scalaire(a|b) (on écrit aussi parfois< a,b >) associe un scalaire à chaque couple de vecteursa et b et constitue de ce faitune généralisation du produit scalaire introduit en géométrie classique.

    Pour être appelée produit scalaire, une application doitposséder les trois propriétéssuivantes :'

    &

    $

    %

    i. le produit scalaire est uneforme hermitienne:

    (a|b) = (b|a) (2.20)

    ii. le produit scalaire est uneforme sesquilinéaire:(

    p

    ∑k=1

    λkak|q

    ∑l=1

    µl bl

    )

    =p

    ∑k=1

    q

    ∑l=1

    λkµl(ak|bl ) (2.21)

    iii. le produit scalaire est uneforme définie positive:

    (a|a) ≥ 0 (2.22)

    l’égalité ayant lieu si et seulement sia = 0.

    Ainsi donc, le produit scalaire n’est commutatif que dans lecas d’un espace vectorielréel.

    Un espace vectoriel de dimension finie muni d’un produit scalaire est appelé unespaceeuclidien.

    Poursuivant l’analogie avec le produit scalaire de deux vecteurs géométriques del’espace réel tridimensionnel, on dit que deux vecteurs sont orthogonauxsi leur produitscalaire est nul.

    Deux vecteurs sontparallèless’ils sont multiples l’un de l’autre.

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 42

    2.1.6 Norme euclidienne.

    En accord encore avec la définition classique de la norme utilisée en géométrie, onintroduit la définition suivante.�

    �La norme euclidienned’un vecteura est le nombre positif donné par

    ‖a‖ =√

    (a|a) ≥ 0 (2.23)

    On dit qu’un vecteur estnorméou unitaire lorsque sa norme est égale à un. Desvecteurs normés mutuellement orthogonaux sont ditsorthonormés.

    2.1.7 Évaluation du produit scalaire et de la norme euclidienne.

    Dans un espace vectorielE, le produit scalaire (et la norme euclidienne) de tout couplede vecteurs est entièrement déterminé par le choix des produits scalaires des vecteursformant une base deE.

    En effet, considérons les vecteurse′1, e′2,. . . , e

    ′n formant une base particulière deE et

    fixons arbitrairement lesn2 nombres

    gi j =(e′j |e′i

    )(2.24)

    Dans la basee′1, e′2,. . . ,e

    ′n, deux vecteurs quelconquesa et b s’écrivent (de façon unique)

    a =n

    ∑i=1

    a′ie′i et b =

    n

    ∑j=1

    b′je′j (2.25)

    Par application de (2.21), on obtient

    (a|b) =(

    n

    ∑i=1

    a′ie′i |

    n

    ∑j=1

    b′je′j

    )

    =n

    ∑i=1

    n

    ∑j=1

    a′ib′j

    (e′i |e′j

    )

    =n

    ∑i=1

    n

    ∑j=1

    a′ig ji b′j

    (2.26)

    qui est bien entièrement défini par la donnée de la basee′1, e′2,. . . , e

    ′n et des produits

    scalaires(

    e′i |e′j)

    des vecteurs de cette base.

    De même, la norme euclidienne d’un vecteur quelconque est une fonction descoordonnées de ce vecteur dans la base choisie et desgi j , soit1

    ‖a‖ =√

    (a|a) =√

    n

    ∑i=1

    n

    ∑j=1

    a′ig ji a′j (2.27)

    1En anticipant sur les concepts introduits à la section 3.7,remarquons queG doit être définie positivepour satisfaire à la condition (2.22).

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 43

    En adoptant une écriture matricielle, les relations (2.26) et (2.27) peuvent s’écrirerespectivement

    (a|b) = b′∗Ga′ (2.28)et

    ‖a‖ =√

    a′∗Ga′ (2.29)

    où les matrices-colonnesa′ et b′ désignent les composantes des vecteursa et b dans labase considérée et où les éléments de la matriceG sont les nombresgi j définis plus haut.Par la propriété (2.20) du produit scalaire, ces nombres sont tels quegi j = g ji , i.e. lamatriceG est hermitienne.

    Le cas le plus intéressant en pratique est celui où on définit unebase orthonormée, i.e.un ensemble den vecteurs de basee1, e2, . . . ,en qui sont à la fois normés et mutuellementorthogonaux deux à deux. Dans ce cas,

    g ji = gi j =(ei |ej

    )= δi j (2.30)

    où δi j est le symboledelta de Kroneckertel que

    δi j =

    {

    1 si i = j

    0 si i 6= j (2.31)

    Dans une telle base, les expressions du produit scalaire et de la norme euclidiennedeviennent simplement

    (a|b) =n

    ∑i=1

    aibi = b∗a (2.32)

    et

    ‖a‖ =√

    n

    ∑i=1

    |ai|2 =√

    a∗a (2.33)

    oùa etb désignent les composantes des vecteursa etb dans la base orthonormée choisie.Remarquons que, conformément à (2.20), les relations (2.26) et (2.32) montrent que

    le produit scalaire n’est pas commutatif dans un espace vectoriel complexe mais est biencommutatif dans un espace vectoriel réel.

    Non seulement l’évaluation du produit scalaire et de la norme est grandement facilitéepar l’adoption d’une base orthonormée, mais aussi la détermination des composantes d’unvecteur. En effet, dans la base orthonorméee1, e2, . . . , en, la composante d’un vecteuraselon le vecteur de baseej s’identifie au produit scalaire de ces deux derniers vecteurs :

    (a|ej

    )=

    (n

    ∑i=1

    aiei |ej)

    =n

    ∑i=1

    ai(ei |ej

    )= a j (2.34)

    Dans une base quelconque, par contre,

    (a|e′j

    )=

    (n

    ∑i=1

    a′ie′i |e′j

    )

    =n

    ∑i=1

    a′i(e′i |e′j

    )=

    n

    ∑i=1

    a′ig ji (2.35)

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 44

    et les composantes dea ne sont donc généralement pas les produits scalaires dea par lesdifférents vecteurs de la base.

    Les définitions des quelques paragraphes précédents et les résultats de cette sectionpermettent de jeter un éclairage nouveau sur les matrices unitaires (et orthogonales dansle cas réel). Pour rappel, ces matrices sont telles que

    A∗ = A−1 (2.36)

    et doncA∗A = I (2.37)

    Si on identifie les colonnes d’une telle matrice parc1, c2, . . . ,cn, (2.37) peut s’écrire

    A∗A =

    c1∗

    c2∗

    ...cn

    (c1 c2 · · · cn

    )=

    (c1∗c1) (c1∗c2) · · · (c1∗cn)

    (c2∗c1) (c2∗c2) · · · (c2∗cn)...

    .... . .

    ...(cn

    ∗c1) (cn∗c2) · · · (cn∗cn)

    = I (2.38)

    Il vient doncci∗c j = δi j (2.39)

    i.e. les colonnes d’une matrice unitaire (ou orthogonale) sont formées des composantes(dans une base orthonormée) de vecteurs normés mutuellement orthogonaux. Il en est demême des lignes d’une matrice unitaire ou orthogonale puisque, notantl1, l2, . . . ,ln leslignes deA et utilisant la relation

    AA∗ = I (2.40)

    on obtientli l j

    ∗ = δi j (2.41)

    2.1.8 Inégalités classiques des normes.

    Quels que soient les vecteurs d’un espace vectoriel normé au sens de (2.23), lesinégalités suivantes sont vérifiées.#

    "

    !

    Inégalité de Schwarz|(a|b)| ≤ ‖a‖‖b‖ (2.42)

    où le signe d’égalité a lieu si et seulement sia et b sont linéairementdépendants.

    En géométrie, on sait que|a ·b| = ‖a‖‖b‖|cosθ| ≤ ‖a‖‖b‖ où θ est l’angle entre lesdeux vecteurs et l’inégalité de Schwarz est bien vérifiée. Dans le cas d’un espace vectorielquelconque, l’inégalité peut être prouvée en considérant

    ‖a+λb‖2 = (a+λb|a+λb) = (a|a)+λ(a|b)+λ(b|a)+λλ(b|b) ≥ 0

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 45

    Si on écrit le nombre complexe(a|b) sous la forme2 |(a|b)|eiα, alors‖a+λb‖2 = ‖a‖2+ |λ|2‖b‖2 +λ|(a|b)|eiα +λ|(a|b)|e−iα ≥ 0

    Choisissant en particulierλ = r eiα, il vient

    ‖a+λb‖2 = ‖a‖2+ r2‖b‖2+2r|(a|b)| ≥ 0Évaluant le discriminant de cette expression quadratique de r, il vient

    4|(a|b)|2 ≤ 4‖a‖2‖b‖2

    d’où le résultat (tous les facteurs étant positifs).Le signe d’égalité ne peut apparaı̂tre dans (2.42) que si et seulement sia et b sont

    linéairement dépendants. En effet, d’une part, sib = αa (ou a = αb) avecα ∈ C, onvérifie aisément que

    |(a|b)| = |(a|αa)| = |α(a|a)| = |α|‖a‖2 = ‖a‖ ‖b‖D’autre part, si (2.42) est vérifié avec le signe d’égalité, alors le discriminant del’expression quadratique précédente est nul. Dans ce cas, il existe unr et donc unλ telque

    a+λb = 0i.e. les deux vecteurs sont linéairement dépendants.

    ���

    ��

    Inégalité triangulaire‖a+b‖ ≤ ‖a‖+‖b‖ (2.43)

    La preuve utilise l’inégalité de Schwarz.En effet,

    ‖a+b‖2 = ‖a‖2+‖b‖2 +2ℜ(a|b) ≤ ‖a‖2+‖b‖2+2|(a|b)|≤ ‖a‖2+‖b‖2+2‖a‖‖b‖ = (‖a‖+‖b‖)2

    d’où le résultat.

    �#

    "

    !

    Égalité du parallélogramme

    ‖a+b‖2+‖a−b‖2 = 2(‖a‖2+‖b‖2

    )(2.44)

    La démonstration résulte de l’application de la définition du produit scalaire.

    2On note eiα = cosα+ i sinα = cisα.

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 46

    2.1.9 Ǵenéralisation de la notion de norme.

    La relation (2.23) définit la norme euclidienne d’un vecteur en fonction du produitscalaire ; la norme est diteinduite par le produit scalaire. Bien que très utilisée, cettefaçon de définir la norme n’est pas la seule possible. En général, on introduit la définitionsuivante.'

    &

    $

    %

    Une norme sur un espace vectorielE est une application qui, à tout vecteura∈ E associe un nombre réel‖a‖ tel que

    i. la norme est définie positive :

    ‖a‖ ≥ 0 (2.45)

    l’égalité ayant lieu si et seulement sia = 0 ;

    ii. la norme est linéaire :‖αa‖ = |α|‖a‖ (2.46)

    pour tout scalaireα ;iii. la norme satisfait à l’inégalité triangulaire :

    ‖a+b‖ ≤ ‖a‖+‖b‖ (2.47)

    Dans une base orthonormée, on peut par exemple définir les normes

    ‖a‖1 =n

    ∑i=1

    |ai| (2.48)

    ou

    ‖a‖2 =√

    n

    ∑i=1

    |ai|2 (2.49)

    ou encore‖a‖∞ = sup

    i=1...n|ai| (2.50)

    et choisir de travailler avec l’une ou l’autre norme selon les besoins théoriques ou lafacilité d’évaluation de la norme. La norme euclidienne introduite précédemment en(2.33) correspond à la norme‖a‖2.

    Norme matricielle.

    Dans le cas particulier de l’espace vectorielCmn des matricesm×n, la base naturelleest formée desm· n matrices élémentairesEi j peuplées uniquement de zéros sauf pour

  • Usag

    elim

    it́eCHAPITRE 2. ALGÈBRE LINÉAIRE. 47

    l’élémenti j égal à 1,i.e. les matrices du type

    Ei j =

    0 0 · · · 0 · · · 00 0 0 0...

    ..... .

    ......

    0 0 1 0...

    ..... .

    ......

    0 0 · · · 0 · · · 0

    (2.51)

    Toute matriceA s’exprime en effet naturellement et de façon unique en fonction desmatrices élémentairesEi j sous la forme

    A =m

    ∑i=1

    n

    ∑j=1

    ai j Ei j (2.52)

    Si on définit le produit scalaire de telle façon que(Ei j |Ekl

    )= δikδ jl (2.53)

    c’est-à-dire si on considère que les matrices élémentaires sont orthonormées, alors leproduit scalaire de deux matrices quelconques est entièrement défini et est donné par

    (A|B) =(

    m

    ∑i=1

    n

    ∑j=1

    ai j Ei j |m

    ∑k=1