Traitement Numerique Du Signal

of 79 /79
TRAITEMENT NUMERIQUE DU SIGNAL INTRODUCTION Pourquoi faire du traitement numérique du signal ? Le mot signal désigne le résultat de la mesure d’une grandeur physique. Sans restreindre en aucune façon notre discours, le résultat obtenu sera vu comme une fonction du temps. On dira alors que le signal est analogique ou à temps continu si la mesure est disponible de façon continue à tout instant et numérique à temps discret si elle n’est observée qu’à des instants discrets particuliers en général régulièrement espacés. Le traitement numérique du signal TNS consiste à traiter des signaux à temps discret. L’émergence du TNS est liée, comme pour de nombreux autres domaines, au perfectionnement des composants électroniques. Ce dernier a stimulé l’imagination des scientifiques et des futurologues, engendrant du même coup de nouveaux problèmes et besoins et, avec eux, la nécessité de disposer d’outils encore plus puissants. Les microprocesseurs, dédiés à l’origine aux traitements purement informatiques, ou à des fonctions simples de contrôle, sont désormais indispensables en TNS. Ils ont facilité la mise en place d’algorithmes qu’il aurait été bien difficile de mettre en œuvre autrement. Il suffit pour s’en convaincre de regarder du côté des applications grand public telles que télévision haute définition, radiodiffusion numérique, téléphonie mobile, applications multimedia, etc. Tous ces services nouveaux utilisent largement le traitement numérique du signal en mettant en œuvre des algorithmes parfois extrêmement complexes et nécessitant des puissances de calcul considérables. Pour se limiter à quelques exemples, on peut citer pêle-mêle : la suppression du bruit de fond lors d’une transmission téléphonique à partir de l’habitacle d’une voiture ; le traitement du signal reçu en téléphonie mobile ; le codage de l’image et de la parole dans un système de visiophonie ; la reconnaissance et la synthèse de la parole ; la détection de défauts dans une pièce mécanique et la maintenance préventive ; la localisation par sonar des bancs de poissons ; l’évaluation par radar des positions et vitesse d’une cible ; l’inversion de profil sismique pour la recherche pétrolière ; l’analyse des vibrations d’une plate-forme pétrolière ; l’analyse des signaux électro-encéphalographiques pour l’aide au diagnostic médical ; la réception d’informations délivrées par le système GPS de navigation par satellites ; la synthèse électronique de sons musicaux ; le traitement de signaux acoustiques provenant de plusieurs microphones, etc. Ces problèmes sont loin d’être complètement résolus et font encore l’objet de recherches. Au-delà de la complexité des problèmes qu’il permet d’aborder, le TNS autorise une grande souplesse dans la phase de mise au point. Les tests sont parfaitement reproductibles. On ne risque pas une dérive dans les caractéristiques des composants comme cela se passe dans les traitements analogiques. Est-ce à dire que ces derniers sont irrémédiablement condamnés ? En fait, même si leur part est en constante régression, elle ne risque pas de disparaître. Dans certains cas on ne peut s’en passer car les phénomènes observés sont trop rapides et, dans

Embed Size (px)

Transcript of Traitement Numerique Du Signal

TRAITEMENT NUMERIQUE DU SIGNALINTRODUCTION Pourquoi faire du traitement numrique du signal ? Le mot signal dsigne le rsultat de la mesure dune grandeur physique. Sans restreindre en aucune faon notre discours, le rsultat obtenu sera vu comme une fonction du temps. On dira alors que le signal est analogique ou temps continu si la mesure est disponible de faon continue tout instant et numrique temps discret si elle nest observe qu des instants discrets particuliers en gnral rgulirement espacs. Le traitement numrique du signal TNS consiste traiter des signaux temps discret. Lmergence du TNS est lie, comme pour de nombreux autres domaines, au perfectionnement des composants lectroniques. Ce dernier a stimul limagination des scientifiques et des futurologues, engendrant du mme coup de nouveaux problmes et besoins et, avec eux, la ncessit de disposer doutils encore plus puissants. Les microprocesseurs, ddis lorigine aux traitements purement informatiques, ou des fonctions simples de contrle, sont dsormais indispensables en TNS. Ils ont facilit la mise en place dalgorithmes quil aurait t bien difficile de mettre en uvre autrement. Il suffit pour sen convaincre de regarder du ct des applications grand public telles que tlvision haute dfinition, radiodiffusion numrique, tlphonie mobile, applications multimedia, etc. Tous ces services nouveaux utilisent largement le traitement numrique du signal en mettant en uvre des algorithmes parfois extrmement complexes et ncessitant des puissances de calcul considrables. Pour se limiter quelques exemples, on peut citer ple-mle :

la suppression du bruit de fond lors dune transmission tlphonique partir de lhabitacle dune voiture ; le traitement du signal reu en tlphonie mobile ; le codage de limage et de la parole dans un systme de visiophonie ; la reconnaissance et la synthse de la parole ; la dtection de dfauts dans une pice mcanique et la maintenance prventive ; la localisation par sonar des bancs de poissons ; lvaluation par radar des positions et vitesse dune cible ; linversion de profil sismique pour la recherche ptrolire ; lanalyse des vibrations dune plate-forme ptrolire ; lanalyse des signaux lectro-encphalographiques pour laide au diagnostic mdical ; la rception dinformations dlivres par le systme GPS de navigation par satellites ; la synthse lectronique de sons musicaux ; le traitement de signaux acoustiques provenant de plusieurs microphones, etc.

Ces problmes sont loin dtre compltement rsolus et font encore lobjet de recherches. Au-del de la complexit des problmes quil permet daborder, le TNS autorise une grande souplesse dans la phase de mise au point. Les tests sont parfaitement reproductibles. On ne risque pas une drive dans les caractristiques des composants comme cela se passe dans les traitements analogiques. Est-ce dire que ces derniers sont irrmdiablement condamns ? En fait, mme si leur part est en constante rgression, elle ne risque pas de disparatre. Dans certains cas on ne peut sen passer car les phnomnes observs sont trop rapides et, dans

dautres, ils simposent en raison de la simplicit mme du traitement effectuer. Ainsi, si un filtrage passe-bas de type RC suffit, un traitement numrique parat quelque peu luxueux pour sy substituer. Nous ne parlerons pas ici du traitement numrique des images. Ses spcificits font de lui un thme le plus souvent expos ou enseign part. Nota : On entend par image 2D (respectivement 3D) une grandeur qui dpend de 2 (respectivement 3) paramtres. Par exemple le signal constitu par le niveau de gris dans une photographie en noir et blanc peut tre indic par la position (abscisse et ordonne) du point. Aprs avoir dcrit les signaux numriques (transforme de Fourier, thorie de lchantillonnage) 1 , dans le paragraphe 2 nous prsentons les principales proprits temporelles et spectrales des signaux dterministes temps discret. Nous y tudierons en particulier la transforme de Fourier discrte qui est lun des outils de base du TNS. Le paragraphe 3 est consacr aux proprits des filtres linaires, en particulier ceux dcrits par une quation rcurrente, et une brve introduction aux mthodes de synthse de filtres. Le paragraphe 4 est consacr aux signaux alatoires. On y prsente les signaux stationnaires au sens large et leur filtrage, ainsi que les chanes de Markov. On conclut par quelques lments destimation statistique. La dernire partie prsente, pour illustrer ce qui prcde, quelques problmes pratiques de traitement : le changement de frquence, lestimation spectrale, lalgorithme de filtrage adaptatif du gradient stochastique. De nombreuses proprits sont nonces sans donner les hypothses de leur validit. Notre seule excuse est que, dans la majorit des cas rencontrs en pratique, ces hypothses sont satisfaites. Les plus curieux pourront amplement se documenter en consultant labondante littrature existant dans le domaine. 1.1 Gnralits En TNS, linformation manipule se prsente sous la forme dune suite de valeurs numriques issues de lobservation des grandeurs physiques. Cette suite porte le nom de signal temps discret ou signal numrique. Nota : le terme signal numrique est ambigu car il a une signification diffrente en thorie des communications o il dsigne le signal temps continu associ la suite de symboles (typiquement des 0 et des 1) du message numrique. Quand la grandeur observe est une fonction du temps, une opration, dite de numrisation, est ncessaire pour effectuer le passage du signal analogique au signal numrique (figure 1). Elle comporte quatre phases. 1. La grandeur observe doit tout dabord tre transforme en un signal lectrique laide dun dispositif appel transducteur comme par exemple un microphone. Par la suite, nous supposerons la prsence implicite dun tel dispositif dans la chane de numrisation et ne le reprsenterons jamais. 2. Le signal lectrique numriser est ensuite appliqu lentre dun filtre passe-bas idal, dit filtre danti-repliement, dont lutilit sera justifie par le thorme dchantillonnage. Le signal ainsi filtr est not xa(t ).

xa(t ) est appliqu en entre dun convertisseur analogique/numrique CAN qui effectue les deux oprations suivantes.

Figure 1 - Numrisation dun signal : filtrage anti-repliement, conversion analogique numrique

3. Lchantillonnage : on prlve toutes les T secondes les valeurs . T est appele la priode dchantillonnage et son inverse Fe la frquence dchantillonnage. 4. La quantification : les chantillons prlevs sont cods sur un nombre fini de bits (gnralement en complment deux). Ainsi, si les informations numriser proviennent dune tension comprise entre 5 V et + 5 V et que lon effectue une conversion sur 8 bits avec reprsentation en complment deux, la valeur 3 V sera code par :

Quant la valeur maximale 5 V, elle est code par 0111 11112.

Figure 2 - Reconstruction partir des chantillons : conversion numrique analogique, filtrage passe-bas

Aprs numrisation, on dispose donc dune suite de valeurs x (n) qui peuvent tre traites sur calculateur. Dans certains cas, de plus en plus rares, on utilise une architecture ddie (ensemble de registres, additionneurs, multiplieurs, etc.) qui permet dobtenir des vitesses de traitement suprieures mais qui manque singulirement de souplesse par rapport au calculateur.

Aprs traitement, les donnes numriques peuvent tre restitues sous forme dun signal physique appropri (figure 2). Le passage se fait par un signal lectrique obtenu laide dun convertisseur numrique/analogique (CNA) qui fournit un signal temps continu en marches descalier par lintermdiaire dun bloqueur dordre 0. Ce convertisseur est suivi dun filtre passe-bas (en principe de gain unit dans la bande ( Fe /2, Fe /2)). La transformation du signal lectrique en signal utile est ensuite effectue par un dispositif transducteur comme par exemple un haut-parleur. Dans la suite, sauf indication contraire, nous ne tiendrons pas compte de lerreur introduite par lopration de quantification et, quand on parlera de signal temps discret, on fera rfrence la suite numrique .

Contrairement aux exposs faits dans le domaine de lautomatique, nous prenons comme parti pris, sauf cas exceptionnel, de ne jamais faire apparatre le temps de manire explicite. Cela revient supposer que les frquences exprimes en hertz sont normalises ou rduites par rapport la frquence dchantillonnage Fe. Cette faon de procder ne pose aucun problme sauf si le traitement fait intervenir des signaux chantillonns diffrentes cadences. Ainsi, le signal numrique produit par un gnrateur sinusodal de frquence F0 (exprime en hertz) et chantillonn la frquence Fe scrira : , o la frquence rduite est f0 = F0/Fe. Nous allons voir que le thorme dchantillonnage impose de prendre si lon veut reconstruire parfaitement la sinusode analogique de dpart partir de la suite x (n). Par consquent .

1.2 Transforme de Fourier Avant daborder les proprits des signaux numriques, nous rappelons la dfinition de la transforme de Fourier des signaux temps continu. On pourra se reporter aux rfrences [4] [6] . Le signal temps continu xa(t) possde (sous des conditions que nous supposerons remplies) une transforme de Fourier et celle-ci scrit :

o F dsigne la frquence exprime en hertz. Le signal xa(t) est dit stable ou de module intgrable si :

Il est dit dnergie finie ou de carr intgrable si :

Il est dit de puissance finie si :

Les oprations de multiplication et de convolution schangent par transformation de Fourier. Le produit de convolution:

a pour transforme de Fourier

.

Pour les signaux dnergie finie on a la formule de Parseval qui scrit :

La fonction est appele spectre ou densit spectrale dnergie (dse). Daprs la formule de Parseval, elle sinterprte en effet comme la rpartition de lnergie le long de laxe des frquences. De faon gnrale, on peut dire quun signal qui prsente des variations brutales possde de lnergie dans les frquences leves et son spectre stale vers les hautes frquences. Le spectre dun signal rel est une fonction paire. On dit quun signal est bande limite si son spectre est nul hors dune certaine bande de frquence. Pour les signaux rels cette bande est de la forme ( B, B) et on dit simplement que le signal est de bande B. Pour les signaux priodiques de priode T, qui sont dnergie infinie mais de puissance finie, on peut dfinir une transforme de Fourier au sens des distributions. Le spectre est alors constitu de distributions de Dirac, couramment appeles raies, situes aux frquences multiples de la frquence fondamentale 1/T. Nota : Les distributions sont des fonctionnels linaires dfinis sur un espace particulier de fonctions. La distribution de Dirac est celle qui associe la fonction g (t) de cet espace sa valeur lorigine g (0).

1.3 Thorme dchantillonnage Dans la mesure o une opration de numrisation prcde tout traitement numrique de signaux temps continu, il est naturel de sintresser tout particulirement aux consquences de celle-ci. Le thorme dchantillonnage nonce quun signal rel bande limite B peut tre reconstruit de faon parfaite (on entend par l que lon espre pouvoir reconstituer le signal original temps continu partir de la seule connaissance des chantillons du signal) si la frquence dchantillonnage est suprieure ou gale deux fois la bande B. Le point de dpart de la dmonstration est la formule de Poisson qui dit que tout signal xa(t) temps continu, et possdant une transforme de Fourier note Xa(F), vrifie :

o Fe = 1/T. Remarquons que la fonction a(F) est une fonction priodique de priode Fe qui ne dpend que de la suite des chantillons, ce que lon rsume parfois en disant que lchantillonnage priodise le spectre. En passant aux frquences rduites, cest--dire en posant f = F/Fe, il vient :

La fonction (f) est appele transforme de Fourier temps discret TFtd de la suite x (n) = xa(nT ). Nous reviendrons en dtail sur ses proprits. Notons toutefois que (f) est une fonction priodique de priode 1. La figure 3 reprsente la forme typique de (f) pour un signal rel de bande B, lorsque Fe > 2B, cest--dire pour b < 1/2 o on a pos b = B/Fe. On voit, dans ce cas, que la priodisation ne provoque pas de chevauchements entre les diffrents lobes composant (f ). On doit pouvoir reconstruire de faon parfaite Xa(F ) partir de (f ) et, par consquent, en dduire xa(t ) pour tout t. Plus prcisment, la formule de reconstruction donnant xa(t ) en fonction de la suite x (n) a pour expression :

avec

.

La frquence minimale 2B permettant une reconstruction parfaite porte le nom de frquence de Nyquist.

Lorsque Fe < 2B lopration de reconstruction parfaite nest plus possible. Les motifs interfrent de faon irrversible : on dit quil y a repliement de spectre. Pour les signaux complexes le rsultat se dduit de la mme faon de la formule de Poisson. Mais, comme le spectre de xa(t ) ne possde plus la symtrie paire, la condition de nonrepliement scrit simplement Cette expression donne bien Exemple signal MIC (modulation par impulsions codes) En tlphonie numrique on chantillonne le signal issu du microphone la frquence de 8 000 Hz. Chaque chantillon est ensuite cod sur 8 bits. Ce qui donne un train dont le dbit binaire est de 64 kbit/s : on le dsigne par le terme de MIC. Profitons de loccasion pour dire que lutilisation de techniques non triviales de traitement du signal permet, sans perte de qualit (selon notre oreille), de rduire ce dbit jusqu 2,4 bit/s : on parle de compression. chantillonnage des signaux bande troite Les signaux couramment utiliss en radiodiffusion ont un spectre qui est localis autour dune frquence F0 trs suprieure la largeur B de leur support en frquence (typiquement, en modulation de frquence, ). Ces signaux sont dits bande troite. En effectuant un chantillonnage une frquence de lordre de B et donc trs infrieure la frquence de Nyquist (qui est suprieure 2F0), on peut satisfaire la condition de reconstruction parfaite. Pour sen convaincre, il suffit de se reporter la formule de Poisson : la priodisation du spectre seffectue bien sans repliement. o W dsigne la largeur totale du support du spectre. pour les signaux rels puisque dans ce cas W = 2B.

Figure 3 - Priodisation du spectre du signal chantillonn 1.4 Phnomne de repliement En pratique, le spectre du signal contient de lnergie des frquences suprieures la frquence de Nyquist, tout simplement parce que cest souvent la frquence dchantillonnage Fe qui est choisie a priori. Il faut garder en mmoire que ce choix dtermine la qualit de reproduction de la source. Ainsi, en tlphonie o on souhaite ne conserver que des frquences allant jusqu 4 kHZ, on a choisi une frquence dchantillonnage de 8 kHz. Par contre, pour les disques compacts, on sest montr beaucoup plus exigeant puisquon a dcid de reproduire fidlement le signal audio-frquence jusquaux limites du spectre audible, soit environ 20 kHz. Cela a conduit prendre une frquence dchantillonnage de 44,1 kHz.

On retiendra le rsultat suivant : si la bande du signal est suprieure Fe/2, et daprs le thorme dchantillonnage, la reconstruction introduit une distorsion. Cette distorsion est rendue minimale si lopration de numrisation est prcde dun filtrage passe-bas de gain unit dans la bande Fe/2. Ce filtrage est dsign sous le terme de filtrage anti-repliement. En pratique, cette opration peut tre avantageusement remplace par un chantillonnage une cadence suprieure deux fois la bande totale du signal (ce qui vite le repliement) suivi dun sous-chantillonnage par un traitement purement numrique 5.1 .

Un phnomne connu permet de comprendre la notion de repliement. Il sagit de leffet stroboscopique observ au cinma avec les roues de chariots que lon voit parfois tourner en sens inverse de celui que lon sattend observer. Lorigine du phnomne se trouve dans le procd denregistrement cinmatographique qui opre la frquence de Fe = 24 Hz (24 images par seconde). Pour simplifier nous supposerons que la roue ne comporte quun seul rayon. Son mouvement peut tre modlis par la fonction complexe . Notons que cette modlisation permet de prendre en compte le sens de rotation suivant que F0 est positif ou ngatif.

Tant que le nombre F0 de tours par seconde est compris entre 0 et Fe/2 = 12 Hz, lil voit tourner la roue dans le bons sens la bonne vitesse. Mais lorsque F0 est compris entre 12 Hz et 24 Hz, la roue se met tourner dans le sens contraire pour atteindre une vitesse apparente nulle lorsque F0 = 24. Puis, lorsque F0 est compris entre 24 Hz et 36 Hz, la roue se remet tourner dans le bon sens mais avec une vitesse apparente qui reste comprise entre 0 et 12 Hz. Lanalyse du spectre fournit lexplication. En effet, le spectre de xa(t ) est constitu dune raie (distribution de Dirac) la frquence F0. La TFtd de la suite chantillonne est donc un peigne de Dirac. Supposons, par exemple, que F0 = 18 Hz, ce qui correspond la frquence rduite f0 = 18/24 = 3/4. La priodisation fait apparatre une raie la frquence rduite 1/4 (figure 4) correspondant la frquence 6 Hz : comme lil ne slectionne, la faon dun filtre passe-bas, que les frquences les plus basses, la roue semble tourner en sens inverse.

Figure 4 - Repliement de spectre : la roue tourne en sens contraire

Une exprience simple permet dexhiber ce phnomne. On chantillonne la frquence Fe un signal sinusodal de frquence variable F0 issu dun gnrateur de signaux. Si on augmente cette frquence F0 de faon continue partir de 0 et que lon coute le signal obtenu partir des chantillons, on constate le phnomne suivant : tant que la frquence F0 est infrieure Fe/2 la hauteur du son suit fidlement celle du gnrateur, lorsque F0 crot de Fe/2 Fe, la hauteur du son, lcoute, se met dcrotre ! La frquence apparente est alors gale Fe F0,

lorsque F0 atteint Fe puis la dpasse, la hauteur du son se met nouveau crotre de 0 Fe/2, etc.

Seul le premier cas correspond une absence de repliement. Dans tous les autres cas, le signal cout ne correspond plus au signal dorigine.

Le phnomne de repliement nest pas toujours nuisible. Ainsi le dcodeur strophonique dun poste rcepteur de radiodiffusion met profit ce phnomne pour sparer les voies gauche et droite.

1.5 Notion de signal alatoire Les volutions temporelles du signal, explicites par exemple par une expression telle que x(n) = a cos (2 f0 n), sont compltement dfinies ds lors que lon connat les deux paramtres a et f0. On dit que ce signal est dterministe. Dans certains cas, et ce ne sont pas les moins frquents, il est impossible de donner une description prcise de lvolution de la grandeur physique observe. Citons en exemple le bruit de fond apparaissant dans tous les dispositifs lectroniques, ou encore le signal produit par de la parole la sortie dun microphone. De tels signaux sont dits alatoires. Pour les dcrire, il faut faire appel la thorie des probabilits. Le signal numrique est alors dfini comme une suite de variables alatoires.

2. Signaux dterministes2.1 Signaux types 2.2 Transforme de Fourier temps discret 2.2.1 Dfinition 2.2.2 Proprits 2.2.3 TFtd des signaux types 2.2.4 Troncature en temps et ondulations parasites 2.3 Transforme de Fourier court terme 2.4 La TFD : outil de calcul de la TFtd 2.4.1 Calcul pratique de la TFtd 2.4.2 Dfinition de la TFD 2.4.3 Proprits de la TFD 2.4.4 Transforme de Fourier rapide 2.4.5 Filtrage par TFR 2.1 Signaux types Pour caractriser les phnomnes observs, ou encore pour tudier les comportements des systmes de traitement, on a souvent besoin de faire appel des suites de rfrence ou signaux types. Ceci ne surprendra personne puisque cest aussi ce que lon fait dans le domaine du temps continu. Ainsi, lanalyse harmonique dun systme (linaire) consiste caractriser celui-ci en appliquant, en entre, des sinusodes et mesurer, en sortie, lamplitude et la phase de la sinusode obtenue ; de mme, lobservation dun signal pendant un intervalle de temps de dure finie revient le multiplier par une fonction rectangulaire qui vaut 1 sur cet intervalle et 0 sinon ; un filtre linaire est caractris par sa rponse une impulsion unit ou lchelon unit, etc.

Limpulsion unit est dfinie par :

Ce signal na rien voir avec la distribution de Dirac rencontre en temps continu. Cest une suite de valeurs numriques : n prend des valeurs entires.

Lchelon unit est dfini par (figure 5) :

La porte rectangulaire de dure N est dfinie par :

Lexponentielle causale et dcroissante (figure 6) :

Lexponentielle complexe (ternelle) est dfinie par :

o la frquence f0 a une valeur comprise entre 0 et 1. 2.2 Transforme de Fourier temps discret 2.2.1 Dfinition Trouver une reprsentation frquentielle consiste rechercher des priodicits dans un signal et en mesurer les contributions. Cest ce que fait la transforme de Fourier temps discret (en abrg TFtd) qui effectue le produit scalaire entre le signal et lexponentielle complexe exp(2jfn) pour tout f. Sa dfinition est :

La TFtd joue pour les signaux numriques le rle de la transforme de Fourier pour les signaux temps continu. Cest une fonction frquence continue, , priodique de priode 1. Il est dusage de la reprsenter sur un intervalle de longueur 1, savoir ( 1/2, + 1/2) ou (0,1).

Figure 5 - chelon unit

Figure 6 - Exponentielle dcroissante causale avec a rel

La fonction la fonction

sappelle le spectre. Dans la littrature ce terme est parfois aussi associ . Les deux expressions deviennent quivalentes si lon utilise lchelle des .

dcibels en posant

Inversement, on peut calculer x (n) partir de X (f) :

2.2.2 Proprits Les proprits de la TFtd rappellent celles de la transforme de Fourier en temps continu. En particulier on a:

linarit :

dcalage en temps : (1)

Nota : Un dcalage en temps est donc quivalent un dphasage linaire.

dcalage en frquence :

renversement temporel :

conjugaison :

caractre rel :

On dit que X (f) possde la proprit de symtrie hermitienne. Le module et la partie relle de X(f) sont des fonctions paires de f, sa phase et sa partie imaginaire sont des fonctions impaires de f ; convolution : (2)

produit :

Formule de Parseval :

2.2.3 TFtd des signaux types

Limpulsion a pour TFtd X (f ) = 1

Figure 7 - Module de la transforme de Fourier temps discret de la porte rectangulaire pour N = 10

Lchelon unit na pas de TFtd au sens des fonctions. Toutefois on peut la dfinir au sens des distributions mais son expression na que peu dintrt pratique. La suite exponentielle complexe na de TFtd quau sens des distributions :

o dsigne la distribution de Dirac au point (f0 n). Il sagit dun peigne de Dirac de priode 1 dcal sur la droite de f0.

La porte rectangulaire N (n) a pour TFtd :

Cette fonction joue un rle analogue celui de la fonction sinus cardinal dans le cas des signaux temps continu. Comme le signal est rel, cette fonction possde la symtrie hermitienne . Son module est pair, possde un lobe principal de largeur 2/N en 0 et des lobes secondaires de largeur 1/N. Le premier lobe secondaire est 13 dB en-dessous du lobe principal. Nous avons reprsent, en dcibels, le module de gN(f )/N (figure 7) pour N = 10. 2.2.4 Troncature en temps et ondulations parasites La TFtd de la porte rectangulaire permet dexpliquer les ondulations parasites qui apparaissent lorsquon effectue la mesure pratique des spectres des signaux. En effet, chaque fois quon considre un signal sur un intervalle de temps infrieur sa dure totale, cela revient le multiplier par une porte rectangulaire. Du point de vue spectral cette multiplication revient convoluer X (f ) par la fonction gN (f ) qui prsente des lobes. Ceux-ci ne sont pas prsents originellement dans la TFtd du signal mais sont un pur artefact d la troncature en temps. Rsolution spectrale Considrons le signal x (n) = sin (2 f0n), , pour et 0 sinon. Ce signal reprsente un bloc de dure N dun signal sinusodal de frquence f0. Sa TFtd a pour expression:

En utilisant la proprit de dcalage en frquence et en notant gN (f) la TFtd de la porte rectangulaire, on obtient :

Son module (normalis) est reprsent figure 8 pour f0 = 0,2 et N = 10.

Figure 8 - Sinusode tronque pour N = 10 et f0 = 0,2

De faon plus gnrale, lorsque le signal est la somme de K sinusodes de frquences f1, f2 ... fk, son spectre comporte des lobes (principaux) de largeur 2/N situs approximativement aux frquences f1, f2 ... fK. On en dduit que la sparation des maxima sera dautant plus marque que N sera grand. On parle alors de rsolution en frquence. Daprs ce que lon vient de voir, la quantit 2/N, appele limite de Fourier, donne donc un ordre de grandeur de la rsolution f en frquence. Cette quantit doit cependant tre revue la hausse pour peu que les sinusodes soient damplitudes trs diffrentes. Il faut en effet que le lobe principal dune sinusode de faible amplitude ne soit pas compltement masqu par un lobe secondaire dune sinusode de plus forte amplitude. Nous avons reprsent figure 9 la TFtd exprime en dB de la somme de deux sinusodes de frquences f1 = 0,2 et f2 = 0,25. Le nombre de points de signal est N = 80. Par consquent la limite de Fourier est gale 1/40 alors que lcart de frquence est 1/20. Le premier spectre correspond un rapport damplitude de 10 dB entre les deux sinusodes. On y distingue nettement la prsence des deux composantes sinusodales. Par contre, sur le second spectre qui correspond un rapport damplitude de 35 dB, on ne distingue plus la frquence f2. Nous avons not que le fait de ne conserver que N points dune sinusode revient prendre une sinusode de longueur infinie et la multiplier terme terme par la porte rectangulaire, appele dans ce contexte fentre de pondration rectangulaire. Pour amliorer la rsolution on est conduit utiliser dautres fentres de pondration. Une fentre trs utilise en pratique est la fentre de Hamming dont lexpression est h (n ) = 0,54 0,46 cos (2 n / N ). On voit sur le troisime spectre que, pour le mme rapport de 35 dB, la fentre de Hamming amliore notablement la sparation des deux frquences au prix, toutefois, de llargissement des lobes principaux.

2.3 Transforme de Fourier court terme

Considrons un signal {x (n)} somme de trois portions de sinusodes mises des instants successifs. Ses caractristiques sont donnes dans le tableau 1. Amplitude Frquence Instant de dbut Instant de fin sinus 1 1 sinus 2 1 sinus 3 1 0,11 0,23 0,37 20 84 292 196 356 512

Caractristiques dun signal compos de la somme de trois sinusodes dcales

Figure 9 - Spectre de la somme de deux sinusodes de frquence 0,2 et 0,25 avec N = 80

Sa TFtd contient effectivement linformation sur lordre chronologique dans lequel apparaissent ces trois frquences, mais elle se trouve cache dans la phase de cette transforme. Par consquent, si on se borne la visualisation du module de la TFtd, le fait que f1 dmarre avant f2 nous chappe. On peut le vrifier sur le spectre reprsent figure 10.

Figure 10 - Chronogramme et spectre du signal dont les caractristiques sont donnes dans le tableau

Par contre, en divisant la dure totale du signal en sous-intervalles de mme dure, on peut calculer plusieurs spectres qui, affichs cte cte, donnent une reprsentation, appele transforme de Fourier court-terme (TFCT), qui fait apparatre linformation concernant lordre des frquences. Reprenons le signal prcdent. En divisant sa dure de 512 units de temps en 32 tronons de dure 16, on peut calculer 32 spectres qui aboutissent la TFCT de la figure 11. Le niveau de gris y est inversement proportionnel lamplitude du spectre. Lchelle des temps (abscisses) est gradue de 0 511 par pas de 16 points, soit 32 pavs. Lchelle des frquences, en ordonnes, est gradue de 0 1/2. Le plan est dit plan temps-frquence. On y distingue nettement les trois composantes ainsi que les instants de dmarrage et de fin. La hauteur dune tache blanche correspond la largeur du lobe principal dune TFtd, soit ici 2/16. Si on rduit la dure dun sous-intervalle de 16 8, les spectres sont calculs avec moins de points. Par consquent :

la rsolution en frquence est rduite puisque les lobes slargissent ; la restitution des dtails temporels est meilleure car la TFtd effectue une sorte de moyenne en temps sur moins de points.

De faon gnrale, plus la dure du sous-intervalle est petite :

plus il est facile de localiser sur lchelle des temps la prsence dun dtail temporel ; et plus il est difficile de distinguer des frquences voisines.

Remarque : le principal dfaut de la TFCT est dutiliser des fentres rectangulaires qui ont pour consquence de masquer les priodicits longues et, par l mme, les frquences basses. Lide de lanalyse multi-rsolution, ou multi-chelle, sur laquelle nous reviendrons plus loin, est dchantillonner des cadences diffrentes le signal de manire effectuer ltude plusieurs niveaux de rsolution.

Figure 11 - Transformation de Fourier court terme (TFCT)

2.4 La TFD : outil de calcul de la TFtd 2.4.1 Calcul pratique de la TFtd Le calcul pratique de la TFtd, fonction de la variable continue f, ne peut tre fait que pour un nombre fini N de points de signal et sur un nombre fini K (suprieur N ) de points de frquence. En gnral on prend K points rgulirement espacs entre 0 et 1 de la forme f = k/K avec . Considrons en exemple x (n) = exp (2jf0n) avec Lexpression de sa TFtd est : , signal de dure finie.

Calcule aux points f = k/K, elle est constitue de valeurs diffrentes de zro, sauf si f0 est exactement un multiple de 1/K. Ainsi, si N = K = 32 et f0 = 7/32, on obtient 32 valeurs dont une seule nest pas nulle savoir X (7/32). Cest ce qui est reprsent figure 12. Si, par contre, on prend f0 = 0,2 on obtient le rsultat de la figure 13. Les valeurs k/32 ne tombent plus exactement sur les zros de X (f ). On voit sur ces figures quon est loin de la forme en sin (f N)/sin (f ) de la TFtd. Toutefois, pour sen approcher, il suffit daugmenter le nombre K de points de frquence. Le choix de K joue donc sur la prcision du trac du spectre. Rappelons ce propos que le nombre N de points dobservation agit pour sa part sur la rsolution en frquence. Ces deux notions ne doivent pas tre confondues.

Figure 12 - TFtd dune sinusode de frquence 7/32 calcule en 32 points de frquence

Figure 13 - TFtd dune sinusode de frquence 0,2 calcule en 32 points de frquence HAUT DE PAGE 2.4.2 Dfinition de la TFD Dans le calcul de la TFtd on peut, sans perte de gnralit, considrer que K = N. En effet, si K > N, il suffit, pour retomber dans le cas K = N, de complter la suite x (n) par (K N ) zros, ce qui ne change rigoureusement rien la valeur de la TFtd calcule au point k/K (bourrage par des zros). Cela conduit la dfinition suivante : on appelle transforme de Fourier discrte (TFD) de la suite finie {x (0), ..., x (N 1)} la suite finie :

o

et WN = exp ( 2j/N ). On montre facilement la formule inverse :

appele transforme de Fourier discrte inverse (TFD). La TFD est loutil de calcul de la TFtd. Son succs tient lexistence dalgorithmes rapides dont le plus rpandu est prsent plus loin. HAUT DE PAGE 2.4.3 Proprits de la TFD Lexamen des proprits de la TFD met en vidence de grandes similitudes avec celles de la TFtd. Elle sen diffrencie essentiellement par le fait que les calculs des indices se font modulo N : Nota : on rappelle que n modulo N reprsente le reste de la division entire de n par N.

linarit :

dcalage en temps :

renversement temporel :

conjugaison :

x (n) relle

convolution circulaire : tant donn les suites x (n) et y (n ) et leurs TFD respectives X (k ) et Y (k ), la TFDI de la suite est la suite :

(3)

formule de Parseval :

HAUT DE PAGE 2.4.4 Transforme de Fourier rapide La transforme de Fourier rapide (TFR), introduite en 1961 [5] , est une technique de calcul rapide de la TFD. Lalgorithme de base, qui connat de nombreuses variantes, utilise un nombre de points N = 2p. Pour en utiliser le principe, traitons lexemple simple p = 3. On dcompose la somme en termes de rang pair et de rang impair :

et on ritre le procd avec les deux termes obtenus :

et

...

Le calcul des termes X (k ) peut alors tre schmatis par le diagramme classique reprsent sur la figure 14. La cellule de calcul de base, que lon voit clairement apparatre sur le schma, est appele papillon. Ainsi, partant des chantillons x (0) et x (4) de lexemple choisi, on calcule deux nouvelles valeurs et travers un papillon de calcul . Les indices des termes x (n) apparaissent dans un ordre donn par le codage binaire renvers de n. Ainsi, le terme de rang 4 = 1002 est x (0012) = x (1). On parle dadressage bit reverse. Le tableau 2 donne lensemble des correspondances. valuation du nombre doprations On peut vrifier que le calcul de N points de TFD ncessite additions complexes et (N/2)log2 N N + 1 multiplications complexes. On se contente en pratique de lexpression approche multiplications-additions complexes. Un calcul direct aurait ncessit 2 N oprations de ce type, soit un gain de temps de lordre de N/log2N. Ainsi, pour N = 1024,

lalgorithme de TFR est environ 100 fois plus rapide que la programmation directe de la formule de TFD. En jouant sur les valeurs particulires des , on rduit encore ce nombre doprations. Il est en outre possible deffectuer des dcompositions plus complexes que la dcomposition examine ici en termes de rang pair et impair. Cela fait apparatre des structures de calcul rduisant le nombre doprations au prix dune programmation plus complexe.

Figure 14 - Transformation de Fourier rapide (TFR) : calcul des termes X (k ) Rang Codage binaire Renversement lment 0 1 2 3 4 5 6 7 000 001 010 011 100 101 110 111 000 100 010 110 001 101 011 111 0 4 2 6 1 5 3 7

Correspondance entre rang, codage binaire et renversement 2.4.5 Filtrage par TFR Nous avons vu (relation ( cf. ici )) que la TFDI de la suite Y (k ) = H (k ) X (k) est le signal :

obtenu par convolution circulaire, alors que le produit des TFtd correspond la convolution (relation ( cf. ici )) :

(4) Il nest donc pas possible de raliser un filtrage en utilisant directement la TFD sur des blocs de longueur N. Toutefois, une solution partir de TFD existe et lutilisation de la TFR peut alors fournir un gain de temps apprciable. Soit le filtre de rponse impulsionnelle hN (n ) et soit le signal x (n ). Daprs ( cf. ici ), la valeur en sortie linstant n est donne par :

Si on utilise la TFD, on est tent de faire un produit de la TFD de hN (n ) par celle dun bloc

de taille N extrait de x (n). Mais, comme on vient de le dire, la convolution associe est circulaire et le rsultat est faux. Une solution est deffectuer la suite doprations schmatises de la faon suivante : 1. calcul de la TFD H2N (k ) de la suite {0 ... 0, hN (0) ... hN (N 1)} obtenue en compltant hN (n) gauche par N zros ; 2. Calcul de la TFD X2N (k ) du bloc :

de longueur 2N ; 3. Multiplication terme terme de X2N (k ) par X2N (k ), suivie dune TFDI ;

4. Conservation des N premiers termes du rsultat prcdent : ces termes concident avec les N valeurs donnes par la relation ( cf. ici ) ; 5. Retour en 2 jusqu puisement des donnes du signal x (n). Comparons le nombre dadditions-multiplications complexes (amc) avec celui dun calcul direct. On nglige la premire TFR qui nest pas faite quune fois. A chaque pas on effectue deux TFR (lune directe, lautre inverse) de taille 2N. La charge de calcul est denviron amc pour N points de convolution, quil faut comparer aux N 2 amc dun calcul direct. On en dduit un gain de temps calcul denviron N/log2 (2N). Pour N > 32, la technique par TFR est donc plus rapide. En ralit dautres paramtres doivent tre pris en compte. Le calcul de la TFR fait intervenir des manipulations de pointeurs dans des tableaux, manipulations qui entranent une charge de calcul non ngligeable. La TFR exige en outre de la place en mmoire pour stocker les tableaux de donnes qui sont de taille gnralement suprieure la mmoire du filtre. Il faut aussi noter, et cest peut-tre le point le plus important, que les rsultats sont obtenus avec un retard de lordre de la taille du bloc soit 2N.

3. Filtrage linaire 3.1 Transforme en z, outil dtude des filtres 3.1.1 Dfinition 3.1.2 Proprits de la transforme en z 3.1.3 Inversion de la transforme en z 3.1.4 Exemples de transformes en z 3.2 Filtre dfini par une quation rcurrente 3.3 Introduction aux mthodes de synthse 3.3.1 Introduction 3.3.2 Filtres RIF 3.3.3 Filtres RII Que ce soit pour raliser un traitement utile (slection dune bande de frquence, extraction dun signal dans du bruit ...) ou que ce soit pour modliser des dformations indsirables (transmission travers un canal), on est conduit envisager des transformations sur les signaux. Une faon de dcrire ces dernires est de faire appel la notion de systme (bote noire) ayant une entre et une sortie. Dans le cas des signaux numriques, il faut gnralement entendre par systme un programme qui, partir du signal dentre x (n), engendre le signal de sortie y (n) :

Dans la majorit des cas rencontrs en pratique, les systmes peuvent tre considrs linaires et invariants dans le temps (systme SLI). On entend par systme invariant un

systme dont les caractristiques nvoluent pas avec le temps, une squence dentre produisant la mme squence sortie quel que soit le moment auquel elle est applique. On utilise le plus souvent le terme de filtre pour dsigner un systme SLI. On montre quun filtre numrique a pour quation dentre/sortie une relation de convolution discrte. Si x (n) dsigne le signal numrique dentre et y (n) celui de sortie, on a : (5)

La suite h (n) qui caractrise le filtre est appele sa rponse impulsionnelle (cest en effet la rponse du systme limpulsion unit (n)). Pour un systme, une des proprits principales que lon peut en attendre est sa stabilit. Le type de stabilit envisag ici est dit EBSB (entre borne/sortie borne), cest--dire que le signal de sortie reste born si le signal dentre est lui-mme born. On montre quune condition ncessaire et suffisante de stabilit dun filtre est que la suite h (n ) soit de module sommable, ce qui scrit . Nous verrons que cette condition prend une forme particulirement simple sur la transforme en z de h (n). Lorsque la rponse impulsionnelle est nulle pour n < 0, on dit que le systme est causal. Dans ce cas, le calcul de la sortie y (n ) ne ncessite pas la connaissance des valeurs dentre dindices suprieurs n. Toutefois, en TNS, la causalit na pas de caractre imprieux. Il suffit de faire le calcul en temps diffr en acceptant un certain retard la connaissance, comme le montre la relation entre/sortie :

Daprs la relation ( cf. ici ) la rponse impulsionnelle de ce filtre est h ( 2) = h (2) = a, h ( 1) = h (1) = b et h (0) = c. Ce systme nest donc pas causal. 3.1 Transforme en z, outil dtude des filtres HAUT DE PAGE 3.1.1 Dfinition On appelle transforme en z de la suite x (n ) la fonction de la variable complexe z dfinie par :

Cette expression na de sens que dans une couronne du plan complexe de la forme que nous supposons non vide. Cette couronne dfinit le domaine de convergence de cette somme. Si le signal est causal (x (n ) = 0) pour n < 0 on vrifie que Xz (z ) converge vers z tend vers linfini et donc le domaine de convergence est de la forme z > R1. Lorsque le cercle unit z = exp (2 jf ) appartient au domaine de convergence, X (f ) = Xz (exp 2jf )) est la TFtd de la suite x (n ). Le cercle unit peut tre gradu en valeurs de la frquence f = /2 ou reprsente largument de z. La transforme en z est loutil privilgi de ltude des filtres linaires. Considrons en effet un filtre temps discret de rponse impulsionnelle h (n ), dentre x (n ) et de sortie y (n ). Notons respectivement Hz (z ), Xz (z ) et Yz (z) leurs transformes en z. Si on suppose, en plus, que le cercle unit appartient leur domaine respectif de convergence, alors les Tftd respectives existent.

On montre que pour un filtre linaire les trois relations suivantes sont quivalentes :

Hz (z ) est appel la fonction de transfert du filtre et H (f ) son gain complexe ou rponse en frquence. La fonction G(f ) = H (f ) sappelle le gain du filtre et (f ) = arg {H (f )} sa phase. Le terme de gain en frquence sexplique simplement : si on applique en entre le signal exp (2jf0n ), le signal en sortie a pour expression H (f0) exp (2jf0n ). Ce rsultat est mis profit pour mesurer la rponse en frquence dun filtre (analyse harmonique) : en rgime sinusodal la comparaison des signaux dentre et de sortie fournit le nombre complexe H (f0). On dit quun filtre est sans distorsion damplitude si son gain Hz exp (2jf )] est constant et sans distorsion de phase si sa phase arg [Hz exp (2jf )] est linaire de la forme c0f. On notera que la notion de phase linaire est lie celle de retard pur. HAUT DE PAGE 3.1.2 Proprits de la transforme en z Soit Hz 1(z ) et Hz 2(z ) les transformes en z respectives de h1(n ) et h2(n ) et (D1) et (D2) leurs domaines de convergence respectifs. Les principales proprits sont de la transforme en z sont :

la linarit :

avec comme domaine de convergence

;

le dcalage en temps :

Le domaine de convergence est inchang ;

La conjugaison :

Le domaine de convergence est inchang. Et donc si h (n ) est rel,

;

Linversion du sens du temps :

Le domaine de convergence est construit partir des bornes inverses ;

la convolution :

avec comme domaine de convergence

.

la relation de Parseval :

o on a suppos que le cercle unit C appartenait au domaine de convergence de Hz (z ) ;

la drivation par rapport z ;

Le domaine de convergence est inchang.

La valeur initiale : si h (n) est causale :

HAUT DE PAGE 3.1.3 Inversion de la transforme en z Il est important de comprendre que linversion de la transforme en z ncessite que lon se donne le domaine de convergence. Ainsi, la fonction Hz (z) = 1/(1 az1), il correspond deux suites numriques diffrentes, suivant que lon choisisse z > a ou z < a. La premire est causale et a pour expression :

et la seconde a pour expression :

Ce qui les distingue dans le plan en z nest pas lexpression de Hz (z ) mais le domaine de convergence associ. A titre dexemple, tablissons ce rsultat pour z < a. On a :

o on a utilis la condition a1 z < 1, ainsi que le dveloppement classique pour u < 1 :

Ce calcul est doublement instructif dans le cas o la fonction Hz (z ) est une fraction rationnelle :

on peut sen inspirer pour linversion, aprs avoir effectu une dcomposition pralable en lments simples ; ce sont les modules des racines du dnominateur qui dlimitent les couronnes de convergence. Ainsi, si on a N racines de modules distincts, on a (N + 1) suites diffrentes. Si aucune des racines nest de module 1, on peut mme trouver une couronne de convergence contenant le cercle unit : dans ce cas la suite associe est de module sommable. Si toutes ces racines sont strictement lintrieur du cercle unit, le domaine de convergence stend jusqu linfini et la suite associe est causale.

Dans le cas gnral, la formule dinversion a pour expression :

o C dsigne un contour de Cauchy inclus dans le domaine de convergence. Une faon rapide deffectuer le calcul est de passer par la mthode des rsidus ([6] , thorme de Cauchy). HAUT DE PAGE 3.1.4 Exemples de transformes en z

Limpulsion unit (n ) donne 1 pour tout z. Lchelon unit u (n ) donne :

Lexponentielle causale x (n ) = an u (n ) donne :

La rampe r (n ) = n u (n) donne :

HAUT DE PAGE 3.2 Filtre dfini par une quation rcurrente La dfinition des filtres linaires laide dune quation rcurrente permet den exhiber trs facilement les proprits. Elle correspond en outre la dfinition algorithmique du traitement quils mettent en uvre. On appelle quation rcurrente linaire coefficients constants une expression de la forme :

(6)

Cette forme est analogue, pour le temps discret, aux quations diffrentielles linaires coefficients constants rencontres dans le cas du temps continu. Lorsque a1 = ... = aN = 0, les coefficients b0 ... bM apparaissent, daprs lquation de convolution ( cf. ici ), comme la rponse impulsionnelle du filtre : on dit que le filtre est rponse impulsionnelle finie (RIF). Lorsque les ai ne sont pas tous nuls, on dit que le filtre est rcursif. Si en plus la fraction rationnelle ( cf. ici ) est irrductible, le filtre est dit rponse impulsionnelle infinie (RII). En utilisant la transforme en z et la proprit de retard on dduit de ( cf. ici ) que lquation rcurrente dfinit un filtre qui a pour fonction de transfert : (7)

Les racines du numrateur sappellent les zros de la fonction de transfert et celles du dnominateur ses ples. Si les coefficients an et bm sont rels, les ples et les zros sont soit rels, soit vont par paires de complexes conjugus. Dans ce cas G (f ) = H (f ) est pair et la rponse impulsionnelle est relle.

,

le

gain

Stabilit et causalit Comme nous lavons dit, si les ples sont de module diffrent de 1, il est possible de choisir un domaine de convergence de Hz (z ) contenant le cercle unit. Dans ce cas, la suite {h (n )} associe est de module sommable et le filtre correspondant est stable. Si tous les ples sont strictement lintrieur du cercle unit, le filtre correspondant est stable et causal.

tude qualitative du gain partir de la position des ples et des zros La gain en frquence est le module de la fonction de transfert lorsque z = exp (2jf ) parcourt le cercle unit. Si on note pk et zk les ples et zros de la fraction rationnelle Hz (z ), le gain sexprime simplement par un rapport des produits des longueurs des segments MZk et MPk o Pk et Zz sont les points du plan complexe daffixes respectives pk et zk et o M daffixe z parcourt le cercle unit :

Supposons que Z1 soit proche du cercle unit. Quand M va passer prs de Z1, le gain va devenir trs faible, voire nul, si z1 est juste gal 1. Ce raisonnement sapplique aussi aux ples, le gain devenant au contraire trs grand (figure 15).

Figure 15 - Forme qualitative du gain partir de la position des ples et des zros HAUT DE PAGE 3.3 Introduction aux mthodes de synthse HAUT DE PAGE 3.3.1 Introduction Le problme de la synthse, tel que nous le restreignons ici, consiste calculer la fonction de transfert Hz (z ) dun filtre partir de son gabarit en frquence, ensemble de spcifications portant sur le gain (plus rarement la phase) du filtre (figure 16). Par exemple, pour un filtre passe-bas, on donnera :

la plus haute frquence de la bande passante fp ; la plus basse frquence de la bande attnue fa ; le taux dondulation dans la bande passante ; lattnuation dans la bande de transition allant de f0 et fa ; le taux dondulation dans la bande attnue.

Figure 16 - Forme typique du gabarit dun filtre passe-bas

Le problme est de synthtiser un filtre dont le gain entre dans le gabarit. Un premier choix va devoir tre fait sur le type du filtre : RIF ou RII. Attention, le fait de ne pouvoir mettre en uvre quun nombre fini doprations ne signifie pas quune ralisation RII est impossible. Ainsi, la mise en uvre du programme : y (n ) = x (n ) + ay (n 1) correspond-elle au filtre de rponse impulsionnelle infinie : h (n ) = an u (n ). De manire gnrale, on retiendra que :

les filtres RIF donnent, pour des caractristiques identiques de gain, une charge de calcul bien suprieure celle des filtres RII ; les filtres RIF peuvent introduire dimportants retards ; les filtres RIF, nayant pas de ple, sont stables sans condition supplmentaire ; les filtres RIF permettent dobtenir une phase linaire 3.1.1 .

Ce paragraphe se limite seulement quelques aspects de la synthse. On trouvera dans la bibliographie des lments indispensables sur la structure des filtres en gard aux bruits de calcul [9] et sur la synthse utilisant des bancs de filtres [20]. HAUT DE PAGE 3.3.2 Filtres RIF La mthode la plus lmentaire de synthse de filtres RIF est la mthode de la fentre. On peut la rsumer de la faon suivante :

on se donne un gain H (f ) thorique ; on en dduit la rponse impulsionnelle (h (n ) ;

on garde un nombre fini N de valeurs de h (n ) ; et on pondre ventuellement (multiplication terme terme), la suite obtenue par une suite w (n ) appele fentre.

Voyons plus en dtail le calcul de h (n ) partir de H (f ). On sait que le gain H (f ) dun filtre dont la rponse impulsionnelle est relle est une fonction relle, paire. Par consquent la TFtd inverse de H (f ) est une suite relle paire ce qui scrit h (n ) = h ( n ). Dautre part, on montre aisment que la TFtd inverse de la fonction Hd (f ) = H (f ) exp (j f ) vrifie hd (n ) = hd ( n 1). De ces remarques on dduit une rgle de calcul des coefficients du filtre, suivant que le nombre N de coefficients retenus est pair ou impair ou pair (figure 17). Pour un nombre impair de coefficients on prend la TFtd inverse de H (f ), tandis que, pour un nombre pair de coefficients, on prend la TFtd inverse de H (f ) exp (j f ). Cela donne :

Dans les deux cas la suite h (n ) obtenue est gnralement infinie. Si on veut faire une implantation directe du filtrage en mettant en uvre la convolution il faut tronquer la suite des h (n ). Cela revient multiplier celle-ci par une porte rectangulaire de largeur K. Dun point de vue spectral, on convolue donc le gabarit dsir par la fonction sin ( f K)/sin (f ), dont les lobes secondaires de largeur 1/K ont pour effet dintroduire des ondulations. Examinons ces effets sur un exemple. Soit raliser le filtre passe-bas de gain reprsent figure 18. En se limitant N = 15 coefficients, on obtient h (n ) = sin (n /2)/n avec n allant de 7 + 7. En prenant le filtre dfini par g (n ) = h (n 7), on obtient un filtre causal qui a le mme gain et dont lexpression est :

Figure 17 - Symtrie de la rponse pour N impair ou N pair

Figure 18 - Gain dun filtre passe-bas demi-bande

Il a donc une phase linaire. Cette proprit est lie au fait que la mthode utilise introduit une symtrie des coefficients qui permet un regroupement des termes 2 par 2. Voyons prsent les effets de la troncature de la rponse impulsionnelle. Nous avons multipli h (n ) par la porte rectangulaire et 0 sinon et donc convolu H (f ) par :

Les lobes de Wr(f ) de largeur 1/15 introduisent des ondulations dans le gain (figure 19). Pour rduire celles-ci on utilise des fentres [10] qui ont des lobes secondaires moins hauts que ceux de la fentre rectangulaire. Mais cela a aussi pour consquence dlargir le lobe principal et donc dlargir la bande de transition. En utilisant la fentre de Hamming dexpression :

on obtient le gain reprsent figure 19. On observe un largissement de la bande de transition accompagn dune rduction des ondulations. Toutefois lamplitude des ondulations ne peut tre rendue arbitrairement petite. On montre que lcart maximal entre le gain thorique et celui du filtre tronqu ne tend pas vers 0 quand K tend vers linfini. Les ondulations persistent tout ordre. Il sagit du phnomne de Gibbs. Ainsi lcart maximal est denviron 0,09 pour la fentre rectangulaire alors quil est de 0,0022 pour la fentre de Hamming. Nous renvoyons la rfrence [10] pour une tude trs complte de lensemble des fentres utilises en TNS.

Figure 19 - Gain dun filtre RIF demi-bande 15 coefficients

La mthode de la fentre est extrmement simple mettre en uvre. Cest la raison pour laquelle elle est assez largement utilise. Ses principaux dfauts sont que les ondulations en bande passante et bande attnue ne sont pas constantes et quelles ne peuvent tre contrles sparment. Lorsquon dsire viter ces inconvnients, des mthodes plus sophistiques sont gnralement retenues pour synthtiser les filtres RIF. Lune des plus courantes, base sur le concept de filtre optimal ondulations constantes de Parks-McClellan [9] , est connue sous le nom de mthode de Rmez. Elle est disponible dans beaucoup de bibliothques de programmes de traitement du signal. HAUT DE PAGE 3.3.3 Filtres RII Il existe trois principales techniques de synthse des filtres RII. La premire consiste partir de filtres analogiques (cest--dire temps continu) en effectuant une approximation des frquences continues par des frquences discrtes. La seconde est base sur un calcul direct des coefficients du filtre. La troisime est btie sur une procdure itrative doptimisation lorsque le traitement analytique direct est trop complexe. Nous allons nous contenter ici de prsenter la mthode de la transformation bilinaire. La mthode de la transforme bilinaire consiste remplacer 1/p par :

dans lexpression de la fonction de transfert dun filtre temps continu (on rappelle que, pour un filtre temps continu, la fonction de transfert est la transforme de Laplace de sa rponse impulsionnelle). La transforme bilinaire est justifie par le fait que 1/p, oprateur dintgration, peut tre approche en temps discret par B (z ). En effet, soit x (t ) une fonction intgrer, xn sa valeur

linstant nT et yn la valeur de son intgrale entre 0 et nT. En utilisant la mthode du trapze, on a lquation rcurrente yn = yn 1 + T (xn + xn 1)/2 qui a pour fonction de transfert B (z ). Si T est suffisamment petit, la distorsion de frquence introduite lors de cette transformation est ngligeable. Dans le cas contraire, il existe des mthodes de compensation. Pour conclure sur la prsentation de cette mthode, indiquons que les trois principaux modles de filtres analogiques utiliss pour synthtiser un filtre numrique, partir de la transforme bilinaire, sont les filtres de Butterworth, de Tchebycheff et de Cauer.

Un filtre de Butterworth a comme fonction de transfert :

avec

et son gain a pour expression

.

Il na pas dondulation en bande passante ni en bande attnue.

Un filtre de Tchebycheff de type 1 a comme gain :

o On montre que les N ples ont pour affixes :

.

avec

. . Ce type de

Lamplitude des ondulations en bande passante est constante et vaut filtre na pas dondulation en bande attnue.

Un filtre de Tchebycheff de type 2 a comme gain :

o fa dsigne la frquence de dbut de la bande attnue. On montre que les N ples ont pour affixes :

avec

.

et o Aa est lamplitude impose en bande attnue. Les N zros zk sont situs sur laxe imaginaire :

Il y a des ondulations en bande attnue mais pas dondulation en bande passante.

Un filtre de Cauer ou elliptique a comme gain :

o Rn est une fonction rationnelle de Tchebycheff. L caractrise lattnuation dans la bande de transition. Les filtres de Cauer prsentent des ondulations constantes en bande passante. Il y a des ondulations en bande attnue. Ces filtres sont dfinis partir de tables. Remarque : les mthodes de synthse ne doivent pas seulement se satisfaire de contraintes de gabarit. Elles doivent aussi prendre en compte limplantation finale de lalgorithme de filtrage. Ainsi, la prsence darrondis dans la reprsentation des coefficients introduit :

des phnomnes derreurs systmatiques que lon dsigne par bruits de calcul ; mais aussi de possibles instabilits lorsquon a affaire des filtres rcursifs.

Ces effets peuvent tre particulirement sensibles lorsque les processeurs utiliss travaillent en virgule fixe. 4. Signaux alatoires

4.1 Quelques rappels de 4.2 Notion de processus 4.3 Processus alatoires 4.3.1 Dfinitions 4.3.2 Ergodicit 4.3.3 Proprits 4.3.4 Filtrage 4.4 Chanes de 4.4.1 Chanes de Markov : 4.4.2 Chanes de Markov 4.5 lments destimation 4.5.1 Objet de la 4.5.2 lments de comparaison des 4.5.3 Estimation des moindres 4.5.4 Mthode des 4.5.5 Mthode du maximum de 4.5.6 Approche baysienne

probabilits alatoire SSL

Markov dfinitions caches statistique statistique estimateurs carrs moments vraisemblance

Comme nous lavons soulign prcdemment, les signaux manipuls en pratique ne peuvent tre que rarement reprsents comme des fonctions, ou comme solution dune quation diffrentielle ou rcurrente ou tout autre moyen mathmatique . On parle alors de signaux alatoires la connaissance desquels on accde travers des informations telles que moyenne, puissance moyenne, etc. qui sont dordre statistique. Cest la raison pour laquelle le fondement de ltude des signaux alatoires est la thorie des probabilits. 4.1 Quelques rappels de probabilits En thorie des probabilits (cf. [3] [9] ) on part dun ensemble dsignant lensemble des preuves. Un vecteur alatoire X de dimension p est dfini comme une application de dans . Se donner sa loi de probabilit cest se donner, pour tout pav b contenu dans probabilit que . Deux cas sont intressants en pratique :

, la

X prend ses valeurs dans un ensemble discret de valeurs. Sa loi est caractrise en se donnant la probabilit de chacune de ces valeurs : on dit que X et un vecteur alatoire discret ; X prend ses valeurs dans un continuum de par une expression de la forme : et la probabilit que est donne

o pX (x1, ..., xp) est une fonction positive, dfinie sur Son intgrale sur

, appele densit de probabilit.

est gale 1. On dit parfois que le vecteur alatoire X est continu .

Pour ne pas alourdir les notations, donnons quelques dfinitions en nous limitant au cas o X possde une densit de probabilit et o p = 2. Soit donc le vecteur alatoire (X1, X2) de densit pX (x1, x2). On montre que la variable alatoire X1 a pour densit de probabilit :

Dans ce contexte cette relation est appele loi a priori ou loi marginale.

On dit que X1 et X2 sont indpendantes si

La densit de probabilit de la loi conditionnelle de X1 connaissant X2 est donne par :

Si les deux variables sont indpendantes, on vrifie que la loi conditionnelle est gale la loi a priori.

La moyenne de X est le vecteur dterministe dont les composantes ont pour expression :

Si E (Xk ) = 0, on dit que Xk est centre. De faon plus gnrale on appelle moment dordre n de la variable alatoire Xk la quantit :

La covariance entre X1 et X2 est la quantit dfinie par :

o

cov(X1, X1) sappelle la variance de X1. On la note var(X1).

On dit que X1 et X2 sont non corrles si et seulement si cov(X1, X2) = 0. Si X1 et X2 sont indpendantes alors elles sont non corrles. En gnral la rciproque est fausse mais elle est vraie dans le cas gaussien.

On dit que la variable alatoire X est uniforme sur (a, b) si sa densit de probabilit est constante sur lintervalle (a,b). Elle a pour expression et 0 sinon.

On dit que X est gaussien si sa densit de probabilit a pour expression :

o x = (x1 x2)T, M = (m1 m2)T et C = (cij) une matrice symtrique, positive de dimension montre que E (Xk ) = mk , var (Xk ) = ckk et cov(X1, X2) = c12. Si cov(X1, X2) = 0, X1 et X2 sont indpendantes. Nota : det (C) dsigne le dterminant de la matrice carre C et AT la transpose de A. On dit quune matrice M est positive si pour tout vecteur a, le scalaire aTMa est positif. HAUT DE PAGE 4.2 Notion de processus alatoire Dans beaucoup de cas pratiques les phnomnes ont une forme si imprvisible quils semblent dus au hasard. On les dit alatoires. Pour modliser un phnomne alatoire (cf. [5] [6] ) on lui associe non plus un signal mais tout un ensemble de signaux que lon peut voir comme le rsultat dune infinit dexpriences rptes lidentique. videmment on ne peut pas rpter lidentique une infinit dexpriences. Mais loutil ainsi introduit permet de dcrire la grandeur observe par des proprits globales portant sur tout lensemble. Ainsi, on pourra supposer par exemple que toutes les trajectoires ont une moyenne nulle et une valeur efficace identique. Mathmatiquement un signal (on dit aussi processus) alatoire est une famille de variables alatoires indices par le temps n. On le note X (n ) (en omettant la rfrence lpreuve ). Il peut tre vu :

; On

soit, pour une preuve fixe 0, comme une simple fonction du temps x (n, 0) appele trajectoire (figure 20), soit, pour un instant fix n0, comme la variable alatoire X (n0).

Figure 20 - Trajectoires dun processus alatoire ( temps continu)

Voyons tout dabord quelques dfinitions.

Pour tout nombre K et pour toute suite dinstants (n1 ... nK ), lensemble des lois de probabilits du vecteur [X (n1 ... X (nK )] caractrise le processus X (n ) : on appelle cet ensemble la loi temporelle du processus. Soulignons que la donne de la loi temporelle ne permet pas de dterminer lquation des trajectoires. On appelle moyenne dun processus alatoire linstant n, lesprance mathmatique de la variable alatoire X (n ). Cest une fonction dterministe qui dpend a priori de n: m (n ) = E (X (n )) Si m (n ) = 0 pour tout n, on dit que le processus est centr.

On appelle suite ou fonction dautocovariance (certains auteurs parlent improprement dautocorrlation) la covariance entre les variables alatoires X (n1) et X (n2). Elle a pour expression :

o ltoile (*) dsigne le complexe conjugu. Bien sr, dans le cas de processus rel, il nest pas utile de le faire apparatre. Dans tous les cas, cest une fonction dterministe qui dpend la fois de n1 et de n2. Dans certains cas il est possible de dcrire le signal alatoire par la donne de sa loi temporelle. En voici trois exemples.

Une suite de variables alatoires indpendantes et identiquement distribues (iid) a une loi temporelle qui sobtient simplement tout ordre partir de (5.3) et de la donne de la loi de X0 de lune dentre elles. Un processus alatoire est gaussien si, pour tout nombre K dinstants, la loi de (X (n1), ..., X (nK)) est gaussienne. Dans ce cas, on vrifie aisment que la loi temporelle est uniquement caractrise par la donne de la moyenne et de la fonction dautocovariance.

Pour un processus alatoire de Markov la loi temporelle sexprime partir de la donne des probabilits de transition entre tats .

Hormis quelques cas particuliers tels que ceux cits prcdemment, il est trs compliqu de se donner compltement la loi temporelle. On se contente bien souvent des expressions de la moyenne et de la fonction de covariance entre X (n1) et X (n2) qui sont les moments dordre 1 et 2. On peut se demander pourquoi sarrter lordre 2. Il se trouve que la description lordre 2 est suffisante dans le cas gaussien, mais, surtout, elle est lie, comme nous allons lexpliquer, la distribution spectrale de la puissance et cette dernire est au centre des problmes de filtrage linaire. Depuis quelques annes, les chercheurs se sont beaucoup intresss aux statistiques dites dordre suprieur (SOS). Mais, aujourdhui encore les SOS restent un outil peu utilis en TNS. HAUT DE PAGE 4.3 Processus alatoires SSL HAUT DE PAGE 4.3.1 Dfinitions On dit quun processus alatoire est stationnaire au sens large (SSL) (sous-entendu du second ordre) sil vrifie les deux proprits suivantes :

la moyenne est indpendante de n et note m, la fonction dautocovariance ne dpend que lcart de temps k = n1 n2. Nous la notons alors R (k ).

Le mot stationnaire est li au fait que la moyenne et la fonction dautocovariance ne dpendent pas de lorigine du temps. Quand le processus est SSL, on a les dfinitions suivantes :

on appelle puissance la quantit P dfinie par :

comme on envisagera souvent des processus centrs, la puissance est alors la valeur lorigine de la fonction dautocovariance ;

on appelle spectre ou densit spectrale de puissance (dsp) dun processus alatoire SSL la TFtd de la suite R (k).

HAUT DE PAGE

4.3.2 Ergodicit Un processus alatoire peut tre vu comme une infinit de trajectoires correspondant une infinit dpreuves. Cependant, dans un grand nombre de cas pratiques, une seule ralisation du processus est accessible la mesure. Cest pourquoi la classe des processus stationnaires pour lesquels les moments peuvent tre obtenus en effectuant une moyenne temporelle sur une seule trajectoire, joue un rle important en pratique. Lergodicit prcise cette notion. Un processus stationnaire X (n ) est ergodique au second ordre si sa moyenne et sa fonction dautocovariance peuvent tre obtenues en effectuant une moyenne temporelle sur une seule trajectoire et sur un intervalle de temps qui tend vers linfini. En pratique, pour N suffisamment grand, on a :

Dans la suite, sauf indication contraire, nous supposerons que les processus sont ergodiques. HAUT DE PAGE 4.3.3 Proprits

La fonction dautocovariance est positive. Cela signifie que, quel que soit M, la matrice hermitienne (R = RT ) :

est une matrice positive. On note que R est une matrice de Toplitz. Nota : Les lignes parallles la diagonale principale sont constitues de termes constants.

La dsp est une fonction positive :

Si le processus est de moyenne non nulle, on adjoint au spectre une raie lorigine (f = 0) damplitude m2. Cette raie lorigine, qui traduit simplement la prsence

dune moyenne non nulle, porte le nom de composante continue du processus. Si on utilise la distribution de Dirac cela revient prendre pour dfinition du spectre la transforme de Fourier du moment du second ordre. On a effet :

qui a pour transforme de Fourier S (f ) + m2 (f ).

On appelle processus harmonique un signal alatoire dont les trajectoires sont dfinies par lexpression : (8)

o {As } dsigne une suite de P variables alatoires centres, non corrles de variance , {s } une suite de P variables alatoires indpendantes des {As }, de loi uniforme sur (0, 2), et {fs } une suite de P frquences. On montre que X (n ) est SSL, centr et que sa fonction dautocovariance a pour expression :

Sa dsp est donne au sens des distributions par :

Elle est constitue de raies situes aux frquences fk , qui traduisent la prsence de composantes priodiques dans le signal.

De faon semblable au cas dterministe avec lnergie, le spectre reprsente la rpartition (on dit aussi la localisation) de la puissance le long de laxe des frquences et la puissance est donne par :

Ltude des mthodes qui permettent destimer le spectre dun processus alatoire SSL est un domaine important du traitement du signal. Nous y reviendrons dans la suite. Quand un processus alatoire centr a une fonction dautocovariance R (k ) identique 0 pour , sa dsp est une constante. Par analogie avec la lumire blanche, dont le spectre est constant tout le long de laxe des frquences optiques, on dit que ce processus est blanc. Le bruit blanc est larchtype des modles de bruit rencontrs en pratique. Ainsi, dans les

systmes de communication, il modlise lensemble des bruits dorigine thermique qui interviennent dans la chane de transmission depuis lmetteur jusquau rcepteur. Un autre exemple de bruit blanc est le bruit introduit par lopration de quantification. Considrons la quantification uniforme sur N bits. Elle consiste diviser lintervalle crtecrte ( Ac , + Ac ) du signal (suppos centr) en 2N intervalles de mme longueur q = 2Ac /2N et dassocier lchantillon Xn le numro, cod sur N bits, de lintervalle auquel il appartient. A la restitution on remplace ce code par la valeur mdiane de lintervalle. Si on note Xn lchantillon quantifier et Yn la valeur restitue, on a Yn = kq si . On peut alors crire Yn = Xn + en o en reprsente lerreur. en est appel le bruit de quantification. Dans les calculs pratiques, on fait lhypothse que les erreurs en sont des variables alatoires non corrles dont la loi est uniforme sur ( q/2, q/2). On en dduit que E (en ) = 0 et que . En labsence dcrtage, lopration de quantification est donc considre comme quivalente laddition dun bruit SSL centr, blanc de puissance Bq = q 2/12 :

En pratique on ne peut pas garantir labsence dcrtage. Par contre on peut faire en sorte que les amplitudes suprieures Ac soient de probabilit ngligeable. Dans le cas o Xn et un signe alatoire, SSL, centr, de puissance 2 = R (0),on pose Ac = F o F est appel facteur de crte. Ainsi, si Xn est un processus alatoire gaussien, en prenant F = 3 on a une probabilit dcrtage qui est infrieure 1 %. Pour un signal de parole, qui vrifie mal lhypothse gaussienne, on prend F de lordre de 4. En supposant prsent que toutes les amplitudes sont comprises entre F et + F, le pas de quantification a pour expression q = 2F /2N. On en dduit que le rapport signal/bruit de quantification a pour expression :

Une consquence pratique est que le rapport signal/bruit de quantification augmente de 6 dB chaque fois quon ajoute 1 bit de codage. Notons que, sil ny avait pas lopration de quantification, il ne servirait rien de surchantillonner un signal au-del de la frquence de Nyquist (voir thorme dchantillonnage). Par contre, suite lopration de quantification, on montre que, sous lhypothse de blancheur du bruit de quantification, on gagne environ 3 dB sur le rapport signal bruit de quantification si lon double la frquence dchantillonnage. Malheureusement, cette rgle de doublement ne peut tre pousse trop loin car lhypothse de blancheur finirait par ne plus tre vrifie.

HAUT DE PAGE 4.3.4 Filtrage Soit X (n ) un processus alatoire SSL, de fonction dautocovariance RX (k ) et de dsp SX (f ), lentre dun filtre linaire de rponse impulsionnelle h (n ) et de gain complexe H (f ). On montre que le processus alatoire Y (n ) en sortie est lui-mme SSL. Sa moyenne est donne par :

Il est donc centr si le signal dentre est centr. Sa dsp est : (9)

Cette formule sapplique que le signal contienne ou pas une composante harmonique (expression ( cf. ici )). Ainsi, si le signal dentre est le processus harmonique (cf. quation ( cf. ici )), sa dsp a pour expression :

o 2 est la variance de A. On rappelle que la dsp de Y (n ) est donne par :

. En appliquant ( cf. ici ),

Ce rsultat est mis profit dans certains dispositifs de synchronisation pour rcuprer, par filtrage trs troit, une composante harmonique prsente dans le processus observ. Compare la formule des spectres ( cf. ici ), lexpression de la fonction dautocovariance RY (k ) en sortie est plus complique. Si h (n ) dsigne la rponse impulsionnelle du filtre, RY (k ) scrit :

o

.

On montre que les processus X (n ) et Y (n ) sont de covariance stationnaire, ce qui signifie que cov(X (n1), Y (n2)) ne dpend que de lcart de temps k = n1 n2. On la note RYX (k ) et son expression est :

HAUT DE PAGE 4.4 Chanes de Markov HAUT DE PAGE 4.4.1 Chanes de Markov : dfinitions Le caractre markovien de signaux alatoires permet dobtenir dintressants rsultats en TNS. Une chane de Markov temps discret [6] est une suite de variables alatoires X (n ) valeurs dans un ensemble fini (e1, ..., eN ) de N valeurs possibles. Le caractre markovien dit que la probabilit pour que X (n ) = ei conditionnellement tout le pass, concide avec la probabilit pour que X (n ) = ei conditionnellement linstant (n 1). Une chane de Markov est donc caractrise par la probabilit conditionnelle dtre dans ltat ej linstant n sachant que lon tait dans ltat ei linstant (n 1), ce que lon note :

Par consquent, pour tout n et tout i, on a

.

Lorsque aij (n ) est indpendant de n, la chane peut tre reprsente par une matrice A dlments aij ou encore par une machine tats dans laquelle chaque transition est pondre par aij. La figure 21 illustre un processus trois tats e1, e2, e3 et les arcs sont pondrs par les probabilits de transition. Par exemple la probabilit de transition de ltat e1 dans ltat e2 est gale 3/4, et la matrice A, appele aussi matrice Markov (la somme des lments dune ligne est gale 1), scrit :

Si on note pi (n ) la probabilit de se trouver dans ltat ei , linstant n et p (n ) = (p1 (n ) p 2 (n ) ... pN (n ))T, on montre facilement que :

Une chane de Markov est donc caractrise par la donne de la matrice A et du vecteur p(0). Son comportement, en particulier quand n tend vers linfini, dpend, entre autre, de la topologie du graphe, cest--dire des zros de A. Il peut y avoir des cycles, des tats probabilit limite nulle, stationnarit, etc.

Figure 21 - Graphe dune chane de Markov trois tats HAUT DE PAGE 4.4.2 Chanes de Markov caches Dans certains problmes, lobservation est directement modlisable par une chane de Markov X (n ). Cest le cas par exemple en communication numrique lorsquon utilise un codeur lentre duquel on a une suite binaire. Mais il en est dautres o lobservation nest quune version Y (n ) transforme dune certaine chane de Markov X (n ) non visible, la transformation subie par X (n ) ntant a priori ni bijective ni mme dterministe. On parle alors de chanes de Markov caches (CMC) (ou en anglais Hidden Markov Model : HMM). Lexemple qui suit, emprunt [19] , explicite cette notion : un exprimentateur procde un lancer de pices de monnaie. Il nonce un observateur, qui ne le voit pas agir, la suite Y (n ) des rsultats obtenus. Lexprimentateur utilise N pices et choisit alatoirement une pice suivant une procdure dcrite par une matrice markovienne A. Les pices peuvent tre truques, ce qui signifie que la probabilit pour que Y (n ) = y sachant que telle pice a t utilise peut ne pas tre gale 1/2. Dans notre cas la variable y ne peut prendre que K = 2 valeurs, savoir pile ou face. De faon plus gnrale, un modle de CMC est dcrit par :

le nombre N dtats {e1 ... eN } ; le nombre K de valeurs possibles de lobservation {Y1 ... YK} ; la matrice A de transition entre tats :

la loi de probabilit de lobservation connaissant ltat :

o

et

;

la probabilit p (0) de ltat initial.

Quelques problmes de base On distingue trois problmes fondamentaux lis la notion de CMC.

Comment calculer numriquement la probabilit dune suite dobservations Y (n ) pour un modle donn de CMC ? La valeur obtenue peut tre utilise comme score dadquation des observations avec le modle et permet donc de choisir parmi plusieurs modles en comptition. tant donn une suite dobservations et un modle de CMC, comment doit-on trouver la suite dtats qui explique au mieux les observations ? Le critre du maximum de vraisemblance peut tre utilis et lalgorithme de Viterbi, bien connu en communications numriques, permet de rsoudre le problme. Comment choisir les paramtres du modle qui maximisent la probabilit (on dit aussi la vraisemblance) de la squence dobservations ? Dans le cas gnral, on ne dispose pas dune expression analytique du rsultat. Cest pourquoi on fait appel des mthodes numriques de maximisation, en particulier lalgorithme esprance-maximisation (EM) [13] .

Exemple dapplication : la reconnaissance de la parole Le domaine de la reconnaissance des formes (RF) est troitement associ celui du traitement du signal. Un dispositif de RF comporte en gnral trois tapes : la mesure dun vecteur de paramtres construits partir du signal, la comparaison de ce vecteur dans une base de rfrence et enfin la dcision. La premire tape utilise largement les outils de TNS. Les chanes de Markov caches en font partie [4] [19]. Comme son nom lindique, la reconnaissance de la parole est un problme de RF et les CMC sont un outil de choix. Lide est la suivante : on considre des mots isols et on associe chacun dentre eux une CMC. Chaque tat est associ grosso modo un morceau du signal correspondant un mot. En fait, pour rduire la taille dun dictionnaire complet de mots, on associe plutt une CMC chaque phonme, sorte dunit sonore du langage parl. Chaque mot est alors le rsultat de la concatnation de plusieurs CMC. Le problme de la reconnaissance peut tre ramen au calcul dune probabilit conditionnelle P (M Y ) caractrisant la validit du modle M relativement aux quantits observes Y. On se retrouve l encore devant un problme de maximum de vraisemblance. La rfrence [19] donne un grand nombre dlments sur lutilisation des CMC en reconnaissance de la parole.

HAUT DE PAGE 4.5 lments destimation statistique Lobjectif de ce paragraphe est de donner un aperu de la problmatique rencontre en estimation statistique et de prsenter quelques mthodes destimation populaires en TNS. Nous ne prtendons nullement puiser le sujet et nous oublions certainement certains aspects fondamentaux. Ce domaine comporte en fait une trs vaste littrature et nous renvoyons le lecteur la rfrence [13] qui en donne une bonne introduction.

HAUT DE PAGE 4.5.1 Objet de la statistique Considrons une exprience alatoire dont la loi de probabilit dpend dun paramtre inconnu . Dans le cas gnral ce paramtre est un vecteur multidimensionnel. Le problme de lestimation statistique est la recherche de mthodes pour valuer partir dune suite {X (1) ... X (n )} dobservations. Plus gnralement, lobjet de la statistique est dinfrer, partir de ces observations, certaines proprits de la loi inconnue, comme par exemple dire si sa variance est suprieure un seuil ou bien encore si cette loi est gaussienne. Le cas le plus simple est celui o la loi de lobservation est compltement spcifie une fois donn le paramtre . On dit alors que le modle est paramtrique. Il nen est pas toujours ainsi. Considrons par exemple lobservation X (n ) = m + W (n ) o m est le paramtre estimer et o W (n ) est une seule de variables alatoires centres de loi inconnue. Dans ce cas, se donner m ne suffit pas dterminer la loi de X (n ). On dit que le modle est non paramtrique. Par contre, si on prcise, dans ce modle dobservation, que W (n ) est une suite de variables alatoires gaussiennes indpendantes, centres, de mme variance 2, le problme devient paramtrique pour le paramtre bidimensionnel = (m 2)T. Dans la suite nous considrons uniquement le cas de lestimation paramtrique dun paramtre de dimension k. HAUT DE PAGE 4.5.2 lments de comparaison des estimateurs On appelle estimateur de , paramtre vectoriel de dimension k, k fonctions (mesurables) de {X (1) ... X (N )}, que nous notons vectoriellement T(X (1) ... X (N )). On utilise aussi le terme de statistique pour dsigner une fonction des observations. Pour comparer entre eux les estimateurs on introduit les quantits suivantes.

On appelle biais de lestimateur T, le vecteur k composantes dfini par :

Dans le cas o la loi de probabilit du vecteur alatoire [X (1) ... X (n )]T possde une densit de probabilit pX (x1 ... xN ; ) la j e composante de b( ) scrit :

En gnral le biais est une fonction du paramtre inconnu . Il est donc lui-mme inconnu. On dit que T est sans biais si, et seulement si, quel que soit , b ( ) = 0. On dit quun estimateur est asymptotiquement sans biais, si b ( ) tend vers 0 quand N tend vers linfini. Cette proprit est tout fait souhaitable car, bien quun estimateur sans biais ne soit pas ncessairement bon, un biais persistant est presque toujours la preuve de performances mdiocres.

On appelle dispersion ou cart quadratique de lestimateur T la matrice de dimension dfinie par :

Cette matrice est positive. On montre que D( ) = cov (T) + b( )bT( ). Par consquent, quand lestimateur est sans biais, sa dispersion est gale sa matrice de covariance. Il faut avoir lesprit que la dispersion reprsente une mesure des fluctuations de T autour de la vraie valeur . En pratique, si on rpte lexprience lidentique un grand nombre de fois, les composantes de T doivent raisonnablement rester dans un intervalle dont la largeur est de lordre de grandeur de la racine carre des lments diagonaux de D( ). Cest pourquoi on adopte la dfinition suivante.

On dit que lestimateur T est meilleur que lestimateur V si, et seulement si quel que soit , DV ( ) DT ( ) est matrice positive.

Malheureusement il nexiste pas destimateur qui soit de dispersion minimale pour toute valeur du paramtre . Cest la raison pour laquelle on est conduit minimiser, plutt que la dispersion, une fonction de risque R (T ; ), dans une classe plus restreinte destimateurs. Signalons quil existe une borne infrieure de la dispersion de tout estimateur, appele borne de Cramer-Rao (BCR). La BCR peut tre vue comme une limite fondamentale la prcision avec laquelle on peut estimer un paramtre . Dans le cas dun estimateur sans biais, on a pour et la BCR est gale F 1( ), o la matrice F( ) a comme lment gnrateur :

F( ) porte le nom de matrice dinformation de Fisher. HAUT DE PAGE 4.5.3 Estimation des moindres carrs A lorigine, la mthode des moindres carrs nest proprement parler de nature statistique. Elle fait appel un modle dterministe du signal dpendant dun paramtre mesurer. On note ce signal S( ). On observe X qui, pour des raisons non explicites, nest quune version dforme de S( ). Lestimateur des moindres carrs consiste prendre comme valeur de celle qui rend minimale la fonction quadratique de cot J ( ) = (X S( ))T (X S( )). Le mrite de son invention revient Gauss qui lutilisa pour calculer le mouvement des plantes, mais aujourdhui, son champ dapplications sest considrablement accru. Le cas le plus simple est celui o le modle de signal dpend linairement de . Dans ce cas la mthode aboutit la construction du meilleur estimateur linaire sans biais. Soit en effet une exprience alatoire dont le modle dobservation est :

On suppose que W (n ) est une suite de variables alatoires, centres, de fonction de covariance R (n1, n2) connue et que hnj est une suite de quantits connues. Pour un chantillon de taille N, la suite des N quations prcdentes peut scrire matriciellement : (10)

o dsigne le vecteur de dimension k estimer et H une matrice connue de dimension . On note C = E (WWT) la matrice de covariance de dimension construite partir de R (n1, n2). On limite la recherche la classe des estimateurs linaires cest--dire de la forme T = AX o A est une matrice de dimension dterminer. On montre que :

est, parmi les estimateurs linaires sans biais, celui qui est de dispersion minimale. Dans le cas o le bruit est blanc, et la matrice de covariance 2 T 1 T C = I. On dduit alors de ( cf. ici ) que T = (H H) H X. Cest lexpression de lestimateur des moindres carrs, dit ordinaire, obtenu lorigine par Gauss et qui correspond lhypothse que le bruit est blanc. Par opposition ( cf. ici ) est dit estimateur des moindres carrs pondrs. Lexpression ( cf. ici ) montre que le calcul de T ncessite la manipulation dune matrice de la matrice H de dimension . Si on veut effectuer le calcul de T au fur et mesure que les donnes X (n ) arrivent, on voit que la taille de cette matrice crot de manire explosive . Dans ces conditions le traitement ne peut pas tre effectu sur calculateur. Heureusement, il existe un algorithme rcursif qui calcule la valeur de T partir de son ancienne valeur et de la dernire valeur reue de X (n ) et qui nutilise que des matrices de dimension finie. Cet algorithme est dit algorithme des moindres carrs rcursifs (MCR). La mthode des moindres carrs stend au cas o le modle dobservation ne dpend plus linairement de . Il suffit de remplacer dans la relation ( cf. ici ) H par S( ) suppose non linaire en . On obtient lquation dobservation X = S( ) + W. Malheureusement, mme sous des hypothses simplificatrices sur W, il nest plus possible dobtenir lexpression analytique dun estimateur sans biais de dispersion minimale. Comme lorigine, lapproche consiste alors dterminer qui rend minimale la fonction quadratique de cot J ( ) = (X S( ))T(X S( )). Sous certaines hypothses de rgularit de S( ), on montre que lestimateur obtenu possde de bonnes performances statistiques. En rgle gnrale la minimisation de J ( ) se fait par des techniques numriques. Une autre famille de mthodes est base sur la dcomposition de la matrice de covariance de X en sous-espaces propres. Ces mthodes, dites de type sous-espace, ont connu un trs fort dveloppement ces dernires annes (MUSIC, ESPRIT, etc. [11] [12]).

Exemple on observe N chantillons {X (1), ..., X (N )} de lexponentielle complexe S (n ; f0) = exp(2jf0(n 1)) de frquence f0. On montre que la valeur de f0 qui minimise :

est donne par :

Cest donc labscisse du maximum de la TFtd de la suite {X (1) ... X (N )}. Dans le cas o on a non plus une mais P frquences valuer, la recherche du minimum ne peut tre effectue que numriquement et est trs coteuse en temps de calcul. Toutefois, le rsultat essentiel retenir est que la solution qui consiste rechercher les P maximum de la TFtd est trs proche de loptimalit lorsque les carts en frquence sont suprieurs la limite de Fourier 2/N. HAUT DE PAGE 4.5.4 Mthode des moments Propose au dpart par Pearson, la mthode des moments est lune des mthodes les plus aises pour la recherche destimateurs. Elle consiste, dans sa forme la plus simple, galer les moments empiriques avec les moments statistiques de mme ordre. Voyons son application dans le cas simple o lchantillon observ {X (1) ... X (N )} est une suite de N variables alatoires iid. On appelle moment empirique dordre m la statistique dfinie par :

On note Sm( ) = E (X m(1)) le moment dordre m de X (1). La mthode des moments consiste rsoudre le systme des k quations aux k inconnues = (1 ... k ) dfini par :

Il existe de multiples variantes de cette mthode, en particulier en prenant des moments de la forme E [fm (X(1))] la place de E [X m(1)] ou encore en prenant un nombre de moments suprieurs k (systme surdimensionn). On montre (sous certaines hypothses de rgularit de la loi de X (1)) que tous ces estimateurs sont asymptotiquement sans biais et de dispersion minimale. Nota : On entend par asymptotiquement que N tend vers linfini. Dans le cas o X (n ) est un signal alatoire SSL (on abandonne lhypothse iid), centr, les statistiques les plus utilises sont de la forme :

qui sont les statistiques empiriques des covariances. En particulier elles sont utilises pour estimer les paramtres dun modle AR (cf. 6.2.3). Ltude de leurs proprits statistiques est beaucoup plus complexe. Toutefois, on montre que, dans le cas de lestimation AR, les estimateurs obtenus sont asymptotiquement sans biais et de dispersion minimale. HAUT DE PAGE 4.5.5 Mthode du maximum de vraisemblance La mthode du maximum de vraisemblance constitue une gnralisation dune ide de Gauss, qui postule que la meilleure valeur du paramtre est celle qui correspond la plus grande probabilit de lvnement observ. On considre une observation dont la loi de probabilit possde une densit not px (x1 ... xN ; ). Lestimateur du maximum de vraisemblance est la valeur de qui correspond au maximum, ce qui scrit :

En probabilit, la fonction px (x (1) ... x (N ) ; ), considre comme une fonction de (x1 ... xN ), est appele une densit de probabilit. Mais en statistique, lorsquelle est considre comme fonction de , elle porte le nom de vraisemblance. Le plus souvent on en prend le logarithme qui porte le nom de log-vraisemblance. Exemple on considre un train binaire que lon modlise comme une suite de variables alatoires iid valeurs dans {0,1}. On pose = P (X (n ) = 1) et on veut estimer partir dune suite de N valeurs. La log-vraisemblance scrit :

Exemple En drivant cette expression par rapport et en lannulant, on obtient lexpression de lestimateur du maximum de vraisemblance :

En gnral, la dtermination de lexpression analytique du maximum est plus difficile, voire impossible, et il faut alors faire appel des techniques numriques de calcul. Certaines sont classiques (algorithme du gradient, algorithme de Newton-Raphson). Une technique plus spcifique, lie au domaine des statistiques, a connu ces dernires annes un essor considrable : lalgorithme dEsprance-Maximisation (EM) [13] . HAUT DE PAGE 4.5.6 Approche baysienne On a dit que la dispersion D( ) ne permettait pas de comparer totalement les estimateurs entre eux. Dans lapproche baysienne, on suppose que toutes les valeurs de ne sont pas galement probables mais quelles sont distribues dans un domaine de , suivant une loi de probabilit connue, appel loi a priori. On peut alors prendre la moyenne de D( ) sur . Ce qui conduit la dfinition du risque baysien. On appelle risque baysien associ lestimateur T la quantit dfinie par :

o q( ) dsigne la densit de probabilit de la loi a priori de . Par dfinition lestimateur baysien est celui qui minimise le risque baysien. On montre quil est donn par lesprance conditionnelle de sachant X(1) ... X(N ), qui se note E ( X (1) ... X (N )). Cest un vecteur k composantes qui a pour expression pour :

Dans le cas gaussien les calculs sont simples. En particulier lestimateur baysien est luimme gaussien. 5. Traitements de signaux

5.1 Traitements 5.1.1 Sur 5.1.2 Banc 5.1.3 Ondelettes 5.2 Estimation 5.2.1 Utilisation 5.2.2 Priodogramme 5.2.3 Modlisation 5.3 Filtrage adaptatif

et de et de du analyse

multicadences sous-chantillonnage filtres multichelle spectre priodogramme moyenn AR

Ce paragraphe ne prtend nullement donner une vue exhaustive des problmes de TNS. Il prsente trois exemples dans le but dillustrer les notions prsentes prcdemment et, pourquoi pas, de susciter lenvie pour certains de se plonger dans limmense littrature consacre ces sujets. 5.1 Traitements multicadences Un systme multicadence est caractris par des cadences de traitement diffrentes en divers points de la chane de calcul. Il y est fait largement appel aux oprations de dcimation et insertion. Dans ce paragraphe nous nous limitons la prsentation de quelques rsultats concernant les bancs de filtres et de leurs liens avec lanalyse multirsolution. HAUT DE PAGE 5.1.1 Sur et sous-chantillonnage Le surchantillonnage dun facteur entier M consiste, sur une suite x (n ), calculer (M 1) valeurs intermdiaires entre deux points conscutifs. Le sous-chantillonnage dun facteur entier M est en quelque sorte lopration inverse : elle consiste calculer, sur une suite x (n ), la suite chantillonne la cadence M foi