Traitement du Signal avec Audacity

Click here to load reader

  • date post

    29-Dec-2016
  • Category

    Documents

  • view

    267
  • download

    7

Embed Size (px)

Transcript of Traitement du Signal avec Audacity

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Traitement du signal avec

    S.Ayrinhac (v13. 14/03/2014)

    1. Introduction Audacity

    1.1. Audacity est un logiciel libre et gratuit, multiplateformes, facile d'utilisation,

    qui va nous permettre d'illustrer des notions de traitement du signal appliques

    aux sons audibles. Ces notions peuvent tre profitables dans dautres thmatiques

    (traitement des images, gophysique, etc) car le traitement du signal est une

    discipline transverse. Ce document fait suite un cours o ont t abordes les

    notions fondamentales : chantillonnage, thorme de Shannon, quantification,

    compression.

    Audacity a t cr en 1999 par Dominic Mazzoni, et est actuellement dvelopp

    par une quipe de bnvoles1.

    Le logiciel est disponible l'adresse http://audacity.sourceforge.net/

    La version la plus rcente d'Audacity est la 2.0.5. Un manuel et des tutoriaux

    peuvent tre tlchargs l'adresse :

    http://audacity.sourceforge.net/manual-fr-1.2/FR_index.html

    L'export de MP3 ncessite l'encodeur LAME. Il faut tlcharger et installer un

    petit add-on la page : http://lame1.buanzo.com.ar/ ; puis lancer l'excutable

    C:\Program Files\Lame for Audacity\Lame_v3.99.3_for_Windows.exe

    1.2. Commandes utiles

    - slectionner une piste partir du curseur : Maj + avance rapide ;

    - slectionner toutes les pistes : Ctrl + A ;

    - copier un bout de piste : Ctrl + C ;

    - coller un bout de piste : Ctrl + V ;

    - annuler une opration : Ctrl + Z ;

    - supprimer une slection : Suppr

    - dzoomer l'chelle verticale : Maj

    1 Voir le livre Audacity 2, Enregistrez, montez, mixez, ditions Pearson, Christian

    Brochec, 2012, ISBN 978-2-7440-9402-6.

    http://audacity.sourceforge.net/http://audacity.sourceforge.net/manual-fr-1.2/FR_index.htmlhttp://lame1.buanzo.com.ar/

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    2. Plan (correspond environ 6h denseignements)

    Partie A

    1. Introduction Audacity.

    2. Chronogramme.

    2.1. Lecture, enregistrement et gnration dun son.

    2.2. Analyse dun spectrogramme.

    2.3. Bruit de quantification : quantification uniforme et non-uniforme.

    3. Transforme de Fourier (TF)

    3.1. Rappels sur la TF : dfinition mathmatique, TF inverse, calcul de la

    TF d'un crneau, TF de quelques fonctions usuelles.

    3.2. Srie de Fourier (SF).

    3.3. TF discrte (TFD) et TF rapide (FFT).

    Visualiser un spectre dans Audacity :

    menu Analyse > Tracer le spectre.

    3.4. Rsolution spectrale et phnomne de battement.

    3.5. Technique du bourrage de zros (zero-padding).

    3.6. Le fentrage

    Partie B

    4. Spectrogramme / sonagramme

    4.1. Dfinition d'un spectrogramme.

    Le spectrogramme dans Audacity, et options de visualisation :

    menu Edition > Prfrences... > Spectrogrammes.

    4.2. Repliement du spectre : frquence instantane, chirp linaire.

    4.3. Aller plus loin : transforme en ondelettes (scalogramme).

    5. Compression

    5.1. Comparaison entre un .wav, un .mp3 et un .ogg du mme morceau.

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Ce cours propose plusieurs types dactivits (dsigns par des couleurs

    diffrentes) :

    Cet icne indique que des rappels de cours doivent tre faits :

    FICHE

    Ce document sappuie sur un certain nombre de documents multimdia :

    - coute dun son - vido explicative - document crit

    - liens vers des pages web www

    2. Chronogramme (forme donde, waveform)

    2.1. Importer un son

    Activit (2.1.1) Lecture

    Limport dun son se fait via le menu : Fichier>Importer>Audio ou

    Fichier>Ouvrir.

    Les dures peuvent tre mesures en cochant en bas la case Dure, et en

    slectionnant une unit adapte (hh:mm:ss + millisecondes par exemple) dans le

    menu droulant du chronomtre.

    Le signal sonore peut tre finalement stock sous la forme d'un fichier

    d'extension .wav.

    Activit (2.1.2) Enregistrement

    Une fois le microphone branch, vous pouvez commencer l'enregistrement en

    allant dans le menu Transport > Enregistrement. Pour manipuler des fichiers de

    taille raisonnable, veillez enregistrer le son en mono, 16 bits, 44100 Hz, en ne

    dpassant pas les 10 s (grce au panneau qui se trouve gauche du

    chronogramme). Le signal sonore peut tre finalement stock sous la forme d'un

    fichier d'extension .wav. Pour cela, allez dans le menu Fichier > Exporter >

    WAV sign 16 bits PCM

    Le VU-metre (voir figure suivante) indique en vert clair le niveau instantan, en

    vert fonc le niveau maximum atteint et en rouge une saturation ventuelle

    Cours / rappels

    thoriques

    Fonctionnement

    dAudacity

    Activit / TP

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    (lorsque l'amplitude dpasse 1). Dans ce cas, il faut recommencer

    l'enregistrement avec un niveau plus faible.

    Il est pratique d'enregistrer sur un dclencheur de niveau. Cette possibilit est

    active via le menu Transport > Enregistrement automatique. Le rglage du

    niveau est accessible par Transport > Niveau de l'enregistrement automatique.

    Activit (2.1.3) Gnration dun son

    Audacity permet de gnrer des sons simples : sinusode, crneaux, etc.

    Pour gnrer un son, ajouter une nouvelle piste :

    Menu Pistes > Ajouter nouvelle > Piste mono

    Puis gnrer le son lui-mme :

    Menu Gnrer > son

    2.2. Analyse d'un chronogramme

    Activit (2.2.1) Chronogramme

    Le chronogramme est appel forme donde dans Audacity.

    Lecture des diffrents paramtres pertinents :

    dure, nombre d'chantillons : ces grandeurs sont visibles en cochant en bas la case Dure, et en slectionnant une unit adapte (hh:mm:ss +

    millisecondes par exemple) dans le menu droulant du chronomtre.

    frquence d'chantillonnage Fe

    nombre de pistes (mono/stro)

    quantification (16 bits pour le .wav mais 32 bits pour les fichiers dAudacity extension .aup).

    Remarque : La Fe est indique de plusieurs manires diffrentes (voir graphique

    ci-dessous).

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    La case Projet en bas gauche permet de modifier la Fe de lensemble du

    projet.

    Activit (2.2.3) Interfrences destructives2

    Question : partir dune piste quelconque, la dupliquer, puis linverser avec le

    menu Effets > Inverse. Ecouter les deux pistes ensemble. Que constatez-vous ?

    Rponse : lorsquon coute en mme temps une piste et son inverse, il y a

    silence. En effet, il y a interfrences destructives, car un signal ajout au mme

    signal en opposition de phase sannule. Cette ide est la base du contrle actif

    du bruit, qui permet une rduction du bruit via lenvoi du mme signal mais en

    opposition de phase.

    Activit (2.2.4) Phase 1

    Question : inverser un son quelconque avec Effets > Inverse. Comparer le son

    obtenu avec le son dorigine. Que constatez-vous ?

    Rponse : un signal complexe invers donne le mme son que le signal de dpart.

    En effet, le cerveau humain est peu sensible la phase (le fait de commencer par

    une crte ou un creux) mais il est plus sensible au contenu frquentiel.

    2 Voir larticle de J.Groppe, The Physics Teacher, Vol. 49, February 2011

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Activit (2.2.5) Phase 2

    Quesion : comparer les chronogrammes des deux sons ci-dessous, la fois

    visuellement, et lcoute. Que constatez-vous ?

    http://www.impmc.jussieu.fr/~ayrinhac/sons/somme_de_sinus.wav http://www.impmc.jussieu.fr/~ayrinhac/sons/somme_de_cosinus.wav

    Rponse : bien que les chronogrammes soient trs diffrents, les deux sons se

    rvlent semblables lcoute3.

    Activit (2.2.6) Taille du fichier numrique

    La taille L dun fichier audio non compress est donne par la formule suivante :

    L=F*T*Q*P

    o F est la frquence dchantillonnage, T le temps denregistrement, Q la

    quantification et P le nombre de pistes (mono, stro, etc). Il faut diviser la taille

    par 8 pour convertir en octets.

    Question : quelle est la taille dun CD audio standard dune heure ?

    Rponse : L=44100*16*2*3600/8=635 Mo.

    Question : prendre un fichier audio quelconque, calculer la taille attendue du

    fichier, et comparer avec la taille sur le disque. Trouvez-vous des tailles (en

    octets) identiques ? Pourquoi ?

    Rponse : les fichiers binaires (les fichiers qui ne contiennent pas du texte)

    possdent un en-tte qui dcrit le format et donne des informations sur le fichier.

    Par exemple, un fichier .wav comporte 44 octets den-tte. Sous Windows, il y a

    une diffrence entre taille et taille sur le disque . Cette diffrence provient

    de la taille des clusters (bloc mmoire ou secteur, en franais) occups par le

    fichier. Les Ko sont en fait des Kio, cest--dire quun Kio=1024 octets et non

    1000.

    3 Voir page 66 du cours de Philippe Guillaume (http://www-gmm.insa-toulouse.fr/~guillaum/sons-musique.pdf)

    http://www.impmc.jussieu.fr/~ayrinhac/sons/somme_de_sinus.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/somme_de_cosinus.wavhttp://www-gmm.insa-toulouse.fr/~guillaum/sons-musique.pdf

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    2.3. Bruit de quantification (bdq)

    - Rappels : l'amplitude est code sur b bits, et l'amplitude est dcoupe en L

    intervalles gaux (quantification uniforme). FICHE

    Question : quel est le lien mathmatique entre L et b ?

    Activit (2.3.1) Quantification uniforme et non uniforme

    Question : les fichiers .wav sont-ils cods avec une quantification uniforme ?

    Rponse : lors de lexport en .WAV, il est indiqu PCM. Cet acronyme signifie

    pulse code modulation . Ce nest pas une quantification uniforme, ce qui

    signifie que lintervalle de variation de lamplitude est dcoupe en L intervalles

    non gaux. Au contraire, le LPCM pour linearized pulse code modulation

    utilise une quantification uniforme.

    Activit (2.3.2) Nombre sign

    Lors de lexport, Audacity prcise 16 bits sign :

    En informatique, un entier sign signifie que le premier bit code le signe.

    Question : si le codage est effectu sur 16 bits signs, quelle est la plage de

    valeurs possibles ?

    Activit (2.3.3) Quantification

    Ecoutons un son avec une quantification qui augmente. Ces sons ont t crs

    grce Scilab (http://www.scilab.org/) partir dun morceau de Yann Tiersen

    issu de la bande originale du film Amlie Poulain4.

    Important : ce nest pas une vraie quantification qui a t effectue sur les

    sons ci-dessous. En effet lamplitude du son est quantifie, mais le son

    numrique reste sur 16 bits !

    Remarque : il est possible de choisir une vraie quantification lexport via

    le menu Fichier>Exporter>Autres formats non

    compresss>Options>Encodage>Unsigned 8 bit PCM

    Le son original est le suivant :

    http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-original.wav Les sons quantifis sont les suivants

    http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-12bits.wav

    4 http://fr.wikipedia.org/wiki/Am%C3%A9lie_Poulain

    http://www.scilab.org/http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-12bits.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/piano-12bits.wav

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-10bits.wav http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-8bits.wav http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-7bits.wav http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-6bits.wav http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-5bits.wav http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-4bits.wav http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-3bits.wav http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-2bits.wav

    Question : partir de quelle quantification entendez-vous un bruit

    parasite apparatre ?

    Question : Quelle est la quantification maximale ? Le morceau ainsi quantifi

    est-il reconnaissable ?

    Rponse : le signal ne contient que 0 ou 1, soit un codage sur 1 bit. Ecoutons un

    morceau ainsi quantifi :

    http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-1bit.wav

    Activit (2.3.4) Bruit de quantification

    On peut essayer de visualiser le bruit de quantification en soustrayant le son

    quantifi au son originel. Pour cela, il faut inverser une des deux pistes (Effets >

    Inverser) et les sommer (Pistes > Mixage et rendu).

    Question : le bruit obtenu est-il un bruit blanc ? Si non, pourquoi ?

    Rponse : en thorie, le bruit de quantification possde les caractristiques dun

    bruit blanc lorsque la quantification est uniforme. En pratique, ce nest pas le cas,

    car les .WAV sont sauvs en PCM qui est une quantification non uniforme.

    3. Transforme de Fourier (TF) et analyse spectrale

    3.1. Rappels sur la transforme de Fourier

    Dfinitions mathmatiques de la TF et de la TF inverse. FICHE

    Exercice : calcul de la TF d'un crneau. FICHE

    Animation : lorsque la largeur de la fonction porte augmente, la largeur du lobe

    principal du spectre diminue.

    http://www.impmc.jussieu.fr/~ayrinhac/videos/TFporte.mpg Voici les TFs de quelques fonctions usuelles

    5 :

    http://www.impmc.jussieu.fr/~ayrinhac/images/TFpage1.gif http://www.impmc.jussieu.fr/~ayrinhac/images/TFpage2.gif http://www.impmc.jussieu.fr/~ayrinhac/images/TFpage3.gif

    5 Pages 26-28 du cours de P.Brault (braultp.free.fr/Cours_signal/signal_6juin_sscmp.pdf)

    http://www.impmc.jussieu.fr/~ayrinhac/sons/piano-10bits.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/piano-8bits.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/piano-7bits.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/piano-6bits.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/piano-5bits.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/piano-4bits.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/piano-3bits.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/piano-2bits.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/piano-1bit.wavhttp://www.impmc.jussieu.fr/~ayrinhac/videos/TFporte.mpghttp://www.impmc.jussieu.fr/~ayrinhac/images/TFpage1.gifhttp://www.impmc.jussieu.fr/~ayrinhac/images/TFpage2.gifhttp://www.impmc.jussieu.fr/~ayrinhac/images/TFpage3.giffile:///C:/Users/ayrinhac/Desktop/Enseignements/LP300%202011-2012/Traitement%20du%20signal%20avec%20Audacity/braultp.free.fr/Cours_signal/signal_6juin_sscmp.pdf

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Activit (3.1.1) Transforme de Fourier dun sinus cardinal

    On peut vrifier que la TF dun sinus cardinal est une fonction porte.

    Voici un sinus cardinal gnr avec Scilab :

    http://www.impmc.jussieu.fr/~ayrinhac/sons/sinc.wav

    3.2. Rappels sur la srie de Fourier

    - Dfinitions mathmatiques de la srie de Fourier (SF) FICHE

    - Lien et diffrence avec les coefficients de Fourier (notion de srie de Fourier).

    Important : ne pas oublier que lorsquon priodise en temps, on discrtise en

    frquence (et inversement, lorsquon discrtise en temps, on priodise en

    frquence).

    Voici la dcomposition de quelques signaux usuels en sries de Fourier :

    http://www.impmc.jussieu.fr/~ayrinhac/images/series_de_fourier.png

    Activit (3.2.1) Motif priodique et spectre de raies

    Grce loutil retouche (icne ci-dessous), gnrer un motif quelconque.

    Exemple de motif :

    dd Dupliquer ce motif pour crer un son. Une mthode possible est la suivante : en

    maintenant Ctrl+V appuy, on peut copier indfiniment une priode (au pralable

    il faut avoir copi un morceau de piste, et plac le curseur en la fin de la piste).

    Ne pas oublier de supprimer la composante DC si elle existe. Tracer le spectre.

    Question : pourquoi a-t-on un spectre de raies ? Identifier le fondamental et les

    harmoniques.

    Rponse : cest la priodicit du motif qui est responsable des pics bien dfinis

    que lon voit dans le spectre. La frquence du fondamental est celle de la priode

    la plus grande visible dans le signal (la dure du motif de base). La rpartition

    http://www.impmc.jussieu.fr/~ayrinhac/sons/sinc.wavhttp://www.impmc.jussieu.fr/~ayrinhac/images/series_de_fourier.png

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    des harmoniques va varier suivant la forme du signal (srie de Fourier) :

    (www) http://www.dspguide.com/graphics/F_13_10.gif

    Activit (3.2.2) Phnomne de Gibbs 1

    Gnrer plusieurs sinusodes sur plusieurs pistes diffrentes avec les frquences

    suivantes : 100 Hz, 300 Hz, 500 Hz, 700 Hz, 900 Hz et les amplitudes suivantes :

    0.1, 0.033, 0.02, 0.0142, 0.0111.

    Sommer toutes les pistes. Quel est le rsultat ?

    Activit (3.2.3) Phnomne de Gibbs 2

    Gnrer un signal carr de 50 Hz puis rchantillonner 8000 Hz. On voit

    apparatre le phnomne de Gibbs (oscillations aux jointures) car la srie de

    Fourier est tronque.

    Remarque : il est possible aussi dappliquer un filtrage passe-bas avec un flanc

    trs abrupt, le maximum tant de 48dB par dcade (Effets>Low pass

    filter>Rolloff 48 dB>Cutoff 8000 Hz).

    3.3. TF discrte (TFD)

    Rappels de cours sur la transforme de Fourier discrte (TFD) FICHE

    http://www.esiee.fr/~bercherj/New/polys/poly_tfd.pdf

    Important : quel est le lien entre la TF, la TFD et la SF ?

    Voici un tableau de synthse6 :

    http://www.impmc.jussieu.fr/~ayrinhac/images/dualite_temps-frequence.png

    Cette animation illustre une proprit particulire de la transforme de Fourier

    discrte : lorsque la frquence de la sinusode est un multiple de l'intervalle

    spectral, on retrouve le spectre idal (un Dirac).

    http://www.impmc.jussieu.fr/~ayrinhac/videos/freqshift.mpg

    3.3. Transforme de Fourier rapide (FFT)

    FICHE La FFT (acronyme de fast fourier transform) est une TFD

    particulire base (en gnral) sur lalgorithme de Cooley-Tukey. La FFT

    apporte un gain de temps : elle ncessite N*log2(N) oprations de calcul au lieu

    6 Ce tableau est issu du site Patrick.furon.free.fr

    http://www.dspguide.com/graphics/F_13_10.gifhttp://www.esiee.fr/~bercherj/New/polys/poly_tfd.pdfhttp://www.impmc.jussieu.fr/~ayrinhac/images/dualite_temps-frequence.pnghttp://www.impmc.jussieu.fr/~ayrinhac/videos/freqshift.mpg

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    de N^2 pour la TFD.

    Il existe une FFT optimise appele FFTW. Pour plus de dtails, voir le site

    suivant :

    (www) fftw.org

    Le spectre dans Audacity

    La Transforme de Fourier Discrte (TFD) et la Transforme de Fourier rapide

    (FFT) sont la base de lanalyse spectrale en informatique. Audacity utilise la

    FFT, mais de manire un peu particulire.

    La mthode utilise par Audacity est la suivante : le signal est dcoup en K

    intervalles de N points (on applique sur ces intervalles une fentre, celle de

    Hanning par exemple). Les fentres ne se recouvrent pas. On fait la FFT de

    chaque intervalle, puis on moyenne les K FFTs, en prenant le module au carr

    (|FFT| ou Re(FFT)+Im(FFT)). Au final Audacity montre un spectre en

    nergie7.

    - Echelle verticale : elle reprsente une nergie en dB (cest donc une chelle

    logarithmique). Dans cette reprsentation, le bruit prend autant dimportance que

    le signal lui-mme.

    Il est impossible de changer cette chelle : une astuce est dajouter un bruit blanc (et ainsi rduire l'chelle verticale et zoomer) pour viter les

    grandes diffrences de niveaux.

    Lchelle verticale est ngative (- X dB) : en effet, une amplitude de 1.0 dans le domaine temporel (amplitude maximale avant saturation) donne

    une amplitude de 0 dB dans le domaine frquentiel. Une amplitude de 0

    dB correspond donc un signal non crt (sans distorsion), cest--dire

    au signal de plus forte amplitude possible. Cest une norme inverse des dB

    audibles o 0 dB correspond au son de plus petite amplitude possible.

    Cela explique que lchelle verticale soit ngative. Lamplitude dun

    signal va dpendre aussi de la fentre employe : ainsi la fentre de

    7 En fait Audacity fait un priodogramme moyenn qui montre la densit

    spectrale de puissance utilise pour les signaux puissance finie (par

    exemple les signaux alatoires). Le priodogramme est lquivalent du

    spectrogramme mais il prend en compte lnergie spectrale au lieu de lamplitude

    spectrale.

    http://www.fftw.org/

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Kaiser-Bessel donne la bonne amplitude alors que la fentre de

    Hamming donne la bonne frquence8.

    Les dB ne correspondent pas au niveau sonore rel, cela dpend du niveau de la piste, mais aussi de lefficacit des haut-parleurs, et la distance au

    haut-parleur. Si lamplificateur est teint, un silence correspond infini.

    Si lamplifier est allum mais le son inaudible, cest 0 dB.

    Important : le spectre obtenu par TFD est forcment discontinu. Or Audacity nous montre une courbe continue. En effet, cette courbe est

    obtenue par une interpolation cubique (par des polynmes de degr 3) des

    points issus de la FFT. Lorsquon exporte le spectre, on constate que

    celui-ci est bien constitu de valeurs discrtes.

    - Echelle horizontale : frquences en Hz.

    A frquence nulle, on trouve la moyenne du signal (appele aussi composante DC

    9 ).

    Lchelle peut tre logarithmique (auquel cas la valeur 0 est rejete moins linfini) ou linaire.

    Important : la frquence maximale est Fe/2 et on visualise N/2 points. En effet, le signal entre Fe/2 et Fe est limage du signal entre 0 et Fe.

    N est une puissance de 2 car on utilise un algorithme de FFT, la rsolution frquentielle est donc Fe/N.

    Le paramtre Taille ne peut pas dpasser le nombre de points du signal, le fichier lexport prsente Taille/2 points.

    Il y a un bug dans l'affichage : le spectre affich est celui du dernier spectre obtenu mme sil ne peut pas calculer ce spectre.

    - Le curseur : La valeur curseur indique la frquence pointe par la croix, tandis

    que Crte donne la frquence du pic le plus proche. Les notations entre

    parenthses traduisent la frquence absolue en notation MIDI : A#3 signifie LA

    dise de loctave 3 .

    - Dure maximum du signal analys : la longueur maximum analysable est de

    10485760 chantillons. A un taux de 44100 Hz, on trouve 237.77234 secondes.

    Si on dpasse cette valeur (cest usuellement le cas dans un morceau de musique

    courant) un message d'erreur s'affiche : Too much audio was selected. Only the

    first %.1f seconds of audio will be analyzed . On peut analyser simultanment

    plusieurs signaux, mais ils doivent tous avoir le mme taux d'chantillonnage. 8Voir le document Analyse du signal(FFT et Filtrage numrique) & Analyse

    des systmes par J.Dumas et B.Bennevault :

    www.altracustica.org/docs/fr_analyse_sig_sys.pdf 9 Par analogie avec un signal lectrique continu ( DC signifie direct current).

    file:///C:/Users/ayrinhac/Desktop/Enseignements/LP300%202012-2013/TS%20-%20documents/www.altracustica.org/docs/fr_analyse_sig_sys.pdf

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    - Lexport : l'export du spectre donne un fichier de 2 colonnes : "Frquence (Hz),

    Niveau (dB)". L'autocorrlation standard et les choix suivants donnent un fichier

    de 3 colonnes : "Dcalage (secondes), Frquence (Hz), Niveau"

    Activit (3.2.1) TF dun crneau

    Grce loutil de retouche, il est facile de gnrer un crneau.

    Icne de loutil de retouche :

    Exemple de crneau :

    Question : quel est le spectre attendu ? Correspond-t-il au spectre donn par

    Audacity ? Que se passe-t-il si on augmente la largeur du crneau ?

    Rponse : visualisons le spectre : comme attendu, le spectre possde un lobe

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    principal centr sur 0 et des lobes secondaires importants (analyse en fentre

    rectangulaire).

    En augmentant la taille du crneau, on rtrcit le lobe principal. Pour dplacer le

    lobe principal vers les hautes frquences, il suffit de moduler le crneau par une

    sinusode.

    Activit (3.2.2) Valeur moyenne (offset vertical, composante DC)

    Voici un son qui possde une composante DC :

    http://www.impmc.jussieu.fr/~ayrinhac/sons/soundshift.wav Visualiser le spectre (avec fentre de Hanning) puis utiliser loutil suivant : Effets

    > normaliser > Supprimer tout dcalage DC.

    Question : que remarquez-vous ?

    3.4 Rsolution spectrale

    Activit (3.4.1) Rsolution spectrale

    Essayons de sparer 2 raies de 200 Hz et de 243 Hz (Fe=44100Hz). On ne

    distingue les raies qu'au-dessus d'une taille de fentre N=4096. (Le pouvoir de

    rsolution de Rayleigh est gal la bande passante 3 dB). La rsolution est

    Fe/N. Cette rsolution donne lincertitude grossire sur la mesure dune

    frquence. Une taille de fentre plus grande amliore la prcision des mesures de

    frquence.

    3.4.2. Les battements

    Lorsque 2 raies sont proches, on constate l'apparition de battements. FICHE

    http://www.impmc.jussieu.fr/~ayrinhac/sons/soundshift.wav

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    On peut le montrer partir de la relation trigonomtrique cos(a+b)+cos(a-

    b)=2cos(a)cos(b). C'est un "modulation d'amplitude" (AM) particulire :

    lamplitude de la porteuse est module pour transmettre de linformation.

    Activit (3.4.2) Battements

    Gnrer 2 pistes de 440 et 442 Hz 0.5 damplitude, spares. Ecouter.

    Question : que remarquez-vous ?

    Rponse : voici ce que lon observe en fusionnant les deux pistes :

    Application : le battement sert accorder les instruments car un battement est

    dissonant.

    3.5. Technique du zero-padding (ou bourrage de zros)

    On rajoute des zros supplmentaires la fin du signal tudi.

    - le nombre de points du spectre augmente

    - lintervalle entre 2 points du spectre augmente car f=Fe/N mais la rsolution

    frquentielle reste la mme car la dure du signal reste inchange.

    - utile pour ajouter des points pour atteindre 2^n valeurs ncessaires la FFT.

    - il n'y a pas d'information supplmentaire par lajout de ces zros.

    - cest une technique dinterpolation

    Voici une animation qui illustre le zro-padding (la ligne bleue claire correspond

    une TFD avec un pas temporel trs faible pour simuler une TF non discrte)

    http://www.impmc.jussieu.fr/~ayrinhac/videos/zero-padding.mpg

    Activit (3.5.1). Zro-padding dans Audacity

    Question : comment effectuer le zero-padding simplement sous Audacity ?

    Prendre une piste quelconque, effectuer un zro-padding et comparer les spectres.

    La rsolution (le plus petit intervalle frquentiel) est-elle modifie ?

    Rponse : il suffit dajouter un silence, la rsolution reste identique.

    Question : dans Audacity, le zro-padding ne peut pas amliorer la rsolution

    spectrale, pourquoi ?

    Rponse : cest la technique du priodogramme (utilise par Audacity pour tracer

    le spectre) qui rend inefficace le zro-padding pour des signaux qui sont plus

    longs que la plus grande taille de fentre.

    http://www.impmc.jussieu.fr/~ayrinhac/videos/zero-padding.mpg

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    3.6. Le fentrage

    Rappels de cours : la fentre "naturelle" ou rectangulaire est abrupte. Fentre

    d'apodisation : les fentres, leurs TF, lobe principal, lobe secondaire. FICHE

    Voici un document qui prsente chaque fentre et son utilit pratique10

    :

    (www) http://www.altracustica.org/docs/fr_analyse_sig_sys.pdf

    Cette animation prsente leffet de la taille de la fenetre naturelle sur un

    signal sinusoidal :

    http://www.impmc.jussieu.fr/~ayrinhac/videos/fenetrage.mpg

    Activit (3.6.1) Nature de la fentre danalyse

    Observons leffet du fentrage sur le spectre.

    Exemple : gnrer 2 sinus de 200 et 243 Hz d'amplitude 0,98 et 0,01.

    Observer le spectre, entre la fentre "naturelle" rectangulaire et une fentre moins

    abrupte de Hanning.

    Question : avec quelle fentre observe-t-on le mieux les deux raies ?

    Activit (3.6.2) Taille de la fentre danalyse

    Gnrer une sinusode de frquence 10 kHz, puis la fentrer et observer

    llargissement du lobe principal.

    4. Spectrogramme et analyse temps-frquence

    4.1. Nature dun spectrogramme

    Un spectrogramme est une TF fentre glissante (les fentres peuvent se

    recouvrir). FICHE

    Le spectrogramme dans Audacity

    Un spectrogramme est la visualisation de lamplitude de Fourier dans le plan

    temps-frquence. La figure montre par Audacity est la projection dun

    diagramme 3D amplitude-temps-frquence en 2D. Lchelle des couleurs indique

    la valeur de lamplitude. Plus la fentre temporelle est petite et plus la rsolution

    10

    Voir aussi larticle de rfrence : On the use of windows for harmonic analysis with the discrete Fourier transform de Harris F.J. DOI : 10.1109/PROC.1978.10837

    http://www.altracustica.org/docs/fr_analyse_sig_sys.pdfhttp://www.impmc.jussieu.fr/~ayrinhac/videos/fenetrage.mpghttp://dx.doi.org/10.1109/PROC.1978.10837

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    en frquence est mdiocre. Ce phnomne est analogue au principe dincertitude

    de Heisenberg en physique. En traitement du signal, on lappelle parfois

    lingalit de Heisenberg-Gabor.

    Exemple de spectrogramme dans Audacity :

    Laffichage du spectrogramme est accessible via le panneau en dbut de

    piste (voir les deux figures ci-dessous) :

    Important : les diffrents paramtres sont accessibles via le menu : Edition >

    Prfrences > Spectrogramme.

    Limage du spectrogramme peut tre sauve via le menu Help>Screenshots

    Tools.

    Lchelle verticale est divise en N/2 bandes o N est la taille de la fentre

    danalyse.

    Important : la frquence max visualise par le spectrogramme est Fe/2 par

    dfaut, de la mme manire que le spectre va de 0 Fe/2.

    Pour des sons concentrs dans les basses frquences, sous-chantillonner permet

    damliorer parfois la qualit du spectrogramme.

    Il existe un type trs courant de reprsentation courante, en 3 parties, o les

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    diffrents axes sont mis en correspondance :

    Voici un exemple :

    Limage est disponible cette adresse :

    http://www.impmc.jussieu.fr/~ayrinhac/images/Analyse_specgram_vibrato.png

    http://www.impmc.jussieu.fr/~ayrinhac/images/Analyse_specgram_vibrato.png

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Activit (4.1.1) Spectrogrammes

    Ici, on vous propose de visualiser le spectrogramme de quelques sons complexes.

    Rglez au mieux les paramtres pour amliorer la visualisation.

    Voici quatre exemples de sons complexes :

    chauve-souris (bat.wav) : http://tftb.nongnu.org/audio/bat.wav un gong (gong.wav) : http://tftb.nongnu.org/audio/gong.wav baleine (whale.mp3) : http://www.impmc.jussieu.fr/~ayrinhac/sons/whales.wav vibrato : http://www.impmc.jussieu.fr/~ayrinhac/sons/Norma-debut.mp3

    Activit (4.1.2) Spectrogramme et partition

    Une partition musicale est la retranscription dun spectrogramme.

    Vous pouvez le vrifier en comparant le morceau Au clair de la lune jou au

    piano, et sa partition :

    http://www.impmc.jussieu.fr/~ayrinhac/sons/au_clair_de_la_lune.wav

    Activit (4.1.3) Apollo 11

    On sintresse ici une nigme historique . Juste aprs le premier alunissage,

    le 21 juillet 1969, lastronaute Neil Armstrong pronona la fameuse phrase:

    That's one small step for a man; one giant leap for mankind . Il y a un doute

    sur la prsence de larticle a : lastronaute la-t-il prononc ?

    Visualiser la phrase dans un spectrogramme, et essayer de conclure.

    http://www.impmc.jussieu.fr/~ayrinhac/sons/Neil_Armstrong_One_Small_Step.wav

    Le fichier original est librement accessible sur Wikipdia :

    http://upload.wikimedia.org/wikipedia/commons/4/48/Frase_de_Neil_Armstrong.ogg

    http://tftb.nongnu.org/audio/bat.wavhttp://tftb.nongnu.org/audio/gong.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/whales.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/Norma-debut.mp3http://www.impmc.jussieu.fr/~ayrinhac/sons/au_clair_de_la_lune.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/voyelles_wiki.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/voyelles_wiki.wavhttp://upload.wikimedia.org/wikipedia/commons/4/48/Frase_de_Neil_Armstrong.ogghttp://upload.wikimedia.org/wikipedia/commons/4/48/Frase_de_Neil_Armstrong.ogg

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Activit (4.1.4) Localisation 1

    Crer un son (Fe=8kHz donc frquence max =4000 Hz) qui comporte deux

    sinusodes colles de frquence 1000 et 2000 Hz. Utiliser loutil de glissement

    temporel pour coller les deux bouts de piste.

    Le fichier est directement disponible ici :

    http://www.impmc.jussieu.fr/~ayrinhac/sons/deux_sins_colles.wav

    Visualiser ce son dans un spectrogramme et faire varier la taille de la fentre N.

    Question : pour quelle taille de fentre mesure-t-on le mieux linstant de

    raccordement ?

    Conclusion : il semble exister un intervalle de temps dans lequel les deux

    frquences sont prsentes en mme temps. Cest paradoxal, puisque nous savons

    que nos deux sinusodes se succdent lune aprs lautre !

    Activit (4.1.5) Localisation 2

    Prendre un son quelconque (musique ou paroles), puis crer un petit silence au

    milieu de la piste. Dessiner le spectrogramme.

    Question : quelle est la taille de fentre N qui permet de distinguer ce silence ?

    Question : dans le son ci-dessous se cache un silence. Trouver sa position

    temporelle et sa dure ?

    http://www.impmc.jussieu.fr/~ayrinhac/sons/son_silence_cache.wav

    Activit (4.1.6) Changement dchelle (time scaling)

    Question : montrer grce la transforme de Fourier que si on multiplie le temps

    par un facteur , on divise les frquences par le mme facteur (exemple avec les

    disques vinyles lus la mauvaise vitesse).

    Pour exprimenter ceci sur Audacity, on peut changer la vitesse de lecture de la

    piste via Panel>Frquence dchantillonnage ou Effet>Changer la vitesse. Par

    http://www.impmc.jussieu.fr/~ayrinhac/sons/deux_sins_colles.wavhttp://www.impmc.jussieu.fr/~ayrinhac/sons/son_silence_cache.wav

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    exemple, un fichier audio de parole vitesse trs ralentie donne des grognements

    de fauve. Augmenter la frquence sans augmenter le tempo se fait avec loutil

    Effets>Changer la hauteur.

    4.2. Frquence instantane.

    Lorsque la frquence est une fonction du temps, on a besoin dintroduire la

    notion de frquence instantane Fi :

    o est largument du chronogramme s(t)=A*cos[(t)].

    Question : Calculer (t) pour Fi(t)=F0+t (variation linaire de la frquence) et

    en dduire s(t). Ce signal est-il priodique ? (on peut rpondre en visualisant le

    spectre)

    Question : que vaut Fi pour un vibrato ? Quelle est la forme de s(t)

    correspondante ?

    Activit (4.2.1) Chirp linaire (sifflet)

    Un chirp linaire et la variation linaire de la frquence (appele hauteur ou

    pitch) avec le temps. Dans Audacity, il est accessible via le menu Gnrer >

    Sifflet > Sinusode.

    Exemple : gnrer un sifflet de 1kHz 4 kHz sur 5 s avec amplitude constante.

    Dessiner le spectrogramme et observer que la frquence varie linairement avec

    le temps.

    4.2. Repliement du spectre (Activit du thorme de Shannon)

    Rappels de cours FICHE

    Question : noncer le thorme de Shannon.

    Question : que se passe-t-il si on chantillonne un signal sinusodal de 1 kHz

    Fe=1.6 kHz ?

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Activit (4.2.2) Repliement (aliasing)

    Pour observer du repliement, il faut dabord sous-chantillonner 8000 Hz, puis

    crer un chirp linaire de 1kHz 10 kHz via le menu Gnrer>Sifflet.

    Question : on observe que la hauteur du son monte puis descend. Pourquoi ?

    Rponse : le schma ci-dessous explique cette forme en dents de scie :

    Note : ce repliement est similaire la dfinition de la premire zone de Brillouin

    pour les cristaux en physique.

    Activit (4.2.3) Filtre anti-repliement

    Question : on rchantillonne le sifflet prcdent 100 Hz, on observe la

    disparition des hautes frquences. Pourquoi ?

    Rponse : Audacity applique un filtre anti-repliement.

    Activit (4.2.4) Sifflet avec forme donde carre

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Visualiser le spectrogramme dun sifflet ayant une forme donde carre.

    4.3. Ondelettes, scalogramme

    La transforme en ondelettes est une analyse temps-chelle o la taille de la

    fentre varie avec la frquence, et londelette est adapte au signal tudier.

    Intrt et applications. FICHE

    Activit (4.3.1) Analyse en ondelettes

    Lanalyse par ondelettes permet dans certains cas une meilleure analyse temps-

    frquence11

    .

    Exemple avec un son complexe.

    http://www.impmc.jussieu.fr/~ayrinhac/sons/son_complexe.wav On rchantillonne dabord 200 Hz .

    Dfinition daffichage : 512. Voici ce que lon observe :

    Dfinition daffichage : 32. Voici ce que lon observe :

    Dd

    11

    Voir larticle Time-frequency analysis with the continuous wavelet transform de W. Christopher Lang and Kyle

    Forinash, Am. J. Phys. 66, 794 (1998).

    http://www.impmc.jussieu.fr/~ayrinhac/sons/son_complexe.wav

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Conclusion : soit on voit le silence sur le signal 80 Hz, soit on distingue les

    deux frquences 10 Hz et 13 Hz.

    Rsum avec la figure ci-dessous : soit un signal complexe qui possde un

    silence de 0.2s en (A) et deux frquences trs proches en (B). En haut droite, on

    a privilgi la rsolution temporelle : on distingue (A) mais pas (B). En bas

    gauche, on a privilgi la rsolution frquentielle : on voit (B) mais pas (A). En

    bas droite une analyse en ondelettes permet de distinguer (A) ET (B).

    Cette image est disponible ladresse suivante :

    http://www.impmc.jussieu.fr/~ayrinhac/images/Analyse_ondelettes_exemple.png

    Larticle de W.C.Lang et K.Forinash est disponible ici :

    http://scitation.aip.org/content/aapt/journal/ajp/66/9/10.1119/1.18959

    5. Compression, MP3

    5.1. Compression

    On a vu des faons simples de compresser :

    - quantifier sur moins de bits

    - sous-chantillonner, par exemple.

    Le format MP3 est une compression avec pertes dinformations.

    Activit (5.1.1) Fichier .mp3

    Gnrer un bruit blanc. Enregistrer ce son au format .wav et au format .mp3.

    Question : quel est le gain de taille apport par le format .mp3 ?

    http://www.impmc.jussieu.fr/~ayrinhac/images/Analyse_ondelettes_exemple.pnghttp://scitation.aip.org/content/aapt/journal/ajp/66/9/10.1119/1.18959

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Question : comparer les spectrogrammes des deux sons .wav et .mp3. Que

    constate-t-on ?

    Rponse : on constate, des effets de bord sur le chronogramme mais surtout la

    disparition des hautes frquences (au-dessus de 20kHz environ). Cest encore

    plus visible lorsquon change le Frequency Gain (dB/dec). Prendre une valeur

    de 10 ou 20.

    Activit (5.1.2) Fichier .ogg

    Contrairement au format MP3, le format OGG Vorbis est libre, et il est considr

    comme de meilleure qualit pour une compression identique12

    . Ce format est

    beaucoup utilis sur Wikipdia.

    Question : quel est le gain de taille apport par le format .ogg ? ce format est-il

    plus performant que le .mp3 ?

    12

    Voir livre de Christian Brochec, page 44.

  • S.Ayrinhac (2014) Universit Pierre et Marie Curie (Paris 6)

    Bibliographie

    1) Sur le traitement du signal :

    - (livre) Mathmatiques pour le traitement du signal M. Bergounioux, DUNOD

    (2010) ISBN 978-2-10-054781-4

    - (livre) Mthodes et techniques de traitement du signal, DUNOD (2004)

    Jacques Max, Jean-Louis Lacoume, EAN13 : 9782100483310

    - (doc. en ligne) Cours de traitement du signal, Patrice Brault (1999-2000)

    http://braultp.free.fr/Cours_signal/signal_6juin_sscmp.pdf

    2) Sur Audacity :

    - (livre) Audacity 2, Enregistrez, montez, mixez, ditions Pearson, Christian

    Brochec, 2012, ISBN 978-2-7440-9402-6.

    - (article) The Hope of Audacity (To teach acoustics), Jennifer Groppe, The

    Physics Teacher 49 99 (2011)

    3) Sur les sons musicaux :

    - cours de Philippe Guillaume (http://www-gmm.insa-toulouse.fr/~guillaum/sons-

    musique.pdf)

    - Documents proposs pour lunit douverture Musique et sciences (LP212)

    de luniversit Paris 6 :

    http://www.proba.jussieu.fr/users/lma/MusiqueSciencesL2.html

    http://www.dunod.com/auteur/jacques-maxhttp://www.dunod.com/auteur/jean-louis-lacoumehttp://braultp.free.fr/Cours_signal/signal_6juin_sscmp.pdfhttp://www-gmm.insa-toulouse.fr/~guillaum/sons-musique.pdfhttp://www-gmm.insa-toulouse.fr/~guillaum/sons-musique.pdf