ENSEA 2006-2007 Audio Numérique 1 Laurent Saïd (98) ST Microelectronics 12, avenue Jules Horowitz...

Post on 04-Apr-2015

103 views 0 download

Transcript of ENSEA 2006-2007 Audio Numérique 1 Laurent Saïd (98) ST Microelectronics 12, avenue Jules Horowitz...

EN

SE

A

200

6-2

007

Audio

Num

éri

que

1

Laurent Saïd (98)

ST Microelectronics

12, avenue Jules Horowitz

38000 GRENOBLE

06.71.58.40.49

email : laurent.said@st.com

1

EN

SE

A

200

6-2

007

Audio

Num

éri

que

2

2

EN

SE

A

200

6-2

007

Audio

Num

éri

que

3Plan de la présentation

Perception-Audition

Signaux Numériques

Précision - Dynamique

Fréquence d’échantillonnage

Conclusion

3

EN

SE

A

200

6-2

007

Audio

Num

éri

que

4Mécanisme de l’audition

• Système auditif périphérique

• Oreille externe:

•transmission aérienne

• Oreille Moyenne:

•transmission mécanique

• Oreille interne:

•transmission hydromécanique

•Transmission électro-chimique

• Système auditif central

• Nerf auditif

• Cortex

EN

SE

A

200

6-2

007

Audio

Num

éri

que

5Anatomie de l’oreille

EN

SE

A

200

6-2

007

Audio

Num

éri

que

6Oreille Externe

Fonction de transfert

EN

SE

A

200

6-2

007

Audio

Num

éri

que

7Oreille Moyenne

1. Marteau2. Enclume3. Étrier4. Tympan5. Fenêtre ronde6. Trompe d’eustache

- (1) Marteau- (2) Ligament du marteau- (3) Enclume- (4) Ligament de l'enclume- (5) Muscle de l'étrier- (6) Platine de l'étrier- (7) Tympan- (8) Trompe d'Eustache- (9) Muscle du marteau- (10) Corde du tympan sectionnée

EN

SE

A

200

6-2

007

Audio

Num

éri

que

8Fonction de Transfert OM

H(f)=Pv/PtPv Pression acoustique au vestibulePt Pression acoustique au tympan

EN

SE

A

200

6-2

007

Audio

Num

éri

que

9Oreille Interne

1. Canal antérieur2. Ampoule (du même canal)3. Ampoule (canal horizontal)4. Saccule5. Canal cochléaire6. Hélicotrème7. Canal latéral (horizontal) 8. Canal postérieur9. Ampoule (canal postérieur)10. Fenêtre ovale11. Fenêtre ronde12. Rampe vestibulaire13. Rampe tympanique14. Utricule

EN

SE

A

200

6-2

007

Audio

Num

éri

que

10Oreille Interne: Coupe de la cochlée

Transmission électro-chimique

Transmission hydromécanique

EN

SE

A

200

6-2

007

Audio

Num

éri

que

11Système Auditif Central

EN

SE

A

200

6-2

007

Audio

Num

éri

que

12Perception de la force sonore

Courbe d’isosonie

EN

SE

A

200

6-2

007

Audio

Num

éri

que

13Effet de masque simultané

EN

SE

A

200

6-2

007

Audio

Num

éri

que

14Bandes critiques

EN

SE

A

200

6-2

007

Audio

Num

éri

que

15Effet de masque temporel

Masquant

Niveau du son « juste masqué »

ProactifRéactif

EN

SE

A

200

6-2

007

Audio

Num

éri

que

16Perception de la hauteur

Stevens & Volkman 1940

Non linéaire

Echelle perceptuelle

)1(log.)( 2 x

xMel

EN

SE

A

200

6-2

007

Audio

Num

éri

que

17Plan de la présentation

Perception-Audition

Signaux Numériques

Précision - Dynamique

Fréquence d’échantillonnage

Conclusion

17

EN

SE

A

200

6-2

007

Audio

Num

éri

que

18PCM : Pulse Code Modulation

Temps

Temps

TempsOpérations lors de la numérisation:

• Echantillonnage

• Quantification

EN

SE

A

200

6-2

007

Audio

Num

éri

que

19Echantillonnage

Théorème

• Shannon (1948)

• Kotel’nikof (1933)

• Nyquist (1928)

• Whittaker (1915)

Théorème de

reconstruction

EN

SE

A

200

6-2

007

Audio

Num

éri

que

20Quantification

Introduit du bruit:

• Corrélé au signal

• Probabilité uniforme

• Puissance f(nombre de pas)

EN

SE

A

200

6-2

007

Audio

Num

éri

que

21Dither soustractif et non-soustractif

Ajout d’un bruit avant la quantification:

Quantification

Channel

-

++

+X(n)

b(n)

Y(n)

Quantification

Channel

++

X(n)

b(n)

Y(n)

EN

SE

A

200

6-2

007

Audio

Num

éri

que

22Dualité fréquence d’échantillonnage - quantification

Amélioration du RSB par sur échantillonnage:• En conversion A/N:

•Filtre analogique à SFe/2•Echantillonnage à SFe•Filtrage / sous-échantillonnage jusqu’à Fe

•En conversion N/A:•Sur-échantillonnage•Filtrage a Fe•Conversion N/A à SFe•Filtrage à SFe

Trois effets

EN

SE

A

200

6-2

007

Audio

Num

éri

que

23Vocabulaire

Transparence:• Quelque soit les modification du signal audio, le résultat

n’est pas perceptible par l’oreille humaine.

Sans pertes:•Les signal transformé est bit exacte.

•Non-réversible:•Des pertes sont volontairement introduites (afin de

compresser par exemple) impliquant:•Plancher de bruit non constant (modulation / masquage

fréquentiel)•Le plancher de bruit est mis en forme selon des critères psycho

acoustiques•L’erreur est corrélée au signal

EN

SE

A

200

6-2

007

Audio

Num

éri

que

24Plan de la présentation

Perception-Audition

Signaux Numériques

Précision - Dynamique

Fréquence d’échantillonnage

Conclusion

24

EN

SE

A

200

6-2

007

Audio

Num

éri

que

25Effet du dithering sur la précision

Spectre d’un signal quantifié sur 16 bits à -90dB de la pleine échelle

EN

SE

A

200

6-2

007

Audio

Num

éri

que

26Perception du bruit de quantification

Bruit de quantification avec dithering sur 16 bits pleine échelle à 114dBspl

Dynamique

EN

SE

A

200

6-2

007

Audio

Num

éri

que

27Cas du CD: Fe=44.1 kHz 120dBspl 16 bits

EN

SE

A

200

6-2

007

Audio

Num

éri

que

28Après le CD: Quantification sans dithering

EN

SE

A

200

6-2

007

Audio

Num

éri

que

29Autres bruits: bruit de fond des salles

Un son à -15dB en dessous du niveau du bruit de fond peut être perçu

EN

SE

A

200

6-2

007

Audio

Num

éri

que

30Autres bruits: bruit d’enregistrement

EN

SE

A

200

6-2

007

Audio

Num

éri

que

31Plan de la présentation

Perception-Audition

Signaux Numériques

Précision - Dynamique

Fréquence d’échantillonnage

Conclusion

31

EN

SE

A

200

6-2

007

Audio

Num

éri

que

32Spectre audible / Fréquence d’échantillonnage

Test d’écoute subjectif:

• x1, x2, x4, x64 FeCD ou FeDAT:

•Hautes Fe préférées

•Pourquoi ?

•Sensibilité acoustique différente si spectre

complexe ?

•Traitement plus simple à ces fréquences ?

EN

SE

A

200

6-2

007

Audio

Num

éri

que

33Perception des fréquences >20kHz

Oreille Moyenne:

• Commence à filtrer passe-bas à partir de ~10kHz

•Plus grand-chose après 20kHz

Cochlée

•Fonctionne Top-Down

•Filtre HF est plus proche du tympan

•Filtre centré sur 15kHz

•Ultra sons par conduction osseuse.

•Des son peuvent être perçus jusqu’à 25kHz (fort niveaux)

•Intermodulation dans la bande (pitch perçu ~20kMEL)

EN

SE

A

200

6-2

007

Audio

Num

éri

que

34Alors, quelle Fréquence d’échantillonnage ?

EN

SE

A

200

6-2

007

Audio

Num

éri

que

35Etendue du spectre audio

Exemple: La cymbale “Crash”

EN

SE

A

200

6-2

007

Audio

Num

éri

que

36Considérations temporelles(1/2)

Lors des test d’écoute a Fe élevée, « c’est mieux »:

• Les graves semblent plus nets

• Le son est:

• plus clair

• plus chaud

•Plus naturel

• Meilleure définition :

• on distingue mieux le premier plan et le deuxième plan

•Mais :

•Haut-parleur sans rendu ultrasonique

•Acuité auditive standard

EN

SE

A

200

6-2

007

Audio

Num

éri

que

37Considérations temporelles(2/2)

Le filtrage anti repliement et de reconstruction:

• Pentes plus raisonnables

• Phase linéaire que dans la bande utile

=> Il est possible de concevoir des filtres causaux

(ou presque) dont la phase est linéaire dans la

bande (apodized filters). Le résultat est très positif

EN

SE

A

200

6-2

007

Audio

Num

éri

que

38Réponses impulsionelles des filtres

EN

SE

A

200

6-2

007

Audio

Num

éri

que

39Plan de la présentation

Perception-Audition

Signaux Numériques

Précision - Dynamique

Fréquence d’échantillonnage

Conclusion

39

EN

SE

A

200

6-2

007

Audio

Num

éri

que

40Conclusion

Transparence:

• PCM 19bits, 52kHz (sans post-traitements)

Qualité:

• Il faut considérer les aspect temporels

• Il faut considérer la chaine de production complète

• Il faut accroitre la dynamique a chaque traitement

L’appareil auditif est un très bon organe de perception.