Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... ·...

40
Cours n Cours n° 2 Codage et stockage de l’audio Codage et stockage de l’audio

Transcript of Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... ·...

Page 1: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Cours nCours n°° 22

Codage et stockage de l’audioCodage et stockage de l’audio

Page 2: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Sommaire1. Codage de l’audio

1. PCM (Pulse Coded Modulation)2. Codage psycho-acoustique

1. MP32. Spatialisation

3. Formats de signaux audio3. Formats de signaux audio

2. Stockage de l’audio1. CD (Compact Disk)

� CD-DA� CD-ROM

2. DVD (Digital Versatil Disk)

Année 2008 - 2009 2M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 3: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

1. Codage de l’audio

Année 2008 - 2009 M1 – Conception Audio – Marie-José Caraty / David Janiszek 3

Page 4: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Codec (codeur-décodeur)� Matériel capable de convertir des signaux audio ou vidéo de leurs formes

analogique à numérique et vice-versa

� Matériel ou logiciel capable de compresser ou de décompresser des données audio ou vidéo.

� Nom générique donné aux algorithmes de compression et de décompression

1.1. CODAGE DE L’AUDIO CODAGE DE L’AUDIO

GénéralitésGénéralités (1/7)(1/7)

� Nom générique donné aux algorithmes de compression et de décompression

Exemples de codec : MP3 pour l'audio DivX pour la vidéo

Mesure du taux de compressionDébit en bits/s (bps ou b/s) à soutenir pour :� le stockage� la transmission (téléphone, internet)� l’application temps-réel (streaming : Web radio/télévision, voix sur IP)

Année 2008 - 2009 4M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 5: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Objectifs des codecs des signaux audio� Optimiser le débit (recherche des faibles débits)

� Optimiser les coûts de calcul de la compression et de la décompression

� Qualité de la restitution (signal restitué après codage et décodage)

Compromis, pour une application donnée, entre ces différents facteurs

1.1. CODAGE DE L’AUDIO CODAGE DE L’AUDIO

GénéralitésGénéralités (2/7)(2/7)

Critères de qualité et applications� Communication téléphonique

Le critère est l’intelligibilité de la parole transmise

� Ecoute musicale

Le critère est lié à l’audition :le signal restitué après décodage doit être, idéalement, indiscernable à l’audition du signal original

Année 2008 - 2009 5M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 6: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Estimation des coûts de calculs en MIPS requis pour le DSP (Digital Signal Processing)

Ordre de grandeur du retard introduit par la compression : du dizième de ms (0,125 ms) à quelques dizaine de ms (30 ms)

1.1. CODAGE DE L’AUDIO CODAGE DE L’AUDIO

GénéralitésGénéralités (3/7) (3/7)

Estimation de la qualité de restitutionen MOS (Mean Opinion Score)

• 5 : excellent • 4 : bon (dégradation à peine perceptible) • 3 : passable (dégradation perceptible, mais on reconnaît son interlocuteur)• 2 : médiocre (dégradation considérable, voix synthétique) • 1 : mauvais (problèmes d'intelligibilité).

Année 2008 - 2009 6M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 7: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Codage réversible/sans perteCodage et décodage : fonction identitéPas de perte dans le contenu informationnel Méthodes de compression entropiques/statistiques

Fanno-Shannon, Lempel-Zipf, Huffman, …Taux de compression 1:2 au plus

1.1. CODAGE DE L’AUDIO CODAGE DE L’AUDIO

GénéralitésGénéralités (4/7)(4/7)

Codage irréversible/avec perteCodage : fonction non injective (même codage pour deux sons différents)Elimination d’information (transparentes à l’audition)Pas de retour possible à l’originalMéthodes

Echelle logarithmiqueMasque de bandePrédiction linéaire

Taux de compression visé > 1:2

Année 2008 - 2009 7M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 8: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Ecoute binauriculaire humainePermet de localiser spatialement les sources sonoresdans un espace tridimensionnel (verticalité , horizontalité , profondeur )

Grande différence dans les phénomènes de perception• notre perception du champ de pression• notre perception à l’écoute d’un enregistrement

1.1. CODAGE DE L’AUDIO CODAGE DE L’AUDIO

Généralités Généralités –– L’écoute humaineL’écoute humaine (5/7)(5/7)

• notre perception à l’écoute d’un enregistrement

Système de prise de son et diffusion modifient la perception du relief sonoreDe plus, l’image peut « modifier » notre perception

Paramètres de restructuration de la profondeur sono reliés à notre acquis auditif

� Intensité Notion de proximité liée à l’intensité plus forte, plus faible � Fréquence Près (loin) d’une source, bonne perception de l’aigu (grave) � Réverbération Notion d’espace et d’éloignement

Année 2008 - 2009 8M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 9: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Système de prise de son par un/des microphones et de diffusion via un/des canaux sur une/des enceintes

Monophonie (19??)� Prise de son par 1 micro diffusé via 1 canal sur 1 ou 2 enceintes

Dans le cas de 2 enceintes, c’est le même canal (information) qui est diffusé

� Perception de profondeur (demie)

1.1. CODAGE DE L’AUDIO CODAGE DE L’AUDIO

Généralités Généralités –– L’audiophonieL’audiophonie (6/7)(6/7)

� Perception de profondeur (demie)

Stéréophonie (1960)Objectif : restituer un relief sonore supérieur à la monophonie

� Prise de son par 2 micros diffusée sur 2 canaux affectés à 2 enceintes

� Perception de profondeur (demie) et d’horizontalité

Monophonie dirigéeConsiste à placer 1 micro par sourcepuis à mixer le son, à gauche , à droite ou au milieu (équilibrage gauche et droit)

Année 2008 - 2009 9M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 10: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Production de disquesStéréophonie (10%)Enregistrement dans les salles concerts pour une acoustique naturelle par positionnement (crucial) des 2 micros. Pas de post-production

Monophonie dirigée (90%)

Radio

1.1. CODAGE DE L’AUDIO CODAGE DE L’AUDIO

Généralités Généralités –– Utilisation de l’audiophonieUtilisation de l’audiophonie (7/7)(7/7)

Radio Stéréophonie (10% : France Musique, France Culture)

CinémaSystème Surround (Dolby) issu de la quadriphonie/tétraphonie (1970) : 2 microphones , 4 pistes pour la perception de la profondeur, 4 enceintes (dont deux placés à l’arrière)

Ambiophonie : plusieurs micro à la prise de son et mixage sur plusieurs canaux/pistes diffusés en pentaphonie appelée 5.1 (années 90), 7.1

Année 2008 - 2009 10M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 11: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

PCM (Pulse Coded Modulation)Codage audio constitué de la séquence des échantillons mesurés suivant :• une fréquence d’échantillonnage• une loi de quantification sur B bits

Quantification linéaireSur B bits : 2B valeurs dans [-2B-1..2B-1 –1]

1.1.1.1. CODAGE PCM (Pulse Coded Modulation) CODAGE PCM (Pulse Coded Modulation)

Quantification linéaire Quantification linéaire

Sur B bits : 2B valeurs dans [-2B-1..2B-1 –1] avec un pas de quantification constant de 1/2B

Codage non-compressif réversible

Débit et poidsDébit (b/s) = NbCanaux x B (bit) x fe (Hz) Monophonie : 1 canalStéréophonie : 2 canaux

Poids (octets) = Débit / 8 (bits)Taille du fichier en octets

Année 2008 - 2009 11M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 12: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Codage de référence de la musiqueQualité HiFi (CD audio) - support de référence CD-DA44,1kHz, 16 bits, stéréophonique

La référence pour comparer/évaluer les codecs « musi caux »entre autres les taux de compression, la qualité de restitution

1.1.1.1. CODAGE PCM (Pulse Coded Modulation) CODAGE PCM (Pulse Coded Modulation)

Exploitation commerciale Exploitation commerciale (PCM (PCM –– Quantification linéaire) Quantification linéaire)

Stockage d’une minute prend 10 M-octets (1411 kb/s)Pour télécharger 1 minute de musique, qualité CD audio, stéréo,16 bits par canal, 44,1kHz, 1) Quelle est la taille attendue du fichier PCM à télécharger ?

Taille = 60x44100x16x2 /8 = 10 584 000 octets ≈ 10,1 Mo2) Combien de minutes peut-on enregistrer sur un CD de 650 Mo ?

NbMinutes = 650/10,1 ≈ 64 minutes3) La durée de son téléchargement sur une ligne téléphonique grand public?4) Le taux de compression à atteindre pour télécharger et jouer en temps réel ?

Année 2008 - 2009 12M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 13: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Prise en compte de la perception• La sonie (intensité perçue) est liée au volume

mais pas de façon linéaire : entre 500 Hz et 5000 Hz• Plus grande sensibilité de l’oreille aux erreurs de quantification

dans les zones de faible intensité (silence)

1.1.1.1. CODAGE PCM (Pulse Coded Modulation) CODAGE PCM (Pulse Coded Modulation)

Quantification non linéaireQuantification non linéaire

Echelle logarithmique de quantification

� Convertisseur analogique-numérique non linéaire

� Une table de conversion d’échelles (linéaire et logarithmique) pour le codeur et le décodeur

� Codage compressif non-réversible

Année 2008 - 2009 13M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 14: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Codage de référence de la téléphonie (norme G.711)Support de la voix parléeMIC (Modulation par Impulsion Codée) loi A 8 kHz, 8 bits, monophonie

La référence pour comparer/évaluer les codecs en té léphonieentre autres les taux de compression, la qualité de restitution

1.1.1.1. CODAGE PCM (Pulse Coded Modulation) CODAGE PCM (Pulse Coded Modulation)

Exploitation commerciale Exploitation commerciale (PCM (PCM –– Quantification non linéaire) Quantification non linéaire)

entre autres les taux de compression, la qualité de restitution

Loi de quantification� Loi A en Europe� Loi mu aux Etats-Unis, JaponIntégration dans les composants électroniques 127204717100

79100010505050000

MICLinMICLin

Table de conversionCodage linéaire 12 bits (-2047…+2048) transformé en MIC 8 bits (-128…+127)

96kb/s -> 64 kb/s

Année 2008 - 2009 14M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 15: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Principe du codage différentielCode la différence entre deux échantillons consécutifs� Delta

Code sur un bit, par échantillon, le signe de la différence entre l’échantillon et son prédécesseur

� DPCM Differential Pulse Code ModulationCode sur quelques bits l’amplitude de la différence des échantillons

1.1.1.1. CODAGE PCM (Pulse Coded Modulation) CODAGE PCM (Pulse Coded Modulation)

Codages différentiels et adaptatifsCodages différentiels et adaptatifs

Code sur quelques bits l’amplitude de la différence des échantillons

Principe du codage adaptatif/prédictifExtrapoler la valeur du signal à partir des N échantillons précédents pour adapter l’amplitude du pas de quantification à la variation prédite du signal

� Delta adaptatif� ADPCM Adaptative Differential Pulse Code Modulation

Application commerciale en téléphonie (norme G.721)Support de la voix parléeADPCM [8 kHz – 4 bits – 32 kb/s] Taux de compression 1:2 (MIC)

Année 2008 - 2009 15M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 16: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

1.2.1.2. CODAGE PSYCHOCODAGE PSYCHO--ACOUSTIQUE ACOUSTIQUE

Standard MPEG de l’audioStandard MPEG de l’audio--vidéo vidéo

MPEG (Motion Picture Experts Group)

Prévoit, pour l’audio, 3 couches/layers (1, 2, 3) de complexité croissante d’algorithme de compression

MPEG1Inclut la vidéo à basse définition et, paradoxalement, le son HiFi Inclut la vidéo à basse définition et, paradoxalement, le son HiFi MP3 correspond au format MPEGMPEG--1 Audio Layer 31 Audio Layer 3

MPEG2Reprend les 3 couches audio , II et III de MPEG1avec des possibilités de fréquences d'échantillonnage plus basses, des débits plus faibles et un nombre de canaux augmentéL’effort porte sur le codec vidéo

Année 2008 - 2009 16M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 17: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Effet de masque fréquentiel caractéristique des codages psycho-acoustiques

1.2.1.2. CODAGE PSYCHOCODAGE PSYCHO--ACOUSTIQUE ACOUSTIQUE

Effet de masque Effet de masque (1/2) (1/2)

Déc

ibel

s

a) Courbe seuil d’auditionb) Modification de la courbe par la présence d’un son pur

de 500Hz de 70dB

Fréquence en Hz

Déc

ibel

s

Année 2008 - 2009 17M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 18: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

dB

1.2.1.2. CODAGE PSYCHOCODAGE PSYCHO--ACOUSTIQUE ACOUSTIQUE

Effet de masque Effet de masque (2/2) (2/2)

Fréquence (kHz)

Exemple d'interprétation de la courbeUn son pur à 8 kHz masque un autre son pur à 7 kHz si ce dernier son à une intensité inférieure à 40dB

Année 2008 - 2009 18M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 19: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Codage d’une trame (26ms)� Analyse spectrale de la trame préemphasée (d'une élévation à la puissance ¾)

� Suppression des fréquences inaudibles (<20 Hz, > 20 kHz)� Découpage du spectre en 32 bandes� Par bande : élimination des sons masqués et quantification adaptée

a) au rapport signal/masque

1.2.1.1.2.1. MP3 (MPEGMP3 (MPEG--1 AUDIO LAYER 3) 1 AUDIO LAYER 3)

Principe du codagePrincipe du codage

a) au rapport signal/masqueb) au débit souhaité

� Compression de Huffmann (des valeurs spectrales quantifiées)

Pour chaque frame, le débit après compression doit avoir une des valeurs prévues par la norme

• CBR (Constant Bit Rate) : débit constant des trames codées• VBR (Variable Bit Rate) : les frames constituées peuvent être de débits différents,

optimisés en fonction du contenu sonore

Année 2008 - 2009 19M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 20: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

1.2.1.1.2.1. MP3 (MPEGMP3 (MPEG--1 AUDIO LAYER 3) 1 AUDIO LAYER 3)

Entête des trames MP3Entête des trames MP3 (1/2)(1/2)

Chaque trame comporte une entête de 32 bits donnant les paramètres nécessaires pour son décodage

Sync : 12 bits de synchronisation

ID : 1bit (0 =MPEG-2, 1=MPEG-1)

Layer : 2 bits (00=pas défini, 01=layer 3, 10=layer 2, 11=layer 1)

Bitrate (débit) : 4 bits (cf. transp.20)Bitrate (débit) : 4 bits (cf. transp.20)

Frequency (fe) : 2 bits(cf. transp.21)

Priv . bit, Copy bit, Home bit : 3 bits de copyright

Mode : 2 bits (type du codage mono/stéréo) (cf. transp.21)

Emphasis : 2 bits (emphase du signal) (cf. transp.21)

Prot . bit : bit de protection

(0=pas de checksum, 1=16 bits de checksum avant les données)

Pad. bit (padding) (1=8 bits ajoutés, 0=pas d’ajout à la protection)

Année 2008 - 2009 20M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 21: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

1.2.1.1.2.1. MP3 (MPEGMP3 (MPEG--1 AUDIO LAYER 3) 1 AUDIO LAYER 3)

Entête des trames MP3Entête des trames MP3 (2/2)(2/2)

Année 2008 - 2009 21M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 22: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

1.2.1.1.2.1. MP3 (MPEGMP3 (MPEG--1 AUDIO LAYER 3) 1 AUDIO LAYER 3)

Entête des trames MP3Entête des trames MP3 (2/2)(2/2)

Année 2008 - 2009 22M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 23: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

1.2.1.1.2.1. MP3 (MPEGMP3 (MPEG--1 AUDIO LAYER 3) 1 AUDIO LAYER 3)

Positionnement de MP3Positionnement de MP3

Comparé avec la qualité CD audioMP3 est réputé indiscernable de l'original avec un débit >= 256 kbit/ssoit un taux de compression de 5.5

A 128 kbit/s , taux de compression de 11Poids d’une minute d'enregistrement qualité CD audio ≈ 1 MoLa qualité reste très bonneLa qualité reste très bonne

Enjeux commerciauxMP3 est connu comme la référence freeware de la musique en ligne

MP3 a fait l'objet d’un dépôt de brevet (Fraunhoffer, Thalès), les droits envisagés pour des applications commercialestelles le DVD audio-vidéo ont conduit à l'adoption du codec concurrent Dolby AC3

Année 2008 - 2009 23M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 24: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

SpatialisationPar exploitation de plusieurs canaux5.1 : 6 canaux7.1 : 8 canaux

1.2.2.1.2.2. SPATIALISATION SPATIALISATION

Codeurs psychoCodeurs psycho--acoustiques avec spatialisationacoustiques avec spatialisation

Principe� Compression basée sur le masquage fréquentiel� Compression par artifices techniques :

un son à émettre sur les six enceintes à la fois, est stocké une seule fois et marqué « global »

� Découpage en fragments d’environ 5 ms, répartis sur les différentes pistes

Année 2008 - 2009 24M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 25: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Support DVD numérique – qualité home cinémaDolby – Digital AC3 (5.1, 7.1)Taux de compression 1:10Actuellement, le signal le plus compressé pour la reproduction du son au cinéma

Studios Universal - DTS (Dolby Theater Sound)Performances audio supérieures au Dolby Digital

1.2.2.1.2.2. SPATIALISATION SPATIALISATION

Exploitation commercialeExploitation commerciale

Performances audio supérieures au Dolby DigitalNécessite un lecteur plus performant (puissance du décodeur)

La concurrenceMP3 (Fraunhoffer& Thalès)Atrac (Sony)Ogg Vorbis (freeware)AC2, AC3, AAC, DTS (Dolby)

Année 2008 - 2009 25M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 26: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

1.2.2.1.2.2. SPATIALISATION SPATIALISATION

Evolution des marchés et des codecsEvolution des marchés et des codecs

Audio des audioAudio des audio--vidéovidéoMP2MP2MPEG1MPEG1CDCD--VidéoVidéo

HomeHome--cinemacinemaAC3AC3DTSDTSMPEG2MPEG2DVDDVD--VidéoVidéo

Films en ligneFilms en ligneAACAACMPEG4MPEG4

MusiqueMusiqueCDCD--DADA

Musique en ligneMusique en ligneMP3MP3MPEG1MPEG1

Musique T HiFiMusique T HiFiDVDDVD--AudioAudioSASA--CDCD

–– ApplicationApplication–– CodecCodec–– StandardStandard–– Support physiqueSupport physique

Année 2008 - 2009 26M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 27: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

1.2.3.1.2.3. FORMAT DES SIGNAUX AUDIOFORMAT DES SIGNAUX AUDIO

Les classiquesLes classiques

Concepteur Compression Multicanal

AIFFMacintosh PCM linéaire, MIC, ADPCM,

RT24, RT29, QuickTimeOui

AUSUN/SGI PCM linéaire 8-16-24-32 bits,

MICNon

OGG, AAC, WMA

Année 2008 - 2009 27M1 – Conception Audio – Marie-José Caraty / David Janiszek

MP3MPEG MPEG Couche 3 Mono/Stéréo

VOCSoundblaster PCM linéaire 2-4-6-8-16 bits Mono/Stéréo

WAVMicrosoft PCM linéaire, MIC, ADPCM,

GSM, MPEG, Dolby AC-2

Oui

Page 28: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

1.2.4.1.2.4. TESTS D’ECOUTE TESTS D’ECOUTE

Principes Principes

Paradigmes de discrimination perceptuelle

Recommandations internationales de l'UIT-R (anc. CC IR)BS.1116 (évaluation de signaux légèrement dégradés)BS.1534 (évaluation de signaux modérément ou très dégradés)

Méthode MUSHRA MUlti Stimulus test with Hidden Reference and AnchorsTest d’écoute en double aveugle, stimulus multiples, avec référence et repères Test d’écoute en double aveugle, stimulus multiples, avec référence et repères dissimulés,mesure absolue de la qualité audio d’un codec,

Signal de référenceSignal original en largeur de bande totale

Signaux repèreSignal original dégradé dans des conditions similaires aux systèmes testés(limitation de la largeur de bande, image stéréo réduite)

Année 2008 - 2009 28M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 29: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

1.2.4.1.2.4. TESTS D’ECOUTE TESTS D’ECOUTE

Test d’écoute à un débit donné Test d’écoute à un débit donné

Création d’un ou de plusieurs signaux repères

Création de N (e.g. 5) ensembles de stimuliSignal de référence + signaux d’un débit donné + signaux repère,Ordre aléatoire et anonymisation des signaux (hors référence)

Notation des N ensembles de stimuliNotation des N ensembles de stimuliEcoute en aveugle par un tiers

Equipe de deux étudiants1er étudiant Construction des stimuli et analyse des notations2ème étudiant Notation des stimuli

Année 2008 - 2009 29M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 30: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

1.2.4.1.2.4. TESTS D’ECOUTE TESTS D’ECOUTE

NotationsNotations

Echelle de qualité continue à cinq niveauxExcellent, bon, moyen, médiocre, mauvais20 graduations par niveau

Année 2008 - 2009 30M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 31: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

2. Stockage de l’audio

Année 2008 - 2009 M1 – Conception Audio – Marie-José Caraty / David Janiszek 31

Page 32: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

� 1982 : Lancement du Compact Disc (CD-DA)� Développé à partir du Laser Disc� Brevet Philips

� Caractéristique physiques� Diamètre (12 cm), épaisseur (1,2 mm), � Trous (largeur 0.5 microns, longueur 0.8 à 3 microns, épaisseur 0.15 microns),

2.1.2.1. STOCKAGE DE L’AUDIO STOCKAGE DE L’AUDIO –– COMPACT DISK (CD) COMPACT DISK (CD)

HistoriqueHistorique

� Trous (largeur 0.5 microns, longueur 0.8 à 3 microns, épaisseur 0.15 microns),� Spirale unique de 5829 m (distance inter-piste 1.6 microns),� Vitesse linéaire constante (1,3 m/s)

� 1984 : Lancement du CD-ROM� Extension de la technologie CD-DA

Année 2008 - 2009 32M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 33: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

� Livre rouge (1980)� Format physique des CD-DA, système de correction d’erreur, subcode channel

� Livre jaune (1983)� Format des CD-ROM, système de fichier ISO9660, spécification des CD-ROM XA

� Livre vert (1986)� Format des CD-I (CD-interactive), synchronisation audio et vidéo, système temps-réel

2.1.2.1. STOCKAGE DE L’AUDIO STOCKAGE DE L’AUDIO –– COMPACT DISK (CD) COMPACT DISK (CD)

NormesNormes

� Livre orange (1990)� Format physiques des disques inscriptibles (CD-MO, CD-WO, CD-RW)

� Livre beige (1991)� Format des Photo CD, Portfolio CD (Kodak)

� Livre blanc (1993)� VideoCD, gestion des données vidéo, capture d’image

� Livre bleu (1995)� Format des CD extra (audio + données)

Année 2008 - 2009 33M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 34: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

� Division en trames

� Organisation d’une trame (588 bits, 136 micro-secondes)

� Bit Contenu0-23 Synchronisation24-26 Bits de redondance

2.1.2.1. STOCKAGE DE L’AUDIO STOCKAGE DE L’AUDIO –– COMPACT DISK (CD) COMPACT DISK (CD)

Format physique du CDFormat physique du CD--DADA

27-40 Subcode Channel (8 canaux) P,Q,R,S,T,U,V,W41-43 Bits de redondance44-247 Voie audio 1 (6 échantillons sur 16 bits)248-315 Détection et Correction d’erreur 316-519 Voie audio 2 (6 échantillons sur 16 bits)520-587 Détection et Correction d’erreur

� Redondance importante (< 33% de données audio)

Année 2008 - 2009 34M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 35: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

� Division en secteurs

� Organisation d’un secteur (2352 octets) = 4 trames

� Octet Contenu� 0 0000 0000� 1- 10 1111 1111

2.1.2.1. STOCKAGE DE L’AUDIO STOCKAGE DE L’AUDIO –– COMPACT DISK (CD) COMPACT DISK (CD)

Format physique du CDFormat physique du CD--ROMROM

� 1- 10 1111 1111� 11 0000 0000� 12 Minutes (+ hex A)� 13 Secondes� 14 Numéro de bloc (mise à zéro à chaque seconde)� 15 Mode (0 bloc nul, 1, 2)� 16-2063 Données utilisateur (2048 octets)� 2064-2351 Correction d’erreur + subcode channel (mod e 1)

� Pas de correction d’erreur en mode 2 (14% de données en plus)

Année 2008 - 2009 35M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 36: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

� 1994 : Spécifications du film numérique� (Hollywood) - MPEG2

� 1995 : Deux formats de supports en concurrence� MMCD (Philips/Sony), SD (Toshiba/Warner)

� 1996 : Accord sur un format unique� DVD-Vidéo 1.0 et DVD-ROM

� 1997 : Création du DVD-forum (organisme de

2.2.2.2. STOCKAGE DE L’AUDIO STOCKAGE DE L’AUDIO –– DIGITAL VERSATIL DISC (DVD)DIGITAL VERSATIL DISC (DVD)

HistoriqueHistorique

� 1997 : Création du DVD-forum (organisme de normalisation)� Sortie des premiers lecteurs

� Caractéristique physiques� Diamètre (12 cm), épaisseur (0,6 mm), � Trous (largeur 0.4 microns, longueur 0.4 à 1.87 microns, épaisseur 0.15 microns),� Spirale unique de 28269 m (distance inter-piste 0.74 microns),� Vitesse linéaire constante (3,49 m/s),� Possibilité de double face, double couche

Année 2008 - 2009 36M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 37: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

� Livre A (1996)� Spécifications du DVD-ROM (4.5 GB 8.5 GB)

� Livre B (1996)� Spécifications du DVD-Vidéo (4.5 GB 8.5 GB 9.4 GB 17.1 GB)� Codage image (720x576), son 3D (jusqu’à 8 pistes audio)

� Livre C (1998)

2. 2.2. 2. STOCKAGE DE L’AUDIO STOCKAGE DE L’AUDIO –– DIGITAL VERSATIL DISC (DVD) DIGITAL VERSATIL DISC (DVD)

NormesNormes

� Livre C (1998)� Spécifications du DVD-Audio (Audio + image fixe + texte) et du DVD-AudioV (+ vidéo)

� Livre D (1999)� Spécifications du DVD-R (3.9 GB normalisé)

� Livre E (2000)� Spécifications du DVD-RW (4.7 GB) - plusieurs formats en concurrence

� Caractéristiques physiques et système de fichiers identique

Année 2008 - 2009 37M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 38: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

� Norme proposée par le DVD forum� Pas de royalties à payer (-> Sony, Philips)

2. 2.2. 2. STOCKAGE DE L’AUDIO STOCKAGE DE L’AUDIO –– DIGITAL VERSATIL DISC (DVD) DIGITAL VERSATIL DISC (DVD)

DVDDVD--Audio (DVDAudio (DVD--A)A)

CD-audio DVD-audio

Capacité 640 Mo 4,7 Go

Nombre de canaux 2 (stéréo) 2 à 6

Durée d’enregistrement

74 minutes 74 min en 6 canaux

Nature du signal audio PCM PCM et MLP

Fréquence d'échantillonnage

44, 1 kHzJusqu’à 192 kHz(suivant nb de canaux )

Taux de transfert 1,4 Mbps 9,6 Mbps

Année 2008 - 2009 38M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 39: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

� Norme propriétaire (Sony, Philips)� Brevet sur la méthode d’acquisition (Direct Stream Digital),

� Conversion analogique-numérique Delta-Sigma (Intégration des différences)

� Fréquence d’échantillonnage 2.8224MHz sur un bit,

� Qualité équivalente au DVD-audio,

2. 2.2. 2. STOCKAGE DE L’AUDIO STOCKAGE DE L’AUDIO –– DIGITAL VERSATIL DISC (DVD) DIGITAL VERSATIL DISC (DVD)

Super Audio Compact Disc (SACD)Super Audio Compact Disc (SACD)

Année 2008 - 2009 39M1 – Conception Audio – Marie-José Caraty / David Janiszek

Page 40: Cours nCours n°°22 Codage et stockage de l’audiojaniszek/_media/enseignement/conception... · l’application temps-réel (streaming : Web radio/télévision, voix sur IP) Année

Qualité Fréquence d'échantillonnage

Bande spectrale

Applications

Téléphonique 8 kHz [300 – 3 400 Hz] Téléphonie

Bande élargie16 kHz

22 kHz[50 – 7 000 Hz]

PC, audio-conférence (ADPCM)

2. 3.2. 3. QUALITE AUDIO ET APPLICATIONSQUALITE AUDIO ET APPLICATIONS

RécapitulatifRécapitulatif

22 kHzconférence (ADPCM)

Radiodiffusion 32 kHz [50 – 15 000 Hz] NICAM

Hi-Fi44.1 kHz

48 kHz[20 – 20 000 Hz]

CD Audio, Studio numérique, DAT

Très hautefidélité

96 kHz [20 – 48 000 Hz]DVD Audio, SACD

Année 2008 - 2009 40M1 – Conception Audio – Marie-José Caraty / David Janiszek