Analyse de scènes sonores pour le traitement des signaux ...

58

Transcript of Analyse de scènes sonores pour le traitement des signaux ...

Page 1: Analyse de scènes sonores pour le traitement des signaux ...

Analyse de scènes sonores pour le traitement dessignaux musicaux

Mathieu Lagrange

October 16, 2009

Page 2: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Je me présente, je m'appelle...

Nom : Mathieu Lagrange

Équipe : Analyse / Synthèse

Statut : Cr2 CNRS

Formation : Informaticien

2 / 28

Page 3: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

La technologie, un monde de dé�s

�Quarante-deux ! cria Loonquawl. Et c'est tout ce que t'as à nousmontrer au bout de sept millions et demi d'années de boulot ?�

D. Adams

Besoins :capturetransmissionaccès

But :bit précisbit utilebit pertinent

Moyens :biologie mécaniquepsycho-acoustiquecognition

3 / 28

Page 4: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

La technologie, un monde de dé�s

�Quarante-deux ! cria Loonquawl. Et c'est tout ce que t'as à nousmontrer au bout de sept millions et demi d'années de boulot ?�

D. Adams

Besoins :capturetransmissionaccès

But :bit précisbit utilebit pertinent

Moyens :biologie mécaniquepsycho-acoustiquecognition

3 / 28

Page 5: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

La technologie, un monde de dé�s

�Quarante-deux ! cria Loonquawl. Et c'est tout ce que t'as à nousmontrer au bout de sept millions et demi d'années de boulot ?�

D. Adams

Besoins :capturetransmissionaccès

But :bit précisbit utilebit pertinent

Moyens :biologie mécaniquepsycho-acoustiquecognition

3 / 28

Page 6: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

La musique, un monde d'enthousiastes

La musique :objet : arrangement de sons et de silences au cours du tempsfonction : forme d'expression

individuelle (sentiments)collective (fête, chant, danse)

Le Musicien :est capable de produire de la musiqueà partir de langages dédiéset d'un dispositif souvent complexe

4 / 28

Page 7: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

La musique, un monde d'enthousiastes

La musique :objet : arrangement de sons et de silences au cours du tempsfonction : forme d'expression

individuelle (sentiments)collective (fête, chant, danse)

Le Musicien :est capable de produire de la musiqueà partir de langages dédiéset d'un dispositif souvent complexe

4 / 28

Page 8: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Travaux Antérieurs

5 / 28

Page 9: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Pourquoi se fatiguer alors qu'ils sont tous sourds ? (LaBRI)

Synthèse sonore à base de sinus [DAFx'01] :

Sans pré-traitement, la synthèse de larges scènes sonores a uncoût de calcul qui est asymptotiquement linéaire en fonctiondu nombre de composantes sinusoïdales.Or, les capacités du système auditif humain sont limitées

Seuil d'auditionMasquage fréquentiel

6 / 28

Page 10: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Pourquoi se fatiguer alors qu'ils sont tous sourds ? (LaBRI)

Synthèse sonore à base de sinus [DAFx'01] :

Sans pré-traitement, la synthèse de larges scènes sonores a uncoût de calcul qui est asymptotiquement linéaire en fonctiondu nombre de composantes sinusoïdales.Or, les capacités du système auditif humain sont limitées

Seuil d'auditionMasquage fréquentiel

6 / 28

Page 11: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

De la théorie à la pratique

L'analyse est une a�aire de compromis plus ou moins assumés :

Observation partielle

Violation de contraintes

Une sinusoïde de fréquence constante (en temps continu)

7 / 28

Page 12: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

De la théorie à la pratique

L'analyse est une a�aire de compromis plus ou moins assumés :

Observation partielle

Violation de contraintes

Une sinusoïde de fréquence constante (en temps discret)

7 / 28

Page 13: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

De la théorie à la pratique

L'analyse est une a�aire de compromis plus ou moins assumés :Observation partielleViolation de contraintes

Une sinusoïde dont la fréquence varie linéairement (cas

non-stationnaire) 7 / 28

Page 14: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

De la subtilité du hachoir...

Compromis usuellement considéré :Identi�cation sur un horizon courtItération avec recouvrementIntégration temporelle par contrainte de régularité

8 / 28

Page 15: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

De la subtilité du hachoir...

pas 12ms., fenêtre 24ms.

Compromis usuellement considéré :

Identi�cation sur un horizon court

Itération avec recouvrement

Intégration temporelle par contrainte de régularité

8 / 28

Page 16: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

De la subtilité du hachoir...

pas 12ms., fenêtre 48ms.

Compromis usuellement considéré :

Identi�cation sur un horizon court

Itération avec recouvrement

Intégration temporelle par contrainte de régularité

8 / 28

Page 17: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

De la subtilité du hachoir...

pas 12ms., fenêtre 96ms.

Compromis usuellement considéré :

Identi�cation sur un horizon court

Itération avec recouvrement

Intégration temporelle par contrainte de régularité

8 / 28

Page 18: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Beaucoup on suivi avant nous...

par heuristiques : MacAulay & al [Taslp'86], Serra [Phd'89]par HMM : Depalle & al [Icassp'93]par splines : Röbel [Tasslp'06]

9 / 28

Page 19: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Beaucoup on suivi avant nous...

par heuristiques : MacAulay & al [Taslp'86], Serra [Phd'89]par HMM : Depalle & al [Icassp'93]par splines : Röbel [Tasslp'06]

9 / 28

Page 20: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

De quelle manière les choses évolues t-elles ?

GMM [Esling Ma'09]

Polynomial + Sinusoïdes [Raspaud Phd'07]

Modèle Auto Régressif [Lagrange Phd'04]

10 / 28

Page 21: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

De quelle manière les choses évolues t-elles ?

GMM [Esling Ma'09]

Polynomial + Sinusoïdes [Raspaud Phd'07]

Modèle Auto Régressif [Lagrange Phd'04]

x(n) =N∑i=1

a(i)x(n − i)

10 / 28

Page 22: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

De quelle manière les choses évolues t-elles ?

GMM [Esling Ma'09]Polynomial + Sinusoïdes [Raspaud Phd'07]Modèle Auto Régressif [Lagrange Phd'04]

10 / 28

Page 23: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

De quelle manière les choses évolues t-elles ?

GMM [Esling Ma'09]

Polynomial + Sinusoïdes [Raspaud Phd'07]

Modèle Auto Régressif [Lagrange Phd'04]

OriginalTronquéAR temporelInterpolation LinéaireInterpolation AR

10 / 28

Page 24: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Dans le monde sinusoïdal : lentement !!

Une contrainte inhérente au modèle sinusoïdal est :

l'évolution lente des paramètres

utilisable pour le suivi de partiels (HFC) [Tasslp'07]

11 / 28

Page 25: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Dans le monde sinusoïdal : lentement !!

Une contrainte inhérente au modèle sinusoïdal est :

l'évolution lente des paramètres

utilisable pour le suivi de partiels (HFC) [Tasslp'07]

11 / 28

Page 26: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Dans le monde sinusoïdal : lentement !!

Une contrainte inhérente au modèle sinusoïdal est :

l'évolution lente des paramètres

utilisable pour le suivi de partiels (HFC) [Tasslp'07]

11 / 28

Page 27: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Dans le monde sinusoïdal : lentement !!

Une contrainte inhérente au modèle sinusoïdal est :

l'évolution lente des paramètres

utilisable pour le suivi de partiels (HFC) [Tasslp'07]

Original MAQ HFCClassique (Sc02)Pop (Sc03)

11 / 28

Page 28: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Voir plus loin ...

Au delà de la résolution de FourierCe qui est localement indécidable, ne l'est pas forcément enconsidérant des à priori structuraux :

Universels : un partiel n'est jamais seulContextuels

12 / 28

Page 29: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Lequel de l'÷uf ou de la poule... (U. of Vic.)

13 / 28

Page 30: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Lequel de l'÷uf ou de la poule... (U. of Vic.)

Harmonicité et continuité temporelle doivent être considéréesconjointementApproche par classi�cation spectrale :

Représentation de la scène sonore sous forme de graphe

n÷uds : atomes sinusoïdauxarcs : pondérés par la probabilité des n÷uds reliés d'appartenirà la même entité.

Formation d'entités sonores par coupures du graphe associé

13 / 28

Page 31: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Lequel de l'÷uf ou de la poule... (U. of Vic.)

13 / 28

Page 32: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Lequel de l'÷uf ou de la poule... (U. of Vic.)

Sinusoidal Synthesis

Texture Window

Spectral Peaks(over Texture Window)

150ms

Spectral Peaks

46ms

Sinusoidal Analysis

Spectral Peaks

46ms

Cluster Selection

Similarity Computation

Normalized Cut

13 / 28

Page 33: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Un grand moment de solitude...

Di�érentes approches de séparation de la mélodie dominante :

Modèle sinusoïdal + Classi�cation Spectrale (SCS) [Lagrange& al Tasslp'08]

Filtrage de Wiener + Factorisation de Matrices Non Négatives(WNMF) [Durrieu & al Icassp'08]

Original SCS WNMFMirex songPop songCeltic songU2 (Live)U2 (Live)

14 / 28

Page 34: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Projet

15 / 28

Page 35: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

L'Analyse de Scènes Auditives (ASA) comme cadrescienti�que

ASA : initié par des psychoacousticiens [Bregman '90]

Aspect computationnel poursuivi par de nombreux laboratoires(Cambridge, Columbia, Tokyo, ...) [Wang & al '06]

Domaine d'application principal : la parolePrincipe:

décomposition sous forme d'atomesstructuration instantanée : regroupement des atomes enentités (notes)structuration séquentielle : regroupement des entités enséquences (voix)

Traits courants de structuration instantanée :HarmonicitéContinuité temporelle...

16 / 28

Page 36: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

L'ASA appliquée aux signaux musicaux

17 / 28

Page 37: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

La structuration doit être multi-critères

Critères de structuration universels :Proximité fréquentielle, d'amplitudeLocalité spatiale

Critères de structuration spéci�ques aux modèles :Sinusoïdal : continuité temporelle, harmonicité, ...Transitoires : régularité spectrale, synchronicité temporelleBruit : régularité spectro/temporelle

Problématique :Comment utiliser judicieusement ces critères ?Prise en compte du contexte :

Type de signalType d'informations recherchées...

18 / 28

Page 38: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

La structuration doit être simultanément �ascendante� et�descendante�

19 / 28

Page 39: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

La structuration doit être simultanément �ascendante� et�descendante�

Problématique complexe:Formalisme commun entre les composants de traitements etles bases de connaissancesPertinence des connaissances

Premières approches :Modèles de timbreModèles probabilistes

Axe de recherche : approche hybride combinant structurationpar coupures de graphes et modélisation probabiliste desconnaissances

20 / 28

Page 40: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Rétroaction et adaptation

21 / 28

Page 41: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Rétroaction et adaptation

21 / 28

Page 42: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Rétroaction et adaptation : des outils fondamentaux pourune meilleure compréhension des signaux musicaux ?

Rétroaction :Amélioration itérative de la qualité de descriptionChallenge en terme d'architecture logicielle

Adaptation :Problématique pluridisciplinaireCognition : processus d'acculturation [Tillman '08]

apprentissage implicite par simple expositionengendre connaissances et attentes musicales

Valide une approche phénoménologique de la musiqueProblématique :

Quels sont les �patrons�, les invariants structuraux ?Comment adapter ces patrons aux phénomènes observés ?

22 / 28

Page 43: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Travaux Annexes

23 / 28

Page 44: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

�Wtf� ? (U. of Vic.)

Architecture logicielle pour le traitement de signaux multimédias[Acmm'08] :

hétérogénéité des données�exibilité et expressivité :

des réseaux de traitementsdes données traitées

24 / 28

Page 45: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

�Wtf� ? (U. of Vic.)

Architecture logicielle pour le traitement de signaux multimédias[Acmm'08] :

hétérogénéité des données�exibilité et expressivité :

des réseaux de traitementsdes données traitées

24 / 28

Page 46: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

�Wtf� ? (U. of Vic.)

Architecture logicielle pour le traitement de signaux multimédias[Acmm'08] :

hétérogénéité des données�exibilité et expressivité :

des réseaux de traitementsdes données traitées

Flots de données sous forme de �Payloads� (MarsyasX)

24 / 28

Page 47: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Similaire, vous avez dit similaire ? (Telecom ParisTech)

Décrire la musique implique de nombreuses dimensions :

Rythme : descripteur compact de la métrique [Ismir'09]

Timbre : modélisation robuste de l'enveloppe spectrale [subIcassp'09]

Hauteur : approche multimodale pour la détection de reprise[sub Icassp'09]

25 / 28

Page 48: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Similaire, vous avez dit similaire ? (Telecom ParisTech)

Décrire la musique implique de nombreuses dimensions :Rythme : descripteur compact de la métrique [Ismir'09]Timbre : modélisation robuste de l'enveloppe spectrale [subIcassp'09]Hauteur : approche multimodale pour la détection de reprise[sub Icassp'09]

25 / 28

Page 49: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Similaire, vous avez dit similaire ? (Telecom ParisTech)

Décrire la musique implique de nombreuses dimensions :

Rythme : descripteur compact de la métrique [Ismir'09]

Timbre : modélisation robuste de l'enveloppe spectrale [subIcassp'09]

Hauteur : approche multimodale pour la détection de reprise[sub Icassp'09]

25 / 28

Page 50: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Pierre qui roule... (McGill)

La synthèse de sons de contact entretenus est un problème di�cile,mais d'intérêt pour de nombreux domaines d'applications. Dansune optique temps réel, on considère :

un modèle Source/Filtre à impulsions multiples

estimation en boucle ouverte

modélisation statistique des impulsions

- 9/18 -

Source/Filter Modeling for

sustained contact sounds

From vanDoel&al

26 / 28

Page 51: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Pierre qui roule... (McGill)

La synthèse de sons de contact entretenus est un problème di�cile,mais d'intérêt pour de nombreux domaines d'applications. Dansune optique temps réel, on considère :

un modèle Source/Filtre à impulsions multiples

estimation en boucle ouverte

modélisation statistique des impulsions

- 16/18 -

Proposed S/F model

! model of the sustained excitation : a series of

similar impulses

26 / 28

Page 52: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Pierre qui roule... (McGill)

La synthèse de sons de contact entretenus est un problème di�cile,mais d'intérêt pour de nombreux domaines d'applications. Dansune optique temps réel, on considère :

un modèle Source/Filtre à impulsions multiples

estimation en boucle ouverte

modélisation statistique des impulsions

26 / 28

Page 53: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Pierre qui roule... (McGill)

La synthèse de sons de contact entretenus est un problème di�cile,mais d'intérêt pour de nombreux domaines d'applications. Dansune optique temps réel, on considère :

un modèle Source/Filtre à impulsions multiples

estimation en boucle ouverte

modélisation statistique des impulsions

26 / 28

Page 54: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Sou�e ici et je te dirais... (LaBRI)

Étude sur le saxophone [Ismir'06] : l'évolution au cours du tempsdes paramètres spectraux portent de nombreuses informations surl'instrumentiste :

son expressivité

son niveau technique

27 / 28

Page 55: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Sou�e ici et je te dirais... (LaBRI)

Étude sur le saxophone [Ismir'06] : l'évolution au cours du tempsdes paramètres spectraux portent de nombreuses informations surl'instrumentiste :

son expressivité

son niveau technique

27 / 28

Page 56: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Sou�e ici et je te dirais... (LaBRI)

Étude sur le saxophone [Ismir'06] : l'évolution au cours du tempsdes paramètres spectraux portent de nombreuses informations surl'instrumentiste :

son expressivité

son niveau technique

27 / 28

Page 57: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Sou�e ici et je te dirais... (LaBRI)

Étude sur le saxophone [Ismir'06] : l'évolution au cours du tempsdes paramètres spectraux portent de nombreuses informations surl'instrumentiste :

son expressivité

son niveau technique

27 / 28

Page 58: Analyse de scènes sonores pour le traitement des signaux ...

Introduction Travaux Projet Annexes

Pour conclure...

A 204

48-71

[email protected]

28 / 28