Automatique - Université Larbi Tébessi · La compression d’images utilisant l’information du...

REPUBLIQUE ALGERIENNE

DEMOCRATIQUE ET POPULAIRE

MINISTERE DE L’ENSEIGNEMENT

SUPERIEUR ET DE LA RECHERCHE

SCIENTIFIQUE

Année Universitaire 2015 / 2016

UNIVERSITE LARBI TEBESSI - TEBESSA

FACULTE DES SCIENCES ET TECHNOLOGIES

DEPARTEMENT DE GENIE ELECTRIQUE

MEMOIRE

DE FIN D'ETUDES POUR L'OBTENTION DU DIPLOME DE MASTER EN

Automatique

THEME

Estimation De Mouvement Par La Méthode Fréquentielle

Présenté par le binôme :

- BAKHOUCHE Somaia

- BOUALLEG Amine

Devant le jury :

- ………………………….. Président

-……………………………Encadreur

-……………………………Examinateur

Liste des figures

Liste des figures

1.1 Un point de l’image de coordonnées(𝑥,𝑦)....................................................................4

1.2 Numérisation d'une image.................................................................................….....5

1.3Zoom de l'image ‘fleur’........................................................................................…...6

1.4Lestype d’images………………………………………………………………………....6

1.5La décomposition d’une image couleur........................................................................7

1.6 Synthèse additive des couleurs………………………………………………………....8

1.7 Luminance d’image…………………………………………………………………....…8

1.8 Exemple de séquence vidéo avec sa représentation en 2D (a) volumique........................10

1.9Relation du traitement d’images avec d’autres disciplines ………………......................11

1.10 Les applications du traitement d'image.................................................................……....13

1.11 Projection mouvement 3D en 2D.............................................................................…....14

1.12 Les champs de mouvement 2-D estimés………………………………………………...16

1.13 Principe des méthodes de mise en correspondance de bloc ………………………….....17

2.1 Transport de la luminosité…………………………………………………………………………………………………………17

2.2 Illustration du problème de l’ouverture………………….………………………………….………………………………19

2.3 Représentation tridimensionnelle de la fonction de GaborNormalisée ………………………….21

2.4 Masque du filtre de Gabor de rayon 21 pixels pour Ɵ = 0, 𝑓 = 2/10 et δx=δx=7………….…21

2.3 Filtres de Gabor complexes dans le domaine fréquentiel………………………………..25

3.1 les étapes de l’estimation de mouvement par filtre de Gabo ………………….…………33

3.2.a- Séquence «TranslatingTree………………………………………….………………..35

3.2.b-Flot mesuré de la séquence «TranslatingTree» basée sur les filtres de Gabor…….......36

3.3.a- Séquence «DivergingTree»

3.3.b-Flot mesuré de la séquence «DivergingTree» basée sur les filtres de Gabor….……....37

3.4.a - Séquence « yosemite. »………………………………………………………...….…38

Liste des figures

3.4.b - Séquence « yosemite. »…………………………………………………….................39

3.4.C - Séquence « yosemite. »………………………………………………………………39

3.5.a- Séquence « Square. »………………………………………………………………….41

3.5.b- Flot mesuré de la séquence « Square2. » par notre approche…………………………41

Liste des tableaux

Liste des tableaux

1.1 : Le traitement d'images recouvre six catégories de tâches……………………………..12

2.1 Influence des paramètres du filtre de Gabor ………………………………………...……23

3.1 Résultats obtenus pour la séquence « TranslatingTree » ………………………………. 36

3.2 Résultats obtenus pour la séquence «DivergingTree »…………………………………..38

3.3 Résultats obtenus pour la séquence«Yosemite » …………………………..……………40

3.4 Résultats obtenue pour la séquence«square» ……………………..……………………..42

SOMMAIRE

Sommaire

Introduction générale ……………………………………………………………………1

Chapitre1 : Généralités sur l’estimation de mouvement…………………………..........3

1Introduction.......................................................................................................................4

2. Définition debase……………………………………….. ……………………………........4

2.1 L’image …………………………………………………………………………...............4

2.2 L'image Numérique...............................................................................................…....5

2.3 Le pixel………………………………………………………………………………….....6

2.4 La pixellisation d'une image:……………………………………………………………....6

2.5 Les type des images…...........................................................................................................6

2.5.1 Les images Matricielles ...……………………………………………...............................6

2.5.2 Les images Vectorielles ........................................................................................................ ..6

2.6 Les formats d'image……………………………………………………..……………………7

2.7 Les images couleurs ..................................................................................................................…...7

2.8Séquence vidéo....................................................................................................................…...8

2.9La vidéo………………………………………………………………………………………….....8

2.10 Vidéo numérique et analogique………………………………………………………………......9

2.11 Classement des séquences vidéo………………………………………………………………….9

2.11.1 Séquences rapides ………………………………………………………………………………9

2.11.2Séquences lentes…………………………………………………………………………………9

2.11.3 Séquences stationnaires……………………………………………………………………......10

2.11.4 Séquences simples ………………………………………………………………………….....10

2.11.5Séquences complexes………………………………………………………………………......10

2.12 Diversité des traitements…………………………………………………………………………11

SOMMAIRE

2.13Le traitement d'images comme contexte…………………………………………………………11

2.14 Applications…………………………………………………………………………………….12

3. ETAT DE L’ART DE L’ESTIMATION DE MOUVEMENT………………………………......14

3.1 Estimation du mouvement d'une image………………………………………………………....14

3.2 La problématique du mouvement ……………………………………………………………….14

3.2.1 Le mouvement dans les images………………………………………………………………..14

3.2.2 Le mouvement dans une séquence d'images bidimensionnelles (2D)………………………....14

3.2.2.1 Mouvement réel ……………………………………………………………………………..15

3.2.2.2 Mouvement apparent…………………………………………………………………………15

3.3 Méthodes d’estimation du mouvement ………………………………………………………….15

3.3.1 Méthodes différentielles ……………………………………………………………………….15

3.3.2 Méthodes fréquentielles………………………………………………………………….........16

3.3.3 Méthode de mise en correspondance de blocs…………………………………………….......17

4. CONCLUSION……………………………………………………………………………….......17

Chapitre 2 : Estimation de Mouvement Par la méthode fréquentielle

1. Introduction………………………………………………………………………………………..20

2. Flot optique………………………………………………………………………………………..20

2.1 Problème d’ouverture……………………………………………………………………………21

2.2 Contraintes supplémentaires…………………………………………………………………......22

3. Estimation de mouvement par la méthode fréquentielle…………………………………………23

3.1. Principe des méthodes fréquentielles…………………………………………………………...23

3.2 Filtre sensibles au mouvement: Fonction et Filtre de Gabor……………………………………23

3.3 Filtres de Gabor complexes…………………………………………………………………….27

3.3.1 Filtres de Gabor 1D complexes……………………………………………………………….27

3.3.2 Filtre de Gabor 2D complexe…………………………………………………………………27

3.3.3 Filtre de Gabor 3D complexe…………………………………………………………………28

3.3.4 Réponse d'un filtre de Gabor………………………………………………………………….28

SOMMAIRE

4. Algorithme de l’estimation de mouvement par filtre de Gabor complexe………………………29

4.1 Estimation de la vitesse………………………………………………………………………...29

4.2 Gradients de phase……………………………………………………………………………....29

4.3 Estimation de la vitesse par les moindres carrés………………………………………………...30

5. Conclusion ……………………………………………………………………………………….31

CHAPITRE 3 : Résultats Expérimentales

3.1 Introduction……………………………………………………………………………….33

3.2 Organigramme de la méthode d’estimation de mouvement par filtre de Gabor ……………33

3.3 Expérimentations …………………………………………………………………………34

3.3.1. Séquences de test……………………………………………………………………….34

3.1.1Séquences« translatingTree » …………………………………………………………34

3.1.2Séquence« squar » …………………………………...………………………………...34

3.1.3. Séquence « Yosemite » …………………………………………………..…………..34

3.2. Critère d’évaluation de la méthode :l’erreur angulaire…………………………………34

4. Simulation de la méthode de l’estimation de mouvement par filtre de Gabor …………..35

4.1Séquence «Translating Tree» ou « newbinarytreet. »………………………………35

4.2 Séquence «DivergingTree» ……………………………………………………………38

4.3 Séquence «Yosemite »…………………………………………………………………39

4.4 Séquence « square.2 »………………………………………………………………….42

5. Interprétation de résultats……………………………………………………………….....43

6. Conclusion …………………………………………………………………………….…43

Introduction Générale

1

Introduction Générale

Le traitment d'image est une discipline de l'informatique et des matématiques appliquées

qui étude les image numériques et leurs transformations, dans le but d'amiliorer leur qualité ou

d'en extraire de l'information

L’EM est un indice très important pour de nombreuses applications, comme la médicine,

la robotique, et la compression vidéo. En domaine médical, cela permet de diagnostiquer et de

suivre le développement des maladies, en robotique, cela justifie de déterminer et souvent donc

de prévoir l'évolution de la position des objets. En compression vidéo, cela permet de

comprendre le mieux possible où se trouve la redondance temporelle de la séquence et de savoir

décrire une image à l'aide des images environnant celle qui nous intéresse. Ainsi, les opérations

de traitement d'image peuvent utiliser cette information à des fins diverses : segmentation,

filtrage,… etc.

L’estimation du flot optique est un problème essentiel dans l’analyse du mouvement des

séquences d’images. Il fournit des informations nécessaires pour la technologie de vidéo, tels

que le suivi d'objets, la segmentation d’image et la compensation du mouvement. Un grand

nombre d'approches pour l'estimation ont été proposées dans la littérature, il y comprit des

techniques basée sur le gradient, la corrélation, et sur l'énergie, et des techniques basé sur la

phase.

Parmi les approches, nous avons adopté l’approche frequentielle basée sur les filtres de Gabor, à

cause de ses avantages de la sensibiltée de mouvement.

L'objectif de ce travail est d’estimer le mouvement dans les séquences temporelles d’images,

grâce à une méthode basée sur les filtres de Gabor. La méthode proposée prend les avantages de

nature de filtre, qui est un outil mathématiques permet d’approximer efficacement et

précisément n’importe quelle fonction.

Dans la première partie de ce travaille on commencera par plusieurs définitions de base,

tel que la séquence temporelle, le mouvement d’image, et le champ de mouvement et présenter

les grandes familles des méthodes de mesure du mouvement. La deuxième partie on fait un tour

rapide dans ce monde pour examiner en bref la méthode d’estimation du flot optique sera

d'étudier comment réaliser l’estimation de mouvement par l’approche fréquentielle. Plusieurs.

Après en discutera la méthode que nous choisie pour estimer l’équation du flot optique. Enfin,

on mettra en œuvre des études expérimentales et on présentera les résultats de notre approche

étudiée.

2

Le manuscrit est organisé de la manière suivante:

Le chapitre I : présente les définitions de base de traitement d’image et les différentes

méthodes d’estimation de mouvement.

Le chapitre II: expose l'approche d'estimation de mouvement en utilisant le filtre de

Gabor.

Le chapitre III : précise l’étude expérimentale, et concrète les résultats de cette approche

choisie.

Enfin, la conclusion générale récapitule ce qui a été fait et expose les perspectives de ce

travail.

Chapitre 01

Généralités sur l’estimation de mouvement

Résumé

Le traitement d’images est l’ensemble des méthodes et techniques opérant sur celles-ci, dans le

but de rendre cette opération possible, plus simple, plus efficace et plus agréable, d’améliorer

l’aspect visuel de l’image et d’en extraire des informations jugées pertinentes.

L’estimation du mouvement dans des séquences temporelles d’images bidimensionnelles est un

des problèmes fondamentaux en traitement d’images. Les applications sont nombreuses et parmi

les domaines d’application concernés nous pouvons mentionner :

La compression d’images utilisant l’information du mouvement, la robotique, la météorologie

avec le suivi de masses nuageuses, la médecine avec l’estimation du mouvement d’organes

mobiles (comme le cœur ou les poumons), etc.

Chapitre 01 Généralité sur l’estimation de mouvement

4

1. INTRODUCTION

Le traitement d’images est un ensemble des méthodes et techniques opérant sur l'image,

dont le but est d'améliorer son aspect visuel. Il se définit comme un ensemble de taches destinées

à extraire de l'image des informations qualitatives et quantitatives [1].

Le contenu de l’image est en constante évolution. Ainsi, il devient nécessaire de traiter une

séquence d’images espacées dans le temps, en tenant compte à la fois des propriétés propres aux

objets, telles que la forme, la couleur ou la texture, mais également de leur déplacement dans la

scène.De ce fait, l’estimation du mouvement dans une séquence d’images est desthématiques qui

ont préoccupé un grand nombre de chercheurs depuis qu’existe la vision artificielle [2].

Nous commencerons ce chapitre par plusieurs définitions de base, tel que la séquence

temporelle, le mouvement d’image, et le champ de mouvement. Ensuitenous présenteronsde

façon rapideles grandes familles de méthodes d'estimation du mouvement (Etat de l’art) : la

méthode fréquentielle, la mise en correspondance de blocs, la méthode différentielle filtrée...etc.

Enfin, nous terminons avec une conclusion contient les points les plus importants dans ce

chapitre.

2. DEFINITIONS DE BASE

2.1 L’image

Une image est obtenue par transformation d’une scène réelle par un capteur. La

numérisation d’une image consiste à passer de la représentation continue à discrète. Une image

peut être définie par une fonction, 𝑓(𝑥, 𝑦), où 𝑥 et 𝑦 sont des coordonnées spatiales planes.

L’amplitude de f pour chaque paire de coordonnées (𝑥, 𝑦) est appelée intensité de l’image au

point donné. Une image peut alors être assimilée à une matrice de points appelés « pixels ». De

nos jours les appareils photos numériques effectuent la transformation d’eux-mêmes, fournissant

directement une image facilement manipulable. [3]

Figure 1.1 : un point de l’image de coordonnées (𝒙, 𝒚) [1].

X

Y

x

y


5

2.2 L'image Numérique

Limage numérique est limage dont la surface est divisée en éléments de tailles fixes

appelés cellules ou pixels, ayant chacun comme caractéristique un niveau de gris ou de couleurs

prélevé à l’emplacement correspondant dans l’image réelle, ou calculé à partir d’une description

interne de la scène à représenter.

La numérisation d’une image est la conversion de celle-ci de son état analogique (distribution

continue d’intensités lumineuses dans un plan 𝑥𝑂𝑦 en une image numérique représentés par une

matrice bidimensionnelle de valeurs numériques 𝑓(𝑥, 𝑦) ou 𝑥, 𝑦 et 𝑓(𝑥, 𝑦) sont respectivement :

Coordonnées cartésiennes d’un point de l’image,

Niveau de gris en ce point [4].

2.3 Le pixel

La notion de pixel Une image est constituée d’un ensemble de points appelés pixels (pixel

est une abréviation de « Picture Elément »). Le pixel représente ainsi le plus petit élément

constitutif d’une image numérique. L’ensemble de ces pixels est contenu dans un tableau à deux

dimensions constituant l’image:. Etant donné que l’écran effectue un balayage de gauche à droite

et de haut en bas, on désigne généralement par les coordonnées [0,0] le pixel situé en haut à

gauche de l’image, cela signifie que les axes de l’image sont orientés de la façon suivante :

– L’axe X est orienté de gauche à droite.

– L’axe Y est orienté de haut en bas, contrairement aux notations conventionnelles en

mathématiques, où l’axe Y est orienté vers le haut [5].

Figure 1.2 : Numérisation d'une image [6].

Valeur : 𝐼(𝑥, 𝑦) Hauteur (lignes)

Largeur (colonnes)


6

2.4 La pixellisation d'une image:

La pixellisation d'une image: est le nombre de points la composant. Ainsi, toute image

est constituée de la juxtaposition de points. Sur notre image "fleur", nous avants 800 lignes

comportant chacune 600 points soit un totale de 480 000 points ayant chacun une couleurpour la

représenter. [7]

Figure 1.3: zoom de l'image ‘fleur’. [8]

2.5 Les type des images

2.5.1 Les images Matricielles

Les images matricielles (ou image en mode point, en anglais « bitmap » ou « raster »)

sont celles utilisons généralement pour restituer des photos numériques. Elles reposent sur

une grille de plusieurs pixels formant une image avec une définition bien précise. Lorsqu'on

les agrandi trop, on perd de la qualité (« pixellisation ») [9].

2.5.2 Les images Vectorielles

Ce sont des images dont la particularité est que chaque forme qui la compose est

décrite mathématiquement à partir de points et de tangentes. Elles ne peuvent pas décrire une

image trop complexe comme une photographie, mais sont tout à fait adaptées au rendu

typographiques, aux logos et autres formes composées de tracés simples [9].

Bitmap vectoriel Bitmap vectoriel

Figure 1.4: les types des images [9].


7

2.6 Les formats d'image

Les formats d'image, une notion très importante. Choisir son format d'image de façon

judicieuse est devenu indispensable dans le monde de l'informatique et surtout du web. Et oui, on

n'envoie pas n'importe quel type d'image sur le web. Attention, quand on dit "type d'image", ils

sont totalement différents. Ils permettent d'indiquer à l'ordinateur de quel type il s'agit, en plus

de lui faire comprendre que c'est un fichier image et non un fichier musique ou texte. Il n'existe

pas qu'un seul format d'image. En réalité, il en existe pas mal. Les propriétés d'une même image,

telles que son poids ou sa qualité, vont sensiblement différer d'un format à l'autre [10].

2.7 Les images couleurs

Une image couleur est en réalité composée de trois images, afin de représenter le rouge, le

vert, et le bleu. Chacune de ces trois images s’appelle un canal. Cette représentation en rouge,

vert et bleu mime le fonctionnement du système visuel humain.

La figure suivante illustre la décomposition d’une image couleur en ses trois canaux constitutifs.

Image numérique canal rouge Canal vert canal bleu

Couleur

Figure 1.5: la décomposition d’une image couleur [11].

Chaque pixel de l’image couleur contient ainsi trois nombres(𝑟, 𝑣, 𝑏), chacun étant un nombre

entier entre 0 et 255. Si le pixel est égal à (𝑟, 𝑣, 𝑏) = (255,0,0), il ne contient que de

l’information rouge, et est affiché comme du rouge. De façon similaire, les pixels

valant (0,255,0) et (0,0,255)sont respectivement affichés vert et bleu.On peut afficher à l’écran

une image couleur à partir de ses trois canaux (𝑟, 𝑣, 𝑏) en utilisant les règles de la synthèse

additive des couleurs. La figure suivante montre les règles de composition cette synthèse

additive des couleurs. Un pixel avec les valeurs (𝑟, 𝑣, 𝑏) = (255,0,255) est un mélange de rouge

et de vert, il est ainsi affiché comme jaune.

http://fr.wikipedia.org/wiki/Couleur

http://fr.wikipedia.org/wiki/Rouge_vert_bleu

http://fr.wikipedia.org/wiki/Rouge_vert_bleu

http://fr.wikipedia.org/wiki/Codage_informatique_des_couleurs


8

Figure 1.6: synthèse additive des couleurs [11].

On peut calculer une image en niveaux de gris à partir d’une image couleur en moyennant les

trois canaux. On calcule donc une valeurqui s’appelle la luminance de la couleur présenté dans

l’équation (1-1).

𝒂 =𝒓+𝒗+𝒃

𝟑 (1-1)

La figure suivante illustre l’image de luminance associée à une image couleur. [11]

Figure 1.7: luminance d’image [11].

2.8 Séquence vidéo

Est une série d'images accompagnées de son, mais on utilise souvent le terme vidéo

pour désigner une simple séquence d'images. C'est la fréquence des images et leurs

dimensions qui différencient un système vidéo d'un autre. La fréquence des images peut aller

jusqu'à 30 images par seconde, ce qui rend inévitable leur compression. Plusieurs normes et

produits sont apparus représentant différentes techniques et répondant aux besoins des

différentes applications [12].

2.9 La vidéo

La vidéo est une succession d’images animées défilant à une certaine cadence afin de

créer une illusion de mouvement pour l’œil humain. Elle peut être analogique (signal continu

d’intensité de luminance) ou numérique (suite de trames ou images). On peut distinguer deux

types de vidéo:


9

- la vidéo entrelacée: où chaque image est formée de deux champs entrelacés. Le premier champ

contenant uniquement les lignes impaires de l'image, le second champ, quant à lui, contenant les

lignes paires (les signaux de télévision nord-américain et européen sont entrelacés).

-la vidéo progressive: dans une vidéo progressive, contrairement au mode entrelacé, toutes les

lignes d'une image sont lues en une passe (vidéo). [13]

2.10 Vidéo numérique et analogique

On distingue généralement plusieurs grandes familles d’images animées :

Le cinéma, consistant à stocker sur une pellicule la succession d’images en négatif. La

restitution du film se fait alors grâce à une source lumineuse projetant les images successives

sur un écran.

La vidéo analogique, représentant l’information comme un flux continu de données

analogiques, destiné à être affichées sur un écran de télévision (basé sur le principe du

balayage). Il existe plusieurs normes pour la vidéo analogique. Les trois principales sont :

PAL, SECAM et NTSC.

La vidéo numérique consistant à coder la vidéo en une succession d’images numériques [5].

2.11 Classement des séquences vidéo

2.11.1 Séquences rapides

Ce sont des séquences où les objets se déplacent d'une image à une autre avec une

Distance importante qui peut même dépasser les limites de la zone de recherche prédéfinie,

ce qui empêche une compression optimale (les séquences des scènes sportives par exemple).

Ce type de séquences nécessite donc l'utilisation de grandes zones de recherche pour

atteindre les objets en mouvement, au détriment du temps de calcul bien sûr. Des techniques

de recherche permettant de minimiser le nombre de blocs testés sont développées pour

surmonter le problème du temps de calcul [12].

2.11.2 Séquences lentes

Ce sont les séquences où les objets se déplacent lentement ou restent fixes (pour la

Plupart du temps) telles que l’exploration d'une scène par une caméra, les séquences de

visiophonie ou les séquences des mobiles de la troisième génération. Dans ce cas, une petite

zone de recherche suffit pour atteindre un très bon taux de compressionen un temps de calcul

réduit [12].

2.11.3 Séquences stationnaires

Ce sont les séquences où les blocs gardent la même position d'une image à l’autre tel

que les arrières plans. Dans ce cas, le taux de compression est maximal et le temps de

recherche est nul si on sait d'avance qu'une portion d'une séquence est stationnaire [12].


10

2.11.4 Séquences simples

Dans ce type de séquences, les images ne contiennent pas beaucoup de détails et les

objets Connaissent le même mouvement en direction et en vitesse (cas du mouvement de la

caméra):c'est-à-dire que les pixels du même objet se déplacent aussi à la même vitesse et la

même direction, ce qui permet de trouver des techniques qui convergent rapidement vers le

bloc le plus ressemblant [12].

2.11.5 Séquences complexes

C'est le contraire du dernier type. Les objets connaissent un mouvement aléatoire (ne peut

être prévu) c'est-à-dire qu'un objet peut être jugé meilleur localement mais ne l'est pas

globalement (problème des minima locaux) ce qui peut conduire à de faibles résultats en taux

de compression et en qualité [12].

(a)Une séquence de 200 trames vue comme une succession d'images 2D. (Seules les trames

1, 27, 93, 151 et 200 sont représentées.) [14]

(b)Vue compacte de la même séquence obtenue en empilant toutes les images le long de la

troisième dimension

Figure 1.8 : Exemple de séquence vidéo avec sa représentation en 2D (a) volumique

(b). [14]

2.12 Diversité des traitements

Le traitement d’images fait appel à un nombre important de disciplines : la théorie du

signal, La théorie du système, l’analyse numérique, les statistiques, la théorie de l’information, la


11

neurophysiologie, et la psychophysique, l’optique, l’électronique et l’informatique pour ne cite

que les principales, Cette situation est résumée à la figure 1.9. On peut voir le traitement

d’images comme une prolongation du traitement numérique des signaux et comme un préalable à

la reconnaissance des formes, à l’analyse de scènes et à l’intelligence artificielle [15].

Figure 1.9 : relation du traitement d’images avec d’autres disciplines [15].

2.13 Le traitement d'images comme contexte

En l'absence de définition consensuelle du domaine du traitement d'images, nous

proposons une définition établie selon un point de vue intentionnel. Le traitement d'images se

définit à partir des six catégories de tâches atomiques résumées dans le tableau (1). Ces six

catégories résultent de la combinaison des trois opérations de base - ajout, modification et

suppression – appliquées à des fins de pure transformation ou à des fins épistémiques

(augmentation de l''intelligibilité de l'information).

La restauration a pour but de retrouver l'image d'origine à partir de sa version dé- gradée

par ajout d'information au niveau signal connaissant la fonction de dégradation (ou au

moins une estimation).

L'amélioration a pour but d'adapter au mieux les données à une exploitation visuelle par

modification de l'information au niveau signal en utilisant uniquement les valeurs de

l'image d'entrée.

TRAITEMENT

D’IMage

AGES

Statistiqu

e

Analyse de

numérique Théorie de

signal

Informatique

Electroniqu

e Neurophysiologie

Psychophysique

Théorie de

l’information

Optique Théorie de

système


12

La compression a pour but de réduire la quantité de données nécessaire pour stocker une

image numérique en supprimant l'information identifiée comme redondante au niveau

signal.

La reconstruction consiste à créer une nouvelle image par ajout d'une information spatio-

temporelle déduite d'une image ou de plusieurs (la forme, le relief, le mouvement).

La segmentation structure l'information signal à un niveau d'information symbolique :

points d'intérêt, régions et contours. - La détection fournit un masque positif des zones de

l'image contenant les objets d'intérêt et supprime toutes les autres informations [16].

Transformation Augmentation

Ajout

Modification

suppression

Restauration

Amelioration

Compression

Reconstruction

Segmentation

Detection

Tableau 1.1 : Le traitement d'images recouvre six catégories de tâches [16].

2.14 Applications

Une caractéristique très importante et en même temps très enrichissante du traitement

d’images est son aspect interdisciplinaire. On trouve ses applications également dans des

domaines très variés tels que les télécommunications (TV, vidéo, transmission, stockage,

téléconférence, services intégrées RNIS, publicité), la médecine (radiographie, ultra-sons,

microscopie, fichiers électroniques et diagnostiques à distance), l’industrie (robotique,

surveillance de qualité, sécurité), la météorologie, le recensement des ressources terrestres,

l’architecture, l’imprimerie, l’armement, etc., La liste est longue et s’allonge chaque jour

davantage [15].

Les informations que l'on souhaite extraire d'une image .les applications, les types de données,

sont si variés qu'il est difficile, lorsque l'on doit traiter une nouvelle application. Le présent

ouvrage a pour objectif de donner au lecteur une bonne compréhension des principes de base du

traitement d'image, associée à un certain esprit critique [17].


13

Amélioration d'image retouche d'image création de panorama

Analyse d'image de Analyse d'image de

document document

Reconnaissance de Reconnaissance fine de la

caractère structure d'un document

Séparation texte/dessin

Imagerie médicale route intelligente réalité augmentée

Segmentation du ventricule localisation des voitures Superposition d’un modèle virtuel 2D

Cérebral (scanner Cérebral) ou 3D sur une image réelle (photo).

Segmentation du rien radars automatiques Domaines : jeux, tourisme, marketing,

(scanner Abdominal) publicité...

Figure 1.10 : Les applications du traitement d'image [18]

Application

de Traitement

d’image


14

3. ETAT DE L’ART DE L’ESTIMATION DE MOUVEMENT

3.1 Estimation du mouvement d'une image

L'estimation du mouvement est un procédé qui consiste à étudier le déplacement des objets

dans une Séquence vidéo, en cherchant la corrélation entre deux images successives afin de

prédire le changement de position du contenu [19].

L'estimation du mouvement consiste à chercher l'origine des objets se trouvant dans l'image cible

et d'extraire des vecteurs de mouvement représentant le déplacement de ces objets, en se basant

sur une mesure de ressemblance entre ces objets. On essaie donc à trouver un objet dans

laréférence minimisant cette mesure [12].

D’autres méthodes utilisent l'estimation d'un champ dense de mouvement, c'est-à-dire

l'estimation d'un vecteur mouvement par pixel de l'image. Ce sont les méthodes basées sur le flot

optique, qui repose sur le fait qu'il y a invariance d’illumination d'un objet au cours du temps.

Dans ce type d’estimation, il y a une seule contrainte scalaire par pixel. [20]

3.2 La problématique du mouvement

3.2.1 Le mouvement dans les images

Le mouvement est un réel problème en vidéo puisqu'il décrit un contexte en trois

dimensions alors que les images sont une projection de scènes 3D dans un plan en 2D.

En général, il est représenté par un vecteur de mouvement qui décrit une transformation d'une

image en deux dimensions vers une autre. [19]

Figure 1.11 : projection mouvement 3D en 2D [19]

3.2.2 Le mouvement dans une séquence d'images bidimensionnelles (2D)

Le mouvement dans une séquence d'images bidimensionnelles, est perceptible grâce aux

changements de la distribution spatiale des intensités lumineuses. Le mouvement ainsi perçu est

appelé "apparent", car il ne correspond pas nécessairement à la projection dans le plan de l'image

du mouvement ayant lieu dans l'espace tridimensionnel (3D). [19]


15

3.2.2.1 Mouvement réel

Le mouvement réel anime la scène réelle, dans l’espace réel 3D. Ce mouvement réel est

observé soit par l’œil humain, soit par un système de prise de vue.

3.2.2.2 Mouvement apparent

Le mouvement apparent est un mouvement 2D perçu dans une séquence à travers des

variations spatio-temporelles de la luminance. Le champ des vitesses apparentes porte le nom de

flot optique. [21]

3.3 Méthodes d’estimation du mouvement

3.3.1 Méthodes différentielles

Les méthodes différentielles d’estimation du mouvement sont basées sur les gradients spatiaux et

temporels de l’intensité lumineuse des pixels. Le principe de ces méthodes repose sur une

hypothèse forte, qui est celle de la conservation de l’intensité lumineuse d’un pixel le long de la

trajectoire du mouvement. Cette hypothèse de conservation peut s’écrire sous la forme :

𝑑𝑖(𝑥1,𝑥2,𝑡)

𝑑𝑡= 0 (1.2)

où x1 et x2 sont les variables spatiales, t est la variable temporelle et 𝑖(𝑥1, 𝑥2,𝑡)est l’intensité du

pixel de coordonnées (𝑥1, 𝑥2,) dans l’image acquise à l’instant t. Un développement de Taylor du

premier ordre de l’équation (1) permet d’obtenir la relation suivante :

𝜕𝑖(𝑥1,𝑥2,𝑡)

𝜕𝑥1𝑑1 +

𝜕𝑖(𝑥1,𝑥2,𝑡)

𝜕𝑥2𝑑2 +

𝜕𝑖(𝑥1,𝑥2,𝑡)

𝜕𝑥𝑡𝑑𝑡 = 0 (1.3)

Où 𝑑1 et 𝑑2 sont les déplacements du pixel courant qui doivent être estimés et dt est la période

temporelle d’acquisition des images. Si on divise l’équation (1.3) par 𝑑𝑡, alors nous obtenons

l’équation de contrainte de mouvement, également appelée équation du flux optique.

Il s’agit donc d’une seule équation avec deux inconnues. Afin de pouvoir résoudre cette

équation, différentes méthodes introduisant des contraintes supplémentaires ont été proposées.

Une comparaison des performances des méthodes différentielles d’estimation du mouvement les

plus utilisées est faite dans Barron. Nous montrons ici un résultat extrait et qui correspond à une

séquence d’images classique, le cube de Rubik, dont nous montrons sur la Figure 12 (a) une

seule image. Les champs de mouvement 2-D estimés avec deux approches différentielles sont

également montrés sur la Figure 12. [22]


16

Figure 1.12 : Les champs de mouvement 2-D estimés [21]

(a) Une image de la séquence d’images expérimentales du cube de Rubik, champ 2-D de

mouvement estimé

(b) un méthode basée sur la technique de Horn et Schunk .

3.3.2 Méthodes fréquentielles

Dans le domaine fréquentiel, nous considérons la séquence d’images I(x, y, t) ayant pour

transformée de Fourier 𝐼𝑏(𝑓𝑥, 𝑓𝑦, 𝑓𝑡). Dans le cas où les objets de la séquence d’images

subissent un mouvement de translation uniforme

(𝑥(𝑡), 𝑦(𝑡))=(𝑥0 + 𝑣1𝑡 + 𝑦0 + 𝑣2𝑡) (1-4)

Nous avons, d’après l’hypothèse de contrainte :

I ((𝑥(𝑡), 𝑦(𝑡)), 𝑡) = I((𝑥(𝑡0), 𝑦(𝑡0)), 𝑡0) ∀t. (1-5)

La relation suivante:

𝐼(𝑥, 𝑦, 𝑡) = 𝐼(𝑥 − 𝑣1𝑡, 𝑦 − 𝑣2𝑡 , 0). (1-6)

Ce qui est équivalent à

𝐼𝑏(𝑓𝑥, 𝑓𝑦, 𝑓𝑡)= 𝐼𝑏0(𝑓𝑥, 𝑓𝑦) δ(𝑓𝑡 + 𝑣1𝑓𝑥 + 𝑣2𝑓𝑦), (1-7)

Où δ(.) est la mesure de Dirac en 0. Posons 𝐾 = (𝑓𝑥 , 𝑓𝑦) et 𝑤 = 𝑓𝑡. Déterminer le flot optique

dans la séquence d’images revient donc, d’après l’équation (1-7), à identifier dans l’espace des

fréquences un plan de vitesse d’équation :

𝑣𝑇 𝑘 + 𝑤 = 0. (1-8)

L’estimation du mouvement est extraite de l’équation (1-8) par filtrage spatio-temporel. Le

problème de l’ouverture est contourné en supposant le flot constant sur les supports des ces

filtres. Cette hypothèse a pour conséquence de lisser le flot à la fois en espace et en temps et peut

parfois poser des problèmes pour des séquences d’images rapides et saccadées. Ces méthodes

sont divisées en deux branches suivant que l’estimation du flot est faite sur l’énergie ou la phase


17

du signal filtré. Ces dernières permettent d’obtenir de très bons résultats mais sont très coûteuses

en temps de calcul. [23]

3.3.3 Méthode de mise en correspondance de blocs

Les méthodes de mise en correspondance de blocs (BM comme Block Matching) sont

parmi les méthodes d’estimation du mouvement les plus utilisées dans la pratique. Le principe de

base des méthodes de mise en correspondance de blocs est de découper l’image de référence en

blocs de pixels, également appelés des régions d’intérêt (ROI). Pour chacun de ces blocs, une

zone de recherche est définie dans l’image cible. [22]

Figure 1.13 : Principe des méthodes de mise en correspondance de blocs. [22]

(a) Une région d’intérêt de taille 𝐿1 × 𝐿2 est considérée dans l’image de référence.

(b) Une zone de recherche est considérée dans l’image cible.

La ROI est recherché dans cette zone de recherche et le meilleur candidat (le plus ressemblant à

la ROI suivant un critère donné) est retenu. A noter que la taille de la zone de recherche impose

le déplacement maximum autorisé pour la ROI courante. [22]

4. CONCLUSION

Le traitement d'image, ces contraintes sont levées ou contournées. En effet, ce domaine

cherche à détecter la présence de certaines formes, certains contours ou certaines textures d'un

modèle connu, La manipulation des images pose cependant des problèmes beaucoup plus

complexes que celles du texte. En effet, l'image est un objet à deux dimensions, censé

représenter un espace à trois dimensions, ce qui a deux conséquences majeures : Le volume des


18

données à traiter est beaucoup plus important, La structure de ces données est nettement plus

complexe. [24]

La mesure du champ de mouvement est une étape de traitement de limage dite de bas niveau. On

lui trouve de nombreuses applications comme l'analyse de mouvements de fluides en physique

expérimentale, la compression de séquence d'images vidéo par compensation de mouvement, ou

encore son utilisation pour des phases de traitement des images de plus haut niveau, comme la

reconstruction de scènes tridimensionnelles [25]

Ce chapitre introductif est pour le but de représenter les éléments de base du traitement d’image

et l’estimation du mouvement dans une séquence d’images qui seront utilisés dans le deuxième

chapitre.

Chapitre 02

Estimation de Mouvement Par la

méthode fréquentielle

Résumé

Dans ce chapitre, nousproposons une méthode d’estimation rapide du flot optique (OF)

dans les séquences temporelles d’image. L’idée basique est de projeter l'équation du flot optique

sur la base de filtres de Gabor afin d’obtenir le champ de vitesse que l'on souhaite trouver.

Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle

20

1. INTRODUCTION

Dans ce chapitre nous présentons une méthode fréquentielle de calcul le déplacement dans les

séquences vidéo à base des filtres Spatio-temporel de Gabor.

2. FLOT OPTIQUE

Le flot optique est un champ de déplacement visuel qui permet d'expliquer des variations

dans une image animée en terme de déplacement de points images. Autre définition du flot

optique est la distribution de la vitesse, par rapport à l’observateur, en chaque point de l’image.

Pour construire l’équation du flot optique il faut définir une telle contrainte :

des considérations humaines,

des considérations physiques.

Alors, l’hypothèse du flot optique annonce que les séquences d’image sont (localement)

invariantes en luminosité, d’autre terme chaque point dans un flux d’image garde la même

luminosité (ou couleur). Une telle hypothèse implique une contrainte (forte) de mouvement.

Donc, Le modèle mathématique standard utilisée pour trouver des équations qui définissent le

flot optique est basée sur une hypothèse d'illumination constante :[26]

Figure2.1:Transport de la luminosité.[26]

I(𝑥, 𝑦, 𝑡) = 𝐼(𝑥 + 𝛿𝑥, 𝑦 + 𝛿𝑦, 𝑡 + 𝛿𝑡), ∀(𝑥, 𝑦) ∈ Ω(2.1)

– Ω : domaine de l’image (région bornée de R2)

– 𝑣 = (𝛿𝑥, 𝛿𝑦) : déplacement du point (𝑥, 𝑦) au temps 𝑡.

Le développement de Taylor au point (𝑥, 𝑦)à l’ordre 1 :


21

𝐼 𝑥 + 𝛿𝑥, 𝑦 + 𝛿𝑦, 𝑡 + 𝛿𝑡 = 𝐼 𝑥, 𝑦, 𝑡 + 𝛿𝑥𝜕𝐼

𝜕𝑥 𝑥, 𝑦, 𝑡 + 𝛿𝑦

𝜕𝐼

𝜕𝑦 𝑥, 𝑦, 𝑡 + 𝛿𝑡

𝜕𝐼

𝜕𝑡 𝑥, 𝑦, 𝑡 (2.2)

et donc :

𝐼 𝑥+𝑢𝛿𝑡 ,𝑦+𝑣𝛿𝑡 ,𝑡+𝛿𝑡 −𝐼(𝑥 ,𝑦 ,𝑡)

𝛿𝑡= 𝐼𝑥

𝛿𝑥

𝛿𝑡+ 𝐼𝑦

𝛿𝑦

𝛿𝑡+ 𝐼𝑡(2.3)

en passantà la limite : 𝛿𝑡 → 0 ∶

𝐼𝑥𝛿𝑥

𝛿𝑡+ 𝐼𝑦

𝛿𝑦

𝛿𝑡+ 𝐼𝑡 = 0(2.4)

Finalement, l’équation de mouvement peut s’écrire :

𝑣. 𝛻𝐼 + 𝐼𝑡 = 0(2.5)

avec 𝑣 = 𝛿𝑥

𝛿𝑡,𝛿𝑦

𝛿𝑡 et𝛻𝐼 =

𝜕𝐼

𝜕𝑥,𝜕𝐼

𝜕𝑦

-Remarque :

𝜕𝐼

𝜕𝑡= 0 (ce qui indique l’invariance de la luminosité)

⇔𝜕𝐼

𝜕𝑡 𝑥 𝑡 , 𝑦 𝑡 , 𝑡) = 0

⇔𝜕𝐼

𝜕𝑥

𝛿𝑥

𝛿𝑡+

𝜕𝐼

𝜕𝑦

𝛿𝑦

𝛿𝑡+

𝜕𝐼

𝜕𝑡= 0

Finalement

𝑣. 𝛻𝐼 + 𝐼𝑡 = 0 (2.6)

Tel que 𝑣 est le vecteur du flot optique, 𝛻𝐼 est le gradient spatial de l’image 𝐼 , et 𝐼𝑡 est le

gradient temporel de l’image𝐼. L’équation (2.6) s’appelle la contrainte du flot optique (Optical

Flow Contraint Equation, OFC).[28]

2.1 Problème d’ouverture

Le problème de sous-conditionnement de la contrainte du flot optique s’appelle le

problème de l’ouverture. Intuitivement, on manque d’information pour calculer le flot optique.

Si on considère l’équation du flot optique donné dans l’équation (2.6), on voit que la valeur du

vecteur 𝑣(𝑥0, 𝑡0), un vecteur de dimension supérieur à 1, n’est contrainte que par unique

équation scalaire linéaire. Dans ces conditions, la seule information sur le champ 𝑣 que l’on peut

extraire est sa composante dans la direction du gradient 𝐼, et non pas toutes les composantes du

vecteur 𝑣.[28]


22

Figure 2.2 : Illustration du problème de l’ouverture.[26]

2.2 Contraintes supplémentaires

– Dans la théorie : il manque une contrainte telle que le système soit résolvable (pas de

dépendances linéaires).

– En pratique : gros problème, pas de réponse universelle, quelle contrainte justifiée prendre ?

Alors la première solution est l’équation multiple de flot optique :

∇𝐼𝑖𝑣 + 𝐼𝑡𝑖 = 0 , 𝑖 ∈ 1,2, ⋯ (2.7)

Les 𝐼𝑖 sont les différents acquisitions d’une même scène : des images multi-spectrales, des

images à différent point de vue (stéréovision), aussi en dérivant d’une image par filtrage (ex :

laplacien filtre de Gabor).

Ainsi, on trouve une condition nécessaire et suffisante pour que le flot optique soit bien posé.[28]


23

3.ESTIMATION DE MOUVEMENT PAR LA METHODE

FREQUENTIELLE.

3.1. Principe des méthodes fréquentielles

Pour une image 𝑖 (𝑥, 𝑦) en translation à vitesse uniforme𝑣 (𝑣𝑥 , 𝑣𝑦), le spectre associé dans le

domaine des fréquences spatio-temporelles occupe un plan passant par l’origine d’équation :

𝑣𝑥𝑓𝑥 + 𝑣𝑦𝑓𝑦 + 𝑓𝑡 = 0 (2.8)

où𝑓𝑥 , 𝑓𝑦 représentent les fréquences spatiales et 𝑓𝑡 la fréquence temporelle.

Le principe des méthodes fréquentielles consiste à localiser le plan de spectre non nul ou

plan de vitesse au moyen d'un banc de filtres spatio-temporels orientés, pour obtenir les

composantes du vecteur de vitesse (𝑣𝑥 , 𝑣𝑦). L'estimation de vitesse est formulée généralement

comme une minimisation de l'écart quadratique entre les réponses mesurées des filtres pour une

séquence d'images quelconque et les réponses prédites pour une séquence d'images de bruit

blanc en translation. Le coût de calculs de cette procédure est très élevé et dépend étroitement de

la précision requise pour l'estimation.

3.2 Filtre sensibles au mouvement: Fonction et Filtre de Gabor

Nous appelons fonction de Gabor l'association d'une courbe de Gauss et d'une sinusoïde

orientée (voir figure 2.3). En traitement d'images, nous travaillons dans le domaine spatial en

Dimension 2, ce qui nous permet d'écrire la fonction de Gabor de la manière suivante :

G x, y, Ɵ, f = e−

1

2

xƟ2

δx2+

yƟ2

δy2

cos 2πfxθ (2.9)

avec xθ = x cos θ + y sin θ

et yθ = y cos Ɵ − x sin Ɵ

où Ɵest l'orientation de la sinusoïde, 𝑓 sa fréquence et δx (respectivement δy ) l'écart type

de la gaussienne selon l’axe des abscisses (resp. des ordonnées).[27]


24

Figure 2.3: Représentation tridimensionnelle de la fonction de Gabor

Normalisée entre les valeurs 0 et 255 [27]

En appliquant cette fonction à un masque de convolution, on définit un filtre de convolution que

Nous appelons filtre de Gabor (voir Figure 2.4).

Figure 2.4: Masque du filtre de Gabor de rayon 𝟐𝟏 pixels pour Ɵ = 𝟎, 𝒇 = 𝟐/𝟏𝟎 et

𝛅𝐱=𝛅𝐱=7 [27]


25

L'application d'un filtre de Gabor 𝑔de masque 𝑀 de rayon 𝑟à une image 𝐼de largeur 𝑚et de

Hauteur 𝑛, se résume donc à la formule suivante :

𝑔 𝐼 = 𝐽 = 𝑀 ∗ 𝐼

où J est une matrice de dimension 𝑚, 𝑛 et pour 𝑖 , 𝑗 ∈ ℕ,𝑟 ≤ 𝑖 < 𝑚 − 𝑟et 𝑟 ≤ 𝑗 < 𝑛 − 𝑟

𝐽𝑖 ,𝑗 = 𝑀𝑘 ,𝑙𝑟𝑙=−𝑟 ∗ 𝐼 𝑖−𝑘 , 𝑗−𝑙

𝑟𝑘=−𝑟 = 𝐺 𝑘, 𝑙, 𝜃, 𝑓 𝑟

𝑙=−𝑟𝑟𝑘=−𝑟 ∗ 𝐼 𝑖−𝑘 , 𝑗−𝑙 (2.10)

Comme nous allons le voir, les filtres de Gabor permettent d'isoler les contours d'une

image d’orientation perpendiculaire à Ɵet répondant à une certaine épaisseur, qui dépend de f.

Ceci justifie le fait que pour détecter l'ensemble des contours d'une image, on lui applique

généralement un ensemble de filtres de Gabor que nous appelons banc. Le tableau suivant

(tableau 2.1) consigne divers exemples d'utilisation des filtres de Gabor sur une même image,

afin d'expliciter l'influence des différents paramètres.[27]


26

Orientation :

L’application d’un seul filtre fait

ressortir les contours orientés

perpendiculairement par rapport à

son orientation.

Orientations multiples :

L'application d'un banc à

plusieurs orientations

permet de détecter des

contours plus nombreux.

Écarts-types :

Si l'on fait varier 𝛿𝑥de

manière à ce qu'il soit

inférieur à 𝛿𝑦 , les

filtres deviennent moins

sensibles aux contours et

le banc se comporte (dans

un état limite) comme un

simple flou gaussien.

Si l'on applique la

variation inverse, le

résultat, légèrement plus

net, ne présentera pas de

grandes différences avec

un filtrage symétrique.

Fréquence :

Si on utilise plusieurs

fréquences, le tracé

devient beaucoup plus net,

le filtre est sensible à de

plus nombreux contours

en termes d'épaisseur.

Tableau 2.1 : Influence des paramètres du filtre de Gabor[27]


27

3.3Filtres de Gabor complexes

3.3.1 Filtres de Gabor 1D complexes

Un filtre de Gabor complexe ℊ 𝑥 est le produit d'une gaussienne par une exponentielle

complexe et est notée :

ℊ 𝑥 =1

𝜍𝑥 2𝜋exp

−𝑥2

2𝜍𝑥2

𝑔𝑎𝑢𝑠𝑠𝑖𝑒𝑛𝑛𝑒

. cos 2𝜋𝑓0𝑥 + 𝑗sin(2𝜋𝑓0𝑥 ) (2.11)

C'est-à-dire :

ℊ 𝑥 =1

𝜍𝑥 2𝜋exp

−𝑥2

2𝜍𝑥2

𝑔𝑎𝑢𝑠𝑠𝑖𝑒𝑛𝑛𝑒

. exp(𝑗2𝜋𝑓0𝑥) 𝑒𝑥𝑝𝑜𝑛𝑒𝑛𝑡𝑖𝑒𝑙𝑙𝑒 𝑐𝑜𝑚𝑝𝑙𝑒𝑥𝑒

(2.12)

Où𝑓0est la fréquence centrale du filtre, i.e. la fréquence pour laquelle le filtre donne la meilleure

réponse et 𝜍𝑥 est l'écart type de la fenêtre gaussienne.

La réponse d'un filtre de Gabor complexe, comporte une partie réelle de base cosinus ℜ ℊ 𝑥

et une partie imaginaire de base sinus ℑ ℊ 𝑥 , les deux parties étant modulées par une

gaussienne.

ℜ ℊ 𝑥 =1

𝜍𝑥 2𝜋exp

−𝑥2

2𝜍𝑥2 . cos 2𝜋𝑓0𝑥 (2.13)

ℑ ℊ 𝑥 =1

𝜍𝑥 2𝜋exp

−𝑥2

2𝜍𝑥2 . (𝑠𝑖𝑛 2𝜋𝑓0𝑥 ) (2.14)

La réponse impulsionnelle d'un filtre de Gabor dans le domaine fréquentiel est une gaussienne

centrée sur 𝑓𝑥0.[29]

𝐺 𝑓𝑥 = exp(−2𝜋2𝜍𝑥2 𝑓𝑥 − 𝑓𝑥0

2) (2.14)

3.3.2 Filtre de Gabor 2D complexe

En étendant l'équation du filtre de Gabor 1D à la deuxième dimension, on obtient l'équation

suivante :

ℊ 𝑥, 𝑦 =1

𝜍𝑥𝜍𝑦 2𝜋exp

−𝑥2

2𝜍𝑥2 −

−𝑦2

2𝜍𝑦2 . exp(𝑗2𝜋 𝑓𝑥0𝑥 − 𝑓𝑥0𝑦 )

(2.15)

La réponse impulsionnelle de ce filtre 2D complexe (Figure 2.3) est une gaussienne 2D centrée

sur (𝑓𝑥0 − 𝑓𝑦0) et est notée :

𝐺 𝑓𝑥 , 𝑓𝑦 = exp(−2𝜋2 𝑓𝑥 − 𝑓𝑥0 2𝜍𝑥

2 + 𝑓𝑦 − 𝑓𝑦0 2𝜍𝑦

2 ) (2.16)


28

a) TF d'un filtre de Gabor 2D complexe b) TF d'un banc de filtres de filtre de

Gabor 2D complexes

Figure 2.3 : Filtres de Gabor complexes dans le domaine fréquentiel

(a) Transformée de Fourier (TF) d'un filtre de Gabor 2D complexe et (b) Transformées de

Fourier d'un banc de 6 filtres de Gabor 2D complexes.[29]

3.3.3 Filtre de Gabor 3D complexe

Les filtres utilisés par Fleet et Jepson [31] pour estimer le flux optique sont des filtres de Gabor

3D et sont notés :

ℊ 𝑥, 𝑦 =1

𝜍𝑥𝜍𝑦𝜍𝑡 2𝜋 3 exp

−𝑥2

2𝜍𝑥2 −

−𝑦2

2𝜍𝑦2 −

−𝑡2

2𝜍𝑡2 . exp(𝑗2𝜋 𝑓𝑥0𝑥 + 𝑓𝑥0𝑦 + 𝑓𝑡0𝑡 )

(2.17)

3.3.4 Réponse d'un filtre de Gabor

La réponse 𝑅 𝑥 , 𝑡 d'un filtre de Gabor 1D complexe peut-être décomposée en amplitude 𝜌 𝑥 , 𝑡

et phase 𝜙 𝑥 , 𝑡 :

𝑅 𝑥 , 𝑡 = 𝜌 𝑥 , 𝑡 . exp(𝑖 𝜙 𝑥 , 𝑡 ) (2.18)

avec l'équation de l'amplitude et de la réponse du filtre donnée par [31]:

𝜌 𝑥 , 𝑡 = 𝑅 𝑥 , 𝑡 (2.19)

= ℜ 𝑅 𝑥 , 𝑡 2

+ ℑ 𝑅 𝑥 , 𝑡 2 (2.20)

et l'équation de la phase de la réponse du filtre donnée par :

𝜙 𝑥 , 𝑡 = arg 𝑅 𝑥 , 𝑡 (2.21)


29

= ℑ loge 𝑅 𝑥 , 𝑡 ∈ −𝜋, 𝜋

4. Algorithme de l’estimation de mouvementpar filtre de Gaborcomplexe

Cette algorithme est basé sur l'équation générale du flux optique mais au lieu de considérer

l'intensité des pixels, on s'intéressera à la phase du signal. La phase et l'amplitude du signal sont

estimées à partir de la réponse de filtres de Gabor 3D orientés. À partir de la phase, on peut

déduire le gradient de phase dans chacune des directions 𝑥, 𝑦, 𝑡 . [28]

L'équation du flux optique correspondante sera notée :

∇𝜙 𝑥 , 𝑡 . 𝑉 𝑥 , 𝑡 + 𝜙 𝑥 , 𝑡 = 0 (2.22)

𝜙𝑥 𝑥 , 𝑡

𝜙𝑦 𝑥 , 𝑡 .

𝜐𝑥 𝑥 , 𝑡

𝜐𝑦 𝑥 , 𝑡 + 𝜙 𝑥 , 𝑡 = 0 (2.23)

Avec ∇𝜙 = 𝜙𝑥

𝜙𝑦 le gradient de phase spatial, 𝑉 𝑥 , 𝑡 =

𝜐𝑥𝜐𝑦

le vecteur vitesse à déterminer,

𝜙𝑡 le gradient de phase temporel et 𝑥 un pixel à la position 𝑥, 𝑦 dans l'image.

4.1 Estimation de la vitesse

D'après l'équation 0, on peut déterminer une première estimation de la vitesse notée :

𝑉 𝑥 , 𝑡 =−𝜙𝑡 𝑥 ,𝑡 .∇𝜙 𝑥 ,𝑡

∇𝜙 𝑥 ,𝑡 2 (2.24)

Avec ∇𝜙 𝑥 , 𝑡 2la norme du gradient spatial.

4.2 Gradients de phase

Pour pouvoir estimer la vitesse 𝑥 , 𝑡 , il est nécessaire d'estimer les gradients spatiaux et le

gradient temporel de la phase du signal. Fleet et Jepson proposent d'utiliser la formule suivante

pour estimer les gradients :

∇𝜙 𝑥 , 𝑡 =ℑ 𝑅 𝑥 ,𝑡 ∗.∇𝜙 𝑥 ,𝑡

𝜌2 𝑥 ,𝑡 (2.25)

Ou 𝑅 𝑥 , 𝑡 ∗ = ℜ 𝑅 𝑥 , 𝑡 − ℑ 𝑅 𝑥 , 𝑡 est le conjugué complexe de 𝑅 𝑥 , 𝑡 , 𝜌 𝑥 , 𝑡 est

l'amplitude de 𝑅 𝑥 , 𝑡 ,

Et ∇𝑅 𝑥 , 𝑡 est le gradient de 𝑅 𝑥 , 𝑡

On déduit de la définition du conjugué complexe :

∇𝜙 𝑥 , 𝑡 =ℑ ∇𝑅 𝑥 ,𝑡 .ℜ 𝑅 𝑥 ,𝑡 −ℜ ∇𝑅 𝑥 ,𝑡 .ℑ 𝑅 𝑥 ,𝑡

ℜ 𝑅 𝑥 ,𝑡 2

+ℑ 𝑅 𝑥 ,𝑡 2 (2.26)

Cette représentation du gradient permet de s'affranchir des problèmes de discontinuité de phase

(repliement de phase et singularité de phase) lorsque la phase est calculée directement et de

manière locale. [28]


30

On s'aperçoit dans l'équation (2.24)de l'estimation de la vitesse, lorsque que l'amplitude du signal

est nul (dénominateur de l'équation(2.24)), il est impossible d'estimer le mouvement. Cette

amplitude nulle correspond à un niveau de gris égal à zéro dans l'image.

4.3 Estimation de la vitesse par les moindres carrés

L'équation (2.24)permet d'estimer la vitesse (𝜐𝑥𝑖 , 𝜐𝑦𝑖 ) pour chacun des filtres 𝑖 ∈ 1 …𝑁 de

Gabor 3D complexes utilisés. Or, l'objectif est de déterminer le couple unique (𝜐𝑥 , 𝜐𝑦) respectant

au mieux la contrainte du flux optique. La technique proposée consiste à estimer le flux optique

par une résolution par les moindres carrés du système pondéré.[31]

On cherche à minimiser :

𝑊( 𝑥 , 𝑡) ∇𝜙 𝑥 , 𝑡 . 𝑉 𝑥 , 𝑡 + 𝜙𝑡 ( 𝑥 , 𝑡) 𝑥 =(𝑥 ,𝑦)𝜖𝛺2

(2.27)

Avec Ωun voisinage spatial carré de taille 𝑛 ∗ 𝑛 et 𝑊 𝑥 , 𝑡 contenant les coefficients d'une

fonction gaussienne 2D qui reflète la mesure de confiance que l'on peut avoir dans la vitesse

estimée𝑉 𝑥 , 𝑡 .

Pour résoudre la minimisation de l'équation (2.27), il faut trouver la solution matricielle de :

𝑊𝐴𝑉 = 𝑊𝑏(2.28)

Avec

A= ∇𝜙 𝑥 1, 𝑡 , … , ∇𝜙 𝑥 𝑛 , 𝑡 𝑇 =

𝜙𝑥1 𝜙𝑦1

𝜙𝑥𝑛 𝜙𝑥𝑦

(2.29)

W= diag 𝑊 𝑥 1, 𝑡 , … , 𝑊 𝑥 𝑛 , 𝑡 (2.30)

=

𝑊 𝑥 1, 𝑡

𝑊 𝑥 𝑖 , 𝑡

𝑊 𝑥 𝑛 , 𝑡

b=− 𝜙𝑡 𝑥 , 𝑡 , … . , 𝜙𝑡 ( 𝑥 , 𝑡) 𝑇(2.31)

On déduit de l'équation précédente :

A𝑇

WAV = 𝐴 𝑇 𝑊𝑏(2.32)

V= A 𝑇 WA −1 A 𝑇 Wb(2.33)

Remarque : La vitesse𝑉 𝑥 , 𝑡 existe si et seulement si la matrice A 𝑇 WA est inversible (non

singulière).[31]

Où


31

𝐴𝑇𝑊𝐴 = 𝑊 𝑥 , 𝑡 𝜙𝑥

2 𝑥 , 𝑡 𝑊 𝑥 , 𝑡 𝜙𝑥 𝑥 , 𝑡 𝜙𝑦 𝑥 , 𝑡

𝑊 𝑥 , 𝑡 𝜙𝑦 𝑥 , 𝑡 𝜙𝑥 𝑥 , 𝑡 𝑊 𝑥 , 𝑡 𝜙𝑦2 𝑥 , 𝑡

(2.34) et

𝐴𝑇𝑊𝐴 = − 𝑊 𝑥 , 𝑡 𝜙𝑥 𝑥 , 𝑡 𝜙𝑡 𝑥 , 𝑡

− 𝑊 𝑥 , 𝑡 𝜙𝑦 𝑥 , 𝑡 𝜙𝑡 𝑥 , 𝑡 (2.35)

𝑊 𝑥 , 𝑡 est un filtre séparable isotopique. [31]

5.CONCLUSION

Nous avons examinédans ce chapitre le problème de l’estimation de mouvement dans les

séquences temporelles d’images. En début, nous avons expliqué la notion du flot optique, où,

nous avons appris sur les problèmes qui font l’obstacleaux dépens de calcul du flot optique

(problème d’ouverture).Ensuite, nous avons présenté une méthode fréquentielle d’estimation de

mouvement pour resoudre ceproblème. Cette méthode est basée sur une analyse spatro-

fréquentielle en appliquant les filtres de Gabor complexe.

Chapitre 03

Expérimentation etRésultats

Résumé

Les simulations de cette approche est réalisé à l'aide de logiciel MATLAB, en utilisant des

séquences de teste composée de deux frames. Cette méthode prend les propriétés de filtre de Gabor

pour calculer le déplacement d’image. L’évaluation requérait une phase de comparaison avec

d’autre approche, en utilisant l’erreur angulaire comme un critère d’évaluation du flot optique

mesuré par notre approche. L’interprétation de ces résultats annonce d’une grande réussite de cette

approche d’atteindre des meilleure performances, tel que une erreur inférieure ce qui signifie à une

grande précision, et une complexité plus faible.

Chapitre 03 Résultats Expérimentales

33

1 Introduction

L’estimation de mouvement est un indice très important pour de nombreuses applications de

traitement du signal et d’analyse d’image,c'est ce que nous avons vu au premier chapitre introductif.

Ainsi, nous avons interprété dans le deuxième chapitre que les filtres de Gabor est un outil

capable pour calculer le déplacement dans les séquences vidéos.

Nous commencerons ce chapitre par la description des propriétés de séquences de teste, puis, nous

présenterons la simulation de l’estimation de mouvement. Ensuite, nous comparons le flot optique

estimé avec le flot optique réel, en utilisant le critère d’évaluation (l’erreur angulaire), par la suite,

nous annoncerons l’interprétation de ces résultats. Enfin, nous terminons par conclusion qui

synthétisera le compris de ce chapitre.

2 Organigramme de la méthode d’estimation de mouvement par filtre de Gabor

La figure 3.1présente les étapes de l’estimation de mouvement par la méthode de filtre de Gabor :

Figure 3.1: les étapes de l’estimation de mouvement par filtre de Gabor


34

3 Expérimentations

Toutes les séquences que nous avons utilisées sont des séquences synthétiques pour lequel le

mouvement réel est connu.Cela permet donc de faire des comparaisons entre le flot réel et le flot

calculé.

3.1. Séquences de test

Nous avons téléchargé différentes séquences rassemblées par Barronsur leur site FTP à l’adresse

csd.uwo.ca.[30]translatingTree » : représentent les séquences de translation et la divergence de

l'image d'un arbre. Ces images sont créées par le déplacement d'un camera

3.1.1. Séquences « sur un plan d’image d'un arbre. La vitesse de la séquence de translation est

variée entre 1.73 et 2.26 pixels/image, et la vitesse de l’image de divergence est variée de 1.29

pixels/image sur le côté gauche, et 1.86 pixels/image sur le coté droit. [30]

3.1.2. Séquence « squar » : Un carré blanc sur fond noir qui se déplace avec une vitesse (4 / 3, 4 /

3) pixels / image.

3.1.3. Séquence « Yosemite » : La séquence « Yosemite » est une séquence complexe et très

importante pour le domaine de l’estimation de mouvement parce qu’elle procède plusieurs

mouvement. Cette séquence montre le survol d'un engin parmi les collines. Donc, on a un

mouvement propre qui génère un flot optique divergent où le focus d'expansion est situé autour du

centre de l'image. La vitesse d'en bas et à gauche est de 5 pixels par image et les nuages se

déplacent vers la droite d'environ 2 pixels par image. Donc, le mouvement du terrain est divergent

et celui des nuages dans l'horizon plus au moins constant.

Les images de la séquence « Square » ont la size de 100 * 100, Les images de la séquence « Tree »

ont la size 150 * 150 et les images de Yosemite ont la size 316 * 252.[30]

3.2. Critère d’évaluation de la méthode :l’erreur angulaire

Le paramètre le plus couramment utilisé pour mesurer la performance du flux optique est la

mesure de l'erreur angulaire (EA) popularisée par Baron [30] mais initialement introduite par Fleet

et Jepson [31]. L'EA est calculée entre la vitesse correcte (réelle) et la vitesse estimée dans un

espace à trois dimensions. Il s'agit de normaliser les vecteurs, de calculer leur produit scalaire et de

prendre le cosinus inverse :

𝜓𝐸 = arccos(𝑉 𝑐 ,𝑉 𝑒)


35

𝜓𝐸 = arccos 𝑣𝑥𝑒𝑣𝑥𝑐+𝑣𝑦𝑒𝑣𝑦𝑐+1

𝑣𝑥𝑒2 +𝑣𝑦𝑒

2 +1× 𝑣𝑥𝑐2 +𝑣𝑦𝑐

2 +1 (3.1)

La vitesse 𝑉 = 𝑣𝑥𝑣𝑦 est représentée comme un vecteur à 3 dimensions tel que

𝑉 =1

𝑣𝑥𝑒2 +𝑣𝑦𝑒

2 +1

𝑣𝑥𝑣𝑦1 (3.2)

4. Simulation de la méthode de l’estimation de mouvement par filtre de Gabor

Les résultats visuels du flux optique pour les méthodes de filtre de Gabor sont respectivement

présentés dans les figures suivantes sous forme de champ vectoriel superposé aux images.

4.1 Séquence «Translating Tree» ou « newbinarytreet. »

Figure 3.2.a- Séquence «TranslatingTree


36

La séquence «TranslatingTree», pose une erreur angulaire moyenne de 2.8114°, qui peuvent

être comparé avec d’autres techniques d’estimation de mouvements. Le tableau suivant rappelle les

résultats obtenus par d’autres méthodes.

Méthode Erreur angulaire

Estimation de mouvement par filtre de Gabor 2.8114 °

Liu et al.[30] 3.67°

Horn et Schunk (original)[30] 38.43°

Horn et Schunk (modifié)[30] 2.02°

Anandan[30] 1.25°

Singh[30] 1.25°

Tableau 3.1- Résultats obtenus pour la séquence « TranslatingTree »

Figure3.2.b-Flot mesuré de la séquence «TranslatingTree» basée sur les filtres de Gabor


37

Nous notons pour cette séquence, que les erreurs sont faibles et équivalentes dans la plupart

des approches, telles que Horn et Schunk (modifié),Anandan, Singh, Liu et al et notre approche.En

revanche, la méthode originale de Horn et Schunk a produitune erreur importante (erreur

moyenne 38.43°.

4.2 Séquence «DivergingTree»

Figure 3.3.a- Séquence «DivergingTree»


38

Figure 3.3.b-Flot mesuré de la séquence «DivergingTree» basée sur les filtres de Gabor.

Ainsi, pour la séquence «DivergingTree», l’erreur angulaire moyenne est 6.3289 °qui peut

être comparé par d’autres méthodes d’estimation. Ceci est illustré dans le tableau suivant :

Méthode Erreur moyenne

Estimation de mouvement par filtre de Gabor 6.3289 °

Liu et al.[30] 1.67°



Anandan[30] 7.64°

Singh[30] 8.60°

Tableau 3.2 Résultats obtenus pour la séquence «DivergingTree »

Les résultats obtenus pour la séquence de «DivergingTree » concernant notre approche n’est

pas le meilleur en comparaison avec les autres méthodes, en termes d’une erreur moyenne

.


39

4.3 Séquence «Yosemite »

4.4

Figure 3.4.a - Séquence « yosemite. »

Figure 3.4.b - Flot mesuré de la séquence « Yosemite. » basé sur les filtres de Gabor


40

La séquence « yosemite.» révèle des différences plus importantes que les autres séquences.

Notre approche donne les meilleurs résultats. Une possible explication est la présence de beaucoup

structure non linéaire (i.e. de coins)

Pour la séquence de «Yosemite», l’erreur moyenne sur toute l’image est de 4.1771°.

L’erreur angulaire moyenne est comparée par d’autres méthodes, selon le tableau suivant :


Estimation de mouvement par filtre de Gabor 4.1771°

Liu et al.[30] 8.43°



Anandan[30] 15.84°

Singh[30] 13.16°

Tableau 3.3. Résultats obtenus pour la séquence «Yosemite »

La séquence «yosemite » est la séquence la plus complexe, car elle contient trop de directions, et

seulement notre approche assure une erreur plus faible par rapport à d'autres méthodes similaires.

Les approches Liu et al. et Horn et Schunk (modifié) produit une erreur moyenne, et la technique

de Horn et Schunk (original) porte une erreur important (erreur moyenne de 32.43°).Cette

comparaison montre l'efficacité de notre approche pour calculer le flot optique d’une séquence

complexe contient un certain nombre de directions.


41

4.4 Séquence « square.2 »

Figure 3.5.a- Séquence « Square. »


42

Figure 3.5.b- Flot mesuré de la séquence « Square2. » par notre approche

Les résultats de l'évaluation du flot optique de la séquence « square.2 » sont récapitulées dans le

tableau 3.4.Il est évident que tout les techniques proposées semblent des résultats très bonnes, tel

que les approches qui présentent les meilleurs résultats sont : Lucas et Kanade, Fleet et Jepson et

notre approche. Notre approche n’est la meilleure, mais donne des résultats satisfaisants (Erreur

moyenne 3.9135°)


Estimation de mouvement par filtre de Gabor 3.9135°

Lucas et Kanade[30] 0.14

Heeger[30] 1.02°

Waxman et al.[30] 4.28°

Fleet et Jepson[31] 0.05°

Tableau 3.4 .Résultats obtenue pour la séquence «square»


43

5. Interprétation de résultats

Après la phase de comparaison de notre approche avec d’autres méthodes, il est évident que

les méthodes de comparaison permettent d’atteindre des erreurs d’estimation faibles, au prix d’une

complexité de calcule sensiblement plus élevée.En revanche, notre méthode offre une erreur

inférieure et une complexité plus faible.

Les avantages des de filtre de Gabor sont évidents dans les résultats des expérimentations

de notre approche :

La propriété de l’invariance par translation est adéquate pour l’hypothèse de la constance de la

luminance qui est la base de tous les approches.

La rapidité de calcule est assurée (complexité faible) parce que le filtre de Gabor offre plus de

contraintes pour faire la résolution de l’équation du flot optique, ce qui donne un temps de

calcul plus faible.

L’erreur de calcul est plus faible ce qui annonce une précision parfaite.

Le flot optique peut être calculé en plusieurs directions.

La disponibilité de l’information de phase, cette dernière permet de localiser les directions du

flot optique de façon exacte.

la réduction de complexité est réussite à cause de l’utilisation de deux frames seulement dans le

calcul de flot optique.

6. Conclusion

Ce chapitre a réalisé la comparaison de la performance de calcul du flot optique de notre

approche avec certain nombre de techniques similaires, en mettant l'accent sur la précision et la

densité de mesures.L'objectif de cette comparaison est d'évaluer l'efficacité et la précision de notre

approche.

Nous avons présenté les résultats de simulation de notre méthode. Tout d’abord, nous avons

commencé par la description des séquences synthétiques qui ont été utilisées dans ce travail.

Ensuite, nous exposons, la simulation de notre approche pour le filtre de Gabor, ainsi nous avons

fait une comparaison avec d’autres techniques, en utilisant l’erreur angulaire comme critère

d’évaluation.

La réduction de la complexité computationnelle est assurée pour notre méthode. Cette

réduction est gagnée parce qu’on a utilisée seulement deux frames pour calculer le flot optique,

ainsi cette algorithme ouvre la voie d’un calcul rapide et peu couteux du flot optique. Les résultats

montrent que notre approche surpasse les méthodes existantes, elle est plus efficace et plus précise.

Conclusion Générale

39

Conclusion Générale

On a présenté l'approche de l’estimation de mouvement pour calculer le flot optique.

Notre algorithme est basé sur le filtre de Gabor complexe qui est sensible de mouvement.

Dans le cas de changements d'illumination, travailler sur la phase du signal est plus robuste que

de travailler sur les dérivées de l'intensité du signal ou encore d'utiliser des filtres d'énergie.

Les expérimentations démontrent que cet algorithme est précis et robuste pour les mouvements

complexes. Ainsi, grâce à l'utilisation d'une séquence composée de deux frames d'image, la

complexité de calcul est diminuée par rapport à d'autres approches.

L'idée clef de cette méthode est d’utiliser l’image filtrée par filtre de Gabor pour

l’estimation de mouvement.

Ce travail consiste 3 chapitres, le premier chapitre est un bref rappel sur les méthodes

classiques d'estimation de mouvement. Le second chapitre a présenté l’approche de l’estimation

de mouvement par filtre de Gabor. Le troisième chapitre a exposé les résultats expérimentaux

de cette approche et a donné les avantages de filtre de Gabor pour calculer le flot optique.

Des critères d'évaluation ont été présenté, tel que l'erreur angulaire.

Les résultats de simulations avec Matlab, interprétation de ces résultats et conclusion, ont été

faitsaussi dans le troisièmechapitre.

Finalement en conclue que notre approche est capable de faire l'estimation du flot optique

de façon efficace, précise et robuste, puisque les filtre de Gabor ont plusieurs avantages tel que l

l'information de phase et la sensibilité par le mouvement, tous ces propriétés sont admissibles et

préférables pour l'application de l'estimation de mouvement.

Comme perspectives de notre travail, on peut utiliser d'autres methode d’estimation de

mouvement comme la méthode de block matching.

Résumé

Dans ce travail, nous présentons une technique del'estimation du champ de flot optique pour

les séquences d'images. Cette méthode est basées sur la phase du signal,en utilisent des filtres

sensibles au mouvement dans le plan de Fourier. Sur ce principe, on propose d'utiliser des

filtres de Gabor complexes 3D pour estimer le flux optique dans les images. Cette approche se

déroule en trois étapes. Tout d'abord, la séquence d'images est filtrée spatialementen utilisant

une banque de paires filtres de Gabor en quadrature, puis nous calculons le gradient de phase,

ce dernier est utilisé pour calculer la vitesse complète. Nous testons cette méthode sur

plusieurs séquences d'images synthétiques. Cette méthode offre une erreur inférieure et une

complexité plus faible pour les mouvements complexes.

Mots clés :estimation,flot optique,mouvements complexes,filtres de Gabor complexes.

Automatique - Université Larbi Tébessi · La compression d’images utilisant l’information du...

Documents

Transcript of Automatique - Université Larbi Tébessi · La compression d’images utilisant l’information du...