Automatique - Université Larbi Tébessi · La compression d’images utilisant l’information du...
Transcript of Automatique - Université Larbi Tébessi · La compression d’images utilisant l’information du...
REPUBLIQUE ALGERIENNE
DEMOCRATIQUE ET POPULAIRE
MINISTERE DE L’ENSEIGNEMENT
SUPERIEUR ET DE LA RECHERCHE
SCIENTIFIQUE
Année Universitaire 2015 / 2016
UNIVERSITE LARBI TEBESSI - TEBESSA
FACULTE DES SCIENCES ET TECHNOLOGIES
DEPARTEMENT DE GENIE ELECTRIQUE
MEMOIRE
DE FIN D'ETUDES POUR L'OBTENTION DU DIPLOME DE MASTER EN
Automatique
THEME
Estimation De Mouvement Par La Méthode Fréquentielle
Présenté par le binôme :
- BAKHOUCHE Somaia
- BOUALLEG Amine
Devant le jury :
- ………………………….. Président
-……………………………Encadreur
-……………………………Examinateur
Liste des figures
Liste des figures
1.1 Un point de l’image de coordonnées(𝑥,𝑦)....................................................................4
1.2 Numérisation d'une image.................................................................................….....5
1.3Zoom de l'image ‘fleur’........................................................................................…...6
1.4Lestype d’images………………………………………………………………………....6
1.5La décomposition d’une image couleur........................................................................7
1.6 Synthèse additive des couleurs………………………………………………………....8
1.7 Luminance d’image…………………………………………………………………....…8
1.8 Exemple de séquence vidéo avec sa représentation en 2D (a) volumique........................10
1.9Relation du traitement d’images avec d’autres disciplines ………………......................11
1.10 Les applications du traitement d'image.................................................................……....13
1.11 Projection mouvement 3D en 2D.............................................................................…....14
1.12 Les champs de mouvement 2-D estimés………………………………………………...16
1.13 Principe des méthodes de mise en correspondance de bloc ………………………….....17
2.1 Transport de la luminosité…………………………………………………………………………………………………………17
2.2 Illustration du problème de l’ouverture………………….………………………………….………………………………19
2.3 Représentation tridimensionnelle de la fonction de GaborNormalisée ………………………….21
2.4 Masque du filtre de Gabor de rayon 21 pixels pour Ɵ = 0, 𝑓 = 2/10 et δx=δx=7………….…21
2.3 Filtres de Gabor complexes dans le domaine fréquentiel………………………………..25
3.1 les étapes de l’estimation de mouvement par filtre de Gabo ………………….…………33
3.2.a- Séquence «TranslatingTree………………………………………….………………..35
3.2.b-Flot mesuré de la séquence «TranslatingTree» basée sur les filtres de Gabor…….......36
3.3.a- Séquence «DivergingTree»
3.3.b-Flot mesuré de la séquence «DivergingTree» basée sur les filtres de Gabor….……....37
3.4.a - Séquence « yosemite. »………………………………………………………...….…38
Liste des figures
3.4.b - Séquence « yosemite. »…………………………………………………….................39
3.4.C - Séquence « yosemite. »………………………………………………………………39
3.5.a- Séquence « Square. »………………………………………………………………….41
3.5.b- Flot mesuré de la séquence « Square2. » par notre approche…………………………41
Liste des tableaux
Liste des tableaux
1.1 : Le traitement d'images recouvre six catégories de tâches……………………………..12
2.1 Influence des paramètres du filtre de Gabor ………………………………………...……23
3.1 Résultats obtenus pour la séquence « TranslatingTree » ………………………………. 36
3.2 Résultats obtenus pour la séquence «DivergingTree »…………………………………..38
3.3 Résultats obtenus pour la séquence«Yosemite » …………………………..……………40
3.4 Résultats obtenue pour la séquence«square» ……………………..……………………..42
SOMMAIRE
Sommaire
Introduction générale ……………………………………………………………………1
Chapitre1 : Généralités sur l’estimation de mouvement…………………………..........3
1Introduction.......................................................................................................................4
2. Définition debase……………………………………….. ……………………………........4
2.1 L’image …………………………………………………………………………...............4
2.2 L'image Numérique...............................................................................................…....5
2.3 Le pixel………………………………………………………………………………….....6
2.4 La pixellisation d'une image:……………………………………………………………....6
2.5 Les type des images…...........................................................................................................6
2.5.1 Les images Matricielles ...……………………………………………...............................6
2.5.2 Les images Vectorielles ........................................................................................................ ..6
2.6 Les formats d'image……………………………………………………..……………………7
2.7 Les images couleurs ..................................................................................................................…...7
2.8Séquence vidéo....................................................................................................................…...8
2.9La vidéo………………………………………………………………………………………….....8
2.10 Vidéo numérique et analogique………………………………………………………………......9
2.11 Classement des séquences vidéo………………………………………………………………….9
2.11.1 Séquences rapides ………………………………………………………………………………9
2.11.2Séquences lentes…………………………………………………………………………………9
2.11.3 Séquences stationnaires……………………………………………………………………......10
2.11.4 Séquences simples ………………………………………………………………………….....10
2.11.5Séquences complexes………………………………………………………………………......10
2.12 Diversité des traitements…………………………………………………………………………11
SOMMAIRE
2.13Le traitement d'images comme contexte…………………………………………………………11
2.14 Applications…………………………………………………………………………………….12
3. ETAT DE L’ART DE L’ESTIMATION DE MOUVEMENT………………………………......14
3.1 Estimation du mouvement d'une image………………………………………………………....14
3.2 La problématique du mouvement ……………………………………………………………….14
3.2.1 Le mouvement dans les images………………………………………………………………..14
3.2.2 Le mouvement dans une séquence d'images bidimensionnelles (2D)………………………....14
3.2.2.1 Mouvement réel ……………………………………………………………………………..15
3.2.2.2 Mouvement apparent…………………………………………………………………………15
3.3 Méthodes d’estimation du mouvement ………………………………………………………….15
3.3.1 Méthodes différentielles ……………………………………………………………………….15
3.3.2 Méthodes fréquentielles………………………………………………………………….........16
3.3.3 Méthode de mise en correspondance de blocs…………………………………………….......17
4. CONCLUSION……………………………………………………………………………….......17
Chapitre 2 : Estimation de Mouvement Par la méthode fréquentielle
1. Introduction………………………………………………………………………………………..20
2. Flot optique………………………………………………………………………………………..20
2.1 Problème d’ouverture……………………………………………………………………………21
2.2 Contraintes supplémentaires…………………………………………………………………......22
3. Estimation de mouvement par la méthode fréquentielle…………………………………………23
3.1. Principe des méthodes fréquentielles…………………………………………………………...23
3.2 Filtre sensibles au mouvement: Fonction et Filtre de Gabor……………………………………23
3.3 Filtres de Gabor complexes…………………………………………………………………….27
3.3.1 Filtres de Gabor 1D complexes……………………………………………………………….27
3.3.2 Filtre de Gabor 2D complexe…………………………………………………………………27
3.3.3 Filtre de Gabor 3D complexe…………………………………………………………………28
3.3.4 Réponse d'un filtre de Gabor………………………………………………………………….28
SOMMAIRE
4. Algorithme de l’estimation de mouvement par filtre de Gabor complexe………………………29
4.1 Estimation de la vitesse………………………………………………………………………...29
4.2 Gradients de phase……………………………………………………………………………....29
4.3 Estimation de la vitesse par les moindres carrés………………………………………………...30
5. Conclusion ……………………………………………………………………………………….31
CHAPITRE 3 : Résultats Expérimentales
3.1 Introduction……………………………………………………………………………….33
3.2 Organigramme de la méthode d’estimation de mouvement par filtre de Gabor ……………33
3.3 Expérimentations …………………………………………………………………………34
3.3.1. Séquences de test……………………………………………………………………….34
3.1.1Séquences« translatingTree » …………………………………………………………34
3.1.2Séquence« squar » …………………………………...………………………………...34
3.1.3. Séquence « Yosemite » …………………………………………………..…………..34
3.2. Critère d’évaluation de la méthode :l’erreur angulaire…………………………………34
4. Simulation de la méthode de l’estimation de mouvement par filtre de Gabor …………..35
4.1Séquence «Translating Tree» ou « newbinarytreet. »………………………………35
4.2 Séquence «DivergingTree» ……………………………………………………………38
4.3 Séquence «Yosemite »…………………………………………………………………39
4.4 Séquence « square.2 »………………………………………………………………….42
5. Interprétation de résultats……………………………………………………………….....43
6. Conclusion …………………………………………………………………………….…43
Introduction Générale
1
Introduction Générale
Le traitment d'image est une discipline de l'informatique et des matématiques appliquées
qui étude les image numériques et leurs transformations, dans le but d'amiliorer leur qualité ou
d'en extraire de l'information
L’EM est un indice très important pour de nombreuses applications, comme la médicine,
la robotique, et la compression vidéo. En domaine médical, cela permet de diagnostiquer et de
suivre le développement des maladies, en robotique, cela justifie de déterminer et souvent donc
de prévoir l'évolution de la position des objets. En compression vidéo, cela permet de
comprendre le mieux possible où se trouve la redondance temporelle de la séquence et de savoir
décrire une image à l'aide des images environnant celle qui nous intéresse. Ainsi, les opérations
de traitement d'image peuvent utiliser cette information à des fins diverses : segmentation,
filtrage,… etc.
L’estimation du flot optique est un problème essentiel dans l’analyse du mouvement des
séquences d’images. Il fournit des informations nécessaires pour la technologie de vidéo, tels
que le suivi d'objets, la segmentation d’image et la compensation du mouvement. Un grand
nombre d'approches pour l'estimation ont été proposées dans la littérature, il y comprit des
techniques basée sur le gradient, la corrélation, et sur l'énergie, et des techniques basé sur la
phase.
Parmi les approches, nous avons adopté l’approche frequentielle basée sur les filtres de Gabor, à
cause de ses avantages de la sensibiltée de mouvement.
L'objectif de ce travail est d’estimer le mouvement dans les séquences temporelles d’images,
grâce à une méthode basée sur les filtres de Gabor. La méthode proposée prend les avantages de
nature de filtre, qui est un outil mathématiques permet d’approximer efficacement et
précisément n’importe quelle fonction.
Dans la première partie de ce travaille on commencera par plusieurs définitions de base,
tel que la séquence temporelle, le mouvement d’image, et le champ de mouvement et présenter
les grandes familles des méthodes de mesure du mouvement. La deuxième partie on fait un tour
rapide dans ce monde pour examiner en bref la méthode d’estimation du flot optique sera
d'étudier comment réaliser l’estimation de mouvement par l’approche fréquentielle. Plusieurs.
Après en discutera la méthode que nous choisie pour estimer l’équation du flot optique. Enfin,
on mettra en œuvre des études expérimentales et on présentera les résultats de notre approche
étudiée.
2
Le manuscrit est organisé de la manière suivante:
Le chapitre I : présente les définitions de base de traitement d’image et les différentes
méthodes d’estimation de mouvement.
Le chapitre II: expose l'approche d'estimation de mouvement en utilisant le filtre de
Gabor.
Le chapitre III : précise l’étude expérimentale, et concrète les résultats de cette approche
choisie.
Enfin, la conclusion générale récapitule ce qui a été fait et expose les perspectives de ce
travail.
Chapitre 01
Généralités sur l’estimation de mouvement
Résumé
Le traitement d’images est l’ensemble des méthodes et techniques opérant sur celles-ci, dans le
but de rendre cette opération possible, plus simple, plus efficace et plus agréable, d’améliorer
l’aspect visuel de l’image et d’en extraire des informations jugées pertinentes.
L’estimation du mouvement dans des séquences temporelles d’images bidimensionnelles est un
des problèmes fondamentaux en traitement d’images. Les applications sont nombreuses et parmi
les domaines d’application concernés nous pouvons mentionner :
La compression d’images utilisant l’information du mouvement, la robotique, la météorologie
avec le suivi de masses nuageuses, la médecine avec l’estimation du mouvement d’organes
mobiles (comme le cœur ou les poumons), etc.
Chapitre 01 Généralité sur l’estimation de mouvement
4
1. INTRODUCTION
Le traitement d’images est un ensemble des méthodes et techniques opérant sur l'image,
dont le but est d'améliorer son aspect visuel. Il se définit comme un ensemble de taches destinées
à extraire de l'image des informations qualitatives et quantitatives [1].
Le contenu de l’image est en constante évolution. Ainsi, il devient nécessaire de traiter une
séquence d’images espacées dans le temps, en tenant compte à la fois des propriétés propres aux
objets, telles que la forme, la couleur ou la texture, mais également de leur déplacement dans la
scène.De ce fait, l’estimation du mouvement dans une séquence d’images est desthématiques qui
ont préoccupé un grand nombre de chercheurs depuis qu’existe la vision artificielle [2].
Nous commencerons ce chapitre par plusieurs définitions de base, tel que la séquence
temporelle, le mouvement d’image, et le champ de mouvement. Ensuitenous présenteronsde
façon rapideles grandes familles de méthodes d'estimation du mouvement (Etat de l’art) : la
méthode fréquentielle, la mise en correspondance de blocs, la méthode différentielle filtrée...etc.
Enfin, nous terminons avec une conclusion contient les points les plus importants dans ce
chapitre.
2. DEFINITIONS DE BASE
2.1 L’image
Une image est obtenue par transformation d’une scène réelle par un capteur. La
numérisation d’une image consiste à passer de la représentation continue à discrète. Une image
peut être définie par une fonction, 𝑓(𝑥, 𝑦), où 𝑥 et 𝑦 sont des coordonnées spatiales planes.
L’amplitude de f pour chaque paire de coordonnées (𝑥, 𝑦) est appelée intensité de l’image au
point donné. Une image peut alors être assimilée à une matrice de points appelés « pixels ». De
nos jours les appareils photos numériques effectuent la transformation d’eux-mêmes, fournissant
directement une image facilement manipulable. [3]
Figure 1.1 : un point de l’image de coordonnées (𝒙, 𝒚) [1].
X
Y
x
y
Chapitre 01 Généralité sur l’estimation de mouvement
5
2.2 L'image Numérique
Limage numérique est limage dont la surface est divisée en éléments de tailles fixes
appelés cellules ou pixels, ayant chacun comme caractéristique un niveau de gris ou de couleurs
prélevé à l’emplacement correspondant dans l’image réelle, ou calculé à partir d’une description
interne de la scène à représenter.
La numérisation d’une image est la conversion de celle-ci de son état analogique (distribution
continue d’intensités lumineuses dans un plan 𝑥𝑂𝑦 en une image numérique représentés par une
matrice bidimensionnelle de valeurs numériques 𝑓(𝑥, 𝑦) ou 𝑥, 𝑦 et 𝑓(𝑥, 𝑦) sont respectivement :
Coordonnées cartésiennes d’un point de l’image,
Niveau de gris en ce point [4].
2.3 Le pixel
La notion de pixel Une image est constituée d’un ensemble de points appelés pixels (pixel
est une abréviation de « Picture Elément »). Le pixel représente ainsi le plus petit élément
constitutif d’une image numérique. L’ensemble de ces pixels est contenu dans un tableau à deux
dimensions constituant l’image:. Etant donné que l’écran effectue un balayage de gauche à droite
et de haut en bas, on désigne généralement par les coordonnées [0,0] le pixel situé en haut à
gauche de l’image, cela signifie que les axes de l’image sont orientés de la façon suivante :
– L’axe X est orienté de gauche à droite.
– L’axe Y est orienté de haut en bas, contrairement aux notations conventionnelles en
mathématiques, où l’axe Y est orienté vers le haut [5].
Figure 1.2 : Numérisation d'une image [6].
Valeur : 𝐼(𝑥, 𝑦) Hauteur (lignes)
Largeur (colonnes)
Chapitre 01 Généralité sur l’estimation de mouvement
6
2.4 La pixellisation d'une image:
La pixellisation d'une image: est le nombre de points la composant. Ainsi, toute image
est constituée de la juxtaposition de points. Sur notre image "fleur", nous avants 800 lignes
comportant chacune 600 points soit un totale de 480 000 points ayant chacun une couleurpour la
représenter. [7]
Figure 1.3: zoom de l'image ‘fleur’. [8]
2.5 Les type des images
2.5.1 Les images Matricielles
Les images matricielles (ou image en mode point, en anglais « bitmap » ou « raster »)
sont celles utilisons généralement pour restituer des photos numériques. Elles reposent sur
une grille de plusieurs pixels formant une image avec une définition bien précise. Lorsqu'on
les agrandi trop, on perd de la qualité (« pixellisation ») [9].
2.5.2 Les images Vectorielles
Ce sont des images dont la particularité est que chaque forme qui la compose est
décrite mathématiquement à partir de points et de tangentes. Elles ne peuvent pas décrire une
image trop complexe comme une photographie, mais sont tout à fait adaptées au rendu
typographiques, aux logos et autres formes composées de tracés simples [9].
Bitmap vectoriel Bitmap vectoriel
Figure 1.4: les types des images [9].
Chapitre 01 Généralité sur l’estimation de mouvement
7
2.6 Les formats d'image
Les formats d'image, une notion très importante. Choisir son format d'image de façon
judicieuse est devenu indispensable dans le monde de l'informatique et surtout du web. Et oui, on
n'envoie pas n'importe quel type d'image sur le web. Attention, quand on dit "type d'image", ils
sont totalement différents. Ils permettent d'indiquer à l'ordinateur de quel type il s'agit, en plus
de lui faire comprendre que c'est un fichier image et non un fichier musique ou texte. Il n'existe
pas qu'un seul format d'image. En réalité, il en existe pas mal. Les propriétés d'une même image,
telles que son poids ou sa qualité, vont sensiblement différer d'un format à l'autre [10].
2.7 Les images couleurs
Une image couleur est en réalité composée de trois images, afin de représenter le rouge, le
vert, et le bleu. Chacune de ces trois images s’appelle un canal. Cette représentation en rouge,
vert et bleu mime le fonctionnement du système visuel humain.
La figure suivante illustre la décomposition d’une image couleur en ses trois canaux constitutifs.
Image numérique canal rouge Canal vert canal bleu
Couleur
Figure 1.5: la décomposition d’une image couleur [11].
Chaque pixel de l’image couleur contient ainsi trois nombres(𝑟, 𝑣, 𝑏), chacun étant un nombre
entier entre 0 et 255. Si le pixel est égal à (𝑟, 𝑣, 𝑏) = (255,0,0), il ne contient que de
l’information rouge, et est affiché comme du rouge. De façon similaire, les pixels
valant (0,255,0) et (0,0,255)sont respectivement affichés vert et bleu.On peut afficher à l’écran
une image couleur à partir de ses trois canaux (𝑟, 𝑣, 𝑏) en utilisant les règles de la synthèse
additive des couleurs. La figure suivante montre les règles de composition cette synthèse
additive des couleurs. Un pixel avec les valeurs (𝑟, 𝑣, 𝑏) = (255,0,255) est un mélange de rouge
et de vert, il est ainsi affiché comme jaune.
Chapitre 01 Généralité sur l’estimation de mouvement
8
Figure 1.6: synthèse additive des couleurs [11].
On peut calculer une image en niveaux de gris à partir d’une image couleur en moyennant les
trois canaux. On calcule donc une valeurqui s’appelle la luminance de la couleur présenté dans
l’équation (1-1).
𝒂 =𝒓+𝒗+𝒃
𝟑 (1-1)
La figure suivante illustre l’image de luminance associée à une image couleur. [11]
Figure 1.7: luminance d’image [11].
2.8 Séquence vidéo
Est une série d'images accompagnées de son, mais on utilise souvent le terme vidéo
pour désigner une simple séquence d'images. C'est la fréquence des images et leurs
dimensions qui différencient un système vidéo d'un autre. La fréquence des images peut aller
jusqu'à 30 images par seconde, ce qui rend inévitable leur compression. Plusieurs normes et
produits sont apparus représentant différentes techniques et répondant aux besoins des
différentes applications [12].
2.9 La vidéo
La vidéo est une succession d’images animées défilant à une certaine cadence afin de
créer une illusion de mouvement pour l’œil humain. Elle peut être analogique (signal continu
d’intensité de luminance) ou numérique (suite de trames ou images). On peut distinguer deux
types de vidéo:
Chapitre 01 Généralité sur l’estimation de mouvement
9
- la vidéo entrelacée: où chaque image est formée de deux champs entrelacés. Le premier champ
contenant uniquement les lignes impaires de l'image, le second champ, quant à lui, contenant les
lignes paires (les signaux de télévision nord-américain et européen sont entrelacés).
-la vidéo progressive: dans une vidéo progressive, contrairement au mode entrelacé, toutes les
lignes d'une image sont lues en une passe (vidéo). [13]
2.10 Vidéo numérique et analogique
On distingue généralement plusieurs grandes familles d’images animées :
Le cinéma, consistant à stocker sur une pellicule la succession d’images en négatif. La
restitution du film se fait alors grâce à une source lumineuse projetant les images successives
sur un écran.
La vidéo analogique, représentant l’information comme un flux continu de données
analogiques, destiné à être affichées sur un écran de télévision (basé sur le principe du
balayage). Il existe plusieurs normes pour la vidéo analogique. Les trois principales sont :
PAL, SECAM et NTSC.
La vidéo numérique consistant à coder la vidéo en une succession d’images numériques [5].
2.11 Classement des séquences vidéo
2.11.1 Séquences rapides
Ce sont des séquences où les objets se déplacent d'une image à une autre avec une
Distance importante qui peut même dépasser les limites de la zone de recherche prédéfinie,
ce qui empêche une compression optimale (les séquences des scènes sportives par exemple).
Ce type de séquences nécessite donc l'utilisation de grandes zones de recherche pour
atteindre les objets en mouvement, au détriment du temps de calcul bien sûr. Des techniques
de recherche permettant de minimiser le nombre de blocs testés sont développées pour
surmonter le problème du temps de calcul [12].
2.11.2 Séquences lentes
Ce sont les séquences où les objets se déplacent lentement ou restent fixes (pour la
Plupart du temps) telles que l’exploration d'une scène par une caméra, les séquences de
visiophonie ou les séquences des mobiles de la troisième génération. Dans ce cas, une petite
zone de recherche suffit pour atteindre un très bon taux de compressionen un temps de calcul
réduit [12].
2.11.3 Séquences stationnaires
Ce sont les séquences où les blocs gardent la même position d'une image à l’autre tel
que les arrières plans. Dans ce cas, le taux de compression est maximal et le temps de
recherche est nul si on sait d'avance qu'une portion d'une séquence est stationnaire [12].
Chapitre 01 Généralité sur l’estimation de mouvement
10
2.11.4 Séquences simples
Dans ce type de séquences, les images ne contiennent pas beaucoup de détails et les
objets Connaissent le même mouvement en direction et en vitesse (cas du mouvement de la
caméra):c'est-à-dire que les pixels du même objet se déplacent aussi à la même vitesse et la
même direction, ce qui permet de trouver des techniques qui convergent rapidement vers le
bloc le plus ressemblant [12].
2.11.5 Séquences complexes
C'est le contraire du dernier type. Les objets connaissent un mouvement aléatoire (ne peut
être prévu) c'est-à-dire qu'un objet peut être jugé meilleur localement mais ne l'est pas
globalement (problème des minima locaux) ce qui peut conduire à de faibles résultats en taux
de compression et en qualité [12].
(a)Une séquence de 200 trames vue comme une succession d'images 2D. (Seules les trames
1, 27, 93, 151 et 200 sont représentées.) [14]
(b)Vue compacte de la même séquence obtenue en empilant toutes les images le long de la
troisième dimension
Figure 1.8 : Exemple de séquence vidéo avec sa représentation en 2D (a) volumique
(b). [14]
2.12 Diversité des traitements
Le traitement d’images fait appel à un nombre important de disciplines : la théorie du
signal, La théorie du système, l’analyse numérique, les statistiques, la théorie de l’information, la
Chapitre 01 Généralité sur l’estimation de mouvement
11
neurophysiologie, et la psychophysique, l’optique, l’électronique et l’informatique pour ne cite
que les principales, Cette situation est résumée à la figure 1.9. On peut voir le traitement
d’images comme une prolongation du traitement numérique des signaux et comme un préalable à
la reconnaissance des formes, à l’analyse de scènes et à l’intelligence artificielle [15].
Figure 1.9 : relation du traitement d’images avec d’autres disciplines [15].
2.13 Le traitement d'images comme contexte
En l'absence de définition consensuelle du domaine du traitement d'images, nous
proposons une définition établie selon un point de vue intentionnel. Le traitement d'images se
définit à partir des six catégories de tâches atomiques résumées dans le tableau (1). Ces six
catégories résultent de la combinaison des trois opérations de base - ajout, modification et
suppression – appliquées à des fins de pure transformation ou à des fins épistémiques
(augmentation de l''intelligibilité de l'information).
La restauration a pour but de retrouver l'image d'origine à partir de sa version dé- gradée
par ajout d'information au niveau signal connaissant la fonction de dégradation (ou au
moins une estimation).
L'amélioration a pour but d'adapter au mieux les données à une exploitation visuelle par
modification de l'information au niveau signal en utilisant uniquement les valeurs de
l'image d'entrée.
TRAITEMENT
D’IMage
AGES
Statistiqu
e
Analyse de
numérique Théorie de
signal
Informatique
Electroniqu
e Neurophysiologie
Psychophysique
Théorie de
l’information
Optique Théorie de
système
Chapitre 01 Généralité sur l’estimation de mouvement
12
La compression a pour but de réduire la quantité de données nécessaire pour stocker une
image numérique en supprimant l'information identifiée comme redondante au niveau
signal.
La reconstruction consiste à créer une nouvelle image par ajout d'une information spatio-
temporelle déduite d'une image ou de plusieurs (la forme, le relief, le mouvement).
La segmentation structure l'information signal à un niveau d'information symbolique :
points d'intérêt, régions et contours. - La détection fournit un masque positif des zones de
l'image contenant les objets d'intérêt et supprime toutes les autres informations [16].
Transformation Augmentation
Ajout
Modification
suppression
Restauration
Amelioration
Compression
Reconstruction
Segmentation
Detection
Tableau 1.1 : Le traitement d'images recouvre six catégories de tâches [16].
2.14 Applications
Une caractéristique très importante et en même temps très enrichissante du traitement
d’images est son aspect interdisciplinaire. On trouve ses applications également dans des
domaines très variés tels que les télécommunications (TV, vidéo, transmission, stockage,
téléconférence, services intégrées RNIS, publicité), la médecine (radiographie, ultra-sons,
microscopie, fichiers électroniques et diagnostiques à distance), l’industrie (robotique,
surveillance de qualité, sécurité), la météorologie, le recensement des ressources terrestres,
l’architecture, l’imprimerie, l’armement, etc., La liste est longue et s’allonge chaque jour
davantage [15].
Les informations que l'on souhaite extraire d'une image .les applications, les types de données,
sont si variés qu'il est difficile, lorsque l'on doit traiter une nouvelle application. Le présent
ouvrage a pour objectif de donner au lecteur une bonne compréhension des principes de base du
traitement d'image, associée à un certain esprit critique [17].
Chapitre 01 Généralité sur l’estimation de mouvement
13
Amélioration d'image retouche d'image création de panorama
Analyse d'image de Analyse d'image de
document document
Reconnaissance de Reconnaissance fine de la
caractère structure d'un document
Séparation texte/dessin
Imagerie médicale route intelligente réalité augmentée
Segmentation du ventricule localisation des voitures Superposition d’un modèle virtuel 2D
Cérebral (scanner Cérebral) ou 3D sur une image réelle (photo).
Segmentation du rien radars automatiques Domaines : jeux, tourisme, marketing,
(scanner Abdominal) publicité...
Figure 1.10 : Les applications du traitement d'image [18]
Application
de Traitement
d’image
Chapitre 01 Généralité sur l’estimation de mouvement
14
3. ETAT DE L’ART DE L’ESTIMATION DE MOUVEMENT
3.1 Estimation du mouvement d'une image
L'estimation du mouvement est un procédé qui consiste à étudier le déplacement des objets
dans une Séquence vidéo, en cherchant la corrélation entre deux images successives afin de
prédire le changement de position du contenu [19].
L'estimation du mouvement consiste à chercher l'origine des objets se trouvant dans l'image cible
et d'extraire des vecteurs de mouvement représentant le déplacement de ces objets, en se basant
sur une mesure de ressemblance entre ces objets. On essaie donc à trouver un objet dans
laréférence minimisant cette mesure [12].
D’autres méthodes utilisent l'estimation d'un champ dense de mouvement, c'est-à-dire
l'estimation d'un vecteur mouvement par pixel de l'image. Ce sont les méthodes basées sur le flot
optique, qui repose sur le fait qu'il y a invariance d’illumination d'un objet au cours du temps.
Dans ce type d’estimation, il y a une seule contrainte scalaire par pixel. [20]
3.2 La problématique du mouvement
3.2.1 Le mouvement dans les images
Le mouvement est un réel problème en vidéo puisqu'il décrit un contexte en trois
dimensions alors que les images sont une projection de scènes 3D dans un plan en 2D.
En général, il est représenté par un vecteur de mouvement qui décrit une transformation d'une
image en deux dimensions vers une autre. [19]
Figure 1.11 : projection mouvement 3D en 2D [19]
3.2.2 Le mouvement dans une séquence d'images bidimensionnelles (2D)
Le mouvement dans une séquence d'images bidimensionnelles, est perceptible grâce aux
changements de la distribution spatiale des intensités lumineuses. Le mouvement ainsi perçu est
appelé "apparent", car il ne correspond pas nécessairement à la projection dans le plan de l'image
du mouvement ayant lieu dans l'espace tridimensionnel (3D). [19]
Chapitre 01 Généralité sur l’estimation de mouvement
15
3.2.2.1 Mouvement réel
Le mouvement réel anime la scène réelle, dans l’espace réel 3D. Ce mouvement réel est
observé soit par l’œil humain, soit par un système de prise de vue.
3.2.2.2 Mouvement apparent
Le mouvement apparent est un mouvement 2D perçu dans une séquence à travers des
variations spatio-temporelles de la luminance. Le champ des vitesses apparentes porte le nom de
flot optique. [21]
3.3 Méthodes d’estimation du mouvement
3.3.1 Méthodes différentielles
Les méthodes différentielles d’estimation du mouvement sont basées sur les gradients spatiaux et
temporels de l’intensité lumineuse des pixels. Le principe de ces méthodes repose sur une
hypothèse forte, qui est celle de la conservation de l’intensité lumineuse d’un pixel le long de la
trajectoire du mouvement. Cette hypothèse de conservation peut s’écrire sous la forme :
𝑑𝑖(𝑥1,𝑥2,𝑡)
𝑑𝑡= 0 (1.2)
où x1 et x2 sont les variables spatiales, t est la variable temporelle et 𝑖(𝑥1, 𝑥2,𝑡)est l’intensité du
pixel de coordonnées (𝑥1, 𝑥2,) dans l’image acquise à l’instant t. Un développement de Taylor du
premier ordre de l’équation (1) permet d’obtenir la relation suivante :
𝜕𝑖(𝑥1,𝑥2,𝑡)
𝜕𝑥1𝑑1 +
𝜕𝑖(𝑥1,𝑥2,𝑡)
𝜕𝑥2𝑑2 +
𝜕𝑖(𝑥1,𝑥2,𝑡)
𝜕𝑥𝑡𝑑𝑡 = 0 (1.3)
Où 𝑑1 et 𝑑2 sont les déplacements du pixel courant qui doivent être estimés et dt est la période
temporelle d’acquisition des images. Si on divise l’équation (1.3) par 𝑑𝑡, alors nous obtenons
l’équation de contrainte de mouvement, également appelée équation du flux optique.
Il s’agit donc d’une seule équation avec deux inconnues. Afin de pouvoir résoudre cette
équation, différentes méthodes introduisant des contraintes supplémentaires ont été proposées.
Une comparaison des performances des méthodes différentielles d’estimation du mouvement les
plus utilisées est faite dans Barron. Nous montrons ici un résultat extrait et qui correspond à une
séquence d’images classique, le cube de Rubik, dont nous montrons sur la Figure 12 (a) une
seule image. Les champs de mouvement 2-D estimés avec deux approches différentielles sont
également montrés sur la Figure 12. [22]
Chapitre 01 Généralité sur l’estimation de mouvement
16
Figure 1.12 : Les champs de mouvement 2-D estimés [21]
(a) Une image de la séquence d’images expérimentales du cube de Rubik, champ 2-D de
mouvement estimé
(b) un méthode basée sur la technique de Horn et Schunk .
3.3.2 Méthodes fréquentielles
Dans le domaine fréquentiel, nous considérons la séquence d’images I(x, y, t) ayant pour
transformée de Fourier 𝐼𝑏(𝑓𝑥, 𝑓𝑦, 𝑓𝑡). Dans le cas où les objets de la séquence d’images
subissent un mouvement de translation uniforme
(𝑥(𝑡), 𝑦(𝑡))=(𝑥0 + 𝑣1𝑡 + 𝑦0 + 𝑣2𝑡) (1-4)
Nous avons, d’après l’hypothèse de contrainte :
I ((𝑥(𝑡), 𝑦(𝑡)), 𝑡) = I((𝑥(𝑡0), 𝑦(𝑡0)), 𝑡0) ∀t. (1-5)
La relation suivante:
𝐼(𝑥, 𝑦, 𝑡) = 𝐼(𝑥 − 𝑣1𝑡, 𝑦 − 𝑣2𝑡 , 0). (1-6)
Ce qui est équivalent à
𝐼𝑏(𝑓𝑥, 𝑓𝑦, 𝑓𝑡)= 𝐼𝑏0(𝑓𝑥, 𝑓𝑦) δ(𝑓𝑡 + 𝑣1𝑓𝑥 + 𝑣2𝑓𝑦), (1-7)
Où δ(.) est la mesure de Dirac en 0. Posons 𝐾 = (𝑓𝑥 , 𝑓𝑦) et 𝑤 = 𝑓𝑡. Déterminer le flot optique
dans la séquence d’images revient donc, d’après l’équation (1-7), à identifier dans l’espace des
fréquences un plan de vitesse d’équation :
𝑣𝑇 𝑘 + 𝑤 = 0. (1-8)
L’estimation du mouvement est extraite de l’équation (1-8) par filtrage spatio-temporel. Le
problème de l’ouverture est contourné en supposant le flot constant sur les supports des ces
filtres. Cette hypothèse a pour conséquence de lisser le flot à la fois en espace et en temps et peut
parfois poser des problèmes pour des séquences d’images rapides et saccadées. Ces méthodes
sont divisées en deux branches suivant que l’estimation du flot est faite sur l’énergie ou la phase
Chapitre 01 Généralité sur l’estimation de mouvement
17
du signal filtré. Ces dernières permettent d’obtenir de très bons résultats mais sont très coûteuses
en temps de calcul. [23]
3.3.3 Méthode de mise en correspondance de blocs
Les méthodes de mise en correspondance de blocs (BM comme Block Matching) sont
parmi les méthodes d’estimation du mouvement les plus utilisées dans la pratique. Le principe de
base des méthodes de mise en correspondance de blocs est de découper l’image de référence en
blocs de pixels, également appelés des régions d’intérêt (ROI). Pour chacun de ces blocs, une
zone de recherche est définie dans l’image cible. [22]
Figure 1.13 : Principe des méthodes de mise en correspondance de blocs. [22]
(a) Une région d’intérêt de taille 𝐿1 × 𝐿2 est considérée dans l’image de référence.
(b) Une zone de recherche est considérée dans l’image cible.
La ROI est recherché dans cette zone de recherche et le meilleur candidat (le plus ressemblant à
la ROI suivant un critère donné) est retenu. A noter que la taille de la zone de recherche impose
le déplacement maximum autorisé pour la ROI courante. [22]
4. CONCLUSION
Le traitement d'image, ces contraintes sont levées ou contournées. En effet, ce domaine
cherche à détecter la présence de certaines formes, certains contours ou certaines textures d'un
modèle connu, La manipulation des images pose cependant des problèmes beaucoup plus
complexes que celles du texte. En effet, l'image est un objet à deux dimensions, censé
représenter un espace à trois dimensions, ce qui a deux conséquences majeures : Le volume des
Chapitre 01 Généralité sur l’estimation de mouvement
18
données à traiter est beaucoup plus important, La structure de ces données est nettement plus
complexe. [24]
La mesure du champ de mouvement est une étape de traitement de limage dite de bas niveau. On
lui trouve de nombreuses applications comme l'analyse de mouvements de fluides en physique
expérimentale, la compression de séquence d'images vidéo par compensation de mouvement, ou
encore son utilisation pour des phases de traitement des images de plus haut niveau, comme la
reconstruction de scènes tridimensionnelles [25]
Ce chapitre introductif est pour le but de représenter les éléments de base du traitement d’image
et l’estimation du mouvement dans une séquence d’images qui seront utilisés dans le deuxième
chapitre.
Chapitre 02
Estimation de Mouvement Par la
méthode fréquentielle
Résumé
Dans ce chapitre, nousproposons une méthode d’estimation rapide du flot optique (OF)
dans les séquences temporelles d’image. L’idée basique est de projeter l'équation du flot optique
sur la base de filtres de Gabor afin d’obtenir le champ de vitesse que l'on souhaite trouver.
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
20
1. INTRODUCTION
Dans ce chapitre nous présentons une méthode fréquentielle de calcul le déplacement dans les
séquences vidéo à base des filtres Spatio-temporel de Gabor.
2. FLOT OPTIQUE
Le flot optique est un champ de déplacement visuel qui permet d'expliquer des variations
dans une image animée en terme de déplacement de points images. Autre définition du flot
optique est la distribution de la vitesse, par rapport à l’observateur, en chaque point de l’image.
Pour construire l’équation du flot optique il faut définir une telle contrainte :
des considérations humaines,
des considérations physiques.
Alors, l’hypothèse du flot optique annonce que les séquences d’image sont (localement)
invariantes en luminosité, d’autre terme chaque point dans un flux d’image garde la même
luminosité (ou couleur). Une telle hypothèse implique une contrainte (forte) de mouvement.
Donc, Le modèle mathématique standard utilisée pour trouver des équations qui définissent le
flot optique est basée sur une hypothèse d'illumination constante :[26]
Figure2.1:Transport de la luminosité.[26]
I(𝑥, 𝑦, 𝑡) = 𝐼(𝑥 + 𝛿𝑥, 𝑦 + 𝛿𝑦, 𝑡 + 𝛿𝑡), ∀(𝑥, 𝑦) ∈ Ω(2.1)
– Ω : domaine de l’image (région bornée de R2)
– 𝑣 = (𝛿𝑥, 𝛿𝑦) : déplacement du point (𝑥, 𝑦) au temps 𝑡.
Le développement de Taylor au point (𝑥, 𝑦)à l’ordre 1 :
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
21
𝐼 𝑥 + 𝛿𝑥, 𝑦 + 𝛿𝑦, 𝑡 + 𝛿𝑡 = 𝐼 𝑥, 𝑦, 𝑡 + 𝛿𝑥𝜕𝐼
𝜕𝑥 𝑥, 𝑦, 𝑡 + 𝛿𝑦
𝜕𝐼
𝜕𝑦 𝑥, 𝑦, 𝑡 + 𝛿𝑡
𝜕𝐼
𝜕𝑡 𝑥, 𝑦, 𝑡 (2.2)
et donc :
𝐼 𝑥+𝑢𝛿𝑡 ,𝑦+𝑣𝛿𝑡 ,𝑡+𝛿𝑡 −𝐼(𝑥 ,𝑦 ,𝑡)
𝛿𝑡= 𝐼𝑥
𝛿𝑥
𝛿𝑡+ 𝐼𝑦
𝛿𝑦
𝛿𝑡+ 𝐼𝑡(2.3)
en passantà la limite : 𝛿𝑡 → 0 ∶
𝐼𝑥𝛿𝑥
𝛿𝑡+ 𝐼𝑦
𝛿𝑦
𝛿𝑡+ 𝐼𝑡 = 0(2.4)
Finalement, l’équation de mouvement peut s’écrire :
𝑣. 𝛻𝐼 + 𝐼𝑡 = 0(2.5)
avec 𝑣 = 𝛿𝑥
𝛿𝑡,𝛿𝑦
𝛿𝑡 et𝛻𝐼 =
𝜕𝐼
𝜕𝑥,𝜕𝐼
𝜕𝑦
-Remarque :
𝜕𝐼
𝜕𝑡= 0 (ce qui indique l’invariance de la luminosité)
⇔𝜕𝐼
𝜕𝑡 𝑥 𝑡 , 𝑦 𝑡 , 𝑡) = 0
⇔𝜕𝐼
𝜕𝑥
𝛿𝑥
𝛿𝑡+
𝜕𝐼
𝜕𝑦
𝛿𝑦
𝛿𝑡+
𝜕𝐼
𝜕𝑡= 0
Finalement
𝑣. 𝛻𝐼 + 𝐼𝑡 = 0 (2.6)
Tel que 𝑣 est le vecteur du flot optique, 𝛻𝐼 est le gradient spatial de l’image 𝐼 , et 𝐼𝑡 est le
gradient temporel de l’image𝐼. L’équation (2.6) s’appelle la contrainte du flot optique (Optical
Flow Contraint Equation, OFC).[28]
2.1 Problème d’ouverture
Le problème de sous-conditionnement de la contrainte du flot optique s’appelle le
problème de l’ouverture. Intuitivement, on manque d’information pour calculer le flot optique.
Si on considère l’équation du flot optique donné dans l’équation (2.6), on voit que la valeur du
vecteur 𝑣(𝑥0, 𝑡0), un vecteur de dimension supérieur à 1, n’est contrainte que par unique
équation scalaire linéaire. Dans ces conditions, la seule information sur le champ 𝑣 que l’on peut
extraire est sa composante dans la direction du gradient 𝐼, et non pas toutes les composantes du
vecteur 𝑣.[28]
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
22
Figure 2.2 : Illustration du problème de l’ouverture.[26]
2.2 Contraintes supplémentaires
– Dans la théorie : il manque une contrainte telle que le système soit résolvable (pas de
dépendances linéaires).
– En pratique : gros problème, pas de réponse universelle, quelle contrainte justifiée prendre ?
Alors la première solution est l’équation multiple de flot optique :
∇𝐼𝑖𝑣 + 𝐼𝑡𝑖 = 0 , 𝑖 ∈ 1,2, ⋯ (2.7)
Les 𝐼𝑖 sont les différents acquisitions d’une même scène : des images multi-spectrales, des
images à différent point de vue (stéréovision), aussi en dérivant d’une image par filtrage (ex :
laplacien filtre de Gabor).
Ainsi, on trouve une condition nécessaire et suffisante pour que le flot optique soit bien posé.[28]
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
23
3.ESTIMATION DE MOUVEMENT PAR LA METHODE
FREQUENTIELLE.
3.1. Principe des méthodes fréquentielles
Pour une image 𝑖 (𝑥, 𝑦) en translation à vitesse uniforme𝑣 (𝑣𝑥 , 𝑣𝑦), le spectre associé dans le
domaine des fréquences spatio-temporelles occupe un plan passant par l’origine d’équation :
𝑣𝑥𝑓𝑥 + 𝑣𝑦𝑓𝑦 + 𝑓𝑡 = 0 (2.8)
où𝑓𝑥 , 𝑓𝑦 représentent les fréquences spatiales et 𝑓𝑡 la fréquence temporelle.
Le principe des méthodes fréquentielles consiste à localiser le plan de spectre non nul ou
plan de vitesse au moyen d'un banc de filtres spatio-temporels orientés, pour obtenir les
composantes du vecteur de vitesse (𝑣𝑥 , 𝑣𝑦). L'estimation de vitesse est formulée généralement
comme une minimisation de l'écart quadratique entre les réponses mesurées des filtres pour une
séquence d'images quelconque et les réponses prédites pour une séquence d'images de bruit
blanc en translation. Le coût de calculs de cette procédure est très élevé et dépend étroitement de
la précision requise pour l'estimation.
3.2 Filtre sensibles au mouvement: Fonction et Filtre de Gabor
Nous appelons fonction de Gabor l'association d'une courbe de Gauss et d'une sinusoïde
orientée (voir figure 2.3). En traitement d'images, nous travaillons dans le domaine spatial en
Dimension 2, ce qui nous permet d'écrire la fonction de Gabor de la manière suivante :
G x, y, Ɵ, f = e−
1
2
xƟ2
δx2+
yƟ2
δy2
cos 2πfxθ (2.9)
avec xθ = x cos θ + y sin θ
et yθ = y cos Ɵ − x sin Ɵ
où Ɵest l'orientation de la sinusoïde, 𝑓 sa fréquence et δx (respectivement δy ) l'écart type
de la gaussienne selon l’axe des abscisses (resp. des ordonnées).[27]
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
24
Figure 2.3: Représentation tridimensionnelle de la fonction de Gabor
Normalisée entre les valeurs 0 et 255 [27]
En appliquant cette fonction à un masque de convolution, on définit un filtre de convolution que
Nous appelons filtre de Gabor (voir Figure 2.4).
Figure 2.4: Masque du filtre de Gabor de rayon 𝟐𝟏 pixels pour Ɵ = 𝟎, 𝒇 = 𝟐/𝟏𝟎 et
𝛅𝐱=𝛅𝐱=7 [27]
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
25
L'application d'un filtre de Gabor 𝑔de masque 𝑀 de rayon 𝑟à une image 𝐼de largeur 𝑚et de
Hauteur 𝑛, se résume donc à la formule suivante :
𝑔 𝐼 = 𝐽 = 𝑀 ∗ 𝐼
où J est une matrice de dimension 𝑚, 𝑛 et pour 𝑖 , 𝑗 ∈ ℕ,𝑟 ≤ 𝑖 < 𝑚 − 𝑟et 𝑟 ≤ 𝑗 < 𝑛 − 𝑟
𝐽𝑖 ,𝑗 = 𝑀𝑘 ,𝑙𝑟𝑙=−𝑟 ∗ 𝐼 𝑖−𝑘 , 𝑗−𝑙
𝑟𝑘=−𝑟 = 𝐺 𝑘, 𝑙, 𝜃, 𝑓 𝑟
𝑙=−𝑟𝑟𝑘=−𝑟 ∗ 𝐼 𝑖−𝑘 , 𝑗−𝑙 (2.10)
Comme nous allons le voir, les filtres de Gabor permettent d'isoler les contours d'une
image d’orientation perpendiculaire à Ɵet répondant à une certaine épaisseur, qui dépend de f.
Ceci justifie le fait que pour détecter l'ensemble des contours d'une image, on lui applique
généralement un ensemble de filtres de Gabor que nous appelons banc. Le tableau suivant
(tableau 2.1) consigne divers exemples d'utilisation des filtres de Gabor sur une même image,
afin d'expliciter l'influence des différents paramètres.[27]
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
26
Orientation :
L’application d’un seul filtre fait
ressortir les contours orientés
perpendiculairement par rapport à
son orientation.
Orientations multiples :
L'application d'un banc à
plusieurs orientations
permet de détecter des
contours plus nombreux.
Écarts-types :
Si l'on fait varier 𝛿𝑥de
manière à ce qu'il soit
inférieur à 𝛿𝑦 , les
filtres deviennent moins
sensibles aux contours et
le banc se comporte (dans
un état limite) comme un
simple flou gaussien.
Si l'on applique la
variation inverse, le
résultat, légèrement plus
net, ne présentera pas de
grandes différences avec
un filtrage symétrique.
Fréquence :
Si on utilise plusieurs
fréquences, le tracé
devient beaucoup plus net,
le filtre est sensible à de
plus nombreux contours
en termes d'épaisseur.
Tableau 2.1 : Influence des paramètres du filtre de Gabor[27]
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
27
3.3Filtres de Gabor complexes
3.3.1 Filtres de Gabor 1D complexes
Un filtre de Gabor complexe ℊ 𝑥 est le produit d'une gaussienne par une exponentielle
complexe et est notée :
ℊ 𝑥 =1
𝜍𝑥 2𝜋exp
−𝑥2
2𝜍𝑥2
𝑔𝑎𝑢𝑠𝑠𝑖𝑒𝑛𝑛𝑒
. cos 2𝜋𝑓0𝑥 + 𝑗sin(2𝜋𝑓0𝑥 ) (2.11)
C'est-à-dire :
ℊ 𝑥 =1
𝜍𝑥 2𝜋exp
−𝑥2
2𝜍𝑥2
𝑔𝑎𝑢𝑠𝑠𝑖𝑒𝑛𝑛𝑒
. exp(𝑗2𝜋𝑓0𝑥) 𝑒𝑥𝑝𝑜𝑛𝑒𝑛𝑡𝑖𝑒𝑙𝑙𝑒 𝑐𝑜𝑚𝑝𝑙𝑒𝑥𝑒
(2.12)
Où𝑓0est la fréquence centrale du filtre, i.e. la fréquence pour laquelle le filtre donne la meilleure
réponse et 𝜍𝑥 est l'écart type de la fenêtre gaussienne.
La réponse d'un filtre de Gabor complexe, comporte une partie réelle de base cosinus ℜ ℊ 𝑥
et une partie imaginaire de base sinus ℑ ℊ 𝑥 , les deux parties étant modulées par une
gaussienne.
ℜ ℊ 𝑥 =1
𝜍𝑥 2𝜋exp
−𝑥2
2𝜍𝑥2 . cos 2𝜋𝑓0𝑥 (2.13)
ℑ ℊ 𝑥 =1
𝜍𝑥 2𝜋exp
−𝑥2
2𝜍𝑥2 . (𝑠𝑖𝑛 2𝜋𝑓0𝑥 ) (2.14)
La réponse impulsionnelle d'un filtre de Gabor dans le domaine fréquentiel est une gaussienne
centrée sur 𝑓𝑥0.[29]
𝐺 𝑓𝑥 = exp(−2𝜋2𝜍𝑥2 𝑓𝑥 − 𝑓𝑥0
2) (2.14)
3.3.2 Filtre de Gabor 2D complexe
En étendant l'équation du filtre de Gabor 1D à la deuxième dimension, on obtient l'équation
suivante :
ℊ 𝑥, 𝑦 =1
𝜍𝑥𝜍𝑦 2𝜋exp
−𝑥2
2𝜍𝑥2 −
−𝑦2
2𝜍𝑦2 . exp(𝑗2𝜋 𝑓𝑥0𝑥 − 𝑓𝑥0𝑦 )
(2.15)
La réponse impulsionnelle de ce filtre 2D complexe (Figure 2.3) est une gaussienne 2D centrée
sur (𝑓𝑥0 − 𝑓𝑦0) et est notée :
𝐺 𝑓𝑥 , 𝑓𝑦 = exp(−2𝜋2 𝑓𝑥 − 𝑓𝑥0 2𝜍𝑥
2 + 𝑓𝑦 − 𝑓𝑦0 2𝜍𝑦
2 ) (2.16)
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
28
a) TF d'un filtre de Gabor 2D complexe b) TF d'un banc de filtres de filtre de
Gabor 2D complexes
Figure 2.3 : Filtres de Gabor complexes dans le domaine fréquentiel
(a) Transformée de Fourier (TF) d'un filtre de Gabor 2D complexe et (b) Transformées de
Fourier d'un banc de 6 filtres de Gabor 2D complexes.[29]
3.3.3 Filtre de Gabor 3D complexe
Les filtres utilisés par Fleet et Jepson [31] pour estimer le flux optique sont des filtres de Gabor
3D et sont notés :
ℊ 𝑥, 𝑦 =1
𝜍𝑥𝜍𝑦𝜍𝑡 2𝜋 3 exp
−𝑥2
2𝜍𝑥2 −
−𝑦2
2𝜍𝑦2 −
−𝑡2
2𝜍𝑡2 . exp(𝑗2𝜋 𝑓𝑥0𝑥 + 𝑓𝑥0𝑦 + 𝑓𝑡0𝑡 )
(2.17)
3.3.4 Réponse d'un filtre de Gabor
La réponse 𝑅 𝑥 , 𝑡 d'un filtre de Gabor 1D complexe peut-être décomposée en amplitude 𝜌 𝑥 , 𝑡
et phase 𝜙 𝑥 , 𝑡 :
𝑅 𝑥 , 𝑡 = 𝜌 𝑥 , 𝑡 . exp(𝑖 𝜙 𝑥 , 𝑡 ) (2.18)
avec l'équation de l'amplitude et de la réponse du filtre donnée par [31]:
𝜌 𝑥 , 𝑡 = 𝑅 𝑥 , 𝑡 (2.19)
= ℜ 𝑅 𝑥 , 𝑡 2
+ ℑ 𝑅 𝑥 , 𝑡 2 (2.20)
et l'équation de la phase de la réponse du filtre donnée par :
𝜙 𝑥 , 𝑡 = arg 𝑅 𝑥 , 𝑡 (2.21)
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
29
= ℑ loge 𝑅 𝑥 , 𝑡 ∈ −𝜋, 𝜋
4. Algorithme de l’estimation de mouvementpar filtre de Gaborcomplexe
Cette algorithme est basé sur l'équation générale du flux optique mais au lieu de considérer
l'intensité des pixels, on s'intéressera à la phase du signal. La phase et l'amplitude du signal sont
estimées à partir de la réponse de filtres de Gabor 3D orientés. À partir de la phase, on peut
déduire le gradient de phase dans chacune des directions 𝑥, 𝑦, 𝑡 . [28]
L'équation du flux optique correspondante sera notée :
∇𝜙 𝑥 , 𝑡 . 𝑉 𝑥 , 𝑡 + 𝜙 𝑥 , 𝑡 = 0 (2.22)
𝜙𝑥 𝑥 , 𝑡
𝜙𝑦 𝑥 , 𝑡 .
𝜐𝑥 𝑥 , 𝑡
𝜐𝑦 𝑥 , 𝑡 + 𝜙 𝑥 , 𝑡 = 0 (2.23)
Avec ∇𝜙 = 𝜙𝑥
𝜙𝑦 le gradient de phase spatial, 𝑉 𝑥 , 𝑡 =
𝜐𝑥𝜐𝑦
le vecteur vitesse à déterminer,
𝜙𝑡 le gradient de phase temporel et 𝑥 un pixel à la position 𝑥, 𝑦 dans l'image.
4.1 Estimation de la vitesse
D'après l'équation 0, on peut déterminer une première estimation de la vitesse notée :
𝑉 𝑥 , 𝑡 =−𝜙𝑡 𝑥 ,𝑡 .∇𝜙 𝑥 ,𝑡
∇𝜙 𝑥 ,𝑡 2 (2.24)
Avec ∇𝜙 𝑥 , 𝑡 2la norme du gradient spatial.
4.2 Gradients de phase
Pour pouvoir estimer la vitesse 𝑥 , 𝑡 , il est nécessaire d'estimer les gradients spatiaux et le
gradient temporel de la phase du signal. Fleet et Jepson proposent d'utiliser la formule suivante
pour estimer les gradients :
∇𝜙 𝑥 , 𝑡 =ℑ 𝑅 𝑥 ,𝑡 ∗.∇𝜙 𝑥 ,𝑡
𝜌2 𝑥 ,𝑡 (2.25)
Ou 𝑅 𝑥 , 𝑡 ∗ = ℜ 𝑅 𝑥 , 𝑡 − ℑ 𝑅 𝑥 , 𝑡 est le conjugué complexe de 𝑅 𝑥 , 𝑡 , 𝜌 𝑥 , 𝑡 est
l'amplitude de 𝑅 𝑥 , 𝑡 ,
Et ∇𝑅 𝑥 , 𝑡 est le gradient de 𝑅 𝑥 , 𝑡
On déduit de la définition du conjugué complexe :
∇𝜙 𝑥 , 𝑡 =ℑ ∇𝑅 𝑥 ,𝑡 .ℜ 𝑅 𝑥 ,𝑡 −ℜ ∇𝑅 𝑥 ,𝑡 .ℑ 𝑅 𝑥 ,𝑡
ℜ 𝑅 𝑥 ,𝑡 2
+ℑ 𝑅 𝑥 ,𝑡 2 (2.26)
Cette représentation du gradient permet de s'affranchir des problèmes de discontinuité de phase
(repliement de phase et singularité de phase) lorsque la phase est calculée directement et de
manière locale. [28]
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
30
On s'aperçoit dans l'équation (2.24)de l'estimation de la vitesse, lorsque que l'amplitude du signal
est nul (dénominateur de l'équation(2.24)), il est impossible d'estimer le mouvement. Cette
amplitude nulle correspond à un niveau de gris égal à zéro dans l'image.
4.3 Estimation de la vitesse par les moindres carrés
L'équation (2.24)permet d'estimer la vitesse (𝜐𝑥𝑖 , 𝜐𝑦𝑖 ) pour chacun des filtres 𝑖 ∈ 1 …𝑁 de
Gabor 3D complexes utilisés. Or, l'objectif est de déterminer le couple unique (𝜐𝑥 , 𝜐𝑦) respectant
au mieux la contrainte du flux optique. La technique proposée consiste à estimer le flux optique
par une résolution par les moindres carrés du système pondéré.[31]
On cherche à minimiser :
𝑊( 𝑥 , 𝑡) ∇𝜙 𝑥 , 𝑡 . 𝑉 𝑥 , 𝑡 + 𝜙𝑡 ( 𝑥 , 𝑡) 𝑥 =(𝑥 ,𝑦)𝜖𝛺2
(2.27)
Avec Ωun voisinage spatial carré de taille 𝑛 ∗ 𝑛 et 𝑊 𝑥 , 𝑡 contenant les coefficients d'une
fonction gaussienne 2D qui reflète la mesure de confiance que l'on peut avoir dans la vitesse
estimée𝑉 𝑥 , 𝑡 .
Pour résoudre la minimisation de l'équation (2.27), il faut trouver la solution matricielle de :
𝑊𝐴𝑉 = 𝑊𝑏(2.28)
Avec
A= ∇𝜙 𝑥 1, 𝑡 , … , ∇𝜙 𝑥 𝑛 , 𝑡 𝑇 =
𝜙𝑥1 𝜙𝑦1
𝜙𝑥𝑛 𝜙𝑥𝑦
(2.29)
W= diag 𝑊 𝑥 1, 𝑡 , … , 𝑊 𝑥 𝑛 , 𝑡 (2.30)
=
𝑊 𝑥 1, 𝑡
𝑊 𝑥 𝑖 , 𝑡
𝑊 𝑥 𝑛 , 𝑡
b=− 𝜙𝑡 𝑥 , 𝑡 , … . , 𝜙𝑡 ( 𝑥 , 𝑡) 𝑇(2.31)
On déduit de l'équation précédente :
A𝑇
WAV = 𝐴 𝑇 𝑊𝑏(2.32)
V= A 𝑇 WA −1 A 𝑇 Wb(2.33)
Remarque : La vitesse𝑉 𝑥 , 𝑡 existe si et seulement si la matrice A 𝑇 WA est inversible (non
singulière).[31]
Où
Chapitre 02 Estimation de Mouvement Par la méthode fréquentielle
31
𝐴𝑇𝑊𝐴 = 𝑊 𝑥 , 𝑡 𝜙𝑥
2 𝑥 , 𝑡 𝑊 𝑥 , 𝑡 𝜙𝑥 𝑥 , 𝑡 𝜙𝑦 𝑥 , 𝑡
𝑊 𝑥 , 𝑡 𝜙𝑦 𝑥 , 𝑡 𝜙𝑥 𝑥 , 𝑡 𝑊 𝑥 , 𝑡 𝜙𝑦2 𝑥 , 𝑡
(2.34) et
𝐴𝑇𝑊𝐴 = − 𝑊 𝑥 , 𝑡 𝜙𝑥 𝑥 , 𝑡 𝜙𝑡 𝑥 , 𝑡
− 𝑊 𝑥 , 𝑡 𝜙𝑦 𝑥 , 𝑡 𝜙𝑡 𝑥 , 𝑡 (2.35)
𝑊 𝑥 , 𝑡 est un filtre séparable isotopique. [31]
5.CONCLUSION
Nous avons examinédans ce chapitre le problème de l’estimation de mouvement dans les
séquences temporelles d’images. En début, nous avons expliqué la notion du flot optique, où,
nous avons appris sur les problèmes qui font l’obstacleaux dépens de calcul du flot optique
(problème d’ouverture).Ensuite, nous avons présenté une méthode fréquentielle d’estimation de
mouvement pour resoudre ceproblème. Cette méthode est basée sur une analyse spatro-
fréquentielle en appliquant les filtres de Gabor complexe.
Chapitre 03
Expérimentation etRésultats
Résumé
Les simulations de cette approche est réalisé à l'aide de logiciel MATLAB, en utilisant des
séquences de teste composée de deux frames. Cette méthode prend les propriétés de filtre de Gabor
pour calculer le déplacement d’image. L’évaluation requérait une phase de comparaison avec
d’autre approche, en utilisant l’erreur angulaire comme un critère d’évaluation du flot optique
mesuré par notre approche. L’interprétation de ces résultats annonce d’une grande réussite de cette
approche d’atteindre des meilleure performances, tel que une erreur inférieure ce qui signifie à une
grande précision, et une complexité plus faible.
Chapitre 03 Résultats Expérimentales
33
1 Introduction
L’estimation de mouvement est un indice très important pour de nombreuses applications de
traitement du signal et d’analyse d’image,c'est ce que nous avons vu au premier chapitre introductif.
Ainsi, nous avons interprété dans le deuxième chapitre que les filtres de Gabor est un outil
capable pour calculer le déplacement dans les séquences vidéos.
Nous commencerons ce chapitre par la description des propriétés de séquences de teste, puis, nous
présenterons la simulation de l’estimation de mouvement. Ensuite, nous comparons le flot optique
estimé avec le flot optique réel, en utilisant le critère d’évaluation (l’erreur angulaire), par la suite,
nous annoncerons l’interprétation de ces résultats. Enfin, nous terminons par conclusion qui
synthétisera le compris de ce chapitre.
2 Organigramme de la méthode d’estimation de mouvement par filtre de Gabor
La figure 3.1présente les étapes de l’estimation de mouvement par la méthode de filtre de Gabor :
Figure 3.1: les étapes de l’estimation de mouvement par filtre de Gabor
Chapitre 03 Résultats Expérimentales
34
3 Expérimentations
Toutes les séquences que nous avons utilisées sont des séquences synthétiques pour lequel le
mouvement réel est connu.Cela permet donc de faire des comparaisons entre le flot réel et le flot
calculé.
3.1. Séquences de test
Nous avons téléchargé différentes séquences rassemblées par Barronsur leur site FTP à l’adresse
csd.uwo.ca.[30]translatingTree » : représentent les séquences de translation et la divergence de
l'image d'un arbre. Ces images sont créées par le déplacement d'un camera
3.1.1. Séquences « sur un plan d’image d'un arbre. La vitesse de la séquence de translation est
variée entre 1.73 et 2.26 pixels/image, et la vitesse de l’image de divergence est variée de 1.29
pixels/image sur le côté gauche, et 1.86 pixels/image sur le coté droit. [30]
3.1.2. Séquence « squar » : Un carré blanc sur fond noir qui se déplace avec une vitesse (4 / 3, 4 /
3) pixels / image.
3.1.3. Séquence « Yosemite » : La séquence « Yosemite » est une séquence complexe et très
importante pour le domaine de l’estimation de mouvement parce qu’elle procède plusieurs
mouvement. Cette séquence montre le survol d'un engin parmi les collines. Donc, on a un
mouvement propre qui génère un flot optique divergent où le focus d'expansion est situé autour du
centre de l'image. La vitesse d'en bas et à gauche est de 5 pixels par image et les nuages se
déplacent vers la droite d'environ 2 pixels par image. Donc, le mouvement du terrain est divergent
et celui des nuages dans l'horizon plus au moins constant.
Les images de la séquence « Square » ont la size de 100 * 100, Les images de la séquence « Tree »
ont la size 150 * 150 et les images de Yosemite ont la size 316 * 252.[30]
3.2. Critère d’évaluation de la méthode :l’erreur angulaire
Le paramètre le plus couramment utilisé pour mesurer la performance du flux optique est la
mesure de l'erreur angulaire (EA) popularisée par Baron [30] mais initialement introduite par Fleet
et Jepson [31]. L'EA est calculée entre la vitesse correcte (réelle) et la vitesse estimée dans un
espace à trois dimensions. Il s'agit de normaliser les vecteurs, de calculer leur produit scalaire et de
prendre le cosinus inverse :
𝜓𝐸 = arccos(𝑉 𝑐 ,𝑉 𝑒)
Chapitre 03 Résultats Expérimentales
35
𝜓𝐸 = arccos 𝑣𝑥𝑒𝑣𝑥𝑐+𝑣𝑦𝑒𝑣𝑦𝑐+1
𝑣𝑥𝑒2 +𝑣𝑦𝑒
2 +1× 𝑣𝑥𝑐2 +𝑣𝑦𝑐
2 +1 (3.1)
La vitesse 𝑉 = 𝑣𝑥𝑣𝑦 est représentée comme un vecteur à 3 dimensions tel que
𝑉 =1
𝑣𝑥𝑒2 +𝑣𝑦𝑒
2 +1
𝑣𝑥𝑣𝑦1 (3.2)
4. Simulation de la méthode de l’estimation de mouvement par filtre de Gabor
Les résultats visuels du flux optique pour les méthodes de filtre de Gabor sont respectivement
présentés dans les figures suivantes sous forme de champ vectoriel superposé aux images.
4.1 Séquence «Translating Tree» ou « newbinarytreet. »
Figure 3.2.a- Séquence «TranslatingTree
Chapitre 03 Résultats Expérimentales
36
La séquence «TranslatingTree», pose une erreur angulaire moyenne de 2.8114°, qui peuvent
être comparé avec d’autres techniques d’estimation de mouvements. Le tableau suivant rappelle les
résultats obtenus par d’autres méthodes.
Méthode Erreur angulaire
Estimation de mouvement par filtre de Gabor 2.8114 °
Liu et al.[30] 3.67°
Horn et Schunk (original)[30] 38.43°
Horn et Schunk (modifié)[30] 2.02°
Anandan[30] 1.25°
Singh[30] 1.25°
Tableau 3.1- Résultats obtenus pour la séquence « TranslatingTree »
Figure3.2.b-Flot mesuré de la séquence «TranslatingTree» basée sur les filtres de Gabor
Chapitre 03 Résultats Expérimentales
37
Nous notons pour cette séquence, que les erreurs sont faibles et équivalentes dans la plupart
des approches, telles que Horn et Schunk (modifié),Anandan, Singh, Liu et al et notre approche.En
revanche, la méthode originale de Horn et Schunk a produitune erreur importante (erreur
moyenne 38.43°.
4.2 Séquence «DivergingTree»
Figure 3.3.a- Séquence «DivergingTree»
Chapitre 03 Résultats Expérimentales
38
Figure 3.3.b-Flot mesuré de la séquence «DivergingTree» basée sur les filtres de Gabor.
Ainsi, pour la séquence «DivergingTree», l’erreur angulaire moyenne est 6.3289 °qui peut
être comparé par d’autres méthodes d’estimation. Ceci est illustré dans le tableau suivant :
Méthode Erreur moyenne
Estimation de mouvement par filtre de Gabor 6.3289 °
Liu et al.[30] 1.67°
Horn et Schunk (original)[30] 12.02°
Horn et Schunk (modifié)[30] 2.55°
Anandan[30] 7.64°
Singh[30] 8.60°
Tableau 3.2 Résultats obtenus pour la séquence «DivergingTree »
Les résultats obtenus pour la séquence de «DivergingTree » concernant notre approche n’est
pas le meilleur en comparaison avec les autres méthodes, en termes d’une erreur moyenne
.
Chapitre 03 Résultats Expérimentales
39
4.3 Séquence «Yosemite »
4.4
Figure 3.4.a - Séquence « yosemite. »
Figure 3.4.b - Flot mesuré de la séquence « Yosemite. » basé sur les filtres de Gabor
Chapitre 03 Résultats Expérimentales
40
La séquence « yosemite.» révèle des différences plus importantes que les autres séquences.
Notre approche donne les meilleurs résultats. Une possible explication est la présence de beaucoup
structure non linéaire (i.e. de coins)
Pour la séquence de «Yosemite», l’erreur moyenne sur toute l’image est de 4.1771°.
L’erreur angulaire moyenne est comparée par d’autres méthodes, selon le tableau suivant :
Méthode Erreur moyenne
Estimation de mouvement par filtre de Gabor 4.1771°
Liu et al.[30] 8.43°
Horn et Schunk (original)[30] 32.43°
Horn et Schunk (modifié)[30] 11.26°
Anandan[30] 15.84°
Singh[30] 13.16°
Tableau 3.3. Résultats obtenus pour la séquence «Yosemite »
La séquence «yosemite » est la séquence la plus complexe, car elle contient trop de directions, et
seulement notre approche assure une erreur plus faible par rapport à d'autres méthodes similaires.
Les approches Liu et al. et Horn et Schunk (modifié) produit une erreur moyenne, et la technique
de Horn et Schunk (original) porte une erreur important (erreur moyenne de 32.43°).Cette
comparaison montre l'efficacité de notre approche pour calculer le flot optique d’une séquence
complexe contient un certain nombre de directions.
Chapitre 03 Résultats Expérimentales
41
4.4 Séquence « square.2 »
Figure 3.5.a- Séquence « Square. »
Chapitre 03 Résultats Expérimentales
42
Figure 3.5.b- Flot mesuré de la séquence « Square2. » par notre approche
Les résultats de l'évaluation du flot optique de la séquence « square.2 » sont récapitulées dans le
tableau 3.4.Il est évident que tout les techniques proposées semblent des résultats très bonnes, tel
que les approches qui présentent les meilleurs résultats sont : Lucas et Kanade, Fleet et Jepson et
notre approche. Notre approche n’est la meilleure, mais donne des résultats satisfaisants (Erreur
moyenne 3.9135°)
Méthode Erreur moyenne
Estimation de mouvement par filtre de Gabor 3.9135°
Lucas et Kanade[30] 0.14
Heeger[30] 1.02°
Waxman et al.[30] 4.28°
Fleet et Jepson[31] 0.05°
Tableau 3.4 .Résultats obtenue pour la séquence «square»
Chapitre 03 Résultats Expérimentales
43
5. Interprétation de résultats
Après la phase de comparaison de notre approche avec d’autres méthodes, il est évident que
les méthodes de comparaison permettent d’atteindre des erreurs d’estimation faibles, au prix d’une
complexité de calcule sensiblement plus élevée.En revanche, notre méthode offre une erreur
inférieure et une complexité plus faible.
Les avantages des de filtre de Gabor sont évidents dans les résultats des expérimentations
de notre approche :
La propriété de l’invariance par translation est adéquate pour l’hypothèse de la constance de la
luminance qui est la base de tous les approches.
La rapidité de calcule est assurée (complexité faible) parce que le filtre de Gabor offre plus de
contraintes pour faire la résolution de l’équation du flot optique, ce qui donne un temps de
calcul plus faible.
L’erreur de calcul est plus faible ce qui annonce une précision parfaite.
Le flot optique peut être calculé en plusieurs directions.
La disponibilité de l’information de phase, cette dernière permet de localiser les directions du
flot optique de façon exacte.
la réduction de complexité est réussite à cause de l’utilisation de deux frames seulement dans le
calcul de flot optique.
6. Conclusion
Ce chapitre a réalisé la comparaison de la performance de calcul du flot optique de notre
approche avec certain nombre de techniques similaires, en mettant l'accent sur la précision et la
densité de mesures.L'objectif de cette comparaison est d'évaluer l'efficacité et la précision de notre
approche.
Nous avons présenté les résultats de simulation de notre méthode. Tout d’abord, nous avons
commencé par la description des séquences synthétiques qui ont été utilisées dans ce travail.
Ensuite, nous exposons, la simulation de notre approche pour le filtre de Gabor, ainsi nous avons
fait une comparaison avec d’autres techniques, en utilisant l’erreur angulaire comme critère
d’évaluation.
La réduction de la complexité computationnelle est assurée pour notre méthode. Cette
réduction est gagnée parce qu’on a utilisée seulement deux frames pour calculer le flot optique,
ainsi cette algorithme ouvre la voie d’un calcul rapide et peu couteux du flot optique. Les résultats
montrent que notre approche surpasse les méthodes existantes, elle est plus efficace et plus précise.
Conclusion Générale
39
Conclusion Générale
On a présenté l'approche de l’estimation de mouvement pour calculer le flot optique.
Notre algorithme est basé sur le filtre de Gabor complexe qui est sensible de mouvement.
Dans le cas de changements d'illumination, travailler sur la phase du signal est plus robuste que
de travailler sur les dérivées de l'intensité du signal ou encore d'utiliser des filtres d'énergie.
Les expérimentations démontrent que cet algorithme est précis et robuste pour les mouvements
complexes. Ainsi, grâce à l'utilisation d'une séquence composée de deux frames d'image, la
complexité de calcul est diminuée par rapport à d'autres approches.
L'idée clef de cette méthode est d’utiliser l’image filtrée par filtre de Gabor pour
l’estimation de mouvement.
Ce travail consiste 3 chapitres, le premier chapitre est un bref rappel sur les méthodes
classiques d'estimation de mouvement. Le second chapitre a présenté l’approche de l’estimation
de mouvement par filtre de Gabor. Le troisième chapitre a exposé les résultats expérimentaux
de cette approche et a donné les avantages de filtre de Gabor pour calculer le flot optique.
Des critères d'évaluation ont été présenté, tel que l'erreur angulaire.
Les résultats de simulations avec Matlab, interprétation de ces résultats et conclusion, ont été
faitsaussi dans le troisièmechapitre.
Finalement en conclue que notre approche est capable de faire l'estimation du flot optique
de façon efficace, précise et robuste, puisque les filtre de Gabor ont plusieurs avantages tel que l
l'information de phase et la sensibilité par le mouvement, tous ces propriétés sont admissibles et
préférables pour l'application de l'estimation de mouvement.
Comme perspectives de notre travail, on peut utiliser d'autres methode d’estimation de
mouvement comme la méthode de block matching.
Résumé
Dans ce travail, nous présentons une technique del'estimation du champ de flot optique pour
les séquences d'images. Cette méthode est basées sur la phase du signal,en utilisent des filtres
sensibles au mouvement dans le plan de Fourier. Sur ce principe, on propose d'utiliser des
filtres de Gabor complexes 3D pour estimer le flux optique dans les images. Cette approche se
déroule en trois étapes. Tout d'abord, la séquence d'images est filtrée spatialementen utilisant
une banque de paires filtres de Gabor en quadrature, puis nous calculons le gradient de phase,
ce dernier est utilisé pour calculer la vitesse complète. Nous testons cette méthode sur
plusieurs séquences d'images synthétiques. Cette méthode offre une erreur inférieure et une
complexité plus faible pour les mouvements complexes.
Mots clés :estimation,flot optique,mouvements complexes,filtres de Gabor complexes.