Image, Mouvement, Vision 3D - École Polytechnique

55
1 X-ENS-UPS – GLB – 13/05/2011 – T1 Image, Mouvement, Vision 3D Un aperçu de la vision bas-niveau Guy Le Besnerais, ONERA/DTIM Contributions ONERA - unités EVS et IMS du DTIM, en particulier Frédéric Champagnat, Martial Sanfourche et les doctorants Aurélien Plyer et Pauline Trouvé - l’ONERA/DAFE (Benjamin Leclaire, Yves Le Sant, Samuel Davoust) Journées X-ENS-UPS 2011 – Séminaire GLB 130511 X-ENS-UPS – GLB – 13/05/2011 – T2 Plan Contexte Deux problèmes typiques Du 2D au 3D Evolutions Conclusions

Transcript of Image, Mouvement, Vision 3D - École Polytechnique

Page 1: Image, Mouvement, Vision 3D - École Polytechnique

1

X-ENS-UPS – GLB – 13/05/2011 – T1

Image, Mouvement, Vision 3DUn aperçu de la vision bas-niveau

Guy Le Besnerais, ONERA/DTIM

Contributions ONERA- unités EVS et IMS du DTIM, en particulier Frédéric Champagnat, Martial Sanfourche et les doctorants Aurélien Plyer et Pauline Trouvé- l’ONERA/DAFE (Benjamin Leclaire, Yves Le Sant, Samuel Davoust)

Jour

nées

X-E

NS

-UP

S 2

011

–S

émin

aire

GLB

130

511

X-ENS-UPS – GLB – 13/05/2011 – T2

Plan

• Contexte• Deux problèmes typiques• Du 2D au 3D• Evolutions• Conclusions

Page 2: Image, Mouvement, Vision 3D - École Polytechnique

2

X-ENS-UPS – GLB – 13/05/2011 – T3

Un modèle stratifié de la vision

Donnéesimage

Sortie numérique

AcquisitionInterprétation

Décision

• Modèle traditionnel « années 80 »• utilisé pour différents systèmes perceptifs :

(pertinence variable, bien entendu)

Capteur Haut-niveauBas-niveau

Système PIV

DroneMouche

Humain

Traitement

FPGA

X-ENS-UPS – GLB – 13/05/2011 – T4

Application : observation IR

• Objectif : améliorationimage

• Critères :• « Qualité image »

• profondeur de champ• stabilisation• « temps réel »

• Futur : vision enrichie• 3D, objets, etc.

Résolution limitée

Flou, bruit

Instabilités

Page 3: Image, Mouvement, Vision 3D - École Polytechnique

3

X-ENS-UPS – GLB – 13/05/2011 – T5

Application : mesure de mouvementsfluides pour l’aérodynamique

• Vélocimétrie par imagerie de particules(PIV)

Deux images de particules

Champ de mouvementestimé

Système PIV

X-ENS-UPS – GLB – 13/05/2011 – T6

Application : navigation autonome

• Perception embarquée• Deux thématiques liées

• Localisation

• Modélisation environnement

• Critères• Précision

• Durée de validité

• Futur : « autonomie complète »(ie. sur qq minutes…)

Trajectoire et modèle 3D

0 50 100 150 200 250 300-100

-50

0

50

100

150

200

Y (m) : EAST

X (m

) : N

OR

TH

GPS / INSVision / INSINS-only

UAV

TargetIMU

Camera

GPS

Onb

oard

Sen

sors Integrated Vision/INS

Navigation Filter

image

UAV attitude, acceleration

UAV position, velocity

Guidance & Flight Control

UAV global state

actuator inputs

Target global state

Targetpixel coord

Predicted targetpixel coordinates

Visual Target Tracker &Optical Flow Estimation

Optical flow

UAV

TargetIMU

Camera

GPS

Onb

oard

Sen

sors Integrated Vision/INS

Navigation Filter

image

UAV attitude, acceleration

UAV position, velocity

Guidance & Flight Control

UAV global state

actuator inputs

Target global state

Targetpixel coord

Predicted targetpixel coordinates

Visual Target Tracker &Optical Flow Estimation

Optical flow

Page 4: Image, Mouvement, Vision 3D - École Polytechnique

4

X-ENS-UPS – GLB – 13/05/2011 – T7

Vision bas-niveau

Donnéesimage

Autrescapteurs

Traitement

Sortie numérique

AcquisitionInterprétation

Décision

• Un domaine du traitement de données• Problématiques classiques : algorithmie, caractérisation, modèles

Base deconnaissances

Modélisation

Algorithmie

Caractérisation

X-ENS-UPS – GLB – 13/05/2011 – T8

Plan

• Contexte• Deux problèmes typiques

• Déconvolution et extensions• Estimation de mouvement image

• Extension jointe : super-résolution

• Du 2D au 3D• Evolutions récentes• Conclusion

Page 5: Image, Mouvement, Vision 3D - École Polytechnique

5

X-ENS-UPS – GLB – 13/05/2011 – T9

Un modèle très utile

• Modèle convolution + bruit

bxhy += *xh*hx

b

Capteur

1D

2D

RI

PSF

X-ENS-UPS – GLB – 13/05/2011 – T10

Approche « naïve »

• Problème discret• Données discrètes• Discrétisation de l’entrée

• Prise en compte du bruit• Solution des moindres carrés

• Un problème inverse• Les données ne suffisent pas à définir une solution satisfaisante

• L’équation d’observation est dite « mal posée »

bxHy +=

2MC minargˆ bxHx +=MCx

Page 6: Image, Mouvement, Vision 3D - École Polytechnique

6

X-ENS-UPS – GLB – 13/05/2011 – T11

Conditionnement

• Une interprétation en Fourier• Théorème de convolution-multiplication

• Solution par filtrage inverse (ou division spectrale)

−∈∀+=2

1,

2

1),()()()( ffBfXfHfYbxhy += *

TF

TF

→Conditionnement

= 1016 !

X-ENS-UPS – GLB – 13/05/2011 – T12

Effet du mauvais conditionnement : 2D

• Division spectrale en 2D• Solution inexploitable

Page 7: Image, Mouvement, Vision 3D - École Polytechnique

7

X-ENS-UPS – GLB – 13/05/2011 – T13

Régularisation

• Régularisation par pénalisation

• Introduire des informations a priori surl’objet recherché

• ex : positivité, régularité, etc.

• Un problème d’optimisation• dimension ?

• propriétés du critère ?

• Au final, une solution de compromis

X-ENS-UPS – GLB – 13/05/2011 – T14

Filtrage de Wiener

• Régularisation quadratique• Solution linéaire

• H : matrice Toeplitz, inversion par Fourier = Filtrage de Wiener

=

Page 8: Image, Mouvement, Vision 3D - École Polytechnique

8

X-ENS-UPS – GLB – 13/05/2011 – T15

Extensions

• Restitution des contours image⇒ Régularisation non quadratique

• Méthodes L2-L1 ou variation totale (TV)• Problèmes algorithmiques

• Méconnaissance de la réponse instrument h

⇒ Déconvolution aveugle/myope

⇒ Méthodes d’identification de la PSF

• Repliement fréquentiel• Les capteurs optiques sont souvent repliés

• = non-respect la condition de Shannon-Nyquist

⇒ Super-résolution

X-ENS-UPS – GLB – 13/05/2011 – T16

Discontinuités

Résultat J. Idier, 1997

Image originale Déconvolution quadratique Déconvolution L2-L1

Page 9: Image, Mouvement, Vision 3D - École Polytechnique

9

X-ENS-UPS – GLB – 13/05/2011 – T17

Déconvolution myope

• Imagerie astronomique à travers l’atmosphère• Système = télescope + atmosphère

• Réponse h mal connue et fluctuante• Exemple : Ganymède

• Acquisition par Banc Optique ONERA à l’obs. Hte Provence• Restauration par algo MISTRAL [Mugnier01]

• Estimation jointe de la réponse du système et de l’objet

[Mugnier01] Mugnier et al. 01, ONERA/DOTA

X-ENS-UPS – GLB – 13/05/2011 – T18

Identification de PSF

• Contexte : PSF spatialement variable• Flou de bougé, Defocus• Identification de PSF locale

• Approche par maximum de vraisemblance généralisé

• Choix de la PSF parmi une famille finie de réponses calibrées

Bougé, deux objets mobiles Defocus

[Zhuo09] : Zhuo, S. and Sim, T. “On the Recovery of Depth from a Single Defocused Image,” CAIP, 2009

Image [Zhuo09]

[Trouvé11] : Single Image Local Blur identification, ICIP’11, Gent (Belgique), 2011.

Résultat [Trouvé11]

Image et résultat [Trouvé11]

Page 10: Image, Mouvement, Vision 3D - École Polytechnique

10

X-ENS-UPS – GLB – 13/05/2011 – T19

Extensions

• Restitution des contours image• Régularisation non quadratique

• Méthodes L2-L1 ou variation totale (TV)• Problèmes algorithmiques

• Méconnaissance de la réponse instrument h

• Déconvolution aveugle/myope

• Méthodes d’identification de la PSF

• Repliement fréquentiel• Les capteurs optiques sont souvent repliés

• = non-respect la condition de Shannon-Nyquist

• Super-résolution

Coupureoptique

Module de la FTO

Niveau de bruit

Fréquenced’échantillonnage

retenue

X-ENS-UPS – GLB – 13/05/2011 – T20

Plan

• Contexte• Deux problèmes typiques

• Déconvolution et extensions• En savoir plus :

[Approche Bayésienne pour les problèmes inverses, J. Idier (Ed), Hermès, Lavoisier (Paris), 2001 ]

• Estimation de mouvement image• Extension jointe : super-résolution

• Du 2D au 3D• Modèle caméra et stéréovision

• Mesures 3D

• Evolutions récentes• Conclusion

Page 11: Image, Mouvement, Vision 3D - École Polytechnique

11

X-ENS-UPS – GLB – 13/05/2011 – T21

Plan

• Contexte• Deux problèmes typiques

• Déconvolution et extensions• Estimation de mouvement image

• Extension jointe : super-résolution

• Du 2D au 3D• Modèle caméra et stéréovision• Mesures 3D

• Evolutions récentes• Conclusion

X-ENS-UPS – GLB – 13/05/2011 – T22

Séquence originale

Extrait Stabilisation

Stabilisation numérique

Page 12: Image, Mouvement, Vision 3D - École Polytechnique

12

X-ENS-UPS – GLB – 13/05/2011 – T23

Compensation de mouvement

• Pb : trouver le mvt 2D qui rend les images superposa bles

X-ENS-UPS – GLB – 13/05/2011 – T24

Compensation de mouvement

• Pb : trouver le mvt 2D qui rend les images superposa bles• On travaille en général sur les images de luminance

Image I1 Image I2

Page 13: Image, Mouvement, Vision 3D - École Polytechnique

13

X-ENS-UPS – GLB – 13/05/2011 – T25

• Minimiser une différence d’images

• On cherche la translation t pour minimiser ΣΣΣΣx (I1(x) – I2(x+t))2

I1(x) – I2(x+t)I1 – I2

Approche dense : translation

X-ENS-UPS – GLB – 13/05/2011 – T26

• Minimiser une différence d’images• On cherche la translation t pour minimiser

• Mise en œuvre : Gauss-Newton

• Initialisation : t0 = 0

• Connaissant ti-1, on pose ti = ti-1 + δt

• Développement au premier ordre

• Résolution en δt linéaire

Approche dense : translation

Σx (I1(x) – I2(x + ti-1) - ∇∇∇∇I2(x + ti-1)t δt)2

Σx (I1(x) – I2(x+t))2

Translation

Page 14: Image, Mouvement, Vision 3D - École Polytechnique

14

X-ENS-UPS – GLB – 13/05/2011 – T27

• Minimiser une différence d’images

• On cherche l’affinité (A, t) pour minimiser ΣΣΣΣx (I1(x) – I2(Ax+t))2

• Inconvénients• Aucune influence des zones homogènes : coût ?

I1 – I2 I1(x) – I2(Ax+t)

Approche dense : modèle affine

Déformationaffine

X-ENS-UPS – GLB – 13/05/2011 – T28

Approche par primitives

• Extraction de primitives• points d’intérêt ou coins [Harris, Forstner, Stephen]

• Appariement de primitives• Mouvement faible : recherche locale de zones similaires

• Block-matching

Page 15: Image, Mouvement, Vision 3D - École Polytechnique

15

X-ENS-UPS – GLB – 13/05/2011 – T29

Approche par primitives

• Recalage de fenêtre(Block matching ) Zone de recherche

Déplacement optimal

X-ENS-UPS – GLB – 13/05/2011 – T30

Approche par primitives

• Block matching (suite)

Carte de scoresde corrélation

DéplacementDéplacementDéplacementDéplacementcorrectcorrectcorrectcorrect

DéplacementDéplacementDéplacementDéplacementfauxfauxfauxfaux

Zone de recherche

Page 16: Image, Mouvement, Vision 3D - École Polytechnique

16

X-ENS-UPS – GLB – 13/05/2011 – T31

Approche par primitives

• Extraction de primitives• points d’intérêt ou coins [cf. Corner detection]

• Appariement de primitives• Mouvement faible : recherche locale de zones similaires

• Exemple : KLT [KLT: Kanade-Lucas-Tomasi Feature Tracker]

X-ENS-UPS – GLB – 13/05/2011 – T32

• Détail entre images 1 et 2• Faisceau des translations estimées pour chaque bipoint apparié

)1()2(ˆ171717 xxt −=Point 17 (image 1) ↔ point 17 (image 2)

translation moyenne : ( )∑ −=n

nnN

)1()2(1ˆ xxt

Estimation aux moindres carrés

Page 17: Image, Mouvement, Vision 3D - École Polytechnique

17

X-ENS-UPS – GLB – 13/05/2011 – T33

• Détail entre images 11 et 12• Faisceau des translations estimées pour chaque bipoint apparié

⇒⇒⇒⇒Modèle affine

Estimation aux moindres carrés : linéaire en paramè tres

( )2))1(()2(minarg)ˆ,ˆ( ∑ +−=

n

nn txAxtA

X-ENS-UPS – GLB – 13/05/2011 – T34

• Détail entre images 6 et 7

Page 18: Image, Mouvement, Vision 3D - École Polytechnique

18

X-ENS-UPS – GLB – 13/05/2011 – T35

Estimation robuste

• Modèle moyen faux• Associé au critère des moindres carrés

⇒⇒⇒⇒ Estimer un modèle majoritaire• Pénalisations non quadratiques non convexe

• Optimisation par moindres carrés repondérés (IRLS)

• Critères non réguliers : Least-Median-Squares [Zhang LMedS] / Ransac

• Optimisation par algorithme stochastique type Ransac

{ } ( )∑ +−=n

nn )(minarg, 21 tAxxtA φ

{ } ( ){ }NnnnL1,)(medianminarg, 21 =+−= tAxxtA

Pénalisation quadratique tronquée

X-ENS-UPS – GLB – 13/05/2011 – T36

• Détail entre images 6 et 7 : solution par estimation robuste

Modèle moyen

Modèle robuste

Page 19: Image, Mouvement, Vision 3D - École Polytechnique

19

X-ENS-UPS – GLB – 13/05/2011 – T37

Extensions

• Détection de relief pour l’aide à l’atterrissage

• Flot optique

X-ENS-UPS – GLB – 13/05/2011 – T38

Défilement apparent et distance

• Observateur en translation / scène rigide• Vitesse de défilement ∝ 1 / distance à l’observateur

• Atterrissage du drone ReSSAC• Caméra en visée nadir• Le relief défile légèrement plus vite que le sol

Page 20: Image, Mouvement, Vision 3D - École Polytechnique

20

X-ENS-UPS – GLB – 13/05/2011 – T39

Détection de relief

• Compensation du mouvement du sol• Homographie : Champ des déplacements image associé aux

mouvements d’un objet plan

• Détection• Estimation robuste du mouvement global

• Elimine appariements faux et points hors sol

• Soustraction d’image + seuillage

Déformationhomographique

33132131

131121112

hyhxh

hyhxhx

++++=

33132131

231221212

hyhxh

hyhxhy

++++=

Séquence drone RESSACVert = sol

Rouge = reliefGris = indécidable

Résultat ONERA/DTIM, 2009

X-ENS-UPS – GLB – 13/05/2011 – T40

Extensions

• Détection de relief pour l’aide à l’atterrissage

• Flot optique

Page 21: Image, Mouvement, Vision 3D - École Polytechnique

21

X-ENS-UPS – GLB – 13/05/2011 – T41

Flot optique

• Champ des déplacements apparents entre deux images

Séquence Ettlinger Törr (Univ. Karlsruhe) Flot optique estimé entre deux images

X-ENS-UPS – GLB – 13/05/2011 – T42

Flot optique

• Flot optique : kézako ?• Réponse 1

• le champ de vecteur qui permet de superposer les deux images

Image I0)ˆ(

~0 ttII u+⋅−

tII −0 tu

xxuxx dII tt2

0 ))(()(( +−∫min

tu

Critère non linéaire etProblème sous-déterminé !

Page 22: Image, Mouvement, Vision 3D - École Polytechnique

22

X-ENS-UPS – GLB – 13/05/2011 – T43

Flot optique

• Flot optique : kézako ?• Réponse 1

• le champ de vecteur qui permet de superposer les deux images

• Réponse 2• le champ de vecteur le plus régulier possible qui permette de

superposer les deux images

• Deux approches• Approches locales [Lucas Kanade, 1981]• Approches globales [Horn Schunck, 1981]

xxuxx dII tt2

0 ))(()(( +−∫min

tuOn retrouve la notion

de régularisation

X-ENS-UPS – GLB – 13/05/2011 – T44

Approches locales

• Block matching + méthode de descente = Algorithme LK [Lucas, Kanade, 1981]

Carte de scoresde corrélation

Chemin de Chemin de Chemin de Chemin de descentedescentedescentedescente

Page 23: Image, Mouvement, Vision 3D - École Polytechnique

23

X-ENS-UPS – GLB – 13/05/2011 – T45

Approche globale

• Critère global et continu

• Régularisation sur les dérivées spatiales du flot

• Résolution itérative (Gauss-Newton)

• Schémas multi-résolution

• Extension : critères non quadratique (« robustes »)• Régularisation TV ([Total Variation])

xxxuxxu dvudIIJ t

222

0 )()()))(()(()( ∆+∆++−= ∫∫ λ

xxuuxxu dvudIIIJ t

t

222

00 )()())()(()( ∆+∆+∇−+−= ∫∫ λδ

X-ENS-UPS – GLB – 13/05/2011 – T46

Résultats typiques

• Versions (relativement) récentes• locale : FOLKI [LeBesnerais05]

• globale : [LeBesnerais06]

Approche locale Approche globale

Page 24: Image, Mouvement, Vision 3D - École Polytechnique

24

X-ENS-UPS – GLB – 13/05/2011 – T47

Plan

• Contexte• Deux problèmes typiques

• Déconvolution et extensions• Estimation de mouvement image

• En savoir plus :[Handbook of Image and Video Processing, Al Bovik (Ed), Academic Press, 2000]

• Extension jointe : super-résolution

• Du 2D au 3D• Modèle caméra et stéréovision

• Mesures 3D

• Evolutions récentes• Conclusion

X-ENS-UPS – GLB – 13/05/2011 – T48

Plan

• Contexte• Deux problèmes typiques

• Déconvolution et extensions• Estimation de mouvement image

• Extension jointe : super-résolution

• Du 2D au 3D• Evolutions récentes• Conclusion

Page 25: Image, Mouvement, Vision 3D - École Polytechnique

25

X-ENS-UPS – GLB – 13/05/2011 – T49

Extension jointe

• Restitution des contours image• Régularisation non quadratique

• Méthodes L2-L1 ou variation totale (TV)• Problèmes algorithmiques

• Méconnaissance de la réponse instrument h

• Déconvolution aveugle/myope• Méthodes d’identification de la PSF

• Repliement fréquentiel• Les capteurs optiques sont souvent repliés

• = non-respect la condition de Shannon-Nyquist

⇒ Super-résolution• Combiner des images pour améliorer la qualité

• échantillonnage, bruit, PSF

Coupureoptique

Module de la FTO

Niveau de bruit

Fréquenced’échantillonnage

retenue

vidéorepliée

X-ENS-UPS – GLB – 13/05/2011 – T50

Super resolution (SR)

• Améliorer la qualité d’une séquence par traitement spatio-temporel

Original Low-ResolutionVideo Sequence (70x120)

3x Spatial Zoom

Interpolation spatiale

Page 26: Image, Mouvement, Vision 3D - École Polytechnique

26

X-ENS-UPS – GLB – 13/05/2011 – T51

Super resolution (SR)

• Améliorer la qualité d’une séquence par traitement spatio-temporel

• Principal objectif : réduire le repliement

• mais aussi : réduire le bruit, déconvoluerla réponse instrument

Original Low-ResolutionVideo Sequence (70x120)

SR

Reconstructed SRx311 LR images used

X-ENS-UPS – GLB – 13/05/2011 – T52

SR : modèle de formation d’image

• Ajouts• Opérateur de mouvement• Décimation

• Résolution• Recalage = estimation de

• Inversion régularisée du système

+∆h

yk = DHFk xk + bk

yk

bk

xkfk

y = A x + bfk

Page 27: Image, Mouvement, Vision 3D - École Polytechnique

27

X-ENS-UPS – GLB – 13/05/2011 – T53

Super-résolution : cas réel

• Imagerie IR aérienne

Spatial Zoom SR image

[Rochefort06] G. Rochefort et al., “An improved observation model for super-resolutionunder affine motion,” IEEE Trans. Image Proc., vol. 15, no 11, pp. 3325, nov 2006

Un cas difficile : séquence IRaérienne en rapprochement

- [Rochefort06]

X-ENS-UPS – GLB – 13/05/2011 – T54

Plan

• Contexte• Deux problèmes typiques• Du 2D au 3D

• Modèle caméra et stéréovision• Mesures 3D

• Evolutions récentes• Conclusion

Page 28: Image, Mouvement, Vision 3D - École Polytechnique

28

X-ENS-UPS – GLB – 13/05/2011 – T55

Modèle géométrique de la prise d’image

• Modèle sténopé• Equation de projection centrale

• Propriété : conservation des droites

CPCMCm ηλ ==

==

cc

cc

ZYfy

ZXfx

f

X-ENS-UPS – GLB – 13/05/2011 – T56

Modèle géométrique de la prise d’image

• Projection centrale : un modèle idéal• Distorsions très visibles pour les

focales courtes•

http://www.flickr.com/people/eirikso/

pas de distorsion

distorsion en coussin

distorsion en barillet

Page 29: Image, Mouvement, Vision 3D - École Polytechnique

29

X-ENS-UPS – GLB – 13/05/2011 – T57

Paramètres intrinsèques

Paramètres extrinsèques

Un modèle géométrique plus réaliste

• Déplacement monde →→→→ caméra : X c = RX + T 6

• Projection centrale 1

• Distorsion 2 à 5

• Numérisation 4

==

cc

cc

ZYfy

ZXfx

+=+=

) ( ~) ( ~

4

2

2

1

4

2

2

1

rkrkyy

rkrkxx

+=+=

0

0

~

~

vypv

uxpu

v

u

X-ENS-UPS – GLB – 13/05/2011 – T58

Calibrage géométriquede caméra

• Plusieurs softs sur le web• [Matlab Calibration Toolbox

J-Y Bouguet]

• Simples d’emploi• Utilisent des images de mire plane

ExtrinsèqueIntrinsèques

Illustrations JY Bouguet

Page 30: Image, Mouvement, Vision 3D - École Polytechnique

30

X-ENS-UPS – GLB – 13/05/2011 – T59

Mesures 3D

• Principes de mesuresgéométriques à partird’images

A

a

a’Cg

Cd

A

a

a’Cg

Cd

A

a

C

• Intermédiaire indispensable : l’association (matchi ng)

1 – Mesures de vitesses planesexemple : PIV 2C

B

image t+1

b

3 – Triangulation 3D

2 – Mesures de vitesses 3C, exemple : stéréo PIV

Cg

4 – Calcul de pose

b

b’

B

image t+1

X-ENS-UPS – GLB – 13/05/2011 – T60

Application : modélisation 3D

Prise de vue stéréo et 3D instantané par FOLKI

Trajectoire et modèle 3D de la zone traversée

Nuage de pts 3D

1.

2.

3.[Résultats M. Sanfourche, A. Plyer, ONERA/DTIM 2010]

Page 31: Image, Mouvement, Vision 3D - École Polytechnique

31

X-ENS-UPS – GLB – 13/05/2011 – T61

Plan

• Contexte• Deux problèmes typiques• Du 2D au 3D

• En savoir plus :[Hartley Zisserman, Multiple View Geometry in Computer Vision, Cambridge Univ. Press, 2004]

• Evolutions• Conclusions

X-ENS-UPS – GLB – 13/05/2011 – T62

Un domaine toujours très actif

Traitement AcquisitionInterprétation

Décision

• Beaucoup d’évolutions récentes (> 2000)• Origines diverses

Capteur Haut-niveauBas-niveau

1 - Evolutions « internes »(imports de modèles et algorithmes)

2 – Solutions de calcul(ex : GPU)

3 – Evolutionscapteurs

4 – Interaction capteurs-traitement(co-conception)

5 – Interaction bas-niveauet haut-niveau

Page 32: Image, Mouvement, Vision 3D - École Polytechnique

32

X-ENS-UPS – GLB – 13/05/2011 – T63

Plan

• Contexte• Deux problèmes typiques• Du 2D au 3D• Evolutions

• Algorithmes et architectures de calcul• Co-conception• Echanges avec le haut-niveau

• Conclusions

X-ENS-UPS – GLB – 13/05/2011 – T64

Evolutions : algorithmes et architectures de calcul

Traitement AcquisitionInterprétation

Décision

Capteur Haut-niveauBas-niveau

1 - Evolutions « internes »(imports de modèles et algorithmes)

2 – Solutions de calcul(ex : GPU)

Page 33: Image, Mouvement, Vision 3D - École Polytechnique

33

X-ENS-UPS – GLB – 13/05/2011 – T65

Approches locales

• Block matching + méthode de descente itérative= Algorithme LK [Lucas, Kanade, 1981]

• Un problème d’optimisation local sur 2 variables

u(0)

u(2)u(1)

))((min )( kuku J

X-ENS-UPS – GLB – 13/05/2011 – T66

Approche locale et estimation dense

• Objectif : minimisation rapide de tous les critères locaux• NB : full HD=1920x1080 ⇒⇒⇒⇒ 2.000.000 optimisations en //

• Critère global :

• Stratégie Gauss-Newton

• Linéarisation itérative de chaque critère local

• Pour chaque critère linéarisé un système 2x2• Pour tout pixel k

⇒⇒⇒⇒ Pb : Contruire et inverser 2M de systèmes 2x2 en < 4 0ms

( )212 )())((~

)()( ∑ ∑ −−−=k m

mkumkmu IIFJ

uuu δ+= 0

somme ts les k sur le support image

)()()( kckukH =( ) )()

~(

~)( t)(

2

)(

2 kkH tt IIF ∇∇∗=

( ) )(~

)( )(

2 kεkctIF ∇∗=

)()(~

)()(~

)(t)(

21

)(

2 kukkkkε t

ttIII ∇−−=

Page 34: Image, Mouvement, Vision 3D - École Polytechnique

34

X-ENS-UPS – GLB – 13/05/2011 – T67

Solutions

1. Une modification d’und’un schéma itératif populaire

• [LeBesnerais-Champagnat,ICIP’05]

2. Implémentation sur GPU(Graphics Proc. Unit)

• [Plyer et al, NVidia09]

FOLKI pseudo-code

X-ENS-UPS – GLB – 13/05/2011 – T68

• Séquence HD (2MP)• Traitement à cadence

vidéo

• exemples

• download

Résultat

www.onera.fr/dtim/gpu-for-image [Plyer et al, NVidia09]

Page 35: Image, Mouvement, Vision 3D - École Polytechnique

35

X-ENS-UPS – GLB – 13/05/2011 – T69

Application : « ultra-fast » PIV

• FOLKI-SPIV

• Travaux menés en lien avecdépartement DAFE (Aérodynamique)à l’ONERA

• Extension à la PIV 3C (stéréo) • gain : 40 (vs. soft commercial)• paramétrage simple

• précision du résultat

• 4 millions de vecteurs 3C en 0.5sec

• cf. [Champagnat et al., 2011]

image PIV (DAFE)

Résultat FOLKI-SPIV

[Champagnat, F., et al. 2011 Fast and accurate PIV computationusing highly parallel iterative correlation maximization.

Exp. Fluids, in press, 2011]

X-ENS-UPS – GLB – 13/05/2011 – T70

PIV : Expé S. Davoust (DAFE)

• Jet turbulent en rotation(swirl )

• 3C Time-resolved PIV• 5mn pour 2000 1103x1149 Stereo PIV images processing (5 iterations)

Norm Vorticity

Résultats S. Davoust et al. ONERA/DAFE, 2010

Page 36: Image, Mouvement, Vision 3D - École Polytechnique

36

X-ENS-UPS – GLB – 13/05/2011 – T71

Travaux S. Davoust

• Jet turbulent en rotation(swirl )

• 3C Time-resolved PIV• 5mn pour 2000 1103x1149 Stereo PIV images processing (5 iterations)

• Description du jet• Le 3D est obtenu en exploitant des propriétés de stationnarité de l’écoulement

θ

u(r,θ,t)

Résultats S. Davoust et al. ONERA/DAFE, 2010

X-ENS-UPS – GLB – 13/05/2011 – T72

Evolutions

Traitement AcquisitionInterprétation

Décision

Capteur Haut-niveauBas-niveau

4 – Interaction capteurs-traitement(co-conception)

Page 37: Image, Mouvement, Vision 3D - École Polytechnique

37

X-ENS-UPS – GLB – 13/05/2011 – T73

Plan

• Contexte• Deux problèmes typiques• Du 2D au 3D• Evolutions

• Algorithmes et architectures de calcul• Co-conception

• Modélisation de performance

• Super-résolution• CAM3D : une caméra passive sensible à la profondeur

• Echanges avec le haut-niveau

• Conclusions

X-ENS-UPS – GLB – 13/05/2011 – T74

Interaction capteur - traitement

• Paradigme passé

TraitementCapteur

OptiqueOptronique

Traitement d’imageVision par ordinateur

Obtenir laplus belle image

possible

Extraire l’information utile de l’image

disponible

Page 38: Image, Mouvement, Vision 3D - École Polytechnique

38

X-ENS-UPS – GLB – 13/05/2011 – T75

Interaction capteur - traitement

• Paradigme co-conception

OptiqueOptronique

Traitement d’imageVision par ordinateur

Système perceptif

Extrairel’information utile

Une mouche,vue de près

Problème : définir un modèle de performanceconjoint (capteur + traitement)

X-ENS-UPS – GLB – 13/05/2011 – T76

Plan

• Contexte• Deux problèmes typiques• Du 2D au 3D• Evolutions

• Algorithmes et architectures de calcul• Co-conception

• Modélisation de performance

• Super-résolution• CAM3D : une caméra passive sensible à la profondeur

• Echanges avec le haut-niveau

• Conclusions

Page 39: Image, Mouvement, Vision 3D - École Polytechnique

39

X-ENS-UPS – GLB – 13/05/2011 – T77

Une structure d’évaluation empirique

• Cas de la détection d’objet[Samson Champagnat Giovannelli 2002] coll. L2S

ModèleCapteur

Traitement

Mesure d’écart Statistiques

« Mesure de performance »

BDD Objets

BDD Fonds

x

y x

X-ENS-UPS – GLB – 13/05/2011 – T78

Transposition bayésienne

ModèleCapteur

Traitement

Mesure d’écart Statistiques

« Mesure de performance »

BDD Objets

BDD Fonds

x

y

Distribution p(y|x; θcapteur, θfond )

Vraisemblance

Distribution a priorip(x; θobjet )

Estimateur

Risque Risque moyen

[ ] dxdyxpxypyxxRxxRE )()())(ˆ,()ˆ,( ∫=

Page 40: Image, Mouvement, Vision 3D - École Polytechnique

40

X-ENS-UPS – GLB – 13/05/2011 – T79

Risque moyen

• Un outil de modélisation de performance• comprend les aspects

• scène• capteur

• traitement

⇒⇒⇒⇒ Un outil de co-conception

• Problème pratique : comment le calculer ?• Difficile en général

• Un exemple : Super-résolution

[ ] ),(),(),())(ˆ,()ˆ,( ,, fondcapteurobjetobjetfondcapteur fdxdyxpxypyxxRxxRE θθθθθθ == ∫

X-ENS-UPS – GLB – 13/05/2011 – T80

Plan

• Contexte• Deux problèmes typiques• Du 2D au 3D• Evolutions

• Algorithmes et architectures de calcul• Co-conception

• Modélisation de performance

• Super-résolution• CAM3D : une caméra passive sensible à la profondeur

• Echanges avec le haut-niveau

• Conclusions

Page 41: Image, Mouvement, Vision 3D - École Polytechnique

41

X-ENS-UPS – GLB – 13/05/2011 – T81

81

Modélisation SR linéaire

séquence BR

séquencerecalée

image SR (x3)

RecalageInversion

linéaire

Facteur SR

Modèle derégularisation

Modèle capteur

Peut-on relier nombre d’images et amélioration de résolution ?

τk^

Gain en résolutionspatiale proche de 2

X-ENS-UPS – GLB – 13/05/2011 – T82

Modélisation de performance SR

• Hypothèses principales

• Mouvement de translation

• Reconstruction linéaire invariante

• Modélisation entrée au second ordre + stationnarité

• Nombreux paramètres• Capteur : H(ν), K, τ τ τ τ = [τ1, … τK]t, rb

• Facteur SR

• Entrée : DSP φx

• Type de traitement SR : w

• Travaux précédents [Robinson et Milanfar 2006]

• Mesure de performance : EQM (BCR)

• Prise en compte des erreurs de recalage

• Limitation : résultat lourd

[ ]duuxuxEwrH b ∫ −= 22 ))(ˆ)((),,,( τσ

Page 42: Image, Mouvement, Vision 3D - École Polytechnique

42

X-ENS-UPS – GLB – 13/05/2011 – T83

Modélisation de performance SR

• Passer en Continu-Discret• Elimine le choix du facteur SR

PSF b1

δ( . – τ1)

translation

δ( . - τk)

δ( . - τK)

+

+

+

bk

bK

x(.)

z1[.]

zk[.]

zK[.]

Echantillonnage

X-ENS-UPS – GLB – 13/05/2011 – T84

Modélisation de performance SR

• Passer en Continu-Discret• Négliger l’erreur de recalage

• Hypothèse réaliste• Rend le problème linéaire

• Conséquence : SR = filtrage multicanal

z1[.]

zk[.]

zK[.]

w1(.)

wk(.)

wK(.)

×

×

×

(.)x

Reconstruction

+

Page 43: Image, Mouvement, Vision 3D - École Polytechnique

43

X-ENS-UPS – GLB – 13/05/2011 – T85

Choix de la mesure de performance

[ ]duuxuxEwrH b ∫ −= 22 ))(ˆ)((),,,( τσ

• Mesure de performance : EQM ponctuelle

• EQM moyenne sur l’intervalle BR

)3,(ˆ =∆ Kx

)4,(ˆ =∆ Kx

)1,(ˆ =∆ Kx

)1,3/(ˆ =∆ Kx

U (pixel)

]))(ˆ)([( 2uxuxE −

Bonus : simplification considérable des expressions formelles !

X-ENS-UPS – GLB – 13/05/2011 – T86

Une formule d’erreur

• Expression compacte de l’EQM en Fourier [Champagnat, Le Besnerais, Kulcsar, JOSA A 2009]

• Valable en SR optimale/sous-optimale

scène : DSP capteur : FTM Traitement :filtrage multi-canal

Capteur : bruit

Acquisition : mouvement

Page 44: Image, Mouvement, Vision 3D - École Polytechnique

44

X-ENS-UPS – GLB – 13/05/2011 – T87

Impact de la valeur des décalages

• Motivation• Etude de performance dans le cas général : décalages aléatoires• Je peux contrôler les décalages : quelles valeurs donner ?

• Statistique des EQM pour une distribution uniforme de décalages

• Rôle particulier des décalages équirépartis : justif ication formelle

Calcul basé sur le modèleCDC théorique proposé

X-ENS-UPS – GLB – 13/05/2011 – T88

Influence du nombre d’images

• Convergence EQM avec nombre d’images BR croissant

• Résultat de convergence p.s. vers le comportement équiréparti= Extraction de toute l’information dans la bande passante du capteur

Page 45: Image, Mouvement, Vision 3D - École Polytechnique

45

X-ENS-UPS – GLB – 13/05/2011 – T89

Exemple en imagerie IR

• Séquence SR : détails• amélioration de la SR avec l’intégration temporelle

SR 1 image SR N image

Données : FLIR ATS

Quelle est la vitesse de convergence ? De quoi dépend-elle ?

X-ENS-UPS – GLB – 13/05/2011 – T90

Etude de vitesse de convergence

• Expression de l’erreur pour le cas équiréparti

Fort RSB : Désaliasing prépondérant

Faible RSB : Débruitage prépondérant

Terme d’aliasing :Décroît rapidement en K

Page 46: Image, Mouvement, Vision 3D - École Polytechnique

46

X-ENS-UPS – GLB – 13/05/2011 – T91

Performance de la SR sous-optimale

• Arrondi des translations• simplification des méthodes de SR

• Lié au facteur SR (fact. 2 → arrondi au ½ pixel BR …)

Calculé avec modèle CDCthéorique proposé

X-ENS-UPS – GLB – 13/05/2011 – T92

Une utilisation « illustrative »

• Comment définir le gain en résolution ?

• Lien gain en résolution / facteur de rapprochement• Modèle simple de scène plane et image 1D : code barre

Facteur de rapprochement = 2.5Facteur de rapprochement = 1

Page 47: Image, Mouvement, Vision 3D - École Polytechnique

47

X-ENS-UPS – GLB – 13/05/2011 – T93

RER : Resolution Enhancement Ratio

Number of Images

Per

f. in

dex

Per

f. in

dex

D0/D

Nombre d’images K Se rapprocher de la scèneK���� D����

• Modèle de performance SR• indice de performance : EQM

• Peut être calculé pour une SR à 1 seule image (interpolation)

• Deux manières d’améliorer la performance

X-ENS-UPS – GLB – 13/05/2011 – T94

Facteur = 1

Facteur = 2.5

Nombre d’images

RER : Resolution Enhancement Ratio

• Lien gain en résolution / facteur de rapprochement• Modèle simple de scène plane et image 1D : code barre• Cadre théorique CDC, indice de perfomance = EQM

• Validation expérimentale[Champagnat, Kulcsar, LeBesnerais, CVPR 06]

Facteur de rapprochement

Nombre d’images BR traitées en SR

Page 48: Image, Mouvement, Vision 3D - École Polytechnique

48

X-ENS-UPS – GLB – 13/05/2011 – T95

Plan

• Contexte• Deux problèmes typiques• Du 2D au 3D• Evolutions

• Algorithmes et architectures de calcul• Co-conception

• Modélisation de performance

• Super-résolution• CAM3D : une caméra passive sensible à la profondeur

• Echanges avec le haut-niveau

• Conclusions

X-ENS-UPS – GLB – 13/05/2011 – T96

Profondeur de champ

• Profondeur de champ

Capteur

PSF

Plan de mise au

point

Objet

Page 49: Image, Mouvement, Vision 3D - École Polytechnique

49

X-ENS-UPS – GLB – 13/05/2011 – T97

Profondeur de champ

Capteur

ObjetPlan de mise au

point

),( sDf=σσ

PSFD

• Profondeur de champ

PSF localeEstimation de profondeur

Déconvolution = extension de la profondeur de champ

X-ENS-UPS – GLB – 13/05/2011 – T98

Pupille codée

• Profondeur de champ• Ajout d’une pupille codée

Capteur

PSFObject

Plan de mise au

point

Page 50: Image, Mouvement, Vision 3D - École Polytechnique

50

X-ENS-UPS – GLB – 13/05/2011 – T99

Un compromis de co-conception !

Pupille codée

• Profondeur de champ• Ajout d’une pupille codée

• Dégradation image : corrigé par déconvolution• Meilleure discrimination de profondeur [Levin07]

Capteur

PSF

ObjectPlan de mise au

point

X-ENS-UPS – GLB – 13/05/2011 – T100

Identification de PSF et estimation de profondeur

Images issues de [Levin07]

Résultats de [Levin07]

9 PSF de taille 7x7 à 15x15

Temps de calcul 3 min sous Matlab

Résultats de [Trouvé11]

Temps de calcul : des heures…

Page 51: Image, Mouvement, Vision 3D - École Polytechnique

51

X-ENS-UPS – GLB – 13/05/2011 – T101

Projet CAM3D

• Capteur passif Monovoie à Capacité 3D• Un vrai travail de co-conception

• Resp. F. Champagnat, ONERA/DTIM

• Coll. G. Druart, Département d’optique (ONERA/DOTA)• travaux de thèse P. Trouvé

Optique et détecteurTraitement

d’estimation local de profondeur

Optimisation

Optimisation

X-ENS-UPS – GLB – 13/05/2011 – T102

Etude de performance : premiers résultats

• Prédiction de performance par BCR• Comparaison pupille classique et pupille codée

Performance théorique del’estimation de profondeur(Résultat P. Trouvé, 2010)

Page 52: Image, Mouvement, Vision 3D - École Polytechnique

52

X-ENS-UPS – GLB – 13/05/2011 – T103

Plan

• Contexte• Deux problèmes typiques• Du 2D au 3D• Evolutions

• Algorithmes et architectures de calcul• Co-conception• Echanges avec le haut-niveau

• Conclusions

X-ENS-UPS – GLB – 13/05/2011 – T104

Evolutions

Traitement AcquisitionInterprétation

Décision

Capteur Haut-niveauBas-niveau

5 – Interaction bas-niveauet haut-niveau

Page 53: Image, Mouvement, Vision 3D - École Polytechnique

53

X-ENS-UPS – GLB – 13/05/2011 – T105

Interactions bas-niveau et haut-niveau

• Approche par primitives• 1990 : description géométrique

de complexité croissante• points de contours, contours, graphes, etc.• décision sur les descriptions complexes

• typiquement : matching de sous-graphes

la décision « l’objet est dans la scène » ne peut être prise que sur une structure géométrique

formée de contours

Images issues de la demoSIFT (Lowe, 05)

X-ENS-UPS – GLB – 13/05/2011 – T106

Interactions bas-niveau et haut-niveau

• 2000 : la décision est prise directement surdes associations de primitives individuelles

• primitives locales mais très informatives• la star : SIFT (Lowe 1999, 2004)

• descripteur = histogrammes d’orientation de gradients

Images et résultats issus de la demoSIFT (Lowe, 05)

Chaque flèche désigne une primitive SIFTqui a une certaine

échelle et orientation

Un algorithme très simple fait l’association des SIFT. Cette association est robuste à la

rotation. La présence de l’objet est attestée par un nombre suffisant de

matchs

Page 54: Image, Mouvement, Vision 3D - École Polytechnique

54

X-ENS-UPS – GLB – 13/05/2011 – T107

Interactions bas-niveau et haut-niveau

• Très nombreuses applications des SIFT• Exemple : autostitch sur iPhone!• Application à la localisation (SLAM, PhotoTourism)

• 2004 : détection de visage par boosting ([Viola et Jones, 2004])• Primitives très nombreuses et de pertinence très variable

• Le choix des meilleures primitives pour la tâche considéréeest faite par apprentissage

• L’apprentissage est massif et long, mais la détection est très rapide

• Standard sur les appareils numériques

• Aussi une tendance actuelle enrestauration d’image

• Apprentissage sur l’imagetraitée elle-même

• Méthodes par bloc

• Ex. Inpainting par copie de texture

image tirée de w3.cloudburstresearch.com/autostitch/autostitch.html

Donnéeset traitementTrex Image

X-ENS-UPS – GLB – 13/05/2011 – T108

Interactions bas-niveau et haut-niveau

• Enseignements récents• Les succès de l’apprentissage se répercutent sur le bas-niveau

• nouveaux outils• analyse multi-échelle redondante et sélection

• histogrammes de caractéristiques

• traitement par bloc

• souvent très efficaces sur des problèmes spécifiques• localisation

• débruitage d’images « naturelles »

• Il existe cependant de nombreux contextes appliqués où le recours à ces solutions semble risqué

• Influence de l’apprentissage et décision

Page 55: Image, Mouvement, Vision 3D - École Polytechnique

55

X-ENS-UPS – GLB – 13/05/2011 – T109

Plan

• Contexte• Deux problèmes typiques• Du 2D au 3D• Evolutions• Conclusions

X-ENS-UPS – GLB – 13/05/2011 – T110

Conclusions

• Ce modèle « stratifié » de la vision est largement ob solète• co-conception• interaction avec l’étage d’interprétation• nouvelles possibilités offertes par les architectures parallèles

• Cette évolution est source de nombreuses innovation s récentes

• et à venir

Capteur Traitement bas-niveau Interprétation