La vision stéréo Sonka et al: sections 11.4.1, 11.4.4, 11.5.5, 11.5.6, 11.6.1 Suppl: 11.4 au...
-
Upload
roselle-boulanger -
Category
Documents
-
view
105 -
download
1
Transcript of La vision stéréo Sonka et al: sections 11.4.1, 11.4.4, 11.5.5, 11.5.6, 11.6.1 Suppl: 11.4 au...
La vision stéréo
Sonka et al: sections 11.4.1, 11.4.4, 11.5.5, 11.5.6, 11.6.1
Suppl: 11.4 au complet
vision numérique, dernière révision nov. 2008– P. Hébert
Modèle de base: la paire stéréo alignée
Définitions: Point de fixation: intersection des axes optiques cas particulier: point de fixation à l'infini
z
x
xgxd
F F
zp
d
F z
disparité laest doù ,
tion triangulade base laest où ,
p
pp
pp
dg
zFz
d
zFz
xx
la disparité (parallaxe) est au dénominateur(en fait, elle croît en s'éloignant du point defixation donc en allant vers les caméras)
Le défi: la correspondance
Deux écoles : . stéréo passive . utilisation d’éclairage structuré
Quel point correspond avec quel point ?
Charles Wheatstone, 1838
Correspondance et reconstruction 3D
PQ
Q'
P'
Ig Idpg qgpd
qd
*tirée de Forsyth
En fait n*m points possible
La perception (Julesz 60-70)
*tirée de Nalwa
Les stéréogrammes(correspondance malgré l'absence de corrélation locale dans chacune des images prises séparément)
Défi correspondance: la difficulté est
que les deux caméras ne couvrent pas exactement les mêmes parties de la scène; il y a donc en général des régions de l'image qui ne doivent pas être appariées.
La correspondance n'est pas toujours biunivoque
zones d'ombre
arête géométrique
arête de texture
fausse arêtegéométrique
ces arêtes ne sont pas toutesstables selon le point de vue!
*il peut y avoir un problème prèsdes arêtes
La correspondance hypothèses:
les points de la scène sont visibles (en général) des deux points de vue
les points correspondants sont similaires dans les images (valide surtout si les points sont beaucoup plus loin que la base de triangulation – surfaces lambertiennes)
approches: corrélation de voisinage (permet un ensemble dense
de correspondances) correspondance de caractéristiques (ensemble
éparse de correspondances). exemple: des points d’intérêt
Approche basée sur la corrélation
il faut des régions texturées et des points de vue assez semblables*
fonctionnement on sélectionne une fenêtre définissant un
voisinage dans l'image gauche on cherche la fenêtre de voisinage
correspondante le long de la droite épipolaire dans l'image de droite (si on suppose le volume d'observation fini, la disparité est limitée; on peut donc fixer un intervalle de recherche le long de la droite épipolaire en supposant une disparité initialement à 0)
*Remarque: on suppose que tous les pixels de la fenêtre ont la même disparité
Fonctions de corrélation
2
2 2
( , ') ' où u et u' sont les valeurs d'illuminance des pixels correspondants
dans les images 1 et 2 (gauche et droite) respectivement.
( , ') ( ')
( 2 ' ' ) si les deux voisinages ont le
u u uu
u u u u
u uu u
même niveau de gris moyen, alors
on peut simplement maximiser uu'!
La corrélation normalisée (insensible à une transformation ax+b).La somme est calculée dans un voisinage.
22 )''()(
)'')(()',(
uuuu
uuuuuu
On peut obtenir un niveau sous-pixel par interpolation des valeurs de corrélation.
Illustration
Voisinage u’Voisinage u
Complément: amélioration Après la première passe, on estime
la géométrie de la surface et on déforme les fenêtres de corrélation en conséquence, par un warping! (Forsyth, fig. 11.11, Faugeras et al., Lucas et Kanade 1981, Szeliski 2004)
Exploitation de contraintes unicité: un point de l'image gauche ne
peut correspondre qu'à un seul point de l'image droite
cohérence: corrélation maximum G <->D i.e. le point gauche doit être le correspondant optimal de son correspondant à droite
Ordre continuité de la disparité
* La section 11.6.1 du livre présente une section intéressante sur les contraintes.
Méthodes de mise en correspondance
méthode hiérarchiquemultirésolution(disponible dans openCV)
programmation dynamique appariement de deux séquences (le long des
épipolaires) basé sur la contrainte d’ordre
Pour plus de performance, on applique d’abordla recherche à basse résolution puis on se sertde la solution comme point de départ pour le niveau suivant.
Autre approche Exploiter la capacité de calcul des cartes
graphiques Hypothèses
sur le volume Recherche de la
photoconsistence(photohull)
Correspondance de caractéristiques
Il s’agit d’une correspondance qui n’est pas dense
Droites et points d'arêtes (perpendiculaires aux droites épipolaires) utile dans des environnements structurés
comme l'intérieur de bâtiments Points d’intérêt ** Centre de cercles (idée des capteurs laser
à triangulation)** Voir le document sur les SIFT dans les références
La reconstruction 3D une paire stéréo alignée et la
rectification la reconstruction pour le cas général
1. cas calibré (seul cas présenté ici)2. seuls les paramètres intrinsèques sont
connus (reconstruction 3D à un facteur d'échelle près)
3. cas non calibré (reconstruction à une projection près)
La rectification idée: appliquer une transformation aux deux
images pour que les droites épipolaires soient parallèles et alignées (on se retrouve donc dans le cas le plus simple)
intérêt: la recherche du point correspondant sur les droites épipolaires est grandement simplifiée
Comment rectifier?: on peut procéder en supposant connus 1- les paramètres intrinsèques et extrinsèques ou 2- non. Nous nous limiterons au premier cas.
La rectification
*tirées de Trucco
La rectification on tournera les plans images autour des centres
de projection Supposons l'origine des images au point
principal et la longueur F
t
t
t
rect
txy
yx
R
3
2
1
213
1222
1
gauche caméra la de (z)
optique axel' àet à laireperpendicu vecteur0,,1
tion triangulade base laselon axeun ,
e
e
e
eee
etttt
e
t
te
(on l'obtient en développant le produit vectoriel)
La rectification … Chaque pixel de la caméra gauche devient:
Même principe pour les pixels de la caméra droite avec où R est la matrice de rotation associée à l'orientation de la caméra droite par rapport à la caméra gauche
En pratique comme on obtient des valeurs fractionnaires pour les positions de pixel, on part plutôt de l'image cible et on applique la transformation inverse pour obtenir le pixel de l'image originale à recopier. On applique alors l'interpolation bilinéaire sur l'image originale.
tg
tgct
tg
zyxz
F
zyx
Fyx
',',''
'
',','
,,
Re
p
pR
p
RRR RectRect '
C’est une homographie!
La reconstruction: cas général calibré
En pratique, à cause de l'erreur, les projecteurs ne se croisent pas.(C'est la méthode du point milieu.)
Reconstruction: cas calibré il y a différentes façons: ex: le point milieu
(Hartley, dans son article Triangulation, critique cette méthode. Il minimise plutôt la distance entre la projection du point 3D dans les images et les droites épipolaires)
les projecteurs
le segment qui lie les deux projecteurs doit être perpendiculaire à ceux-ci.
Il reste à calculer le point milieu.
d
g
b
a
pRt
p
000 ,,)( cbacba dgdg tpRppRp
Liste des méthodes méthode du point milieu approche algébrique
on écrit le système linéaire (équations de 4 plans + 3 inc.)
on cherche le point 3D qui minimise la distance aux 4 plans
minimisation de l’erreur de reprojection (bundle adjustment) on cherche le point 3D tel que sa projection dans
chacune des images est près des points image observés rectifier la paire et appliquer le calcul avec la
disparité
Remarques En pratique, on calibre la paire stéréo au
moyen d'une cible. On obtient la transformation entre la cible et chacune des caméras. Il faut alors composer ces transformations pour obtenir la transformation entre chacune des caméras. (schéma au tableau)
Une approche plus stable consiste à imposer une contrainte de rigidité entre les deux caméras.
Fin du bloc de base Un sujet de recherche très actif au
cours des dernières années: la stéréoscopie multivue
Site de référence: vision.middlebury.edu/stereo