Thèse De Doctorat De

Total Page:16

File Type:pdf, Size:1020Kb

Thèse De Doctorat De THÈSE DE DOCTORAT DE L’UNIVERSITE DE RENNES 1 COMUE UNIVERSITE BRETAGNE LOIRE École Doctorale N◦601 Mathématique et Sciences et Technologies de l’Information et de la Communication Spécialité : Signal, Image, Vision Par Thibaud TOULLIER Simultaneous characterization of objects temperature and radiative properties through multispectral infrared thermography Thèse présentée et soutenue à L’IFSTTAR - CENTRE DE NANTES , le 6 Novembre 2019 Unité de recherche : Inria Thèse N◦ : Rapporteurs avant soutenance : Xavier MALDAGUE Full Professor Université Laval - Québec Christophe PRADÈRE Directeur de Recherche Universite de Bordeaux Composition du jury : Président : Guillaume MOREAU Professeur des Universités École Centrale de Nantes Examinateurs : Xavier MALDAGUE Full Professor Université Laval - Québec Christophe PRADÈRE Directeur de Recherche Université de Bordeaux Alexia GORECKI Ingénieure R&D LYNRED Dir. de thèse : Laurent MEVEL Directeur de Recherche Inria Co-dir. de thèse : Jean DUMOULIN Chargé de Recherche IFSTTAR Invité(s) : Laurent IBOS Maître de Conférence Université Paris-Est Créteil There is no real ending. It’s just the place where you stop the story. Franck Herbert À Mélina et Naomi Remerciements Je souhaite remercier avant tout mes encadrants qui m’ont accompagné durant ces trois années. En premier lieu, merci à Jean Dumoulin pour l’ensemble des remarques scientifiques qui ont concrétisé cette thèse. Au-delà des échanges professionnels, merci pour ta compréhension, ta patience ainsi que tes conseils avisés. Je remercie également Laurent Mevel pour nos discussions très pertinentes qui ont beaucoup ap- porté dans la thèse et ce jusqu’aux derniers instants. Mes différentes visites à Rennes ont à chaque fois permis une grande progression dans mes travaux. Ainsi, l’implication des différents membres d’I4S fût très bénéfique. En particulier, je tiens à re- mercier Qinghua Zhang pour les échanges que nous avons eu qui ont fait mûrir ma thèse. Même si je n’ai pas toujours compris l’ensemble des remarques immédiatement, celles-ci se sont avérées perti- nentes et m’ont fait de prendre du recul sur mes travaux. De la même manière je souhaite remercier Frédéric Gillot pour le temps passé à réfléchir à mes équations. Merci notamment pour ta pédagogie et pour m’avoir présenté le Krigeage qui fût finalement un point-clé de ces travaux. Je remercie l’IFSTTAR, l’Inria ainsi que la région Bretagne pour avoir financé cette thèse. Je remercie Guillaume Moreau pour avoir bien voulu présider mon jury. Des remerciements aussi aux rapporteurs Xavier Maldague et Christophe Pradère pour leur examen minutieux du manuscrit ainsi que leurs remarques qui ont permis de finaliser et d’éclaircir certains points. J’adresse également des remerciements à Alexia Gorecki qui a accepté de faire partie du jury et Laurent Ibos pour avoir assisté à la soutenance et m’avoir suivi lors du comité de suivi de thèse. Je souhaite aussi remercier Sébastien Bourguignon de l’École Centrale Nantes pour m’avoir offert l’opportunité de donner des cours mais aussi de m’avoir guidé dans ce processus. D’une manière moins académique, ces trois années de thèses furent une expérience personnelle épanouissante, notamment grâce à l’ambiance qui règne au sein du laboratoire SII et de l’équipe I4S. Les différents collègues (permanents, stagiaires, doctorants et post-docs) rencontrés ont été une source d’enrichissement. Merci ainsi à Louis-Marie Cottineau à qui je souhaite une bonne retraite et à Vin- cent Le Cam (aérobic) les directeurs successifs du laboratoire. Des remerciements aussi à l’ensemble des chercheurs avec qui j’ai pu intéragir, Vincent Baltazar, David Bétaille, Xavier Chapeleau et Alex Coiret. Je me dois de saluer aussi l’ensemble des collègues qui contribuent à cette bonne entente : Yveline pour son travail de l’ombre, Ivan pour l’animation des débats autour du café, Quentin pour ses goûts musicaux, Jean-Luc pour ses connaissances en champignons et ses connaissances tout court, Jean-Marc pour nos échanges sur le traitement d’images et Jean-Philippe pour ses conseils de bricoleur. Je pense aussi à ceux qui ont été de passage et qui l’ont marqué, Ludo pour ne citer personne. Une pensée à tous les autres doctorants qui vont bientôt soutenir. Dernière ligne droite Shreedhar ! Courage Antoine, tu es le prochain sur la liste, bonne chance pour tes futures fonctions. Salut à toi Arthur à qui je n’aurais jamais dû dire que je voulais faire un triathlon, quelle idée ! Merci au futur docteur David pour tous les échanges que nous avons pu avoir et que nous aurons sur Kalman et l’informatique en général (enfin quelqu’un qui comprend mes délires informatiques !). Courage pour la suite ! Merci à tous mes collègues de bureau, notamment Guillaume qui a eu le courage de se reconvertir en architecte Java. Une grande pensée pour Nico qui m’a emmené dans des drôles d’aventures (encore désolé pour la boule noire) et qui a répondu à mes nombreuses questions mathématiques. Profite bien de la campagne, je publierais une version du jeu python un jour. Enfin, merci à Martin maître-pneu investisseur, le petit dernier du bureau qui regorge d’idées innovantes. Accroche-toi, la route est longue mais le jeu en vaut la chandelle ! Merci à Emacs pour me simplifier la vie. Mes remerciements les plus chaleureux s’adressent à toute ma famille et à ma belle-famille qui n’ont cessé de me soutenir et de m’aider durant ces années, notamment pour que la maison avance. Je termine ces pensées avec toi Mélina. Tu as été mon soutien le plus fort grâce à ta présence à mes côtés au jour le jour et tous les sacrifices que cela a représenté. Il y a une part de toi dans l’aboutissement de ces travaux. En cette fin de thèse, tu m’as offert la plus belle rencontre qui soit et il est ainsi temps de démarrer notre nouvelle vie à trois. Résumé étendu en Français Introduction e travail réalisé dans cette thèse s’inscrit dans un contexte de développement croissant de l’utili- sation de nouvelles technologies pour la surveillance de structures. Le contrôle de santé des L infrastructures est primordial afin d’assurer la pérennité des réseaux de transports et des con- structions. Au regard des récents évènements en Italie, la prévention et la réparation des infrastruc- tures est un enjeu à la fois social et économique. Pour pallier la vétusté des structures, des moyens de mesures afin de quantifier leur état sont nécessaires. En particulier, l’utilisation de caméras in- frarouges bas-coûts pour la surveillance long-terme d’infrastructures est prometteuse grâce aux ré- centes avancées technologiques du domaine. En effet, les derniers développements technologiques ainsi que la miniaturisation des détecteurs infrarouges non-refroidis permettent d’avoir des caméras bas-coûts et faciles à mettre en œuvre. La thermographie infrarouge vise alors à fournir une mesure sans-contact et plein champs de la température. Cependant, une mesure précise de la température des surfaces observées in-situ se heurte au manque de connaissance des propriétés radiatives de la scène. En effet, la thermographie infrarouge permet de mesurer un flux radiatif arrivant à la caméra. Cependant, ce flux est la résultante de différentes contributions radiatives : l’émission propre de l’objet, perme- ttant de remonter - en théorie - à sa température, mais aussi l’atmosphère, le soleil, les autres objets environnants de la scène, l’optique de la caméra, etc. Une étude bibliographique de la mesure par thermographie infrarouge ainsi que l’écriture des équa- tions du transfert radiatif met en exergue ce phénomène complexe multi-varié. De cette étude se dé- gage trois voies d’amélioration de la précision de la mesure par thermographie infrarouge. Surveillance long-terme d’infrastructures par thermographie infrarouge Dans un premier temps, il est montré que la correction des paramètres environnementaux in- hérents à la mesure ainsi que l’exploitation de données issues d’une instrumentation multi-capteurs permettent d’accroître la précision de la mesure. Dans l’optique d’une mesure précise, les processus de calibration spatiale et thermique sont tout d’abord présentés. Afin d’exploiter l’ensemble des don- nées provenant d’une instrumentation multi-capteurs, un logiciel de visualisation et de traitement est présenté. En particulier, un module YAML permet un traitement d’un large nombre de données par lots ; facilitant ainsi l’ensemble du processus. L’interface graphique du logiciel permet une vue d’ensemble des mesures et assiste les utilisateurs dans l’exploitation des données. Le modèle de conversion des im- Figure 1: Principe de la mesure par thermographie infrarouge: le flux résultant dépend de l’environnement et des différentes réflections de la scène. ages infrarouges en niveaux numériques vers la température est parallélisé par une approche GPGPU (General-purpose processing on graphics processing units), afin d’obtenir un logiciel de traitement efficace. Ensuite, l’exploitation des données multi-capteurs montre qu’il est possible d’améliorer l’estimation de la température. De plus, des solutions faisant usage de bases de données climatiques en ligne et libres d’accès sont proposées pour pallier tout manque d’instrument de mesure. Enfin, une étude de sensibilité des différents paramètres est menée. Il apparaît alors que l’émissivité, propriété radiative propre à tout matériaux, est un facteur prépondérant dans l’estimation de la tem- pérature ; nonobstant l’usage de données multi-capteurs. Par conséquent, des méthodes d’estimation conjointe d’émissivité et de température sont proposées dans la suite. Simulateur multi-spectral de scènes 3D Dans un second temps et dans l’optique d’évaluer les méthodes d’estimation conjointe d’émissivité et de température, un simulateur de scènes 3D complexes dans l’infrarouge a été étudié et développé. Suite à une étude bibliographique, la méthode des radiosités progressives est sélectionnée pour son approche par éléments finis.
Recommended publications
  • Lecture 6: Camera Computation and the Essential Matrix
    Computer Vision Lecture 6 2020-02-05 Lecture 6: Camera Computation and the Essential Matrix 1 Computing Cameras From the Fundamental Matrix In Lecture 5 we considered the two-view structure from motion problem, that is, given a number of measured points in two images we want to compute both camera matrices and 3D points such that they project to the measurements. We showed that the 3D points can be eliminated from the problem by considering the fundamental matrix F . If x is an image point belonging to the fist image and x¯ belongs to the second then there is a 3D point that projects to to these if and only if the epipolar constraint x¯T F x = 0 (1) is fulfilled. Using the projections of 8-scene points we can compute the fundamental matrix by solving a homo- geneous least squares problem (the 8-point algorithm). What remains in order to find a solution to the two-view structure from motion camera is to compute cameras from F and finally compute the 3D-points. In general we may assume (see Lecture 5) that the cameras are of the form P1 = [I 0] and P2 = [A e2] where T e2 is the epipole in the second image. Since we know that F e2 = 0 we can find e2 by computing the null space T of F . In what follows we will show that A = [e2]×F gives the correct epipolar geometry and therefore solution for the second camera is given by P2 = [[e2]×F e2] : (2) The Fundamental matrix of the camera pair P1 and P2 is according to Lecture 5 given by [t]×A = [e2]×[e2]×F we need to show that this expression reduces to F .
    [Show full text]
  • Table of Contents Stereopsis
    CS-9645 Introduction to Computer Vision Techniques Winter 2020 Table of Contents Stereopsis................................................................................................................................................... 1 The Correspondence Problem............................................................................................................... 1 Epipolar Geometry................................................................................................................................ 2 Estimating the Essential and Fundamental Matrices.............................................................................5 Algorithm.............................................................................................................................................. 5 Locating Epipoles..................................................................................................................................6 Rectification.......................................................................................................................................... 7 3D Reconstruction.................................................................................................................................8 Stereopsis In stereopsis, two visual sensors are used in order to obtain the depth of scene points, as an attempt the reconstruct the observed scene. Image features from one image must correlate with the features observed in the other image. This is commonly known as the correspondence problem. Once
    [Show full text]
  • Monitoring Mountain Cryosphere Dynamics by Time Lapse Stereo Photogrammetry
    ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Volume V-2-2020, 2020 XXIV ISPRS Congress (2020 edition) MONITORING MOUNTAIN CRYOSPHERE DYNAMICS BY TIME LAPSE STEREO PHOTOGRAMMETRY ∗ G. Marsy1,2,3,, F. Vernier1, X. Bodin2, D. Cusicanqui2,4, W. Castaings3, E. Trouve´1 1 Univ. Savoie Mont Blanc, LISTIC, 74000 Annecy, France 2 CNRS, EDYTEM, Univ. Savoie Mont Blanc, 73000 Chambery,´ France 3 TENEVIA 38240 Meylan, France 4 Universite´ Grenoble Alpes, Institut de Geosciences´ de l’Environement (IGE, UMR 5001), 38000, Grenoble France Commission II, WG II/4,5 KEY WORDS: Photogrammetry, Cryosphere monitoring, Stereo time lapse, Image registration ABSTRACT: In this paper, we propose a method to monitor surface dynamics in mountain cryosphere environments, based on a device with two fixed cameras at two different locations and with a convergent angle. Computer vision methods are used to derive pixel displace- ments between images taken at different times and to reconstruct the 3D geometry of the scene to convert pixel displacements into meter displacements. The proposed methods overcome the drawbacks of traditional methods such as lack of time repeatability or lack of spatial resolution. We present the results on two study sites instrumented with the device located in the French Alps: a temperate glacier and a rock glacier. We propose different ways to assess the accuracy of each processing steps solely based on stereo images. The method is validated using traditional measurements (GPS and LiDAR) and shows results comparable or even more robust than these traditional methods. 1. INTRODUCTION Rasmussen, 1986). Nowadays, the increase in sensor resol- ution and the digital nature of the images, coupled with new The methods to monitor mountain cryosphere, such as glaciers algorithms, allow movements of a few centimeters to be detec- and rock glaciers dynamics rely on two classical approaches: ted (Roncella et al., 2014).
    [Show full text]
  • Essential' Matrix
    Recovering Baseline and Orientation from ‘Essential’ Matrix Berthold K.P. Horn January 1990 Abstract: Certain approaches to the problem of relative orientation in binocular stereo (as well as long-range motion vision) lead to an encoding of the baseline (translation) and orientation (rotation) in a single 3 × 3 matrix called the “essential” matrix. The essential matrix is defined by E = BR, where B is the skew-symmetric matrix that satisfies Bv = b × v for any vector v, with b being the baseline and R the orientation. Shown here is a simple method for recovering the two solutions for the baseline and the orientation from a given essential matrix using elementary matrix op- erations. The two solutions for the baseline b can be obtained from the equality 1 bbT = Trace(EET )I − EET , 2 where I is the 3 × 3 identity matrix. The two solutions for the orientation can be found using (b · b) R = Cofactors(E)T − BE, where Cofactors(E) is the matrix of cofactors of E. There is no need to perform a singular value decomposition, to transform coordinates, or to use circular functions, and it is easy to see that there are exactly two solutions given a particular essential matrix. If the sign of E is reversed, an additional pair of solutions is obtained that are related the two already found in a simple fashion. This helps shed some light on the question of how many solutions a given relative orientation problem can have. 1. Coplanarity Condition in Relative Orientation Relative orientation is the well-known photogrammetric problem of recov- ering the position and orientation of one camera relative to another from five or more pairs of corresponding ray directions [Zeller 52] [Ghosh 72] [Slama et al.
    [Show full text]
  • Generalized Essential Matrix: Properties of the Singular Value Decomposition
    Generalized Essential Matrix: Properties of the Singular Value Decomposition Pedro Miraldo1,2, Helder Araujo2 Abstract When considering non-central imaging devices, the computation of the relative pose requires the estimation of the rotation and translation that transform the 3D lines from one coordinate system to the second. In most of the state-of- the-art methods, this transformation is estimated by the computing a 6 × 6 matrix, known as the Generalized Essential Matrix. To allow a better understanding of this matrix, we derive some properties associated with its singular value decomposition. Keywords: Generalized epipolar geometry, relative pose, singular value decomposition, rigid transformation of lines. 1 1. Introduction 2 Relative pose estimation is one of the main problems in computer vision, which has been studied for more than a 3 century [1]. The goal is to estimate the rigid transformation between two cameras (or the same camera in two different 4 positions) using matching between pixels that are images of the same 3D point in the world. The cameras (or camera) 5 are considered calibrated. As a result, for each image pixel, we know the corresponding 3D projection line in the 6 world. Thus, by computing the 3D projection lines associated to each match of pixels, the problem can be seen as 7 finding the rotation and translation that align the 3D projection lines to ensure that they intersect in the world, as 8 shown in Fig. 1. One of the most important applications is its use in robotics navigation, in methods such as visual 9 odometry [2]. 10 When considering conventional perspective cameras there are several solutions for the relative pose.
    [Show full text]
  • Mathematical Methods for Camera Self-Calibration in Photogrammetry and Computer Vision
    Mathematical Methods for Camera Self-Calibration in Photogrammetry and Computer Vision A thesis accepted by the Faculty of Aerospace Engineering and Geodesy of the Universität Stuttgart in partial fulfillment of the requirements for the degree of Doctor of Engineering Sciences (Dr.-Ing.) by Rongfu Tang born in Guangdong, China P. R. Committee Chair: Prof. Dr.-Ing habil. Dieter Fritsch Committee member: Prof. Dr.-Ing habil. Christian Heipke Date of defence: 28.05.2013 Institute of Photogrammetry University of Stuttgart 2013 Deutsche Geodätische Kommission bei der Bayerischen Akademie der Wissenschaften Reihe C Dissertationen Heft Nr. 703 Rongfu Tang Mathematical Methods for Camera Self-Calibration in Photogrammetry and Computer Vision München 2013 Verlag der Bayerischen Akademie der Wissenschaften in Kommission beim Verlag C. H. Beck ISSN 0065-5325 ISBN 978-3-7696-5115-7 Deutsche Geodätische Kommission bei der Bayerischen Akademie der Wissenschaften Reihe C Dissertationen Heft Nr. 703 Mathematical Methods for Camera Self-Calibration in Photogrammetry and Computer Vision Von der Fakultät Luft- und Raumfahrttechnik und Geodäsie der Universität Stuttgart zur Erlangung der Würde eines Doktors der Ingenieurwissenschaften (Dr.-Ing.) genehmigte Abhandlung Vorgelegt von M.Sc. Rongfu Tang München 2013 Verlag der Bayerischen Akademie der Wissenschaften in Kommission beim Verlag C. H. Beck ISSN 0065-5325 ISBN 978-3-7696-5115-7 Adresse der Deutschen Geodätischen Kommission: Deutsche Geodätische Kommission Alfons-Goppel-Straße 11 ! D – 80 539 München Telefon +49 – 89 – 23 031 1113 ! Telefax +49 – 89 – 23 031 - 1283 / - 1100 e-mail [email protected] ! http://www.dgk.badw.de Hauptberichter: Prof. Dr.-Ing. habil. Dieter Fritsch Mitberichter: Prof.
    [Show full text]
  • Epipolar Geometry and the Essential Matrix
    Epipolar Geometry and the Essential Matrix Carlo Tomasi The epipolar geometry of a pair of cameras expresses the fundamental relationship between any two corresponding points in the two image planes, and leads to a key constraint between the coordinates of these points that underlies visual reconstruction. The first Section below describes the epipolar geometry. The Section thereafter expresses its key constraint algebraically. 1 The Epipolar Geometry of a Pair of Cameras Figure 1 shows the main elements of the epipolar geometry for a pair of cameras. P projection ray projection ray epipolar plane epipolar line of q J p I center of projection q epipole e baseline epipolar line of p camera C camera D center of epipole f projection Figure 1: Essential elements of the epipolar geometry of a camera pair. The world point P and the centers of projection of the two cameras identify a plane in space, the epipolar plane of point P. The Figure shows a triangle of this plane, delimited by the two projection rays and by the baseline of the camera pair, that is, the line segment that connects the two centers of projection.1 If the image planes are thought of extending indefinitely, the baseline intersects the two image planes at two points called the epipoles of the two images. In particular, if the cameras are arranged so that the baseline is parallel to an image plane, then the corresponding epipole is a point at infinity. The epipoles are fixed points for a given camera pair configuration. With cameras somewhat tilted towards each other, and with a sufficiently wide field of view, the epipoles would be image points.
    [Show full text]
  • Variational 3D Reconstruction from Stereo Image Pairs and Stereo Sequences
    Variationelle 3D-Rekonstruktion aus Stereobildpaaren und Stereobildfolgen Dissertation zur Erlangung des Grades des Doktors der Naturwissenschaften der Naturwissenschaftlich-Technischen Fakultäten der Universität des Saarlandes vorgelegt von Levi Valgaerts Saarbrücken, 2011 R S V E I T I A N S U S S A I R S A V I E N Mathematische Bildverarbeitungsgruppe, Fakultät für Mathematik und Informatik, Universität des Saarlandes, 66041 Saarbrücken Vision and Image Processing Group, Cluster of Excellence MMCI, Universität des Saarlandes, 66041 Saarbrücken ii Tag des Kolloquiums 29.09.2011 Dekan Prof. Dr. Holger Hermanns Prüfungsausschuss Prof. Dr. Bernt Schiele (Vorsitz) Universität des Saarlandes Prof. Dr. Joachim Weickert (1. Gutachter) Universität des Saarlandes Prof. Dr. Thomas Brox (2. Gutachter) Universität Freiburg Dr. Andrés Bruhn Universität des Saarlandes Kurzzusammenfassung – Short Abstract Kurzzusammenfassung – Deutsch Diese Arbeit befasst sich mit der 3D Rekonstruktion und der 3D Bewegungsschätzung aus Stereodaten unter Verwendung von Variationsansätzen, die auf dichten Verfahren zur Berechnung des optischen Flusses beruhen. Im ersten Teil der Arbeit untersuchen wir ein neues Anwendungsgebiet von dichtem optischen Fluss, nämlich die Bestimmung der Fun- damentalmatrix aus Stereobildpaaren. Indem wir die Abhängigkeit zwischen der geschätzten Stereogeometrie in Form der Fundamentalmatrix und den berechneten Bildkorresponden- zen geeignet ausnutzen, sind wir in der Lage, im zweiten Teil der Arbeit eine gekop- pelte Bestimmung der Fundamentalmatrix und des optischen Flusses vorzuschlagen, die zur einer Erhöhung der Genauigkeit beider Schätzungen führt. Im Gegensatz zu vielen existierenden Verfahren berechnet unser gekoppelter Ansatz dabei die Lage der Kameras und die 3D Szenenstruktur nicht einzeln, sonderen bestimmt sie in einem einzigen gemein- samen Optimierungsschritt. Dem Prinzip der gemeinsamen Schätzung weiter folgend kop- peln wir im letzten Teil der Arbeit die dichte 3D Rekonstruktion der Szene zusätzlich mit der Bestimmung der zugehörigen 3D Bewegung.
    [Show full text]
  • Lecture 9: Epipolar Geometry
    Lecture 9: Epipolar Geometry Professor Fei‐Fei Li Stanford Vision Lab Fei-Fei Li Lecture 9 - 1 21‐Oct‐11 What we will learn today? •Why is stereo useful? • Epipolar constraints • Essential and fundamental matrix •Estimating F (Problem Set 2 (Q2)) • Rectification Reading: [HZ] Chapters: 4, 9, 11 [FP] Chapters: 10 Fei-Fei Li Lecture 9 - 2 21‐Oct‐11 Recovering structure from a single view Pinhole perspective projection P p Ow Scene C Calibration rig Camera K Why is it so difficult? Intrinsic ambiguity of the mapping from 3D to image (2D) Fei-Fei Li Lecture 9 - 3 21‐Oct‐11 Recovering structure from a single view Pinhole perspective projection Lazebnik S. slide Courtesy Intrinsic ambiguity of the mapping from 3D to image (2D) Fei-Fei Li Lecture 9 - 4 21‐Oct‐11 Two eyes help! Fei-Fei Li Lecture 9 - 5 21‐Oct‐11 Two eyes help! ? x1 x2 K =known K =known R, T O2 O1 This is called triangulation Fei-Fei Li Lecture 9 - 6 21‐Oct‐11 Triangulation 2 2 • Find X that minimizes d ( x1 , P1 X ) d ( x 2 , P2 X ) X x2 x1 O1 O2 Fei-Fei Li Lecture 9 - 7 21‐Oct‐11 Stereo‐view geometry • Correspondence: Given a point in one image, how can I find the corresponding point x’ in another one? • Camera geometry: Given corresponding points in two images, find camera matrices, position and pose. • Scene geometry: Find coordinates of 3D point from its projection into 2 or multiple images. This lecture (#9) Fei-Fei Li Lecture 9 - 8 21‐Oct‐11 Stereo‐view geometry Next lecture (#10) • Correspondence: Given a point in one image, how can I find the corresponding point x’ in another one? • Camera geometry: Given corresponding points in two images, find camera matrices, position and pose.
    [Show full text]
  • Inaugural-Dissertation
    Inaugural-Dissertation zur Erlangung der Doktorw¨urde der Naturwissenschaftlich-Mathematischen Gesamtfakult¨at der Ruprecht–Karls–Universit¨at Heidelberg vorgelegt von Master of Mathematics and Computer Science Andreas Neufeld aus Ramenskoje (Russland) Tag der m¨undlichen Pr¨ufung: Variational Approaches for Motion and Structure from Monocular Video Betreuer: Prof. Dr. Christoph Schn¨orr Prof. Dr. Bj¨orn Ommer Zusammenfassung Das Sch¨atzen von Bewegung und r¨aumlicher Struktur aus Bildfol- gen sind grundlegende Probleme in der Bildverarbeitung. Diese Prob- lemstellungen sind noch aktuell, obwohl die ersten Methoden bereits vor mehreren Jahrzehnten ver¨offentlicht wurden. Wir pr¨asentieren neue Verfahren zur Bewegungs- und Struktursch¨atzung f¨ur das au- tonome Fahren. Ein autonomes Auto braucht genaue Kenntnis ¨uber seine Umgebung, da eine Fehleinsch¨atzung gravierende Konsequenzen haben kann. Speziell behandeln wir monokulare Verfahren, bei denen nur eine Kamera auf dem Fahrzeug verf¨ugbar ist. Bildfolgen aus dem Straßenverkehr sind f¨ur das Sch¨atzen von Be- wegung besonders herausfordernd. Durch die hohe Geschwindigkeit ist die Bewegung sehr groß, die Lichtverh¨altnisse sind nicht stabil und es kann Verf¨alschungen geben durch Reflektionen und wetterbedingte St¨orungen. Wir stellen neue diskrete Verfahren zur Berechnung des optischen Flusses vor, welche probabilistische graphische Modelle f¨ur den optischen Fluss definieren. In dem ersten Ansatz w¨ahlen wir einige Stellen im Referenzbild aus, und vergleichen diese mit dem zweiten Bild. Die besten Korresponden- zen, welche auch zu einer monokularen Bewegung passen, werden als Kandidaten f¨ur ein graphisches Modell ausgew¨ahlt. In einem weit- eren Verfahren, vergleichen wir alle Stellen im Referenzbild, l¨osen das graphische Modell jedoch nicht direkt, sondern approximieren es mit einer Sequenz von kleineren Modellen.
    [Show full text]
  • Fundamental Matrix / Image Rectification
    Fundamental Matrix / Image Rectification COMPSCI 773 S1 T VISION GUIDED CONTROL A/P Georgy Gimel’farb Epipolar Geometry • Ol,Or - projection centres – Origins of the reference frames – fl, fr - focal lengths of cameras • πl, πr - image planes – 3D reference frame for each camera: Z-axis = the optical axis T T Pl=[Xl,Yl,Zl] , Pr=[Xr,Yr,Zr] - the same 3D point P in the reference frames T T pl=[xl ,yl, zl =fl] , pr=[xr,yr, zr =fr] - projections of P onto the image planes Epipoles COMPSCI 773 1 Basics of Epipolar Geometry • Reference frames of the left and right cameras - related via the extrinsic parameters – Translation vector T = (Or - Ol) and a rotation matrix R defining a rigid transformation in 3-D space, given a 3-D point P, between Pl and Pr: Pr = R(Pl - T) • Epipoles el and er - the points at which the line through the centres of projection intersects the image planes – Left epipole - the image of the right projection centre – Right epipole - the image of the left projection centre – Canonical geometry: the epipole is at infinity of the baseline COMPSCI 773 2 Basics of Epipolar Geometry T • 3-D point P = [X,Y,Z] ⇔ its projections pl and pr: flPl f rPr pl = ; pr = Zl Zr • Epipolar plane: the plane through P, Ol, and Or – Epipolar line: its intersection with each image plane – Conjugated€ lines: both the lines for an epipolar plane – Given pl, the 3-D point P can lie anywhere on the ray pl Ol depicted by the epipolar line through the corresponding pr – Epipolar constraint: the true match lies on the epipolar line COMPSCI 773 3 Basics of Epipolar Geometry • All epipolar lines go through the epipole – With the exception of the epipole, only one epipolar line goes through any image point – Mapping between points on one image and corresponding epipolar lines on the other image ⇒ the 1-D search region – Rejection of false matches due to occlusions – Corresponding points must lie on conjugated epipolar lines • The obvious question: how to estimate the epipolar geometry, i.e.
    [Show full text]
  • Epipolar Geometry: Essential Matrix
    CS4501: Introduction to Computer Vision Epipolar Geometry: Essential Matrix Various slides from previous courses by: D.A. Forsyth (Berkeley / UIUC), I. Kokkinos (Ecole Centrale / UCL). S. Lazebnik (UNC / UIUC), S. Seitz (MSR / Facebook), J. Hays (Brown / Georgia Tech), A. Berg (Stony Brook / UNC), D. Samaras (Stony Brook) . J. M. Frahm (UNC), V. Ordonez (UVA), Steve Seitz (UW). Last Class • Stereo Vision – Dense Stereo • More on Epipolar Geometry Today’s Class • More on Epipolar Geometry • Essential Matrix • Fundamental Matrix Es#ma#ng depth with stereo • Stereo: shape from “motion” between two views • We’ll need to consider: • Info on camera pose (“calibration”) • Image point correspondences scene point image plane optical center Key idea: Epipolar constraint X X X x x ’ x ’ x ’ Potential matches for x have to lie on the corresponding line l’. Potential matches for x’ have to lie on the corresponding line l. Epipolar geometry: notation X x x ’ • Baseline – line connecting the two camera centers • Epipoles = intersec9ons of baseline with image planes = projec9ons of the other camera center • Epipolar Plane – plane containing baseline (1D family) Epipolar geometry: notation X x x ’ • Baseline – line connecting the two camera centers • Epipoles = intersections of baseline with image planes = projections of the other camera center • Epipolar Plane – plane containing baseline (1D family) • Epipolar Lines - intersections of epipolar plane with image planes (always come in corresponding pairs) Epipolar Geometry: Another example Credit: William
    [Show full text]