Layered Depth Images for Multi-View Coding Vincent Jantet
Total Page:16
File Type:pdf, Size:1020Kb
Layered Depth Images for Multi-View Coding Vincent Jantet To cite this version: Vincent Jantet. Layered Depth Images for Multi-View Coding. Multimedia [cs.MM]. Université Rennes 1, 2012. English. tel-00758301v2 HAL Id: tel-00758301 https://tel.archives-ouvertes.fr/tel-00758301v2 Submitted on 14 Feb 2013 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. ANNÉE 2012 THÈSE / UNIVERSITÉ DE RENNES 1 sous le sceau de l'Université Européenne de Bretagne pour le grade de DOCTEUR DE L'UNIVERSITÉ DE RENNES 1 Mention : Informatique École doctorale Matisse présentée par Vincent Jantet préparée à l'unité de recherche TEMICS UMR 6074 IRISA / INRIA TraitemEnt, Modélisation d'Images & CommunicationS Université de Rennes 1 Thèse soutenue à Rennes le 23 novembre 2012 devant le jury composé de : Layered Depth Images Béatrice PESQUET Professeur, Télécom ParisTech / rapporteur for Multi-View Coding Ferran MARQUÉS Professeur, Université Polytechnique de Catalogne, Espagne / rapporteur Edmond BOYER Directeur de Recherche, INRIA Grenoble / examina- teur Aljoscha SMOLIC Ingénieur de Recherche, Disney Research, Zurich, Suisse / examinateur Christine GUILLEMOT Directeur de Recherche, INRIA Rennes / directrice de thèse Luce MORIN Professeur, INSA-Rennes / co-directrice de thèse 2 Contents Glossary 7 Résumé en français: Compression multi-vues par représentation LDI 9 1 Construction des LDI . 10 1.1 Équations de projection . 11 1.2 Construction naïve des LDI . 11 1.3 Construction incrémentale des LDI . 13 1.4 Segmentation par couche-object . 14 2 Compression des LDI . 15 2.1 Codeur MVC . 16 2.2 Codage des LDI par MVC . 16 3 Synthèse de vues . 16 3.1 Projection Ordonnée JPF (pour Joint Projection Filling)......... 17 3.2 Prise en compte de la profondeur lors du remplissage . 20 3.3 Qualité du rendu . 20 4 Résultats . 22 5 Conclusions . 23 1 General introduction 26 1.1 Historical context . 26 1.2 Present challenges . 28 1.3 Objectives . 32 1.4 Contributions . 33 1.5 Scope of the thesis . 34 2 3D content representations and compression format: a state-of-the-art 36 2.1 3D video sequences representation . 36 2.1.1 Rendering-optimized representations . 37 Multi-video with additional geometry . 37 The plenoptic function . 37 Microfacet billboarding . 38 Conclusion . 39 2.1.2 Transmission-optimized representations . 39 3 Image-based representations . 39 Model-based representations . 42 2.2 3D video coding . 43 2.2.1 Introduction . 43 2.2.2 Concepts of image and video compression . 44 Image prediction . 44 Distortion measures . 45 2D Video compression . 46 2.2.3 Multi-view video compression . 48 Simulcast Coding scheme . 49 Multi-View Coding (MVC) . 50 Multi-View plus Depth coding (MVD) . 52 I Virtual view synthesis 55 3 Background work on DIBR: State-of-the-art 57 3.1 Perspectives on projective geometry . 58 3.1.1 Homogeneous coordinates . 58 3.1.2 Perspective projection . 59 From R0 to RC ................................. 59 From RC to image plane . 60 From image plane to pixel coordinate system IC .............. 61 Summary . 61 3.1.3 Reverse equations . 62 3.1.4 Optimization . 62 3.2 Forward projection . 63 3.3 Backward projection for cracks handling . 64 3.4 Ghosting artifacts removal through boundaries detection . 65 3.5 Disocclusion filling . 65 3.5.1 Image inpainting . 66 Exemplar-based inpainting approach . 67 Inpainting methods for disocclusions filling . 68 Depth-aided inpainting method . 70 3.6 Conclusion . 71 4 Joint Projection Filling method for new DIBR 73 4.1 Joint Projection Filling method for disocclusion handling . 74 4.1.1 Disocclusion detection . 74 4.1.2 Disocclusion filling . 77 4.1.3 Results . 78 4.2 View extrapolation with full-Z depth-aided inpainting . 79 4.2.1 Full-Z depth-aided inpainting method . 81 4.2.2 Inpainting Results . 81 4 4.3 Intermediate view interpolation with Floating Texture . 85 4.4 Conclusion . 87 II Layered Depth Image (LDI) for compact 3D representation 88 5 Background work on LDI: State-of-the-art 90 5.1 Classical LDI construction . 91 5.1.1 LDI from 3D models . 91 5.1.2 LDI from real images . 92 5.1.3 LDI from multiple video plus depth sequences . 92 5.2 LDI compression schemes . 93 5.2.1 Aggregation . 94 5.2.2 Filling . 95 5.3 Conclusion . 95 6 Layer Depth Image representation 97 6.1 Compression of LDI sequences with AVC/MVC . 97 6.1.1 LDI coding with AVC/MVC . 98 6.1.2 Experimental results . 98 6.2 Incremental-LDI (I-LDI) . 100 6.2.1 Incremental scheme for LDI construction . 101 6.2.2 Experimental results . 103 6.2.3 Conclusion . 105 6.3 Object-based LDI . 106 6.3.1 Object-based classification . 107 Classification with global threshold . 108 Classification by region growing . 108 6.3.2 Background filling by inpainting . 110 6.3.3 Results . 110 6.3.4 Conclusion . 112 6.4 LDI Rendering . 112 6.4.1 Mesh-based LDI rendering . 113 6.4.2 JPF-based view synthesis . 114 6.5 Conclusion . 115 7 Conclusion and perspectives 117 7.1 Summary of contributions . 117 7.1.1 Virtual view synthesis . 117 Joint Projection Filling method . 118 Pixel confidence measure for ghosting removal . 118 Full-Z depth-aided inpainting . 118 Texture registration with texture misalignments handling . 119 Conclusion . 119 5 7.1.2 LDI processing . 119 LDI compression . 120 Incremental LDI . ..