Face Recognition for Great Apes: Identification of Primates in Real-World Environments

FakultätfürElektrotechnik und Informationstechnik der Technischen Universität Ilmenau Face Recognition for Great Apes: Identification of Primates in Real-World Environments Alexander Loos geboren am 05.05.1983, Hildburghausen, Deutschland Dissertation zur Erlangung des akademischen Grades Doktor-Ingenieur (Dr.-Ing.) Anfertigung im: Fachgebiet Elektronische Medientechnik Institut fur¨ Medientechnik Fakultät fur¨ Elektrotechnik und Informationstechnik Gutachter: Prof. Dr.-Ing. Dr. rer. nat. h.c. mult. Karlheinz Brandenburg Univ.-Prof. Dr.-Ing. habil. Gerhard Linß Dr. Tilo Burghardt Vorgelegt am: 07.05.2015 Verteidigt am: 13.01.2016 urn:nbn:de:gbv:ilm1-2016000034 iii Danksagung Die vorliegende Arbeit entstand währendmeiner Tätigkeit am Fraunhofer-Institut fürDigitale Medientechnologie in Ilmenau. Ich möchte an dieser Stelle dem Leiter des Instituts, Prof. Dr.- Ing. Karlheinz Brandenburg, fürdie Möglichkeit der Bearbeitung dieses Themas meinen Dank aussprechen. Ein besonderer Dank geht an Prof. Dr.-Ing. habil. Gerhard Linß und Dr. Tilo Burghardt fürdie Begutachtung meiner Arbeit. Ich danke außerdem Dr. Tobias Deschner für die Bild- und Videoaufnahmen, welche die Grundlage füreines der Vewendeten Datensets meiner Arbeit diente. Danke an den Zoo Leipzig und an das Wolfgang KöhlerPrimatenzentrum sowie an all die zahlreichen Assistenten und Tierpfleger fürdie Kollaboration währenddes SAISBECO Projektes. Ein herzliches Dankeschöngeht auch an Laura Aporius und Karin Bahrke für das Aufnehmen und Annotieren von zahlreichen Trainings- und Testdaten. Vielen Dank auch an alle Mitglieder des SAISBECO Projektes, allen voran Andreas Ernst, Jens Garbas und Hjalmar Kühlfürdie kreative, unkomplizierte und fruchtbringende Zusammenarbeit. Weiterhin möchte ich mich bei den zahlreichen Studenten bedanken, die maßgeblich zum Gelin- gen dieser Arbeit beigetragen haben. Ein großes Dankeschöngeht außerdem an die Mitarbeiter und Mitarbeiterinnen sowie alle Doktoranden des Fraunhofer IDMT fürdas angenehme Arbeit- sklima. Allen voran möchte ich mich bei meinen Kollegen der Gruppe Audio-visuelle Systeme, Uwe Kühhirt,Christian Weigel, Ronny Paduschek und Sascha Krämerfür eure grenzenlose Geduld und eure wertvolle Unterstützungbei Implementierungsfragen bedanken. Ein herzliches Dankeschöngeht auch an alle Mitglieder des SciBeCircles - durch unsere anregenden Meetings und fruchtbringenden Diskussionen habe ich nicht nur viel gelernt sondern konnte auch stets neue Anregungen fürmeine Arbeit gewinnen. Des Weiteren möchte ich mich bei meinen Eltern, Hans-Joachim und Christa Loos, bedanken, ohne deren finanzielle Unterstützungmein Studium, welches die Grundlagen fürdiese Arbeit legte, nicht möglich gewesen wäre. Herzlichen Dank Anja und Alina, fürEure grenzenlose Geduld und eure Unterstützungin guten wie in schweren Zeiten währendmeiner Promotion. Nicht zuletzt geht mein Dank auch an alle anderen Freunde, Kommilitonen und Bekannte, die mir eine solch schöneund unvergessliche Zeit in Ilmenau bereitet haben. v Abstract Due to the ongoing biodiversity crisis, many species including great apes such as chimpanzees or gorillas are threatened and need to be protected. To overcome the catastrophic decline of biodiversity, biologists recently started to use remote cameras for wildlife monitoring. However, the manual analysis of the resulting image and video material is extremely tedious, time consuming, and highly cost intensive. To overcome the burden of exhaustive routine work, this thesis explores a novel applica- tion of computer vision: Automatic detection and identification of primates in visual footage. Based on the assumption that humans and our closest relatives - the great apes - share similar properties of the face, algorithms for human face detection and recognition are adapted and extended in order to identify chimpanzees and gorillas in their natural habitats. The thesis proposes and evaluates an algorithmic framework comprising detection, alignment, and identification of primate faces in images and videos which is robust to various poses, chal- lenging lighting, clutter, and partial occlusion among other extrinsic and intrinsic factors present in real-world environments. Free-living and captive chimpanzees and gorillas serve as sample species to demonstrate the feasibility but also highlight limitations of the approach. Emphasizing on the identification part of the proposed system, first algorithms for reliable identification of primates in still images are proposed. Holistic global features and locally ex- tracted descriptors are combined using a decision-level fusion paradigm. This approach is further extended to recognize great apes in videos. After faces have been detected and tracked through the sequence, a number of quality assessment modules are applied in order to select the frames which are best suited for subsequent recognition. Furthermore, a novel frame-weighting scheme is proposed which weights the predictions of multiple frames according to the classifier’s confi- dence. Secondly, the developed algorithms are thoroughly evaluated on realistic image and video benchmark datasets annotated by experts. To show the superiority of the proposed framework, it is compared to various state-of-the-art face recognition algorithms originally developed to identify humans. In order to provide a practical proof of concept, the proposed algorithms are integrated into a unified full-automatic prototypical implementation currently used by biologists and ecologists to estimate population sizes faster and more precisely than current approaches. Thus, the proposed Primate Recognition Framework (PRF) has the potential to open up new venues in efficient wildlife monitoring and can help researchers to develop innovative protection schemes in the future. vii Zusammenfassung Aufgrund des gegenwärtigen Artensterbens sind viele Spezies, einschließlich Menschenaffen wie Schimpansen und Gorillas, vom Aussterben bedroht. Daher gewinnt die Uberwachung¨ der ak- tuellen Bestände mittels autonomer Aufnahmegeräte zunehmend an Bedeutung. Die manuelle Auswertung solcher Daten ist jedoch extrem muhsam,¨ zeitaufwändig und kostenintensiv. Um der immer größer werdenden Datenflut Herr zu werden, untersucht diese Arbeit ein neu- es Anwendungsgebiet der Bildverarbeitung und des maschinellen Sehens: Automatische De- tektion und Identifikation von Primaten in Bildern und Videos. Basierend auf der Annahme, dass Menschen und unsere nächsten Verwandten ähnliche Charakteristika des Ge- sichts aufweisen, werden in dieser Arbeit Algorithmen zur Erkennung menschlicher Gesichter erweitert um Schimpansen und Gorillas in ihrem naturlichen¨ Lebensraum zuverlässig identifizieren zu können. Die Dissertation beschreibt und evaluiert ein algorithmisches System bestehend aus Detektion, Ausrichtung und Identifikation von Primatengesichtern in Bildern und Videos. Die vorgeschlagenen Algorithmen sind dabei robust gegenuber¨ verschiedenen Posen, Beleuch- tungsbedingungen und partiellen Verdeckungen sowie anderen Faktoren wie sie häufig in realen Anwendungsszenarien auftreten. Die Leistungsfähigkeit, aber auch Grenzen des Systems werden ausfuhrlich¨ anhand von Datensets freilebender und gefangener Schimpansen und Gorillas diskutiert. Mit dem Fokus auf die individuelle Erkennung werden zuerst Algorithmen fur¨ eine zuverlässige Erkennung von Primaten in Bildern vorgestellt. Holistische Merkmale sowie lokale Deskriptoren werden mittels einer Entscheidungsfusion kombiniert. Anschließend wird dieser Ansatz auf die Erkennung von Menschenaffen in Videos erweitert. Nach der Detektion und Verfolgung von Gesichtern werden Module zur Qualitätsbeurteilung angewandt, um Frames zu identifizieren, die sich am besten fur¨ die folgenden Gesichtserkennungsalgorithmen eignen. Weiterhin wird ein neuartiger Frame-Weighting-Algorithmus beschrieben, welcher basierend auf der Konfidenz des Klassifikators die Resultate mehrerer Frames gewichtet. Des Weiteren werden die entwickelten Algorithmen auf realistischen, von Experten annotierten Bild- und Videodatenbanken, sorgfältig evaluiert. Um die Vorteile des vorgeschlagenen Systems zu demonstrieren, wird es mit anderen dem Stand der Technik entnommenen Algorithmen zur Gesichtserkennung verglichen. Die implementierten Algorithmen wurden in einer prototypischen Anwendung zusammen- gefuhrt,¨ welche derzeit von Biologen genutzt wird um Populationsgrößen schneller und genauer schätzen zu können. Daher hat das entwickelte Primate Recognition Framework (PRF) das Potential, den Weg zu effizienteren Monitoringverfahren zu ebnen und damit zukunftig¨ Wis- senschaftlern zu helfen, neue innovative Schutzmaßnahmen zu entwickeln. Contents ix Contents Danksagung iii Abstract v Zusammenfassung vii Contents viii 1. Introduction 1 1.1. Motivation.......................................1 1.2. Wildlife Monitoring: A Brief Introduction......................2 1.3. Problem Outline and Contributions..........................4 1.4. Thesis Overview....................................6 2. Background 9 2.1. Chapter Overview...................................9 2.2. Visual Descriptors...................................9 2.2.1. Global Features................................. 10 2.2.2. Local Descriptors................................ 16 2.3. Feature Space Transformations............................ 19 2.3.1. Principal Component Analysis (PCA).................... 20 2.3.2. Linear Discriminant Analysis (LDA)..................... 20 2.3.3. Locality Preserving Projections (LPP)...................

Face Recognition for Great Apes: Identification of Primates in Real-World Environments

Behind the Mask the Real Face of Corporate Social Responsibility Contents Christian Aid/Liz Stuart

Hyper-Realistic Face Masks: a New Challenge in Person Identification

A Multi-Dimensional Study of the Emotion in Current Japanese Popular Music

From" Morning Sun" To" Though I Was Dead": the Image of Song Binbin in the "August Fifth Incident"

Law, Virtual Reality, and Augmented Reality

The Recording Industry in Japan 2008 CONTENTS

Space In-Between: Masumura Yasuzo, Japanese New Wave, And

Stardigio Program

Virtual & Real Face to Face Teaching

The Real Face of Russia

Karaoken Presenteras Av Sveriges J-Rock-Förening

Japanese Children's Books at the Library of Congress: a Bibliography of Books from the Postwar Years, 1946-1985