Reproducible Research, Software Quality, Online Interfaces and Publishing for Image Processing Nicolas Limare

Reproducible research, software quality, online interfaces and publishing for image processing Nicolas Limare To cite this version: Nicolas Limare. Reproducible research, software quality, online interfaces and publishing for image processing. Other [cs.OH]. École normale supérieure de Cachan - ENS Cachan, 2012. English. NNT : 2012DENS0026. tel-00752569 HAL Id: tel-00752569 https://tel.archives-ouvertes.fr/tel-00752569 Submitted on 16 Nov 2012 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. ECOLE´ NORMALE SUPERIEURE´ DE CACHAN Ecode´ Doctorale de Sciences Pratiques T H ESE` présentée par Nicolas Limare pour l’obtention du titre de Docteur de l’Ecole´ Normale Supérieure de Cachan spécialitémathématiques appliquées Recherche reproductible, qualitélogicielle, publication et interfaces en ligne pour le traitement d’image — Reproducible Research, Software Quality, Online Interfaces and Publishing for Image Processing présentée et soutenue le 21 juin 2012 àCachan devant le jury composéde Rapporteurs Konrad Hinsen - Centre de Biophysique Moléculaire, Orléans, FR Patrick Vandewalle - Philips Research, Eindhoven, NL Directeurs Jean-Michel Morel - ENS de Cachan, Cachan, FR Jacques Froment - Universitéde Bretagne Sud, Vannes, FR Lionel Moisan - UniversitéParis Descartes, Paris, FR Examinateurs Guillermo Sapiro - University of Minnesota, USA Gregory Randall - Universidad de la República, Montevideo, UY Thierry Geraud´ - EPITA, Kremlin-Bicêtre, FR Friedrich Leisch - Universitätfür Bodenkultur, Wien, AT Centre de Mathématiques et de Leurs Applications — CMLA UMR 8536 Ecole´ Nationale Supérieure de Cachan 61 Avenue du Président Wilson, 94235 Cachan Cedex, France In addition to institutional repositories, this work is available, with future updates, from http://nicolas.limare.net/phd/. The author can be reached at [email protected]. This work is distributed under a CC-BY-NC-SA license : Creative Commons Attribution-NonCommercial- ShareAlike 3.0 Unported License. See http://creativecommons.org/licenses/by-nc-sa/3.0/ for details. This work includes references to online resources. Permanent URLs were provided when possible and the availability of these resources was verified in May 2012, but the progressive obsolescence of these references is inevitable. version 1/registered revision 4eb11a3e - 2012-06-12 18:47:05 +0200 A produced on June 12, 2012 with LTEX and pandoc Résumé Cette thèse est basée sur une étude des problèmes de reproductibilitérencontrés dans la recherche en traitement d’image, et de manière générale dans les sciences appliquées et informatiques. Partant du constat du manque de vérifiabilitédes publications scientifiques et de implémentations associées aux algorithmes publiés, nous avons con¸cu, crééet développé un journal scientifique, Image Processing On Line1 (IPOL), dans lequel nous proposons un nouveau mode d’évaluation et de publication de la recherche en traitement d’image afin d’atteindre une meilleure fiabilitédes logiciels et algorithmes issus de la recherche. Les articles publiés dans IPOL incluent une implémentation complète des algorithmes décrits; cette implémentation est publiée, après validation par les rapporteurs qui s’assurent également que les algorithmes sont décrits complètement et avec précision. Un service web de démonstration des algorithmes publiés est joint aux articles, permettant aux utilisateurs de les tester sur des données libres avec le choix des paramètres et de consulter l’historique des expériences précédemment effectuées sur ce service. Ces extensions de la publication contribuent àplus d’échanges entre les équipes de recherche en favorisant la validation et la comparaison des résultats, la réutilisation des implémentations, et la constitution progressive d’un état de l’art vérifiable. Pour cela, nous avons tout d’abord étudiéla faisabilitéd’un système de publication et d’expérimentation basésur l’environnement web, ajoutant aux principes d’évaluation par les pairs d’un journal de recherche des contenus logiciels et des composantes interactives. Le choix de l’environnement web nous semble naturel compte tenu de l’évolution des réseaux et de leurs usages au cours des décennies précédentes, mais il limite l’interactivitéqu’on peut attendre des services de démonstration des algorithmes et la précision de l’affichage des documents publiés. Il nous place de plus dans un contexte oùles normes, standards et langages sont multiples et ne suffisent pas àdéfinir complètement l’environnement logiciel dans lequel IPOL est utilisévia les navigateurs web des visiteurs. La publication de logiciel nous a aussi amenéàune tentative de synthèse du corpus législatif appliquable aux programmes informatiques, du point de vue du droit d’auteur et du droit des inventions. Il apparaˆıt essentiellement que cette réglementation est nationale et hétérogène, et que l’association de manuscrits et logiciels en un produit unique de la recherche ne semble pas aisée tant ces deux entités disposent de statuts juridiques différents. Nous proposons dans ce contexte une politique de droits d’auteur et licences destinée àfaciliter la diffusion des travaux de recherche et leur réutilisation pour des travaux ultérieurs. La publication de logiciel est un objectif récent pour les journaux académiques, et on ne dispose pas pour le code source informatique de l’équivalent des règles qui, appliquées aux articles de recherche, définissent ce qui est publiable, et sous quelle forme. Nous proposons donc des règles en ce sens, visant àguider les rapporteurs dans leur évaluation du logiciel et contribuant àgarantir qu’une implémentation sera utilisable par le plus grand nombre, qu’elle produira des résultats identiques dans divers environnements informatiques, et qu’elle est compréhensible et vérifiable, comme un manuscrit mathématique doit l’être. Ces règles d’évaluation du logiciel sont complétées par un projet de procédure automatisée de traitement 1http://www.ipol.im/ i des implémentations avant publication, complétant l’évaluation manuelle des codes source par des tests systématiques. Les travaux de mise en place d’IPOL ont étémenés dans trois directions: la définition des critères et des procédures de validation et publication adaptéà ces nouveaux types d’articles, le développement d’outils logiciels génériques nécessaires à l’intégration des algorithmes publiés dans des services web de démonstration, et la mise en place et l’administration de ces services et outils sur une infrastructure de ressources informatiques. Après un peu plus d’une année d’activité, le projet scientifique que constitue IPOL nous apparaˆıt très bénéfique àla recherche en traitement d’image. Malgréla charge de traitement manuel qui subsiste en raison de la nouveautédu sujet et du manque d’expérience et d’outils pour une gestion plus automatisée des articles et logiciels, plus de vingt contributions ont pu être publiées, et une cinquantaine de nouveaux articles sont en préparation. La fréquentation d’IPOL montre par son volume, son origine internationale et la diversitédes expériences faites avec le service de démonstration des algorithmes que ce journal est utile au-delàde la communautéde ses auteurs. Les auteurs sont globalement satisfaits de leur expérience et estiment que le travail supplémentaire que cette forme de publication nécessite est compensépar les avantages obtenus en terme de compréhension des algorithmes, de qualitédes logiciels produits, de diffusion de leurs travaux et d’opportunités de collaboration. A` la lumière de cette expérience, on peut établir un programme de recherche ambitieux en traitement et analyse d’images adaptéàcette forme de validation et diffusion de la recherche. Disposant de définitions claires des objets et méthodes, et d’implémentations validées, il devient possible de construire des chaˆınes complexes et fiables de traitement des images. On peut également souhaiter que d’autres journaux scientifiques et groupes de recherche adoptent des méthodologies similaires. ii Abstract This thesis is based on a study of reproducibility issues in images processing and computa- tional research. From a constatation of the unverifiability of scientific publications and of the implementations associated with published algorithms, we designed, created and developed a scientific journal, Image Processing On Line2 (IPOL), in which we propose a new method for the evaluation and publication of research in image processing, in order to improve the reliability of research algorithms and software. Articles published in IPOL include a complete implementation of the algorithms. This implementation is published, after a validation by the reviewers, who shall also ensure that the description of the algorithms is complete and detailed. A demonstration web service is attached to every article, allowing users to test the algorithms on their data with their choice of parameters. The full history of the experiments previously performed with this service is also publicly available. These principles lead to further exchanges between research groups working on image processing, they promote the validation and comparison of the algorithms, the reuse of implementations, and the progressive compilation of a verifiable state of the art.

Reproducible Research, Software Quality, Online Interfaces and Publishing for Image Processing Nicolas Limare

Usask Open Textbook Authoring Guide – Ver.1.0

Odata Services Company

Tuto Documentation Release 0.1.0

Markdown Markup Languages What Is Markdown? Symbol

Assignment of Master's Thesis

Pyslet Documentation Release 0.6.20160201

Bibliography of Erik Wilde

ISO/IEC JTC 1 Information Technology

Haris Kurtagic, SL-King Jason Birch, City of Nanaimo Geoff Zeiss, Autodesk Tim Berners-Lee, in Government Data Design Issues, Proposes

The R Journal Volume 4/2, December 2012

SAP Analytics Cloud, Analytics Designer Developer Handbook

Customization of an Enterprise Request Management System