Trabajo Final De Carrera : Compiladores

Total Page:16

File Type:pdf, Size:1020Kb

Trabajo Final De Carrera : Compiladores Trabajo Final de Carrera - Compiladores Enrique Marquet Durán Ingeniería en Informática Gerard Enrique Manonellas 09/01/2015 Resumen del proyecto El objetivo de este proyecto final de carrera es el estudio del formato ODF (OpenDocument Format), para permitirnos la extracción de texto con la finalidad de transformarlo en texto hablado y guardar el resultado en un archivo de audio. De los diferentes tipos de documentos que utilizan este estándar ODF nos centraremos en los de tipo texto, que tienen extensión odt. Para poder realizar una pequeña aplicación que cumpliera con el objetivo del proyecto se ha tenido que realizar un estudio de las diferentes tecnologías involucradas en esta cruzada. La primera de las tecnologías que hemos estudiado ha sido el formato del XML y las herramientas que hay para su validación, centrándonos en las DTD. Hay que tener en cuenta que la arquitectura de los archivos OpenDocument está basada en XML, ya que se trata de un archivo comprimido (tipo ZIP) formado por diversos ficheros con este formato, como se verá en el apartado de estudio correspondiente. Después también se ha realizado un estudio de los diferentes formatos de audio existentes en el mercado, no ha sido un estudio muy técnico, si no que se ha centrado más en ver qué se podía encontrar actualmente y qué diferencias existen entre ellos, para después poder utilizar un formato en la aplicación que se realizaría. Por último se ha estudiado la tecnología Text-To-Speech (conversión de texto-voz), que está muy ligada a la lingüística. En este apartado se ha visto las diferentes posibilidades que hay para realizar el proceso de conversión, así como las diferentes herramientas que hay en el mercado que lo realizan, también se buscaron librerías que permitieran realizar este proceso para introducirlo en nuestra aplicación resultante del estudio. La pequeña aplicación realizada en este proyecto final de carrera se ha nutrido de la información obtenida durante la fase de estudio de estos conceptos y tecnologías. INDICE DE CONTENIDOS Resumen del proyecto.................................................................................................................2 INDICE DE CONTENIDOS......................................................................................................3 INDICE DE FIGURAS...............................................................................................................5 Capítulo 1: Introducción............................................................................................................6 1.1 Justificación del PFC y contexto en el que se desarrolla: punto de partida y aportación del PFC...................................................................................................................................6 1.2 Objetivos del TFC...........................................................................................................7 1.3 Enfoque y método seguido..............................................................................................7 1.4 Planificación del proyecto...............................................................................................8 1.4.1 Planificación temporal.............................................................................................9 1.4.2 Descripción de las actividades...............................................................................10 1.5 Análisis de riesgos.........................................................................................................12 1.5.1 Riesgo de problemas relacionados con la investigación........................................12 1.5.2 Riesgo de problemas relacionados con la tecnología............................................12 1.5.3 Riesgo de problemas con los juegos de pruebas....................................................13 1.5.4 Riesgo derivado del no acceso a Internet..............................................................13 1.6 Productos obtenidos.....................................................................................................13 1.7 Breve descripción de los otros capítulos de la memoria...............................................14 Capítulo 2: Estudio del formato XML.....................................................................................15 2.1 Definición y objetivos...................................................................................................15 2.2 Breve historia................................................................................................................15 2.3 Características de un documento XML.........................................................................15 2.3.1 Estructura del formato XML.................................................................................16 2.3.2 Sintaxis de un documento XML............................................................................17 2.4 Validación de un documento XML................................................................................19 2.4.1 Características de una DTD...................................................................................20 2.4.2 Ventajas e inconvenientes de las DTDs.................................................................24 Capítulo 3: Estudio formato OpenOffice (ODF).....................................................................25 3.1 Breve historia de OpenOffice........................................................................................25 3.2 Introducción...................................................................................................................26 3.3 Arquitectura OpenDocument.........................................................................................26 3.3.1 Fichero content.xml...............................................................................................27 3.3.2 Fichero styles.xml..................................................................................................30 3.3.3 Fichero meta.xml...................................................................................................30 3.3.4 Fichero settings.xml...............................................................................................31 3.3.5 Fichero mimetype.xml...........................................................................................31 3.3.6 Carpeta pictures.....................................................................................................31 3.4 Tipos de documentos soportados...................................................................................31 3.5 Librerías de soporte al formato.....................................................................................32 3.5.1 Apache ODF Toolkit (incubating).........................................................................33 Capítulo 4: Formatos de audio libre.........................................................................................37 4.1 Introducción...................................................................................................................37 4.2 Tipos de formatos..........................................................................................................37 4.2.1 Matroska................................................................................................................38 4.2.2 Ogg........................................................................................................................40 4.2.3 Vorbis.....................................................................................................................42 4.2.4 FLAC (Free Lossless Audio Codec)......................................................................43 4.2.5 Formato AU (.au)...................................................................................................44 4.2.6 Formato AIFF........................................................................................................44 4.3 Librerías de desarrollo...................................................................................................45 Capítulo 5: Estudio de Text-To-Speech...................................................................................47 5.1 Introducción...................................................................................................................47 5.2 Voz sintética (Síntesis de habla)....................................................................................48 5.2.1 Problemas de la voz sintética.................................................................................48 5.3 ¿Cómo funciona esta tecnología?..................................................................................48 5.3.1 Desafíos del cliente (front-end).............................................................................49 5.4 Breve historia................................................................................................................50 5.5 Tecnologías de síntesis..................................................................................................51 5.6 Posibles aplicaciones de los sistemas TTS....................................................................51 5.7 Aplicaciones TTS..........................................................................................................52 5.7.1 Documentos...........................................................................................................53 5.7.2 Navegadores..........................................................................................................54
Recommended publications
  • An Assessment of Psychoacoustical Models in The
    Abstract A simple system for recognizing music is presented, based on various musical descriptors, num- bers that describe some aspect of the music. Various descriptors are discussed; in particular, a novel descriptor, the floor-1 cepstral coefficient (F1CC) measure, a refinement of MFCCs based on the Vorbis psychoacoustical model is presented and evaluated. Also, various forms of statistical dimensionality reduction, among them PCA and LDA, are considered in the present context. Finally, a few directions for future work are discussed. vii viii Acknowledgments First of all, I would like to thank my advisor Jan Tro, who patiently provided feedback and guidance over the course of the entire semester. However, several other people have played important roles: Greg Maxwell originally proposed the idea that eventually led to the develop- ment of F1CCs, and Chris Montgomery provided helpful guidance on the internals of the Vorbis encoder. Mette Langaas helped with various insights on statistics, in particular dimensionality reduction. H˚avard Midtkil provided his entire music collection in FLAC format as data mate- rial, saving countless hours of ripping labor. Finally, Rune Holm and Magne Mæhre proofread the manuscript at various stages, providing invaluable feedback, corrections and suggestions. ix x Contents Abstract vii Acknowledgments ix Contents xi 1 Introduction 1 1.1 MusicInformationRetrieval . ....... 1 1.2 Aimofstudy ...................................... 2 1.3 Structure ....................................... 2 1.4 Previouswork.................................... 2 2 Audio descriptors 5 2.1 Motivation ...................................... 5 2.2 Formaldescription ............................... .... 5 2.3 Desiredproperties ............................... .... 6 2.4 Distortionandnoise .............................. .... 7 2.5 Choiceofsourcefragment . ..... 9 2.6 Basicmusicaldescriptors . ...... 9 2.7 Humandescriptors ................................ 13 3 Mel frequency cepstral coefficients (MFCC) 15 3.1 Psychoacoustical motivation .
    [Show full text]
  • Uva-DARE (Digital Academic Repository)
    UvA-DARE (Digital Academic Repository) Video Vortex reader II: moving images beyond YouTube Lovink, G.; Somers Miles, R. Publication date 2011 Document Version Final published version Link to publication Citation for published version (APA): Lovink, G., & Somers Miles, R. (2011). Video Vortex reader II: moving images beyond YouTube. (INC reader; No. 6). Institute of Network Cultures. http://www.networkcultures.org/_uploads/%236reader_VideoVortex2PDF.pdf General rights It is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s), other than for strictly personal, individual use, unless the work is under an open content license (like Creative Commons). Disclaimer/Complaints regulations If you believe that digital publication of certain material infringes any of your rights or (privacy) interests, please let the Library know, stating your reasons. In case of a legitimate complaint, the Library will make the material inaccessible and/or remove it from the website. Please Ask the Library: https://uba.uva.nl/en/contact, or a letter to: Library of the University of Amsterdam, Secretariat, Singel 425, 1012 WP Amsterdam, The Netherlands. You will be contacted as soon as possible. UvA-DARE is a service provided by the library of the University of Amsterdam (https://dare.uva.nl) Download date:07 Oct 2021 Video Vortex Reader II MOVING IMAGES BEYOND YOUTUBE 2 Video Vortex Reader II MOVING ImAGES BEYOND YOUTUBE MOVING ImAGES BEYOND YOUTUBE 3 Video Vortex Reader II: moving
    [Show full text]
  • Video Vortex Reader II: Moving Images Beyond Youtube
    Video Vortex Reader II MOVING IMAGES BEYOND YOUTUBE 2 Video Vortex Reader II MOVING ImAGES BEYOND YOUTUBE MOVING ImAGES BEYOND YOUTUBE 3 Video Vortex Reader II: moving images beyond YouTube Editors: Geert Lovink and Rachel Somers Miles Copy Editor: Nicole Heber Design: Katja van Stiphout Cover Image: Team Thursday, Rotterdam Printer: Ten Klei, Amsterdam Video Publisher: Institute of Network Cultures, Amsterdam 2011 ISBN: 978-90-78146-12-4 Vortex Contact Reader II Institute of Network Cultures phone: +3120 5951866 MOVING fax: +3120 5951840 email: [email protected] IMAGES web: http://www.networkcultures.org BEYOND Order a copy of this book by sending an email to: [email protected] YOUTUBE EDITED BY A PDF of this publication can be downloaded freely at: GEERT LOviNK AND http://www.networkcultures.org/publications/inc-readers RACHEL SOMERS MilES Join the Video Vortex mailing list at: http://www.listcultures.org INC READER #6 Supported by: the School for Communication and Design at the Amsterdam University of Applied Sciences (Hogeschool van Amsterdam DMCI). The Video Vortex Reader is produced as part of the Culture Vortex research program, which is supported by Foundation Innovation Alliance (SIA - Stichting Innovatie Alliantie). Thanks to Andreas Treske, Dan Oki, Bram Crevits and the Video Vortex Steering Committee for their valuable input and editorial support. Thanks to our Culture Vortex partners: MediaLAB Amsterdam, Netherlands Institute for Sound and Vision, Netherlands Media Art Institute, Virtueel Platform, VPRO, Amsterdam City Archives, Museum Boijmans van Beuningen, IDFA, and the Urban Screens Association. (http://networkcultures.org/culturevortex/) Special thanks to all the authors for their contributions, and to Nicole Heber for her copy editing.
    [Show full text]