
<p>ESCOLA TÈCNICA SUPERIOR D’ENGINYERIA <br>ELECTRÒNICA I INFORMÀTICA LA SALLE </p><p>PROJECTE FI DE CARRERA <br>ENGINYERIA EN INFORMÀTICA </p><p>PDFLab </p><p></p><ul style="display: flex;"><li style="flex:1">ALUMNE </li><li style="flex:1">PROFESSOR PONENT </li></ul><p></p><p></p><ul style="display: flex;"><li style="flex:1">Yuri González Azín </li><li style="flex:1">Mª Antonia Mozota Coloma </li></ul><p></p><p><strong>ACTA DE L'EXAMEN </strong><br><strong>DEL PROJECTE FI DE CARRERA </strong></p><p>Reunit el Tribunal qualificador en el dia de la data, l'alumne <br>D. Yuri González Azín va exposar el seu Projecte de Fi de Carrera, el qual va tractar sobre el tema següent: </p><p><em>PDFLab </em></p><p>Acabada l'exposició i contestades per part de l'alumne les objeccions formulades pels Srs. membres del tribunal, aquest valorà l'esmentat Projecte amb la qualificació de </p><p>Barcelona, </p><ul style="display: flex;"><li style="flex:1">VOCAL DEL TRIBUNAL </li><li style="flex:1">VOCAL DEL TRIBUNAL </li></ul><p>PRESIDENT DEL TRIBUNAL </p><p>Abstract <br>Este proyecto se ha encargado de desarrollar la herramienta <em>PDFLab</em>. <em>PDFLab </em>es una herramienta capaz de leer ficheros PDF y generar una estructura intermedia para implementar cualquier otro tipo de aplicaciones. </p><p>En este documento se puede apreciar todo el estudio que ha sido necesario para desarrollar este proyecto. Así como, un estudio de las aplicaciones que existen en el mercado. Y documentación técnica sobre las etapas del desarrollo, tales como, Análisis, Diseño e Implementación. </p><p>i</p><p><em>A mi padre porque este trabajo es tanto suyo como mío. </em></p><p>iii <br>Resumen <br>En este proyecto se ha desarrollado <em>PDFLab</em>, una herramienta capaz de leer ficheros PDF y generar una estructura intermedia para implementar cualquier otro tipo de aplicaciones. En el desarrollo se comprende el estudio de la estructura interna de los ficheros PDF, estudio de las técnicas de desarrollo, tanto metodológicas como de diseño, toma de requerimientos, análisis de requerimientos, diseño orientado a objetos, implementación, pruebas y mantenimiento. </p><p>En el capítulo de <strong>Introducción </strong>se proporciona el ámbito general del sistema <em>PDFLab</em>. En el capítulo de <strong>Portable Documento Format </strong>se presenta el estudio en el que se centra todo el proyecto: El Formato de Documento Portátil (PDF). </p><p>En el capítulo <strong>Técnicas de compilación </strong>se presentan un conjunto de temas de la teoría del diseño e implementación de lenguajes de programación que han sido usados a lo largo de este proyecto. </p><p>En el capítulo <strong>Estado del arte </strong>se estudia el mercado para localizar herramientas que trabajen con PDF. Éstas se han clasificado en diferentes categorías según su aplicación y uso del fichero PDF. </p><p>En el capítulo <strong>Metodología </strong>se presenta la metodología de desarrollo que ha sido utilizada a lo largo de este proyecto: Programación Extrema. </p><p>En el capítulo <strong>Requerimientos </strong>se define la Especificación de Requisitos Software (ERS) para el proyecto: <em>PDFLab</em>. Esta especificación se ha estructurado inspirándose en las directrices dadas por el estándar “IEEE <em>Recomended Practice for Software </em></p><p><em>Requeriments Specification </em>ANSI/IEEE 830 1998”. </p><p>En el capítulo <strong>Planificación </strong>se presenta el conjunto de iteraciones resultantes en el desarrollo del proyecto. </p><p>En el capítulo <strong>Análisis Orientado a Objetos </strong>se analizan los requerimientos y se definen: El modelo estático, que identifica los objetos del sistema, y el modelo dinámico, que establece la colaboración de los objetos del sistema. </p><p>En el capítulo <strong>Diseño Orientado a Objetos </strong>se presentan las tecnologías utilizadas para implementar el proyecto y los diagramas de clases de las clases principales del proyecto </p><p><em>PDFLab</em>. </p><p>En el capítulo <strong>Implementación </strong>se facilitan los diagramas de paquetes de la implementación del proyecto. </p><p>En el capítulo <strong>Estudio económico </strong>se ha realizado el estudio económico del coste del desarrollo del proyecto <em>PDFLab </em></p><p>En el capítulo <strong>Conclusiones </strong>concluye el proyecto dejando reflejadas las conclusiones y sensaciones que han ido surgiendo a lo largo del desarrollo de este proyecto. </p><p>Y por último las <strong>Líneas de futuro </strong>donde se indican que progresión tendrá el proyecto y que posibilidades futuras se pueden implementar para aprovechar todo su potencial. </p><p>v<br>Índice </p><p><strong>12</strong><br><strong>INTRODUCCIÓN................................................................................................................. 3 PORTABLE DOCUMENT FORMAT (PDF).................................................................... 7 </strong><br><strong>2.1 DEFINICIÓN ......................................................................................................................... 7 2.2 HISTORIA............................................................................................................................. 7 2.3 VERSIONES PDF................................................................................................................ 11 2.4 ESTÁNDARES ISO.............................................................................................................. 12 2.5 ISO 32000-1....................................................................................................................... 17 </strong></p><p></p><ul style="display: flex;"><li style="flex:1"><strong>3</strong></li><li style="flex:1"><strong>TÉCNICAS DE COMPILACIÓN..................................................................................... 33 </strong></li></ul><p><strong>3.1 EXPRESIONES REGULARES ............................................................................................... 33 3.2 SINTAXIS LIBRE DE CONTEXTO ........................................................................................ 34 3.3 GRAMÁTICA DE ATRIBUTOS............................................................................................. 35 </strong></p><p></p><ul style="display: flex;"><li style="flex:1"><strong>4</strong></li><li style="flex:1"><strong>ESTADO DEL ARTE......................................................................................................... 39 </strong></li></ul><p><strong>4.1 HERRAMIENTAS ................................................................................................................ 39 4.2 CLASIFICACIÓN................................................................................................................. 45 4.3 PDFLAB............................................................................................................................. 46 </strong></p><p></p><ul style="display: flex;"><li style="flex:1"><strong>5</strong></li><li style="flex:1"><strong>METODOLOGÍA ............................................................................................................... 51 </strong></li></ul><p><strong>5.1 MANIFIESTO ÁGIL ............................................................................................................ 51 5.2 PROGRAMACIÓN EXTREMA ............................................................................................. 52 </strong></p><p><strong>678</strong><br><strong>REQUERIMIENTOS ......................................................................................................... 55 PLANIFICACIÓN DEL PROYECTO ............................................................................. 61 ANÁLISIS ORIENTADO A OBJETOS........................................................................... 65 </strong><br><strong>8.1 MODELO ESTÁTICO .......................................................................................................... 65 8.2 MODELO DINÁMICO.......................................................................................................... 66 </strong></p><p></p><ul style="display: flex;"><li style="flex:1"><strong>9</strong></li><li style="flex:1"><strong>DISEÑO ORIENTADO A OBJETOS............................................................................... 69 </strong></li></ul><p><strong>9.1 TECNOLOGÍAS................................................................................................................... 69 9.2 ARQUITECTURA DEL SISTEMA Y DIAGRAMA DE DESPLIEGUE........................................ 70 9.3 DIAGRAMA DE CLASES ..................................................................................................... 71 </strong></p><p><strong>10 IMPLEMENTACIÓN ...................................................................................................... 75 10.1 DIAGRAMAS DE PAQUETES............................................................................................. 75 10.2 PRUEBAS / TESTING:....................................................................................................... 79 10.3 MANTENIMIENTO............................................................................................................ 82 </strong></p><p><strong>11 ESTUDIO ECONÓMICO................................................................................................ 85 12 CONCLUSIONES............................................................................................................. 89 13 LÍNEAS DE FUTURO...................................................................................................... 93 14 BIBLIOGRAFÍA............................................................................................................... 97 15 ANEXO ............................................................................................................................ 101 </strong></p><p>vii </p><p>Introducción </p><p>En este capítulo se introduce y se proporciona el ámbito general del sistema <em>PDFLab. </em></p><p><strong>1 Introducción </strong></p><p>En mi trabajo final de carrera tuve el placer de estudiar qué y cómo son los <em>Spiders</em>, y de cómo adquieren, a fuerza bruta, cualquier texto plano que se encuentre entre etiquetas <em>HTML</em>. Ahora bien, no cualquier información substancial, se encuentra en este formato. Como he ido encontrando a lo largo de estos años, mucha de esta información fundamental está contenida en un formato de documento portátil o, comúnmente conocido, <em>PDF</em>. </p><p>Así pues, a lo largo de todo este proyecto se centrarán todos los esfuerzos en lograr acceder a los documentos PDF y recopilar la información contenida en éstos y generar una <strong>estructura de objetos </strong>que contenga toda la información y contenido del PDF. </p><p>PDFLab </p><p></p><p>Análisis lexicográfico. Análisis sintáctico. Traducción dirigida por sintaxis. Desencriptación. Decodificación. </p><p></p><ul style="display: flex;"><li style="flex:1">Documento PDF </li><li style="flex:1">Estructura de Objetos </li></ul><p></p><p>Una vez especificada la función principal de este sistema, antes de diseñarlo e implementarlo se debe: </p><p> Realizar un estudio exhaustivo del estado del arte para reafirmar el porqué del proyecto. <br> Estudiar la estructura interna de los ficheros PDF. Analizar la estructura sintáctica de la estructura interna de los ficheros PDF. Definir la estructura de datos que se puede generar a partir de un PDF. </p><p>3</p><p>Portable Document Format </p><p>En este capítulo se presenta el estudio en el que se centra </p><p>todo el proyecto. El <strong>Formato de Documento Portátil </strong></p><p>(PDF). Este capítulo introduce históricamente los acontecimientos importantes sucedidos a lo largo del tiempo relacionados con PDF y centra el estudio en la especificación de su implementación interna, basada en la actual norma ISO 32000-1:2008. </p><p><strong>2 Portable Document Format (PDF) </strong></p><p><strong>2.1 Definición </strong></p><p>PDF (acrónimo del inglés <em>Portable Document Format</em>, formato de documento portátil) es un formato de almacenamiento de documentos, desarrollado por la empresa <em>Adobe </em></p><p><em>Systems</em>. </p><p><strong>2.2 Historia </strong></p><p>John Warnock, cofundador de <em>Adobe Systems</em>, esboza el sistema ‘<em>Camelot’</em>. El objetivo de <em>Camelot </em>es básicamente: </p><p>1991 </p><p></p><p>Capturar eficazmente documentos de cualquier aplicación. Enviar versiones electrónicas de estos documentos a cualquier parte. Ver e imprimir dichos documentos en cualquier equipo. </p><p>1992 1993 1994 </p><p>Adobe libera la primera versión de PDF, nombre en clave ‘Carousel’, en Comdex, debutando y ganando el galardón “Best of Comdex”. </p><p>El 15 de Mayo de 1993, aparecen las primeras herramientas para crear y ver documentos PDF, Acrobat y Acrobat Reader. </p><p><em>Adobe Systems </em>lanza Acrobat 2.0 junto con la versión PDF 1.1 </p><p>7</p><p>1995 1996 1997 </p><p><em>Adobe Systems </em>lanza Acrobat 2.1 junto con la versión PDF 1.1 <em>Adobe Systems </em>lanza Acrobat 3.0 junto con la versión PDF 1.2 </p><p>1998 1999 <br>2000 </p><p><em>Adobe Systems </em>lanza Acrobat 4.0 junto con la versión PDF 1.3 </p><p><em>Adobe Systems </em>lanza Acrobat 4.05 </p><p>8</p>
Details
-
File Typepdf
-
Upload Time-
-
Content LanguagesEnglish
-
Upload UserAnonymous/Not logged-in
-
File Pages113 Page
-
File Size-