Informe Profesional
Total Page:16
File Type:pdf, Size:1020Kb
PEDECIBA Informática Instituto de Computación – Facultad de Ingeniería Universidad de la República Montevideo, Uruguay Tesis de Maestría en Informática Redes de Contenido: Taxonomía y Modelos de evaluación y diseño de los mecanismos de descubrimiento de contenido Pablo Rodríguez-Bocca Octubre 2005 Orientador de Tesis: Dr. Héctor Cancela Bosi Supervisor: Dr. Héctor Cancela Bosi Redes de Contenido: Taxonomía y Modelos de evaluación y diseño de los mecanismos de descubrimiento de contenido. Pablo Rodríguez-Bocca. ISSN 0797-6410 Tesis de Maestría en Informática, PEDECIBA. Reporte Técnico INCO-RT-05-xx (número en trámite). PEDECIBA. Instituto de Computación - Facultad de Ingeniería Universidad de la República. Montevideo, Uruguay, Octubre de 2005. Agradecimientos En primer lugar quiero agradecer a mi tutor, Héctor Cancela Bosi, por su apoyo y estímulo permanente. Al área de Informática del PEDECIBA por la admisión al programa de Maestría en Informática. Al programa de jóvenes investigadores de la Comisión Sectorial de Investigación Científica (CSIC), al proyecto RMS del Programa de Desarrollo Tecnológico (PDT) y al proyecto PAIR del programa de Equipos Asociados del INRIA (Francia) por su apoyo económico en distintas etapas de la maestría.Al Departamento de Investigación Operativa del Instituto de Computación y a la Administración Nacional de Telecomunicaciones (ANTEL) por permitir mi dedicación al proyecto. A mis padres, que con su esfuerzo me permitieron realizar las carreras de Ingeniería en Computación y Eléctrica, siempre fomentando en mi el ingenio y el trabajo. A mi hermana y amigos por ayudarme y disimular interés en estos temas académicos; y a mi novia por su incondicional apoyo y paciencia. Resumen En este trabajo se estudia a las Redes de Contenido en su conjunto, desde el punto de vista de su diseño y arquitectura. Una Red de Contenido es una red virtual que se monta sobre la infraestructura IP, donde se soportan búsquedas y enrutamiento en base exclusivamente al contenido. Estas redes virtuales de contenido tienen el atractivo y la flexibilidad de adecuarse a los requerimientos de cada aplicación específica en cuanto a confiabilidad, performance, anonimato, seguridad, etc. En los últimos años, se han desarrollado en distintos contextos gran cantidad de redes de contenido, incluyendo redes peer-to-peer, cooperative Web caching, content delivery network, subscribe-publish networks, content-based sensor networks, backup networks, distributed computing, collaboratives networks, instant messagings, multiplayers games y search engines. En la primera parte del trabajo se determina una taxonomía y clasificación sobre la arquitectura y diseño que presentan las redes de contenido. Esto permite especificar una serie de problemas relacionados, desde un enfoque de optimización. En particular, se concentra el estudio sobre una clase de problemas de diseño: respecto al descubrimiento del contenido en la red, donde existe un compromiso entre la publicación y la búsqueda de información. Estas redes intentan, mediante distintas técnicas, maximizar la disponibilidad del contenido presente en la red. Al encontrarse los nodos participantes limitados en su consumo de comunicación, se debe decidir si invertir en publicar los nuevos contenidos o esperar a las búsquedas de los solicitantes. Dependiendo de la dinámica del contenido en la red (tanto en las solicitud como en el alojamiento del contenido) y del costo de transmisión de una publicación o una búsqueda, se encuentra el compromiso de diseño de la red. En la segunda parte del trabajo, se presentan dos modelos para el problema del descubrimiento del contenido, uno aplicable al contexto general y otro a los nodos más comprometidos de la red: los nodos agregadores (o cache). En la amplia mayoría de las redes de gran escala existen los nodos agregadores, estos nodos tienen como finalidad disminuir el costo de participar en la red a los solicitantes y fuentes de contenido. Una de las técnicas más aplicadas en estos nodos, para minimizar el consumo de ancho de banda y la latencia, es reutilizar temporalmente consultas previas de algún contenido (el cache). Para el problema en los nodos agregadores se presenta una metodología de resolución, la cual se aplica a dos casos de estudios concretos: una red P2P para compartir archivos y el sistema DNS. Palabras clave: Redes de contenido, peer-to-peer, optimización no lineal, caching, clustering, DNS. Contenido Introducción General..................................................................................................................................... 1 1.1 Motivación......................................................................................................................................... 1 1.2 Resultados y Contribuciones........................................................................................................... 3 1.2.1 Características y Taxonomía de las Redes de Contenido y las Redes P2P........................ 3 1.2.2 Modelos para el Problema del Descubrimiento del Contenido en estas redes.................... 3 1.2.3 Metodología para la Resolución del Problema del descubrimiento en los nodos agregadores. ............................................................................................................................................ 4 1.3 Organización del Documento .......................................................................................................... 5 Contexto Tecnológico: Redes de Contenido ............................................................................................ 7 2.1 Redes de Contenido ........................................................................................................................ 7 2.1.1 Introducción .............................................................................................................................. 7 2.1.2 Fundamentos y Antecedentes................................................................................................. 8 2.1.3 Bases Conceptuales .............................................................................................................. 11 2.1.4 Características Generales ..................................................................................................... 13 2.1.5 Clasificación y Taxonomía..................................................................................................... 26 2.1.6 Conclusiones y Consideraciones Generales........................................................................ 32 2.2 Redes de Pares (Peer to Peer) ..................................................................................................... 34 2.2.1 Introducción ............................................................................................................................ 34 2.2.2 Bases Conceptuales .............................................................................................................. 34 2.2.3 Clasificación y Taxonomía..................................................................................................... 36 2.2.4 Evolución Histórica................................................................................................................. 39 2.2.5 Arquitecturas Actuales ........................................................................................................... 44 2.3 Sistema de Nombre de Dominios ................................................................................................. 48 2.3.1 Introducción ............................................................................................................................ 49 2.3.2 Bases Conceptuales .............................................................................................................. 50 2.3.3 El DNS en el Marco de las Redes de Contenido ................................................................. 57 2.4 Discusión y Conclusiones.............................................................................................................. 58 2.4.1 Problemas Asociados a la Arquitectura de las Redes de Pares......................................... 58 2.4.2 Problema de Estudio: Descubrimiento del Contenido en una Red de Contenido ............. 60 Modelo General: Problema del Descubrimiento de Contenido ........................................................... 63 3.1 CDP - Content Discovery Problem................................................................................................ 64 3.1.1 El Tiempo................................................................................................................................64 3.1.2 El Contenido y los Nodos....................................................................................................... 65 3.1.3 Estado de la Red.................................................................................................................... 66 3.1.4 Descubrimiento del Contenido: Mensajes y Restricción de Ancho de Banda.................... 66 3.1.5 Transición de Estado ............................................................................................................. 67 3.1.6 Objetivo de la Red.................................................................................................................. 68 3.1.7 Resumen ................................................................................................................................68 3.2 Aplicación del CDP a Redes Reales............................................................................................