UNIVERSIDAD CARLOS III DE MADRID Escuela Politécnica Superior Ingeniería de Telecomunicación Proyecto Fin de Carrera Análisis y caracterización de técnicas para el Filtrado de Contenidos digitales en el acceso a Internet y las nuevas Tecnologías. Autor: Mercedes Núñez Mayor Tutor: Marcelo Bagnulo Braun Octubre 2015 Ingeniería Telemática Universidad Carlos III Madrid Ingeniería Superior de Telecomunicación Índice Introducción ............................................................................................................................ 7 i. Motivación .................................................................................................................. 8 ii. Objetivos ..................................................................................................................... 9 iii. Resumen ............................................................................................................... 10 CAPÍTULO 1: Estado del arte ............................................................................................. 12 1. Introducción .............................................................................................................. 12 2. El origen del análisis de contenidos ......................................................................... 12 2.1. Concepto ............................................................................................................... 12 2.2. Definiciones de análisis de contenido .................................................................. 13 2.3. Antecedentes de las técnicas de análisis de contenidos ........................................ 15 2.3.1. Propuestas metodológicas ................................................................................ 15 2.3.2. Aparición de los programas de ordenador ........................................................ 16 2.4. Características básicas .......................................................................................... 17 2.4.1. Definición del objeto de análisis ...................................................................... 17 2.4.2. Definición de la unidad de análisis ................................................................... 17 2.4.3. Sistema de codificación .................................................................................... 19 2.4.4. Sistema de categorías........................................................................................ 20 2.4.5. Inferencia .......................................................................................................... 20 2.5. Fiabilidad .............................................................................................................. 21 2.6. Tipos de modelos .................................................................................................. 22 3. El origen de Internet y de la navegación .................................................................. 23 3.1. Comienzos de Internet .......................................................................................... 24 3.2. Evolución del uso de Internet ............................................................................... 27 3.3. Evolución de usuarios de Internet ........................................................................ 30 CAPÍTULO 2: Diseño de un sistema de análisis de contenidos de Internet ........................ 35 1. Introducción a las técnicas de clasificación .............................................................. 36 1.1. Agrupaciones de páginas ...................................................................................... 36 1.2. Análisis del contenido de un sitio web ................................................................. 38 2. Aplicación de las técnicas de clasificación............................................................... 41 2.1. Categorías de contenidos ...................................................................................... 41 2.2. Sistemas de clasificación normalizados ............................................................... 41 2.2.1. RSAC ................................................................................................................ 42 2.2.2. SafeSurf ............................................................................................................ 43 2.3. Análisis de textos .................................................................................................. 43 2.3.1. Análisis de la URL ........................................................................................... 45 2.3.2. Análisis del contenido devuelto por el servidor ............................................... 46 3. Arquitectura de un sistema de filtrado de contenidos .............................................. 46 3.1. Diseño de la solución ............................................................................................ 47 3.2. Descripción e implementación ............................................................................. 47 4. Constitución de un sistema modular de filtrado de contenidos ................................ 48 2 Universidad Carlos III Madrid Ingeniería de Telecomunicación 4.1. Descripción del proceso de análisis de contenidos ............................................... 48 4.2. Página de bloqueo ................................................................................................. 49 4.3. Experiencia de usuario.......................................................................................... 50 4.4. Diagrama de comunicación .................................................................................. 52 CAPÍTULO 3: Entorno de pruebas y resultados obtenidos ................................................. 55 1. Introducción .............................................................................................................. 55 2. Entorno de pruebas ................................................................................................... 55 2.1. Características del servidor proxy ........................................................................ 55 2.1.1. Procesador ........................................................................................................ 55 2.1.2. Tamaño de disco ............................................................................................... 56 2.1.3. Memoria RAM ................................................................................................. 56 2.1.4. Interfaces de red................................................................................................ 56 2.1.5. Sistema Operativo ............................................................................................ 56 2.2. Arquitectura de red ............................................................................................... 56 2.2.1. Topología de red ............................................................................................... 56 2.2.2. Diagrama de la arquitectura de red ................................................................... 58 2.2.2.1. Internet .............................................................................................................. 58 2.2.2.2. Cliente PC ......................................................................................................... 60 2.2.2.3. Servidor proxy .................................................................................................. 61 2.3. Pruebas y resultados obtenidos ............................................................................. 61 2.3.1. Modelado del tráfico ......................................................................................... 61 2.3.2. Latencia ............................................................................................................ 65 2.3.3. Rendimiento ..................................................................................................... 66 2.3.4. Falsos positivos/negativos ................................................................................ 68 2.3.4.1. Top 100 mundial ............................................................................................... 69 2.3.4.2. Top de contenidos de adultos ........................................................................... 70 2.3.4.3. Top 100 en España ........................................................................................... 72 CAPÍTULO 4: Análisis funcional ........................................................................................ 73 1. Introducción .............................................................................................................. 73 2. Hábitos del uso de Internet ....................................................................................... 73 3. Problemática ............................................................................................................. 75 4. Diseño de la solución ................................................................................................ 76 4.1. Topología de la solución ...................................................................................... 76 4.2. Identificación y autenticación de usuarios............................................................ 76 4.3. Definición hardware y software ........................................................................... 78 4.4. Redirección del tráfico de usuario .......................................................................
Details
-
File Typepdf
-
Upload Time-
-
Content LanguagesEnglish
-
Upload UserAnonymous/Not logged-in
-
File Pages109 Page
-
File Size-