Big Intelligence. Nuevas Capacidades Big Data Para Los Sistemas De
Total Page:16
File Type:pdf, Size:1020Kb
MINISTERIO innovación DE INDUSTRIA, ENERGÍA Y TURISMO y creatividad big intelligence nuevas capacidades big data para los Sistemas de Vigilancia Estratégica e Inteligencia Competitiva Program Management Linked Data Scraping eb Semántica W Ontologías Procesamiento "V" de Big Data de Lenguaje Natural Data Science Métodos Estadísticos Machine Learning Procesamiento Big Data Bases de Datos NoSQL 60 aniversario MINISTERIO innovación DE INDUSTRIA, ENERGÍA Y TURISMO y creatividad big intelligence nuevas capacidades big data para los Sistemas de Vigilancia Estratégica e Inteligencia Competitiva 60 aniversario CRÉDITOS DIRECCIÓN DEL PROYECTO AUTOR Eduardo Lizarralde Antonio Miranda Raya Vicedecano EOI Director de Proyectos en EOI Juan Jiménez Morillas Responsable de Proyectos de Investigación EOI Libro digital en: http://a.eoi.es/bigintelligence Enlace directo en: ISBN “Cuidamos el papel que utilizamos 978-84-15061-61-8 para imprimir este libro” Fibras procedentes de bosques sos- DEPÓSITO LEGAL tenibles certificados por el Forest Stewardship Council (FSC). M-35029-2015 © Fundación EOI, 2015 www.eoi.es Madrid, 2015 Esta publicación está bajo licenciaCreative Commons Reconocimiento, Nocomercial, Compartirigual, EOI no se responsabiliza de los contenidos, (by-nc-sa). Usted puede usar, copiar y difundir este informaciones aportadas u opiniones documento o parte del mismo siempre y cuando se vertidas por los participantes en el libro, que mencione su origen, no se use de forma comercial son responsabilidad exclusiva de los autores. y no se modifique su licencia. ÍNDICE ACERCA DE LOS AUTORES ............................................................................................. | 5 | PRÓLOGO .............................................................................................................................. | 11 | Capítulo 1 PRESENTACIÓN ................................................................................................................... | 15 | Capítulo 2 VIGILANCIA ESTRATÉGICA E INTELIGENCIA COMPETITIVA ............................... | 27 | 1. Vigilancia Estratégica, Inteligencia Competitiva y Gestión del conocimiento en el siglo XX ................................................................................................................................. | 28 | 2. Vigilancia, Inteligencia, Conocimiento y Prospectiva................................................. | 37 | 3. La norma UNE 166.006:2011 “Gestión I+D+i: Sistema de Vigilancia Tecnológica e Inteligencia Competitiva” ......................................................................... | 42 | Capítulo 3 NUEVAS CAPACIDADES BIG DATA .............................................................................. | 49 | 1. “V” de Big Data ............................................................................................................................ | 50 | 2. Business Bots, Spiders, Scrapers: recuperando información desestructurada de la WEB ...................................................................................................................................... | 54 | 3. Data Science, Estadística, Inteligencia artificial, Data Mining, Investigación Operativa, Machine Learning, Procesamiento del Lenguaje Natural… el entorno de Big Data ............................................................................................................. | 65 | 4. Machine Learning ....................................................................................................................... | 80 | 5. Procesamiento de Lenguaje Natural ................................................................................ | 86 | 6. Procesamiento de Lenguaje Natural versus Machine Learning............................. | 94 | 7. Arquitectura Big Data .............................................................................................................. | 100 | 8. Ontologías, Datos Enlazados (Linked Data) y Web Semántica ............................ | 112 | 9. Gestionando el Conocimiento y la Veracidad de la información.......................... | 131 | 10. Mapeando las tecnologías Big Data y las actividades de Vigilancia Estratégica e Inteligencia Competitiva........................................................................... | 135 | | 4 | ÍNDICE Capítulo 4 DISEÑANDO SISTEMAS DE VIGILANCIA E INTELIGENCIA CON NUEVAS CAPACIDADES BIG DATA ................................................................................................ | 139 | 1. Casos de Uso y Necesidades de Vigilancia Estratégica e Inteligencia Competitiva: el estilo de pensar “Big Data” .................................................................... | 141 | 2. Fuentes de Información. Taxonomías ............................................................................... | 143 | 3. Integración de Datos ................................................................................................................ | 149 | 4. Modelo de Información: los Módulos de Entidades Estructurales de Información ............................................................................................................................ | 154 | 5. NoSQL: las Bases de Datos del Big Data......................................................................... | 165 | 6. Funcionalidades, Implementaciones e Interfaces Big Data para los Sistemas de Vigilancia e Inteligencia .................................................................................................... | 168 | Capítulo 5 FORMALIZACIÓN DEL MODELO Y LA METODOLOGÍA .......................................... | 211 | 1. Elementos del Modelo ............................................................................................................... | 212 | 2. Metodología de Diseño del Sistema de Vigilancia / Inteligencia .......................... | 215 | 3. El Modelo organizativo ............................................................................................................ | 226 | 4. Puesta en marcha mediante Program Management.................................................. | 229 | Capítulo 6 BIBLIOGRAFÍA Y FUENTES DE DOCUMENTACIÓN.................................................. | 235 | ACERCA DE LOS AUTORES Program Management Linked a Data Scraping eb Semántica W Ontologías Procesamiento "V" de Big Dat de Lenguaje Natural Data Science Métodos Estadísticos Machine Learning Procesamiento Big Data Bases de Datos NoSQL | 6 | ACERCA DE LOS AUTORES Autor Antonio Miranda Raya Cuenta con más de 15 años de experiencia que va desde la Gerencia en el sector de la Consultoría TIC hasta la Dirección de Sistemas de Información y departamentos TIC. Su foco actual es el diseño y dirección de iniciativas que contribuyan a la Innovación y transformación digital de las organizaciones y la sociedad. Actualmente es Director de Proyectos en EOI. Durante el año 2014 se encargó de la Dirección y Ejecución del proyecto consistente en el diseño de un Sistema Big Data de Vigilancia Estratégica e Inteligencia Competitiva del sector TIC realizado para la Secretaría de Estado de Telecomunicaciones y Sociedad de la Información del Ministerio de Industria y Turismo, proyecto tras el que surge la iniciativa de crear este libro. Es Licenciado en Informática por la UPM y Executive MBA por el IE. Ha realizado en EOI los Programas de Finanzas para Directivos, Dirección de Proyectos con Metodología PMI, el nuevo rol del Director de Servicios IT y Mapas Estratégicos y Cuadro de Mando Integral entre otros. Asimismo ha cursado programas especializados en Gestión del I+D+i en el CEU y la UPM. Colaboraciones Este libro cuenta con las siguientes colaboraciones: Dr. Asunción Gómez Pérez Es una experta en Inteligencia Artificial en el área de ontologías y Web semántica. Se licenció en informática por la Universidad Politécnica de Madrid (UPM) en 1991, y alcanzó el doctorado en Ciencias de la Computación e Inteligencia Artificial en la misma universidad en diciembre de 1993. Realizó estudios post-doctorales en el pres- tigioso Knowledge Systems Laboratory de la Universidad de Stanford, en Palo Alto (California). Habla francés e inglés, y tiene un Máster en Dirección y Administración de Empresas. Ha ganado el premio Ada Byron a la Mujer Tecnóloga en 2015. Ha sido distinguida recientemente como “una de las tres mujeres más reconocidas y con mayor presencia mundial en el amplio campo de investigación de las tecnologías semánticas. Actualmente es Catedrática en la Universidad Politécnica de Madrid (UPM). “Ontologías, Datos Enlazados (Linked Data) y Web Semántica”. Apartado 3.8. BIG INTELLIGENCE: nuevas Capacidades BIG DATA | 7 | PARA LOS SISTEMAS DE VIGILANCIA ESTRATÉGICA E INTELIGENCIA COMPETITIVA Juan Jiménez Morillas Es un especialista en prospectiva y vigilancia tecnológica, habiendo desarrollado su labor en el Observatorio de Prospectiva Tecnológica Industrial (OPTI). Actualmente es Director de Proyectos en el Vicedecanato de EOI. Su formación universitaria es de Ingeniero de Caminos, Canales y Puertos por la UPM, en la especialidad de Urbanismo y Ordenación del Territorio. Juan es también Executive MBA por la EOI. “Vigilancia Estratégica, Inteligencia Competitiva y Gestión del conocimiento en el siglo XX”. Apartado 2.2. María Poveda Villalón Es estudiante de doctorado en el Ontology Engineering Group, grupo de investigación perteneciente a la Universidad Politécnica de Madrid (UPM). En dicha universidad realizó también los estudios de Ingeniería Superior en Informática (2009) y Máster en Investigación en Inteligencia