
Complex networks approach to modeling online social systems The emergence of computational social science TESIS DOCTORAL Przemyslaw A. Grabowicz Directores: Dr. V´ıctor M. Egu´ıluz Dr. Jos´eJ. Ramasco Ponente: Prof. Maxi San Miguel Universitat de les Illes Balears, 2013 ii Complex networks approach to modeling online social systems The emergence of computational social science Przemyslaw A. Grabowicz Tesis presentada en el Departamento de F´ısicade la Universitat de les Illes Balears PhD Thesis Directores: Dr. V´ıctorM. Egu´ıluz, Dr. Jos´eJ. Ramasco iii Tesis doctoral presentada por Przemyslaw A. Grabowicz para optar al t´ıtulo de Doctor, en el Programa de F´ısicadel Departamento de F´ısicade la Universitat de les Illes Balears, realizada en el IFISC bajo la direcci´onde Dr. V´ıctorM. Egu´ıluzy Dr. Jos´eJ. Ramasco. Visto bueno Director de la tesis Dr. V´ıctorM. Egu´ıluz Visto bueno Director de la tesis Dr. Jos´eJ. Ramasco Visto bueno Ponente Prof. Maxi San Miguel Doctorando Przemyslaw A. Grabowicz iv To my parents. vi Acknowledgments This thesis is a result of the studies that I have performed under the supervision of Victor M. Eguiluz and Jose J. Ramasco. Victor has been supervising me from the beginning of my doctoral studies, while Jose has been supervising me in the second half of my doctoral studies. Suggestions and comments of both of them have been very helpful throughout my studies and I am thankful to them for their commitment. This dissertation has been developed thanks to the support of CSIC JAE Predoc program and research projects of the Institute of Interdisciplinary Physics and Complex Systems in Palma de Mallorca. Parts of this thesis have been developed during my research stays, which were allowed by the support of the JAE Predoc and hospitality of Esteban Moro, Fil Menczer, and Alejandro Jaimes, whom I am thankful to for being open to research collaborations with me. Furthermore, I would like to thank all my collaborators that have contributed to our publications. Apart from the above mentioned scholars, I thank to Luca Maria Aiello, Bruno Goncalves, Luca Chiarandini, Michele Trevisiol, and Josep Puyol for their contributions. I also thank Luis Fernandez Lafuerza, Gideon Zenz, and Dario Taraborelli for their helpful comments and discussions on some parts of the studies. Finally, I thank all my friends from the institute who made it more enjoyable to perform the studies in the nice environment. Especially, I would like to thank Karin for occasionally interrupting me and insisting on having a tea with me. Also, I would like to thank Luis, Pedro, and Adrian for making noises and having fun while I was working. Naturally, everybody needs to take a break sometimes. I thank all the students staying in the room number 7 of our institute for creating the nice working atmosphere. vii viii Resumen La presente tesis est´adedicada a la descripci´on,an´alisisy modelado cuantitativo de sistemas complejos sociales en forma de redes sociales en internet. Mediante el uso de m´etodos y conceptos provenientes de ciencia de redes, an´alisisde redes sociales y miner´ıade datos se descubren diferentes patrones estad´ısticosde los sistemas estudiados. Uno de los objetivos a largo plazo de esta l´ıneade inves- tigaci´onconsiste en hacer posible la predicci´ondel comportamiento de sistemas complejos tecnol´ogico-sociales, de un modo similar a la predicci´onmeteorol´ogica, usando inferencia estad´ısticay modelado computacional basado en avances en el conocimiento de los sistemas tecnol´ogico-sociales. A pesar de que el objeto del presente estudio son seres humanos, en lugar de los ´atomoso mol´eculasestudia- dos tradicionalmente en la f´ısicaestad´ıstica,la disponibilidad de grandes bases de datos sobre comportamiento humano hace posible el uso de t´ecnicasy m´etodos de f´ısicaestad´ıstica. En el presente trabajo se utilizan grandes bases de datos provenientes de redes sociales en internet, se miden patrones estad´ısticosde com- portamiento social, y se desarrollan m´etodos cuantitativos, modelos y m´etricas para el estudio de sistemas complejos tecnol´ogico-sociales. Los grupos juegan un papel fundamental en sistemas sociales, como muestran numerosos estudios sociol´ogicos.Por ello, buena parte de este trabajo se centra el estudio de grupos humanos. La presente tesis contribuye al campo emergente de la ciencia social computacional en los siguientes aspectos: • Descripci´ony modelado de la evoluci´ontemporal del tama~node grupos. • An´alisisde patrones estad´ısticos de interacci´onde personas dentro y a trav´es de de grupos. • Desarrollo de m´etodos de inferencia estad´ısticapara la diferenciaci´onde grupos seg´unsu tipo. ix x • Introducci´onde un modelo de creaci´onde enlaces acoplado a movilidad que da lugar a la formaci´onde redes sociales con propiedades estad´ısticas geogr´aficasy estructurales realistas. Las distribuciones de probabilidad de tipo ley de potencias y \cola larga" son caracter´ısticasde los sistemas complejos, entre ellos las redes sociales. Usual- mente, su existencia se explica como consecuencia del mecanismo \rich-gets- richer" (el que es rico se hace a´unm´asrico) y con modelos basados en crecimiento preferente. Sin embargo, en muchos casos, el crecimiento de los elementos de un sistema dado no est´adeterminado ´unicamente por este mecanismo, sino que tambi´endepende de propiedades intr´ınsecasde los elementos. La variaci´onde es- tas propiedades entre los elementos es un origen de heterogeneidad en el sistema. El efecto de la heterogeneidad puede ser m´asimportante que el mecanismo \rich- gets-richer" y sin embargo dar lugar a las mismas distribuciones de tipo ley de potencias. De hecho, en el Cap´ıtulo2 se muestra que las propiedades estad´ısticas de grupos declarados por los usuarios en la red social Flickr pueden explicarse a partir de un modelo basado ´unicamente en heterogeneidad. A continuaci´on,pasamos del estudio de grupos declarados por usuarios al estudio de grupos de individuos detectados mediante m´etodos basados en teor´ıa de grafos. La identificaci´onde grupos es uno de los intereses centrales en ciencia de redes. En los ´ultimosa~nosse han desarrollado numerosos algoritmos para la detecci´onde comunidades en redes. Una pregunta natural concierne la relevancia de los grupos detectados con dichos m´etodos. En el Cap´ıtulo 3 se muestra, mediante el uso de bases de datos de la red social Twitter, que las interacciones dentro de y entre los grupos detectados dan lugar a propiedades estad´ısticasno triviales que corresponden a predicciones de la teor´ıade Granovetter. Esto es, las interacciones de tipo personal suceden considerablemente m´asa menudo de lo esperado dentro de los grupos, mientras que las interacciones de tipo transmisi´on de informaci´onsuceden m´asa menudo entre grupos. Adem´as,los usuarios que pertenecen a varios grupos act´uancomo puentes entre ellos, y los enlaces sociales de estos usuarios son usados m´asfrecuentemente para la difusi´onde informaci´on. Es importante se~nalarque en las redes sociales en internet los grupos pueden ser identificados de varias formas. Por un lado, los grupos pueden ser creados y declarados expl´ıcitamente por los propios usuarios, de modo que la existencia y composici´onde estos grupos puede inferirse directamente de los datos. Por otro lado, se pueden usar algoritmos de detecci´onde comunidades para identificar los grupos a partir de la estructura de la red de enlaces. En el Cap´ıtulo4, se comparan los conjuntos de grupos obtenidos mediante estos dos m´etodos y se muestra que la coincidencia entre ellos es mayor que la esperada a partir de una asignaci´onaleatoria. Adem´as,la comparaci´ones extendida mediante la consideraci´onde la natu- raleza y el tipo de los grupos, esto es, si est´anbasados en identidad com´un(grupos xi t´opicos)o en enlaces comunes (grupos sociales). En este cap´ıtulo tambi´ense es- tudia la manera de clasificar los grupos en estos dos tipos usando una gran base de datos procedente de Flickr. Para ello, se desarrollan nuevas m´etricasbasadas en las teor´ıasde la identidad com´uny del enlace com´uny se muestra que predi- cen el tipo de grupo con gran precisi´on.Finalmente, se muestra que los grupos detectados son de tipo social m´asa menudo que los grupos declarados. La ´ultimaparte de la tesis se centra en las propiedades espaciales de redes sociales en internet. De hecho, las relaciones sociales y la localizaci´onespa- cial est´anintr´ınsecamente entrelazadas, ya que a menudo la gente con la que interaccionamos y mantenemos relaciones se localizan geogr´aficamente cerca de nosotros. En el Cap´ıtulo 5, es introducido un modelo que acopla la creaci´onde enlaces sociales y la din´amicaespacial de una poblaci´on. El modelo simula el movimiento de los usuarios y crea enlaces entre ellos cuando se encuentran ge- ogr´aficamente cercanos, imitando las interacciones cara a cara. Las predicciones del modelo son comparadas con grandes bases de datos de las redes sociales Twitter, Brightkite, and Gowalla que incluyen localizaci´onespacial. El modelo reproduce varias propiedades estad´ısticasde la red social y la distancia geogr´afica entre los usuarios. Varias componentes del modelo son analizadas para identi- ficar los mecanismos m´asimportantes y entender su impacto en la red generada y sus propiedades espaciales. Por ejemplo, se muestra que la tendencia de pares de nodos enlazados a un tercero a estar enlazados entre s´ı,puede derivarse del hecho de que los nodos coinciden temporal y espacialmente. Esta tesis est´aformada por una Introducci´on,reproducciones de cuatro de mis publicaciones, Ep´ılogoy Ap´endice. Los Cap´ıtulos2, 3, 4, and 5 son repro- ducciones, respectivamente, de las siguientes publicaciones: • Grabowicz, P. A. and Egu´ıluz,V. M. (2012).
Details
-
File Typepdf
-
Upload Time-
-
Content LanguagesEnglish
-
Upload UserAnonymous/Not logged-in
-
File Pages180 Page
-
File Size-