Overlapping Community Detection in Dynamic Networks Qinna Wang

Overlapping community detection in dynamic networks Qinna Wang To cite this version: Qinna Wang. Overlapping community detection in dynamic networks. Other [cs.OH]. Ecole normale supérieure de lyon - ENS LYON, 2012. English. NNT : 2012ENSL0713. tel-00701217 HAL Id: tel-00701217 https://tel.archives-ouvertes.fr/tel-00701217 Submitted on 24 May 2012 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. THESE` en vue d’obtenir le grade de Docteur de l’Ecole Normale Supérieure de Lyon SpécialitéInformatique Universitéde Lyon Laboratoire de l’Informatique du Parallélisme Ecole´ doctorale Informatique et Mathématiques présentéeet soutenue publiquement le ! Avril !# ! par Qinna Wang $$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$% Détection de communautésrecouvrantes dans des réseaux de terrain dynamiques $$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$% devant la commission d’examen composéede Rapporteurs: Anne-Marie Kermarrec) D&) Inria Rennes(*retagne "tlantique Matthieu Latapy) D&) ,NRS - UPM, Examinateurs' Pablo Jensen) D&) ,NRS - ENS de Lyon Bertrand Jouve) Professeur) UniversitéLumi/ere Lyon ! Christophe Prieur) Md,) UniversitéParis Diderot Directeur de th/ese: Eric Fleury) Professeur, ENS de Lyon aa 0 Abstract In complex net1orks) the notion of community structure refers to the presence of groups of nodes in a net1or23 4hese groups are more densely connected internally than with the rest of the net1or23 4he presence of communities inside a net1ork gives an insight on net1or2 structural properties3 5or e.ample) in social net1or2s, communities are based on common interests) location, hobbies3333 6enerally) a community structure is described by a partition of the net1or2 nodes) where each node belongs to a unique com- munity3 " more reasonable description seems to be overlappin+ community structure, where nodes are allo1ed to be shared by several communities3 Moreover) 1hen con- siderin+ dynamic net1orks whose interactions bet1een nodes evolve in time, it appears crucial to consider also the evolution of the intrinsic community structure. This thesis focus on minin+ dynamic community evolution and overlappin+ com( munity detection. 7e have proposed t1o distinct methods for overlapping community detection. The 8rst one named clique optimization and the second one called fuzzy detection. :ur clique optimization aims to identify granular overlaps and it is a 8ne grain scale approach3 :ur fu99y detection is at a coarser grain scale 1ith the strategy of identifying modular overlaps3 Their applications in synthetic and real net1orks indicate that both methods can be used for characteri9in+ overlappin+ nodes but in distinct and complementary views. 7e also propose the definition of predecessor and successor in mining community evolution3 Such definition describes the relationship bet1een com( munities at different time steps. 7e use it to detect community evolution in dynamic net1or2s and sho1 ho1 modular overlaps evolve over time. " visuali9ation tool called lineage diagrams is used to sho1 community evolution by connectin+ communities in relationship of predecessor and successor. Several cases are studied. Keywords: community detection, overlappin+ community structure) complex net( 1or2s, dynamic net1or2s, community evolution, net1or2 science Résumé Dans le conte.te des réseaux comple.es, la structure communautaire du réseau de- vient un su<et important pour plusieurs domaines de recherche. Les communautéssont en +énéral vues comme des groupes intérieurement denses3 La détection de tels groupes offre un éclairage intéressant sur la structure du réseau3 Par exemple) une communauté de pages 1eb regroupe des pages traitant du m=eme sujet3 La définition de commu( nautés est en +énéral limitée/aune partition de l’ensemble des nœuds3 Cela exclut par définition qu’un n>ud puisse appartenir /aplusieurs communautés) ce qui pourtant est naturel dans de nombreux ?cas des réseau. sociau. par exemple@3 Une autre question importante et sans réponse est l’étude des réseau. et de leur structure communautaire en tenant compte de leur dynamique. Cette th/ese porte sur l’étude de réseau. dynamiques et la détection de communautésrecouvrantes3 Nous proposons deux méthodes di;érentes pour la détection de communautés recouvrantes. La premi/ere méthode est appelée optimisation de clique3 L’optimisation de clique vise /adétecter les n>uds recouvrants granulaires3 La méthode de l’optimisation de clique est une approche /agrain 8n3 La seconde méthode est nommée détection Aoue ?fu99y detection@3 Cette méthode est /agrain plus grossier et vise /aidentifier les groupes recouvrants3 Nous appliquons ces deux méthodes /ades réseaux synthétiques et réels3 Les résultats obtenus indiquent que les deux méthodes peuvent =etre utilisées pour caractériser les nœuds recouvrants3 Les deux approches apportent des points de vue distincts et complémentaires. Dans le cas des +raphes dynamiques, nous donnons une définition sur la relation entre les communautés/adeux pas de temps consécutif. ,ette technique permet de représenter le changement de la structure en fonction du temps3 Pour mettre en évidence cette relation, nous proposons des diagrammes de lignage pour la visualisation de la dynamique des communautés3 Ces diagrammes qui connectent des communautés/ades pas de temps successifs montrent l’évolution de la structure et l’évolution des groupes recouvrantes3 Nous avons également appliquer ces outils /ades cas concrets. Mots clés: structure communautaire) communautés recouvrantes, réseau. de terrain dynamiques) évolution de communautés) réseaux comple.es Remerciements Be remercie) en premier lieu, mes rapporteurs, Mme Anne-Marie Cermarrec et Mr3 Matthieu Latapy) pour avoir acceptéla t=ache de rapporter ma th/ese3 Be remercie également Mr3 ,hristophe Prieur) M3 *ertrand Bouve et Mr3 Pablo Jensen d’avoir acceptéde prendre part /amon <ury3 Au cours des trois années qu’a duréma th/ese, <’ai eu le plaisir de rencontrer un grand nombre de chercheurs, d’enseignants et d’étudiants) avec lesquels <’ai eu le tr/es grand plaisir de travailler tout au long de cette th/ese. C’est /aeux que vont mes plus grands remerciements3 Be leur adresse ma gratitude pour l’attention, les conseils) les encouragements, la patience, l’amabilitédont ils ont fait preuve tout au long de mes travaux3 Be remercie) M. Eric 5leury pour m’avoir offert l’opportunitéde réaliser cette th/ese3 Il a diri+émon travail avec une grande justesse, une profonde humanitéet beaucoup de gaieté) ce pour quoi je le remercie infiniment3 Be remercie en particulier les membres de l’équipe D(NET ' 6uillaume Chelius) Andreea Chis, Christophe ,respelle, Adrien 5riggeri) Lucie Martinet, S/everine Morin et Evelyne Blesle. Be remercie chaleureusement mes coll/egues de l’Universitéde Paris D' Bean-Loup Guillaume et 4homas Aynaud3 Enfin) <e souhaiterais remercier mes parents) tous les amis et les personnes qui ont toujours encouragéet accompagnémon travail de leur penséepositive3 Contents Introduction 9 1 Community detection in dynamic networks 13 3 Communities in net1or2s 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 0 3 3 Definitions of community 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 E 3 3! Community structure 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 F 3! Community evolution in dynamic net1or2s 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 G 3!3 Communities in dynamic graphs 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 H 3!3! Community dynamics 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 H 30 Community detection in dynamic net1or2s 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 !! 303 Dynamic community detection challenges 3 3 3 3 3 3 3 3 3 3 3 3 3 !E 303! 41o-stage approaches 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 !I 3030 Evolutionary clusterin+ 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 0 303E Couplin+ graph clusterin+ 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 0E 3E Benchmar2s 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 0F 3E3 Benchmark graphs 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 0F 3E3! Real net1or2s 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 0I 3E30 Comparing partitions 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 0H 3F Conclusion 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 333333333333333333 E 2 Overlapping communities and modularity 42 !3 Related 1ork on cover detection 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 E0 !3! Modi8ed modularity for covers 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 EE !3!3 " novel modularity 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 EE !3!3! Existin+ modularity for covers 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 EG !30 Clique optimi9ation 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 F# !303 :ur proposed definition 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 F# !303! The clique optimization algorithm 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 F! !3030 Benchmark graphs 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 FE !3E 5uzzy detection 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3

Overlapping Community Detection in Dynamic Networks Qinna Wang

Syllabus Organizational Network Analysis V2.2

Dynamic Social Network Analysis: Present Roots and Future Fruits

Evolving Networks and Social Network Analysis Methods And

Dynamic Network Analysis (Spring 2020) Course 17-801, 17‐685, 19‐640 Instructor Prof

Self-Organized Terrorist- Counterterrorist Adaptive Coevolutions, Part I

Presented to the Faculty of the School of Engineering and Applied Science University of Virginia

A Statistical Network Analysis of Underground Punk Worlds in Manchester and Liverpool 2013-2015

Introduction to Social Network Analysis (SNA) As an Investigative Tool

Sustainable Enrollment Management: a Dynamic Network Analysis Forrest Murray Stuart Clemson University

A Network Analysis of Information Use in a Public Health Organization

New Approaches for Performance Optimization and Analysis of Large-Scale Dynamic Social Network Analysis Using Anytime Anywhere Algorithms

ORA: a Toolkit for Dynamic Network Analysis and Visualization