Cooperative games and stable matchings in networks Mikaël Touati
To cite this version:
Mikaël Touati. Cooperative games and stable matchings in networks. Networking and Internet Ar- chitecture [cs.NI]. Télécom ParisTech, 2016. English. NNT : 2016ENST0077. tel-03146510
HAL Id: tel-03146510 https://pastel.archives-ouvertes.fr/tel-03146510 Submitted on 19 Feb 2021
HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. 2016-ENST-0077
EDITE - ED 130
Doctorat ParisTech
THÈSE
pour obtenir le grade de docteur délivré par
TELECOM ParisTech
Spécialité « Informatique et réseaux »
présentée et soutenue publiquement par
Mikaël Touati le 1er décembre 2016 Jeux Coopératifs et d’Appariements Stables
dans les Réseaux
Directeurs de thèse : Marceau Coupechoux Rachid El-Azouzi Co-encadrement de la thèse : Eitan Altman
Jury T M. Tamer BA ¸SAR, Professeur, Coordinated Science Laboratory, University of Illinois Rapporteur M. Samson LASAULCE, Directeur de recherche, CNRS, CentraleSupélec Rapporteur H M. Merouane DEBBAH, Professeur, CentraleSupélec Examinateur È M. Rida LARAKI, Directeur de recherche, CNRS, Université Paris Dauphine Examinateur M. Jean-Marc KELIF, Ingénieur de recherche, Orange Labs Examinateur S M. Marceau COUPECHOUX, Maître de conférences, INFRES, Telecom ParisTech Directeur M. Rachid EL-AZOUZI, Professeur, LIA, Univertité d’Avignon Directeur E M. Eitan ALTMAN, Directeur de recherche, INRIA Encadrant TELECOM ParisTech école de l’Institut Mines-Télécom - membre de ParisTech
46 rue Barrault 75013 Paris - (+33) 1 45 81 77 77 - www.telecom-paristech.fr ii Acknowledgments
Before starting the PhD, I met a few people to gather advices, opinions and feedbacks about this postgraduate formation that was supposed to make me a researcher. At this time, I thought "So, when they say it is a unique experience they probably mean that its a lot of work because of the pa- pers to be published and all these things I will have to learn." . This was true but highly incomplete. How could I have imagine a three years period of my life that would actually heavily depend on skills and people I did not know about? I discovered that the PhD is more than doing science. It is also about people. Those that you already know and those that you do not but discover. You interact with them, learn from them and sometimes work or cooperate with them. In any case, it is unique because every person is. I would like to thank Eitan Altman, Marceau Coupechoux, Rachid El-Azouzi and Jean-Marc Kélif for having guided me through this important step of my life. You are exceptional people and researchers. It was an honor working with you and I hope that you enjoyed these years as much as I did. Thank you also to Richard Combes for having accepted me as an intern for a few months. It was great working with you and I could not have expected a better ending. I also would to thank my manager Laurent Labéguerie at Orange for both his outstanding hu- man skills and his valuable lessons as well as my colleagues at Orange Labs and Telecom ParisTech. Finally, I would like to thank the jury members and the reviewers of the manuscript, Director of Research Samson Lasaulce and Professor Tamer Baa¸r.
iii iv Résumé Jeux Coopératifs et d’Appariements Stables dans les Réseaux
Dans cette thèse, nous proposons des solutions à plusieurs problèmes d’ allocation de ressources et d’associations dans les réseaux. Pour cela, nous employons les jeux coopératifs, particulière- ment les jeux d’appariements stables, classiquement utilisés en économie pour l’analyse de marchés bifaces et la conception de leurs mécanismes d’allocations. Dans la première partie, nous intro- duisons les jeux de négociation et d’appariements stables. Dans une seconde partie, nous pro- posons un nouveau mécanisme stable d’association des utilisateurs en WiFi réduisant l’impact de l’anomalie du protocole. Nous présentons également une analyse d’un problème de stockage de videos et un nouvel algorithme d’énumération de structures stables. Dans une troisième partie, nous analysons des conditions pour la stabilité de certains schémas d’équité connus en termes de mesures d’aversion au risque. Dans une quatrième partie, nous analysons la stabilité d’une place de marché biface de crowdsourcing avec contraintes d’ordonnancement de tâches. La classique propriété de substitution des biens n’étant pas satisfaite, nous introduisons des nouvelles condi- tions et montrons l’existence d’appariements stables. Nous proposons également une résolution du problème par une formulation non-coopérative en forme extensive.
MOTS-CLEFS: réseaux, réseaux sans fil, allocation de ressources, appariements, théorie des jeux, jeux coopératifs, stabilité, marchés bifaces
Abstract Cooperative Games and Stable Matchings in Networks
In this thesis, we propose new solutions to matching problems in networks. We use coop- erative games, particularly stable matchings, classically used in economy to analyze two-sided markets and design matching mechanisms. In the first part, we introduce bargaining and stable matching games. In the second part, we propose a new stable matching mechanism for user as- sociation in WiFi reducing the impact of the anomaly in the protocol. Furthermore, we analyze a video caching problem and show a new algorithm enumerating stable structures. In the third part, we analyze conditions for the stability of some fairness schemes in terms of risk aversion indica- tors. In the fourth part, we analyze the stability of a two-sided crowdsourcing marketplace with scheduling constraints on the tasks. The classical substitutability condition does not hold in this case. We introduce new conditions and show the existence of stable matchings. We also solve the crowdsourcing problem as a non-cooperative game in extensive form.
KEY-WORDS: networks, wireless networks, resource allocation, matchings, game theory, sta- bility, cooperation, two-sided markets
v vi Contents
Résumé détaillé en français 1
1 Introduction 21
2 Cooperation and Bargainings 23 2.1 Cooperation, Negotiation and Arbitration ...... 24 2.2 The Nash Bargaining Solution ...... 25 2.3 The Generalized Nash Bargaining ...... 30 2.4 References ...... 32
3 Stable Matchings 33 3.1 Stable Matchings ...... 34 3.2 The Stable Marriage Problem ...... 34 3.3 The College Admission Problem ...... 40 3.4 The Firms and Workers Model: Choice Functions, Subtitutability and Salaries .... 44 3.5 Complementarities and Peer Effects ...... 45 3.6 Matching with Contracts and Externalities ...... 51 3.7 References ...... 55
4 Nash Bargaining for Resource Allocation in WiFi 57 4.1 Competition for Resource Allocation in Networks ...... 58 4.2 WiFi ...... 58 4.3 WiFi as a Nash Bargaining ...... 63 4.4 Conclusion ...... 64 4.5 References ...... 65
5 A Cooperative Game Theoretic Analysis of WiFi 67 5.1 Introduction ...... 68 5.2 System model ...... 71 5.3 Matching Games Formulation ...... 72 5.4 Existence of Core Stable Matchings in the Game and Unemployment ...... 74 5.5 Mechanism for controlled matching game ...... 74 5.6 Numerical Results ...... 79 5.7 Conclusion ...... 86 5.8 References ...... 87 5.9 Appendix: Two examples of control of incentives in games ...... 89 5.10 Appendix: Proofs ...... 90 5.11 Appendix: Interpretation of BDAA in the economic framework ...... 95 5.12 Appendix: Example ...... 96
vii CONTENTS
6 Video Caching and an Enumerative Cliques-Based Algorithm 99 6.1 Introduction ...... 100 6.2 Related Works ...... 100 6.3 Contributions ...... 100 6.4 Potential Coalition Games and Video Caching ...... 101 6.5 An Anytime Centralized Enumerative Algorithm ...... 102 6.6 Some elements about the complexity ...... 104 6.7 Example ...... 106 6.8 Conclusion ...... 108 6.9 References ...... 109
7 Fear of Ruin and Concavity Conditions in Coalition Games with Generalized Æ-Fair Re- source Allocation 111 7.1 Introduction ...... 112 7.2 Contributions ...... 113 7.3 Model ...... 113 7.4 Motivating Examples ...... 115 7.5 The Generalized Æ-fair Allocation: Stability, Risks and Behaviors ...... 117 7.6 Risks and Measures of Aversion ...... 120 7.7 Conclusion ...... 125 7.8 References ...... 127 7.9 Appendix: Proof of Proposition 114 ...... 128
8 Matching Games and Crowdsourcing 131 8.1 Introduction ...... 132 8.2 Crowdsourcing System with Scheduling Constraints ...... 135 8.3 Matching with Contracts, Externalities and Scheduling Constraints ...... 143 8.4 The Crowdsourcing Problem in Normal form ...... 147 8.5 The Crowdsourcing Problem in Extensive Form ...... 152 8.6 Conclusion ...... 158 8.7 References ...... 160 8.8 Appendix: Insufficiency of Existing Solutions ...... 162 8.9 Appendix: Proofs ...... 167 8.10 Appendix: Alternative Stabilities ...... 175 8.11 Appendix: Player-Specific Matroid Congestion Games with Priorities ...... 178
9 Open Questions 181 9.1 Nash Bargaining, Markov Chains and Relative Entropy ...... 181 9.2 Strategic Information Transmission and Recommendations Systems ...... 186 9.3 References ...... 190
10 Conclusion 191
11 Publications 193 11.1 Journals ...... 193 11.2 Conferences with review committee ...... 193 11.3 Talks ...... 193
viii Résumé détaillé en français
0.1 Introduction
Au cours des dernières années, le développement des réseaux et l’innovation dans les services con- nectés ont donné aux entreprises et utilisateurs de nouvelles opportunités de création de valeur, consommation et de communications. Les plateformes en lignes ont émergé comme places de marchés virtuelles où plusieurs millions d’utilisateurs peuvent s’échanger des biens ou des ser- vices. Dans ces systèmes, l’offre et la demande forment un marché biface permettant une com- pétition en ligne des agents sur les ressources. Beaucoup de ces marchés sont régulés par des rè- gles et mécanismes (tels les enchères) qui définissent la façon dont les agents participent à la com- pétition. Ces systèmes bénéficient de la connectivité globale d’Internet et des réseaux de commu- nication hautes performances (fixes ou sans-fils) qui permettent un accès aux services à de nom- breux agents et une diffusion à grande échelle de l’information. Les modèles économiques, les habitudes des consommateurs et les technologies ont changé ensemble pour se combiner dans de nouvelles solutions et systèmes plaçant les réseaux au coeur d’une révolution. De nouveaux prob- lèmes sont apparus tels que la gestion d’énormes volumes de données, la pertinence des informa- tions transmises ou l’automatisation de la prise de décision. Cependant, en dépit de leur nombre croissant, les places de marchés et leurs mécanismes ne sont pas nécessairement nouveaux. Beau- coup ont déjà été étudiés en économie, théorie des jeux et réseaux. Une approche couronnée de succès, fondée sur le théorie des jeux coopératifs, est appelée théorie des appariements stables. Les résultats développés ont révélés des propriétés insoupçonnées de mécanismes d’allocation de ressources et les recherches ont développé une méthodologie puissante pour les étudier et en concevoir de nouveaux.
0.2 Contributions et plan
Dans cette thèse, on étudie le lien entre certains problèmes des réseaux et les analyses des marchés bifaces par la théorie des jeux. Plus particulièrement, on traite quatre problèmes en utilisant la théorie des appariements stables. Dans le chapitre 2, on donne une brève introduction à la coopération en théorie des jeux en se concentrant sur le problème de marchandage et la solu- tion de Nash à ce problème. Dans le chapitre 3, on introduit la théorie des appariements stables, utilisée tout au long de cette thèse pour développer des solutions aux problèmes posés. Dans le chapitre 4, on montre que dans certaines conditions, le protocole WiFi peut être modélisé comme un marchandage de Nash. Dans le chapitre 5, on étudie le problème de la gestion des connexions WiFi. On montre que le système peut être modélisé comme une place de marché biface avec un schéma coopératif d’allocation de ressources tels que traités par les jeux. On propose un nou- veau mécanisme stable d’appariements réduisant l’impact de la congestion et de l’anomalie du protocole, problèmes bien connus induit par l’impact mutuel des agents communicants. Dans le chapitre 6, on applique certains éléments de la solution précédente au problème de mise en cache de vidéos dans les réseaux. On propose un nouveau mécanisme de stockage entre vidéos d’un fournisseur de contenu et les serveurs d’un opérateur. La solution prend en compte l’impact mutuel des vidéos et les gains de qualité induits par des serveurs différenciés. Dans notre modèle, on suppose un marchandage de Nash sur les revenus générés par le stockage et on considère un
1 CONTENTS jeu général de formation de coalitions avec potentiel. On définit un nouvel algorithme énumératif de structures core stables. Pour améliorer la compréhension du lien entre allocation de ressources et stabilité, en chapitre 7, on étudie l’alpha-équité proportionnelle généralisée. On utilise des ré- sultats récents de la théorie des jeux pour montrer que les conditions de concavité sur les fonc- tions d’utilités des agents pour l’existence de structures core stables peuvent être simplement for- mulées en termes d’indicateurs d’aversion au risque. Dans le chapitre 8, on étudie un marché bi- face de production participative (crowdsourcing) avec contrats et contraintes d’ordonnancement de tâches. On suppose la stabilité pair-à-pair comme concept de solution et on fournit des con- ditions suffisantes d’existence d’appariements stables. On mène également une analyse via une reformulation par les jeux non-coopératifs. Ce problème est important pour la conception de plateformes de production participative plus complexes et complètes permettant plus de coor- dination dans la distribution des tâches au sein des entreprises participantes ainsi qu’entre elles. Finalement, au chapitre 9 on expose des problèmes ouverts.
0.3 Coopération et négociation
Dans ce chapitre, on introduit la théorie des jeux coopératifs. On se concentre sur les problèmes de marchandages et la solution de Nash qui sera utilisée avec les jeux d’appariements dans les chapitres 4 et 5 pour étudier l’allocation de ressource WiFi et développer un mécanisme d’association ainsi que dans le chapitre 6 pour développer un mécanisme de mise en cache de vidéos. Dans un jeu coopératif, les joueurs peuvent faire des choix stratégiques non-coopératifs mais ont aussi des opportunités conjointes introduites par les ententes mutuelles. Dans ce cadre, on peut s’attendre à l’apparition de nouvelles formes de stabilité et concepts de solution dans la prise de décision. Un point particulièrement important est que la coopération, par l’ensemble des nou- velles possibilités stratégiques qu’elle introduit, induit un problème de sélection d’équilibre. Ce problème est à l’origine de la théorie de la négociation (arbitrage, marchandage) qui est en fait une théorie de la sélection coopérative d’équilibres. Un exemple simple est proposé par le jeu du partage des dollars. Supposons deux joueurs devant se partager cent dollars. Si la demande des deux est inférieure ou égale à cent dollars, alors chacun obtient la part demandée. Si la de- mande dépasse les cent dollars, alors les joueurs ne reçoivent rien. Dans ce cas, toute demande telle que la somme des montants (positifs) est égale à cent dollars est un équilibre de Nash. Parmi ces équilibres, donner cinquante dollars à chacun est un partage équitable. Il s’agit sans doute du partage que suggérerait un arbitre impartial, ce qui confère à cette allocation une propriété spécifique d’attraction que les autres équilibres n’ont pas.
0.3.1 Le marchandage de Nash
Il existe de nombreux schémas et processus possibles d’arbitrage. Le modèle de marchandage de Nash repose sur l’hypothèse que le résultat d’un marchandage entre agents devrait être une fonc- tion de l’ensemble des opportunités conjointement atteignables mesurées en utilité et de menaces qui bloqueraient le processus de négociation en cas de désaccord en garantissant à chaque joueur une quantité d’utilité connue. L’arbitrage proposé par Nash repose sur cinq axiomes. Le premier axiome requiert la faisabilité et la Pareto-efficience de l’allocation. Le second demande une ra- tionalité individuelle: aucun joueur ne devrait accepter moins que l’utilité qu’il peut garantir par application de sa menace. Le troisième requiert une invariance de la solution par transforma- tion affine positive de l’utilité alors que le quatrième requiert une conservation de la solution à la suppression des allocations qui ne sont pas des équilibres. Finalement, le dernier axiome requiert une symétrie telle que l’allocation soit la même pour des agents identiques en termes d’utilité. Soit B R2 l’ensemble compacte 1 convexe2 des allocations d’utilités conjoitement atteignables par les Ω 2 joueurs, appelé ensemble faisable. Soit t =(t1,t2) un vecteur de R appelé vecteur de menaces et
1Fermé et borné 2 x,y B, ∏ [0,1],∏x (1 ∏)y B 8 2 8 2 + ° 2
2 CONTENTS