Netinf – Network of Information, an Information- Centric Networking Architecture for the Future Internet, © May 2013 Gutachter: Prof
Total Page:16
File Type:pdf, Size:1020Kb
NETINF–NETWORKOFINFORMATION An Information-Centric Networking Architecture for the Future Internet Dissertation christian dannewitz zur Erlangung des akademischen Grades Doktor der Naturwissenschaften (Dr. rer. nat.) im Fach Informatik Fakultät für Elektrotechnik, Informatik und Mathematik Universität Paderborn May 2013 Christian Dannewitz: NetInf – Network of Information, An Information- Centric Networking Architecture for the Future Internet, © May 2013 gutachter: Prof. Dr. Holger Karl (Universität Paderborn, Germany) Prof. Dr. Jörg Ott (Helsinki University of Technology, Finland) ABSTRACT The usage of the Internet has changed significantly in recent years. The original Internet architecture has been designed to facilitate the communication between a defined set of network nodes, i.e., the de- sign is host-centric. Today’s dominating use case has become infor- mation retrieval, i.e., an information-centric use case. In this use case, the user is only interested in the information itself; it is irrelevant which node delivers the information as the information itself is node- independent in this scenario. At the same time, this shift has re- sulted in a tremendous traffic increase. The Internet protocol suite handles this traffic inefficiently due to its host-centric design which dictates the data source in advance instead of allowing the network to choose the most suitable data source; i.e., the host-centric design does not fit the information-centric use case. This results in several problems. Especially, the original Internet architecture incorporates neither caching nor the ability to intelligently select the most suitable data source(s), which results in inefficient, redundant transmission of identical content and unnecessarily high network traffic and latency. Other problems include high load at the origin server, limited robust- ness due to single points of failure, vulnerability to distributed denial of service (DDoS) attacks, the flash-crowd effect1, and hard-to-handle connection interruptions and mobility (e.g., of clients, servers, and entire networks). These problems are mainly addressed via application-specific peer- to-peer (P2P) overlays, proprietary, provider-specific content distribu- tion networks (CDNs), and specific application layer solutions such as Hypertext Transfer Protocol (HTTP) load balancing today. How- ever, these solutions cannot leverage the full potential of content dis- tribution as each solution independently addresses only a subset of symptoms instead of addressing the main cause of all these prob- lems. Moreover, today’s solutions often reside in application-specific P2P overlays and provider-specific CDN overlays. This leads to prob- lems such as inefficient data forwarding, a limited number of sup- ported applications, and missing support for small content provid- ers, which suffer most from problems such as the flash-crowd effect and DDoS. Other solutions such as proxy caches require additional client-side or server-side configuration. Moreover, all mentioned solu- tions only focus on content distribution but do not address the other problems of the original Internet architecture such as mobility and in- termittent connectivity. Currently, these problems again require sepa- 1 The effect that certain content, e.g., a web page, is suddenly “overwhelmed” by an unusually large number of concurrent users, typically rendering this content inac- cessible for all users. iii rate solutions such as mobile IP. This leads to an unnecessarily com- plex Internet architecture and in some cases (such as transparent web caching) also violate the rules of the Internet protocol as data packets are transparently redirected to a destination other than defined in the packet header. The information-centric networking (ICN) paradigm aims to ad- dress these problems by shifting the focus from a host-centric archi- tecture towards an information-centric architecture that puts infor- mation retrieval at the center of the architecture, thereby better fitting today’s dominating Internet use case. This thesis describes a new, information-centric Internet architec- ture called Network of Information (NetInf) that addresses the afore mentioned problems in an architecturally sound way. It aims to offer efficient information dissemination in a very general form including many different related use cases for a wide variety of applications, for all content providers, and in a variety of different scenarios. In this thesis, I first evaluate the ICN paradigm and existing ap- proaches in general before describing the design of the NetInf archi- tecture in general. The NetInf architecture combines a unique set of characteristics. This includes its secure naming scheme, flexible object retrieval based on name resolution and name-based routing, its object model, and the ability to adapt to a wide variety of different network scenarios. This also includes a flexible caching model that supports on-path (i.e., data and resolution path) as well as off-path caching, in- cluding in-network caches and caching on user nodes. I focus specifi- cally on two aspects: (1) The design and evaluation of the secure nam- ing scheme, which builds the foundation of the secure, information- centric architecture. (2) The name resolution service (NRS), which is essential for efficient information retrieval but challenging due to the flat namespace and huge number of expected data objects (≈ 1015). In addition, I describe and evaluate our prototype of the overall NetInf architecture called OpenNetInf. The results from the theoretical analysis, simulations, and proto- typing indicate that a scalable, world-wide Network of Information with 1015 data objects is feasible with an NRS latency of (well) below 100 ms. The flexible NetInf architecture proved to have several ben- efits and is adaptable to various network and application scenarios. Based on these results, it seems reasonable that NetInf can offer a serious complement to the current Internet architecture. iv ZUSAMMENFASSUNG Die Nutzung des Internets hat sich innerhalb der letzten Jahre si- gnifikant verändert. Während die ursprüngliche Internet Architektur knotenzentrisch ist (d.h. Aufbau einer Kommunikation zwischen fest- gelegten Netzknoten), hat sich die Informationsbeschaffung, also ein informationszentrischer Anwendungsfall, in den letzten Jahren zum do- minierenden Anwendungsszenario entwickelt. In diesem Szenario ist der Nutzer nur an der Information an sich interessiert und nicht dar- an, welcher Knoten im Netz die Information liefert, da die Informa- tion in diesem Szenario knotenunabhängig ist. Gleichzeitig hat die- se Veränderung zu stark gestiegenem Datenverkehr im Internet ge- führt. Dieser Verkehr kann von den Internetprotokollen jedoch nicht effizient gehandhabt werden, da ihr knotenzentrischer Entwurf im Vorhinein schon die zu verwendende Datenquelle vorschreibt anstatt dem Netz die Freiheit zu lassen, selber die geeignetste Datenquel- le auszuwählen. D.h., der knotenzentrische Entwurf passt nicht mit dem dominierenden informationszentrischen Anwendungsszenario zusammen. Insbesondere ist in der ursprünglichen Internetarchitek- tur das Zwischenspeichern von Daten („Caching“) nicht vorgesehen und das Netz kann nicht selbstständig die geeignetste Datenquelle auswählen, was zu ineffizienten, redundanten Mehrfachübertragun- gen identischer Daten und hohem Datenverkehr führt. Zusätzlich führt die knotenzentrische Architektur teilweise zu unnötig hoher La- tenz, hoher Last am Ursprungsserver, und Schwierigkeiten mit Mobi- lität und Verbindungsabbrüchen. Weitere Probleme sind Anfälligkeit für distributed denial of service (DDoS) Angriffe, der Flash-Crowd Ef- fekt2 und begrenzte Robustheit, da der Ursprungsserver zum „Single Point of Failure“ werden kann. Heutzutage wird diesen Problemen hauptsächlich mittels Applika- tions-spezifischer peer-to-peer (P2P) Overlay Netze, proprietärer, Anbie- ter-spezifischer content distribution networks (CDNs) und speziellen Lösungen auf der Anwendungsschicht wie z.B. Lastbalancierung via Hypertext Transfer Protocol (HTTP) begegnet. Diese Lösungen kön- nen jedoch nicht das volle Potenzial einer gesamtheitlichen Archi- tektur zur Informationsverteilung ausschöpfen, da die Lösungen je- weils nur einzelne Symptome adressieren anstatt den Kern der ge- nannten Probleme zu lösen. Darüber hinaus sind die Lösungen größ- tenteils auf einzelne Applikationen, P2P Overlay Netze und Inhal- teanbieter beschränkt. Hieraus resultiert u.a. eine ineffiziente Daten- Weiterleitung, eine nur begrenzte Anzahl unterstützter Applikatio- 2 Flash-Crowd bezeichnet den Effekt, dass Inhalte wie z.B. eine Webseite durch eine ungewöhnlich hohe Anzahl an gleichzeitigen Nutzeranfragen überlastet wird und daher für alle Nutzer nicht mehr verfügbar ist. v nen und mangelnde Unterstützung für kleine Inhalteanbieter, die be- sonders von Problemen wie dem Flash-Crowd Effekt und DDoS be- troffen sind. Andere Lösungen wie Proxy Caches erfordern zusätz- liche Konfiguration der Clients oder Server. Darüber hinaus fokus- sieren die genannten Lösungen nur auf die effiziente Informations- verteilung. Die anderen Internet-Probleme wie z.B. Handhabung von Mobilität und Verbindungsabbrüchen erfordern wiederum separate Lösungen. All dies führt zu einer unnötig komplexen Internetarchi- tektur und in einigen Fällen wie z.B. transparentem Web Caching zu einer Verletzung der Internetprotokoll-Regeln. Das information-centric networking (ICN) Paradigma versucht die- se Probleme zu lösen, indem sie den Fokus von einer knotenzentri- schen