And Template-Based Data Compression Approach to Improve Resource-Constrained Iot Systems Interoperability
Total Page:16
File Type:pdf, Size:1020Kb
Department OF Computer Architecture AND TECHNOLOGY ACONTEXT- AND TEMPLATE-BASED DATA COMPRESSION APPROACH TO IMPROVE RESOURCE-CONSTRAINED IOTSYSTEMS INTEROPERABILITY Dissertation FOR THE DEGREE OF Doctor OF PhilosophY Candidate Jorge Berzosa Supervisors Roberto Cortiñas - Luis Gardeazabal 2019 (cc)2019 JORGE BERZOSA MACHO (cc by-nc 4.0) AbstrACT The Internet OF Things (IoT) HAS EMERGED AS A POWERFUL PARADIGM WITH A HUGE RANGE OF possibilities, PROMOTING ITS ADOPTION ACROSS MULTIPLE TECHNOLOGICAL domains. Roughly speaking, THE IoT ABSTRACTION AIMS TO INTERCONNECT EVERY KIND OF THINGS, LIKE SIMPLE de- VICES (a LIGHT BULB OR A thermostat) OR MORE COMPLEX AND ABSTRACT systems, e.g., FACILITY management. Behind THESE THINGS, THERE ARE PHYSICAL DEVICES TASKED WITH SPECIfiC SENSING OR ACTUATION roles. Similarly TO THE THINGS themselves, THESE DEVICES OFTEN HAVE signif- ICANT DIFFERENCES AMONG THEM IN TERMS OF CAPABILITIES AND THE SET OF COMMUNICATION TECHNOLOGIES THEY use. This HETEROGENEITY LEADS TO AN INTEGRATION CHALLENGE REGARDING INTEROPERABILITY AT THE CONNECTIVITY level, INCLUDING DATA representation. A COMMON APPROACH TO DEAL WITH INTEROPERABILITY IN IoT SYSTEMS IS TO re-use Internet MATURE TECHNOLOGIES AND approaches. At DATA level, THIS CAN BE IMPLEMENTED BY structur- ING DATA FOLLOWING A STANDARD DATA MODEL AND USING text-based DATA formats, e.g., XML. However, THE TYPE OF DEVICES USUALLY DEPLOYED IN IoT SYSTEMS HAS LIMITED CAPABILITIES AS WELL AS SCARCE PROCESSING AND COMMUNICATION resources. Due TO THESE restrictions, text- BASED DATA FORMATS CANNOT BE INTEGRATED INTO resource-constrAINED DEVICES AND NETWORKS IN AN EASY AND EffiCIENT WAY. Consequently, THESE LIMITATIONS ALSO APPLY TO INTEROPERABLE TECHNOLOGIES THAT RELY ON text-based DATA FORMATS SUCH AS WEB Services. In THIS Thesis, WE PRESENT A NOVEL DATA COMPRESSION APPROACH FOR text-based DATA for- mats, NAMELY Context- AND Template-based Compression (CTC), WHICH IS SPECIALLY DESIGNED TAKING INTO ACCOUNT THE LIMITATIONS OF resource-constrAINED DEVICES AND networks. CTC ENHANCES data-level INTEROPERABILITY IN IoT SYSTEMS WHILE KEEPING VERY LOW RESOURCE re- QUIREMENTS (in TERMS OF COMMUNICATION bandwidth, MEMORY SIZE AND PROCESSING power). This Thesis ALSO INCLUDES THE SPECIfiCATION OF A SET OF COMPLEMENTARY SOLUTIONS WHICH FACILITATE THE DEPLOYMENT OF CTC IN IoT NETWORKS AND ITS INTEGRATION INTO APPLICATIONS TARGETED TO resource-constrAINED devices. Interestingly, CTC IS DESIGNED WITH INTEROPERABILITY AND EXTENSIBILITY IN MIND SO THAT IT CAN BE APPLIED TO DIFFERENT DATA formats. This WORK ALSO INCLUDES THE EVALUATION OF THE PROPOSED SOLUTION FOR TWO POPULAR DATA formats, XML AND JSON, BOTH IN REAL AND SIMULATED scenarios. ADDITIONALLY, THE RESULTS OF THE EVALUATIONS HAVE BEEN COMPARED WITH SOME OTHER CURRENT DATA COMPRESSION approaches, SHOWING THAT CTC IS A SUITABLE CANDIDATE FOR DATA COMPRESSION IN resource-constrAINED IoT DEPLOyments. II Laburpena Gauzen Interneta (THE Internet OF Things, IoT) AUKERA ANITZ ESKAINTZEN DITUEN PARADIGMA BIHURTU da, BERE ERABILERA DOMEINU TEKNOLOGIKO DESBERDINETAN sustatuz. IoT-ren HELBURU NAGUSIA MOTA ASKOTAKO GAUZAK ELKAR KONEKTATZEA da: BONBILA EDO TERMOSTATOA BEZALAKO GAILU SINPLEETATIK hasita, ETXEA EDO MAKINA MODUKO ELEMENTU ABSTRAKTU ETA Konplexuago- RAINO IRITSIZ . Gauza HAUEN atzean, SENTSORE ETA AKTUAZIO ARDURA ESPEZIfiKOK DITUZTEN GAILU fiSIKOAK daude. Gauzekin GERTATZEN DEN bezala, GAILU HAUEK ELKARRENGAN OSO EZBERDINAK DIRa, BEREZIKI GAITASUNEI ETA ERABILTZEN DITUZTEN TEKNOLOGIEI dagokienez. Heterogeneota- SUN HONEK KONEKTAGARRITASUN MAILAKO ELKARRERAGINGARRITASUNEAN INTEGRAZIOA ERRONKA HANDIA AURKEZTEN du, DATUEN ERREPRESENTAZIOA barne. IoT sistemetan, ELKARRERagingarritasuna, Interneten DENBORA LUZEZ ERABILI DIREN TEKNOLOGIEKIN JORRATZEA OHIKO JOERA da. Planteamendu honek, DATUEN ERREPRESENTAZIO mailan, DATUAK EREDU ESTANDAR BAT JARRAITUZ EGITURATZEA ESKATZEN du, BAITA TESTUAN oinar- RITUTAKO DATU FORMATUAK ERABILTZEA ERE (esaterAKo, XML). IoT SISTEMETAN ERABILI OHI DIREN gailuak, aldiz, GAITASUN MUGATUAK ETA PROZESATZEKO ETA KOMUNIKATZEKO BALIABIDE URRIKOAK IZAN OHI DIRa. MurrizkETA HAUEK medio, TESTUAN OINARRITUTAKO DATU formatuak, BALIABIDE MURRIZTUKO GAILU ETA SAREETAN ERA ERRAZ ETA ERAGINKOR BATEAN INTEGRATZEA EZ DA posible. Are gehiago, MURRIZKETA hauek, TESTUAN OINARRITUTAKO DATU FORMATUAK ERABILTZEN DITUZTEN BESTELAKO TEKNOLOGIA ELKARRERAGILEETARA ERE HEDATZEN da, BESTEAK beste, WEB Zerbitzuak. TESI honetan, TESTUAN OINARRITUTAKO DATU FORMATUEN KONPRESIORAKO SOLUZIO BAT au- RKEZTEN da, BALIABIDE MURRIZTUKO GAILU ETA SAREEN MUGAK AINTZAT HARTUTA DISEINATUA IZAN dena. Soluzio HONEK Context- AND Template-based Compression, CTC, DU izena. CTC-ek IoT SISTEMEN DATU MAILAKO ELKARRERAGINGARRITASUNA HOBETZEA DU helburu, BEHARREZKO KOMUNIKAZIO BANDA ZABALERa, MEMORIA TAMAINA ETA PROZESAMENDU AHALMEN ERABILERA minimizatuz. Are gehiago, TESI honetan, CTC SOLUZIOA IoT SAREETAN ETA BALIABIDE murriz- TUKO GAILUETAN ERRAZAGO INTEGRATZEKO bidean, HAINBAT SOLUZIO OSAGARRI ZEHAZTU DIRa. CTC ELKARRERAGINGARRITASUNA ETA HEDAGARRITASUNA ARDATZ IZANIK DISEINATU da, DATU FORMATU EZBERDINETAN APLIKAGARRIA izanik. ProposatutakO SOLUZIOA BI DATU FORMATUREKIN EBALUATU da, XML ETA JSON, INGURUNE SIMULATU ETA errealetan. Ebaluazio HAUEN emaitzak, DATU KONPRESIOA JORRATZEN DUTEN GAUR EGUNGO BESTE SOLUZIO BATZUEN EMAITZEKIN KONPARATU DIRa. KONPARAKETA honetan, CTC BALIABIDE MURRIZTUKO IoT SISTEMEN DATU KONPRESIORAKO HAUTAGAI ONA DELA IKUSI da. IV Resumen El Internet DE LAS Cosas (THE Internet OF Things, IoT) HA SURGIDO COMO UN PARADIGMA CON UN AMPLIO número DE posibilidades, PROMOVIENDO así SU adopción EN múltiples DOMINIOS tecnológicos. El OBJETIVO DE IoT ES EL DE INTERCONECTAR TODO TIPO DE COSAS, DESDE DISPOSITIVOS simples, COMO UNA BOMBILLA O UN termostato, A ELEMENTOS más COMPLEJOS Y ABSTRACTOS COMO UNA máquina O UNA casa. Detrás DE ESTAS COSAS SE ENCUENTRAN DISPOSITIVOS físicos QUE desempeñan ROLES específiCOS DE SENSOR O activador. De MANERA SIMILAR A LAS COSAS, ESTOS DISPOSITIVOS varían ENORMEMENTE ENTRE sí, ESPECIALMENTE EN LAS CAPACIDADES QUE POSEEN Y EL TIPO DE tecnologías QUE utilizan. Esta HETEROGENEIDAD GENERA UNA GRAN COMPLEJIDAD EN LOS PROCESOS INTEGRación EN LO QUE A LA INTEROPERABILIDAD SE REfiere, INCLUYENDO LA representación DE LOS datos. Un ENFOQUE HABITUAL PARA ABORDAR LA INTEROPERABILIDAD EN SISTEMAS IoT ES EL DE REUTILIZAR tecnologías DE Internet YA consolidadas. Más concretamente, A NIVEL DE repre- sentación DE LOS datos, LOS DATOS SE PUEDEN REPRESENTAR SIGUIENDO UN MODELO DE DATOS estándar, así COMO FORMATOS DE DATOS BASADOS EN texto, e.g., XML. Sin embargo, nor- MALMENTE EL TIPO DE DISPOSITIVOS QUE SE SE ENCUENTRA EN SISTEMAS IoT TIENE CAPACIDADES limitadas, así COMO RECURSOS DE PROCESAMIENTO Y DE comunicación escasos. Debido A ESTAS LIMITACIONES NO ES POSIBLE INTEGRAR FORMATOS DE DATOS BASADOS EN TEXTO DE MANERA SENCILLA YEfiCIENTE EN DISPOSITIVOS Y REDES CON RECURSOS restringidos. Además, ESTA situación también APLICA A tecnologías INTEROPERABLES QUE DEPENDEN DE FORMATOS DE DATOS BASADOS EN TEXTO como, POR ejemplo, LOS Servicios Web. En ESTA Tesis, PRESENTAMOS UNA NOVEDOSA solución QUE PERMITE UNA gestión EfiCIENTE DE LOS DATOS MEDIANTE LA compresión DE DATOS PARA FORMATOS DE DATOS BASADOS EN TEXTO Y QUE está ESPECIALMENTE diseñada TENIENDO EN CUENTA LAS LIMITACIONES DE DISPOSITIVOS Y REDES CON RECURSOS restringidos. Denominamos A ESTA solución Context- AND Template- BASED Compression (CTC). CTC MEJORA LA INTEROPERABILIDAD A NIVEL DE LOS DATOS DE LOS SISTEMAS IoT A LA VEZ QUE REQUIERE MUY POCOS RECURSOS EN CUANTO A ANCHO DE BANDA DE LAS comunicaciones, tamaño DE MEMORIA Y CAPACIDAD DE procesamiento. Esta TESIS también ESPECIfiCA UNA SERIE DE SOLUCIONES COMPLEMENTARIAS QUE FACILITAN EL DESPLIEGUE DE CTC EN REDES IoT, así COMO SU INTEGRación EN APLICACIONES ORIENTADAS A DISPOSITIVOS CON RECURSOS restringidos. Como ASPECTO destacable, CTC está diseñado CON LA INTEROPERABILIDAD Y EXTENSIBILIDAD EN mente, POR LO QUE PUEDE SER APLICADO A DIFERENTES FORMATOS DE datos. En ESTE TRABAJO SE PRESENTA LA evaluación DE LA solución PROPUESTA PARA DOS FORMATOS DE DATOS populares, XML Y JSON, TANTO EN ENTORNOS REALES COMO EN simulados. Además, LOS RESULTADOS DE ESTAS EVALUACIONES SE HAN CONTRASTADO CON SOLUCIONES DE compresión DE DATOS actuales. Los RESULTADOS MUESTRAN QUE CTC ES UN CANDIDATO válido PARA LA compresión DE DATOS EN DESPLIEGUES IoT CON RECURSOS restringidos. VI ACKNOWLEDGEMENTS A Maite, POR SU PACIENCIA Y APOYO CUANDO más LO necesitaba. Además, POR DECIRME QUE DESCONECTARA DE LA TESIS DE VEZ EN cuando. A MIS padres, PORQUE ME DIERON EL PRIMER empujón QUE ME HA TRaído HASTA aquí Y AHORa. A MIS HERMANOS Y hermana, POR CREER EN mí AUN SABIENDO COMO SOY. Nire zuzendarientzat, DOKUMENTU HONI FORMA EMAN DIOTEN fiNKetak, hobekuntzak, eta, bereziki, ZUZENKETA guztiengatik. VIII ACRONYMS 6LowPAN Internet Protocol (IPv6) AND Low-power Wireless Personal Area Networks ACK ACKNOWLEDGEMENT API Application ProgrAMMING Interface CBOR Concise Binary Object Representation CoAP ConstrAINED Application Protocol CoRE ConstrAINED RESTful Environments CPS Cyber PhYSICAL SYSTEM CPU CentrAL PROCESSING UNIT CTC Context- AND Template-based Compression DNS Domain Name SYSTEM DOM Document Object Model DPWS Devices ProfiLE FOR WEB Services DTD Document Type DefiNITION DTLS DatagrAM TrANSPORT LaYER Security EXI EffiCIENT XML Interchange EXIP EXIProcessor HTML Hyper TEXT Markup Language HTTP HyperTEXT TrANSFER Protocol IANA Internet Assigned Numbers AUTHORITY