ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ Επιστήμη Του Διαδικτύου «Web Science»
Total Page:16
File Type:pdf, Size:1020Kb
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ Επιστήμη του Διαδικτύου «Web Science» ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Τιτλος Εργασιας Διασυνδεδεμένα Γεωπολιτικά Δεδομένα της Ελλάδος: Η Ελληνική Δημόσια Δαπάνη Greek Geopolitical Linked Data: The Case of Public Spending Γεώργιος Αλεξίου ΕΠΙΒΛΕΠΩΝ: Ιωάννης Αναγνωστόπουλος Επίκουρος Καθηγητής Πανεπιστημίου Θεσσαλίας Θεσσαλονίκη , Δεκέμβριος 2013 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ Επιστήμη του Διαδικτύου «Web Science» ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Τιτλος Εργασιας Διασυνδεδεμένα Γεωπολιτικά Δεδομένα της Ελλάδος: Η Ελληνική Δημόσια Δαπάνη Greek Geopolitical Linked Data: The Case of Public Spending Γεώργιος Αλεξίου ΕΠΙΒΛΕΠΩΝ: Ιωάννης Αναγνωστόπουλος Επίκουρος Καθηγητής Πανεπιστημίου Θεσσαλίας Εγκρίθηκε από την Τριμελή Εξεταστική Επιτροπή την 12η Δεκεμβρίου 2013. ………………………… ………………………… ………………………… Ι. Αντωνίου Ι. Αναγνωστόπουλος Π. Μπαμίδης Καθηγητής Επ. Καθηγητής Επ. Καθηγητής θεσσαλονίκη , Δεκέμβριος 2013 Greek Geopolitical Linked Data: The Case of Public Spending ………………………………………….. Γεώργιος Η. Αλεξίου Copyright © Γεώργιος Η. Αλεξίου, 2013 Με επιφύλαξη παντός δικαιώματος. All rights reserved. Απαγορεύεται η αντιγραφή, αποθήκευση και διανομή της παρούσας εργασίας, εξ ολοκλήρου ή τμήματος αυτής, για εμπορικό σκοπό. Επιτρέπεται η ανατύπωση, αποθήκευση και διανομή για σκοπό μη κερδοσκοπικό, εκπαιδευτικής ή ερευνητικής φύσης, υπό την προϋπόθεση να αναφέρεται η πηγή προέλευσης και να διατηρείται το παρόν μήνυμα. Ερωτήματα που αφορούν τη χρήση της εργασίας για κερδοσκοπικό σκοπό πρέπει να απευθύνονται προς τον συγγραφέα. Οι απόψεις και τα συμπεράσματα που περιέχονται σε αυτό το έγγραφο εκφράζουν τον συγγραφέα και δεν πρέπει να ερμηνευτεί ότι εκφράζουν τις επίσημες θέσεις του Α.Π.Θ. 3 Georgios Alexiou Περιληψη Στόχος αυτής της διπλωµατικής εργασίας είναι η δηµιουργία, η διασύνδεση και η αξιοποίηση Διασυνδεδεµένων Δεδοµένων σχετικών µε την γεωπολιτική δοµή της Ελλάδος, σε συνδιασµό µε την Ελληνική δηµόσια δαπάνη όπως αυτή αναπαριστάται στην πλατφόρµα του publicspending.medialab.ntua.gr. Για το σκοπό αυτό, αρχικά, δηµιουργήθηκε µια οντολογία, η οποία είναι βασισµένη στη νέα αρχιτεκτονική της αυτοδιοίκησης και της αποκεντρωµένης διοίκησης µε το όνοµα «Σχέδιο Καλλικράτης». Σύµφωνα µε την προαναφερθείσα οντολογία, αναπτύχθηκε ένα σηµασιολογικό σύνολο δεδοµένων (dataset), στο οποίο περιλαµβάνεται όλη η πληροφορία σχετικά µε τη δοµή και την ιεραρχία της ελληνικής αυτοδιοίκησης και της αποκεντρωµένης διοίκησης, βασισµένη στη δοµή των ταχυδροµικών κωδικών της χώρας. Το σηµασιολογικό σύνολο δεδοµένων (dataset) αναπτύχθηκε σύµφωνα µε της αρχές των ανοιχτών διασυνδεδεµένων δεδοµένων, ενώ οι πηγές της δηµιουργίας και του εµπλουτισµού του ήταν δηµόσια APIs διαδεδοµένων και αξιόπιστων εµπορικών εφαρµογών. Επιπρόσθετα αυτό το σύνολο δεδοµένων διασυνδέθηκε -πάντα σύµφωνα µε της αρχές των Διασυνδεδεµένων δεδοµένων- µε άλλα γνωστά και ευρέως διαδεδοµένα σύνολα δεδοµένων, µε απώτερο σκοπό την βελτιστοποίηση της ποσότητας και της ποιότητας των δεδοµένων αυτού. Εν συνεχεία, έγιναν κάποιες προσθήκες στην ήδη υπάρχουσα οντολογία της πλατφόρµας publicspending.medialab.ntua.gr, µε σκοπό να γίνει διασύνδεση των δύο συνόλων δεδοµένων και να αξιοποιηθεί η νεοπαραχθείσα πληροφορία που έγινε διαθέσιµη λόγω της διασύνδεσης. Τέλος, η διπλωµατική πραγµατεύεται τη δηµιουργία διαφόρων εργαλείων για την αξιοποίηση αυτής της πληροφορίας, για την βελτιστοποίηση της αναζήτησης στη δηµόσια δαπάνη, αλλά και την οπτικοποίηση αυτής σε διαδραστικούς χάρτες. Λέξεις κλειδιά: Σηµασιολογικός Ιστός, Διασυνδεδεµένα Δεδοµένα, Δηµόσια Δαπάνη, Γεωπολιτική Οντολογία, Διαδραστικοί Χάρτες 4 Greek Geopolitical Linked Data: The Case of Public Spending Συνοψη Ο Παγκόσµιος Ιστός (World Wide Web) έχει προκαλέσει µια τεχνολογική επανάσταση στις επικοινωνίες και δεν έχει αλλάξει µόνο τον τρόπο που επικοινωνούµε αλλά και τον τρόπο που συγκεντρώνουµε δεδοµένα. Ο Σηµασιολογικός Ιστός [1], είναι µια επέκταση του Παγκόσµιου Ιστού που εµπλουτίζει την υπάρχουσα πληροφορία ώστε αυτή να είναι αναγνωρίσιµη και επεξεργάσιµη απο τις µηχανές (υπολογιστές). Με άλλα λόγια ο Παγκόσµιος Ιστός εξελίσεται από «Ιστό συνδεδεµένων αρχείων» σε «Ιστό διασυνδεδεµένων δεδοµένων». Επιπρόσθετα, τα ανοιχτά δεδοµένα (δεδοµένα τα οποία είναι δηµόσια διαθέσιµα), αυξάνονται µε εκθετικό ρυθµό, µε την πλειψηφία τους να προέρχεται απο δηµόσια κυβερνητικά δεδοµένα. Παράλληλα, η πρόσφατη δηµιουργία των Διασυνδεδεµένων Δεδοµένων (Linked Data) [2], µας έδωσε νέες δυνατότητες για την εκµετάλλευση τους. Εντούτοις, σε πολλές περιπτώσεις, τα δεδοµένα είναι κλειστά, όπως λ.χ. σε πληροφοριακά συστήµατα και βάσεις δεδοµένων (Data Silos) [3]. Συνήθως αναπαριστώνται µε τη χρήση διαφορετικών µη-“ευθυγραµισµένων” λεξιλογίων και σχηµάτων. Στην Ευρώπη, η πρόσβαση στα κυβερνητικά δεδοµένα και η πιθανότητα ελεύθερης εκµετάλλευσης τους, θεωρείται καταλυτική για το στόχο της ανοιχτής διακυβέρνησης. Τα ανοιχτά αυτά δεδοµένα συχνά αναφέρονται σε δηµόσια δεδοµένα (π.χ. δηµόσια δαπάνη, µεταφορές, υποδοµές και επικοινωνίες, παιδεία, περιβάλλον κ.α.), τα οποία µπορούν να χρησιµοποιηθούν ελεύθερα και να διανεµηθούν απο τον καθένα, µε µηδενικό ή ελάχιστο κόστος. Όµως, το άνοιγµα τέτοιων δεδοµένων (π.χ. Διαδικτυακές πύλες δεδοµένων – Data Portals) συχνά πραγµατοποιείται µε ad-hoc τρόπους. Ως αποτέλεσµα, χιλιάδες σύνολα δεδοµένων (datasets) δηµοσιεύονται χωρίς τη χρήση προσυµφωνηµένων προτύπων και µοναδικών αναγνωριστικών πόρων. Έτσι, κατ’αυτόν τον τρόπο, δηµιουργείται ένα κατακερµατισµένο υπερσύνολο δεδοµένων στο οποίο η επαναχρησιµοποίηση, η εύρεση και η ολοκλήρωση της πληροφορίας γίνεται πραγµατικά απροσπέλαστη. Τα Διασυνδεδεµένα Δεδοµένα µπορούν να ανταποκριθούν αποτελεσµατικά σε αυτή την πρόκληση και να δράσουν ως καταλύτης για τη διαµόρφωση της ηλεκτρονικής διακυβέρνησης, οδηγώντας στη δηµιουργία πιο «έξυπνων» και αποδοτικών κυβερνητικών υπηρεσιών και εφαρµογών, ενώ παράλληλα µπορούν να προωθήσουν τη δηµιουργικότητα και την καινοτοµία στην εποχή της ψηφιακής οικονοµίας. 5 Georgios Alexiou Στην Ελλάδα, ο στενός αλλά και ο ευρύτερος δηµόσιος τοµέας, δηµιουργούν ένα µεγάλο πλούτο δηµόσιων ανοιχτών δεδοµένων, τα οποία κυµαίνονται απο τοµείς όπως η δηµόσια δαπάνη έως τα µητρώα των επιχειρήσεων, στατιστικά στοιχεία για εγκληµατικότητα, πυρκαγιές και περιβάλλον. Ανοίγοντας αυτή την πληροφορία στο κοινό δηµιουργείται µεγαλύτερο αίσθηµα κοινής ευθύνης, οι πολίτες βοηθούνται στο να κάνουν πιο συνειδητές επιλογές και δίδεται η δυνατότητα σε τρίτους να δηµιουργήσουν εργαλεία και εφαρµογές για την αξιοποίηση αυτών των δεδοµένων. Παρακινούµενοι απο το άνοιγµα αυτών των δεδοµένων και σε µια προσπάθεια να αντιµετωπίσουµε το πρόβληµα των ad-hoc συνόλων δεδοµένων (αλλά και παράλληλα να αξιοποιήσουµε τα δηµόσια κυβερνητικά δεδοµένα), ξεκινήσαµε την πλατφόρµα publicspending.gr [4]. To publicspending.gr είναι µια προσπάθεια, η οποία ξεκίνησε το 2011 µε κύριο στόχο την ενδυνάµωση της διαφάνειας στον τοµέα της Ελληνικής δηµοσίας δαπάνης. Βαθύ µας πιστεύω ήταν και είναι οτι η δηµιουργία και ο εµπλουτισµός των Δηµόσιων Ανοιχτών Δεδοµένων (Linked Open Data) στο δηµόσιο τοµέα θα βοηθήσει πολίτες, δηµοσιογράφους, ερευνητές αλλά και το ίδιο το κράτος να βελτιώσουν την ποιότητα των αποφάσεων τους. Υπάρχει ένας αυξάνων αριθµός παρόµοιων προσπαθειών ανά τον κόσµο µε κυριότερες προσπάθειες που έχουν γίνει σε Η.Π.Α., Ηνωµένο Βασίλειο, Ιταλία, Σλοβακία και Πορτογαλία. Η πρωτοβουλία του publicspending.gr ξεκίνησε ως µία ερευνητική προσπάθεια του εργαστηρίου Πολυµέσων της σχολής Ηλεκρολόγων Μηχανικών και Μηχανικών Ηλεκρονικών Υπολογιστών του Εθνικού Μετσοβίου Πολυτεχνείου µε σκοπό να παράγει, να συντηρήσει, να διασυνδέσει και να δηµοσιεύσει πληροφορίες σε ηµερήσια βάση για την Ελληνική δηµόσια δαπάνη. Πληροφορίες οι οποίες είναι προσβάσιµες απο το ευρύ κοινό και απο την επιστηµονική κοινότητα. Είναι µια διαδικτυακή πλατφόρµα η οποία προσφέρει προηγµένες δυνατότητες αναζήτησης στα δεδοµένα της δηµόσιας δαπάνης, ενώ η παρεχόµενη πληροφορία χωρίζεται σε τοµείς (π.χ. Τοπική Αυτοδιοίκηση, Εκπαίδευση κ.λπ.). Όµως, ένα απο τα µειονεκτήµατα των δεδοµένων τα οποία προέρχονται απο τον δηµόσιο τοµέα και αφορούν τη δηµόσια δαπάνη, είναι οτι ούτε είναι διαχωρισµένα ανάλογα µε τη γεωπολιτική δοµή της χώρας, ούτε παρέχουν καµία πληροφορία σε σχέση µε γεωχωρικά δεδοµένα. Επιπλέον, δεν έχει ακόµα µοντελοποιηθεί η νέα αρχιτεκτονική της αυτοδιοίκησης και της αποκεντρωµένης διοίκησης µε το όνοµα «Σχέδιο Καλλικράτης» σε σχέση µε το γεωγραφικό διαχωρισµό της χώρας και µε βάση 6 Greek Geopolitical Linked Data: The Case of Public Spending τους ταχυδροµικούς κώδικες και την συσχετισµένη γεωχωρική πληροφορία. Με βάση τα παραπάνω, η πλατφόρµα του publicspending.gr, είναι το έναυσµα (και η βάση) αυτής της διπλωµατικής εργασίας, που έχει ως σκοπό την διασύνδεση δεδοµένων που αφορούν την ελληνική δηµόσια δαπάνη και την γεωπολιτική δοµή της χώρας. Η κύρια ιδέα είναι απο τη µία πλευρά να µοντελοποιηθεί η γεωπολιτική δοµή της Ελλάδος, βασισµένη στο «σχέδιο Καλλικράτης» [25] και απο την άλλη πλευρά η διασύνδεση της παραχθείσας πληροφορίας επί των δηµοσίων δαπανών. Φυσικά, αυτό πραγµατοποιείται ακολουθώντας τις αρχές των Διασυνδεδεµένων Δεδοµένων. Σαν επέκταση αυτής της προσπάθειας θα προκύψουν αρκετές εφαρµογές και εργαλεία, τα οποία θα έχουν ως στόχο την αντιµετώπιση του προβλήµατος της οπτικοποίησης της δηµόσιας δαπάνης σε διαδραστικούς χάρτες, καθώς και την βελτιστοποίηση των εξελιγµένων µεθόδων αναζήτης της δηµόσιας δαπάνης. Η παρούσα διπλωµατική εργασία χωρίζεται σε πέντε κεφάλαια.