Dane Z Internetu. Rola Rafinacji Informacji Sieciowej W Kampaniach Wyborczych
Total Page:16
File Type:pdf, Size:1020Kb
Wydział Dziennikarstwa i Nauk Politycznych Uniwersytetu Warszawskiego Dane z internetu. Rola rafinacji informacji sieciowej w kampaniach wyborczych mgr Paweł Kuczma Praca doktorska wykonana pod kierunkiem prof. dr. hab. inż. Włodzimierza Gogołka oraz dr. Krzysztofa Kowalika, Instytut Dziennikarstwa, Wydział Dziennikarstwa i Nauk Politycznych Uniwersytetu Warszawskiego Niniejsza praca jest dostępna na międzynarodowej licencji Creative Commons Uznanie Autorstwa 4.0. Treść licencji dostępna jest na stronie http://creativecommons.org/licenses/by/4.0/. Warszawa, luty 2016 Spis treści Wstęp .......................................................................................... 4 Rozdział 1. Ideologia web 2.0 i media społecznościowe ............ 22 1.1. Web 2.0 ................................................................................... 22 1.1.1. Definicja pojęcia web 2.0 .......................................................... 23 1.1.2. Cechy web 2.0 ......................................................................... 23 1.1.3. Krytyka web 2.0 i User Generated Content ................................... 52 1.1.4. Web 3.0 ................................................................................. 58 1.2. Media społecznościowe .............................................................. 66 1.2.1. Definicja mediów społecznościowych ........................................... 67 1.2.2. Historia mediów społecznościowych ............................................ 72 1.2.3. Typy mediów społecznościowych ................................................ 78 1.2.4. Potencjał mediów społecznościowych pod względem oddziaływania na użytkowników .................................................................................. 82 Rozdział 2. Wartość danych ...................................................... 91 2.1. Dane ........................................................................................ 91 2.2. Piramida Dane-Informacje-Wiedza-Mądrość ............................... 93 2.3. Wielkie zasoby danych (big data) ............................................... 96 2.4. Otwarty dostęp ......................................................................... 108 2.5. PSI i Open Data ........................................................................ 113 2.5.1. Definicje otwartych danych ........................................................ 113 2.5.2. Sposoby pozyskiwania i przechowywanie otwartych danych ............ 125 2.5.3. Korzyści płynące z eksploatacji otwartych danych .......................... 127 2.5.4. Wady i zagrożenia eksploatacji otwartych danych .......................... 152 2.5.5. Bariery w udostępnianiu danych ................................................. 154 2.5.6. Licencje dla otwartych danych .................................................... 156 2.6. Otwarte dane drogą do otwartego rządu i otwartego społeczeństwa 158 1 Rozdział 3. Cyberpaństwo ......................................................... 160 3.1. Cyberspołeczeństwo .................................................................. 162 3.1.1. Społeczeństwo w cyberpaństwie ................................................. 162 3.1.2. Cyberdemokracja / e-demokracja ................................................ 167 3.1.3. Cyberprzestrzeń ....................................................................... 173 3.2. Cyberwładza. Otwarty rząd ....................................................... 175 3.2.1 Definicje otwartego rządu ........................................................... 176 3.2.2. Koncepcja otwartego rządu w perspektywie web 2.0 ....................... 180 3.3. Model cyberpaństwa ................................................................. 186 3.3.1. Istota cyberpaństwa. Rola cybernetyki w rządzeniu i zarządzaniu ...... 186 3.3.2.Teoretyczne i techniczne implikacje cyberpaństwa .......................... 194 3.3.3. Schemat funkcjonowania cyberpaństwa ........................................ 199 3.4. Próby tworzenia cyberpaństwa ................................................... 201 3.4.1. Cybersyn w Chile .................................................................... 201 3.4.2. Państwa-liderzy w otwieraniu i wykorzystywaniu danych ................ 207 3.4.3. Otwarte dane w Polsce .............................................................. 211 3.5. Cyberbezpieczeństwo ................................................................ 214 3.6. Wyzwania stojące przed cyberpaństwem ..................................... 223 Rozdział 4. Wykorzystanie danych do prognozowania. Wyniki badań własnych .......................................................................... 226 4.1. Reprezentatywność badań online ................................................ 227 4.2. Zaangażowanie w życie publiczne w mediach społecznościowych i z dala od klawiatury ...................................................................... 231 4.3. Metodologia badania ................................................................. 236 4.4. Informacyjny potencjał sieci – rafinacja informacji sieciowej na przykładzie wyborów prezydenckich 2010 i parlamentarnych 2011 .. 241 4.5. Dynamika zmian liczby wpisów wraz z postępami kampanii wyborczej ...................................................................................... 246 4.6. Wnioski z analizy jakościowej. Udział kontekstów w badanych treściach .. 249 4.6.1. Udział kontekstów w badanych treściach ...................................... 249 4.6.2. Wydźwięk treści ...................................................................... 251 4.7. Wiarygodność wartości korelacji ................................................ 258 2 4.8. Waga mediów społecznościowych ............................................... 258 4.9. Podsumowanie .......................................................................... 261 Zakończenie ................................................................................ 264 Spis rysunków ............................................................................. 268 Spis tabel ..................................................................................... 271 Bibliografia ................................................................................. 272 Aneks ........................................................................................... 315 3 Wstęp Umieszczony w zachodniej Australii radioteleskop ASKAP (Australian Square Kilometer Array Pathfinder) w każdej sekundzie wysyła 2,8 GB danych1. Co minutę na Youtube przesyłanych jest 100 godzin filmów. Użytkownicy codziennie oglądają w serwisie setki milionów godzin materiałów wideo2. Wykonane przez Ellen De Generes, a opublikowane na Twitterze zdjęcie z gali rozdania Oscarów (rys. 1.)3 zostało w ciągu 12 godzin wyświetlone ponad 26 milionów razy w ciągu 12 godzin po publikacji4. Ponad 3 miliardy ludzi na świecie wytwarza dane w internecie5. Zarówno w postaci tworzonych przez nich treści (User-Generated Content - UGC), jak i tych powstających w wyniku korzystania z usług sieciowych6. O ile zapisywanie i replikowanie danych na skalę masową umożliwił wynalazek Guttenberga, o tyle digitalizacja danych rozpoczęła nowy rozdział w ich historii. Ta nowa era związana jest z przechowywaniem badaniem wielkich zasobów danych (big data)7 oraz wyciąganiem wniosków z wyników analizy i stosowaniem ich w praktyce. Rys. 1. Zdjęcie z gali rozdania Oscarów obejrzane 26 milionów razy w ciągu 12 godzin Źródło: twitter.com/theellenshow/status/440322224407314432 [dostęp 12.01.2015]. 1 emc.com/leadership/digital-universe/2014iview/executive-summary.htm [dostęp 12.01.2015]. 2 http://youtube.com/yt/press/pl/statistics.html l [dostęp 19.11.2015]. 3 twitter.com/theellenshow/status/440322224407314432 [dostęp 12.01.2015]. 4 blog.twitter.com/2014/the-reach-and-impact-of-oscars-2014-tweets [dostęp 12.01.2015]. 5 internetworldstats.com/stats.htm [dostęp 12.01.2015]. 6 Omówienie tego zjawiska w części 1.4.3. User Generated Content. 7 Będzie o tym mowa w punkcie 2.3. Wielkie zasoby danych (big data). 4 Dane Dane w rozumieniu przyjętym w niniejszej rozprawie to, zgodnie z definicją van Beverena8, „surowe fakty”. Stanowią one tworzywo, z którego budowane są informacje poprzez łączenie danych, osadzanie ich w kontekście9. Danych10 jest coraz więcej i w coraz większym stopniu mogą one być analizowane i wykorzystywane do podejmowania decyzji11. W 2011 roku nastąpiła prawdziwa eksplozja zainteresowania zjawiskiem wielkich zasobów danych (rys. 2.)12. Analiza realiów może być wykorzystywana na wielu polach eksploatacji, w tym do zwiększania zaangażowania politycznego obywateli, np. dzięki wykorzystywaniu analizy cyfrowych śladów ich aktywności13, a także do tworzenia nowych usług (por. Rozdział 2.) i wspomagania szeroko rozumianego podejmowania decyzji. Skuteczność zarządzania procesami różnego typu jest, dzięki danym, większa niż bez ich użycia14. Coraz mniejszą względnie część wytwarzanych danych jesteśmy jednak w stanie, jako ludzkość, przechowywać w postaci cyfrowej. W 2013 roku było to mniej niż 33%, w 2020 roku udział ten spadnie do 15%15. Bezwzględnie ilość ta jest znacznie większa16. Van Dijk zwraca uwagę na analizę faktów m.in. także w perspektywie zagrożenia dla prywatności. Wiele śladów ludzkiej aktywności pozostaje w centrach operacyjnych banków, bazach danych firm, a szczególnie w sklepach internetowych i hurtowniach danych. Realia te opisują jednostkowe zachowania użytkowników sieci i używane osobno nie są szkodliwe. Jeśli natomiast zostaną zebrane w hurtowni danych, a relacje