LIETUVOS EDUKOLOGIJOS UNIVERSITETAS GAMTOS, MATEMATIKOS IR TECHNOLOGIJŲ FAKULTETAS INFORMATIKOS KATEDRA

Tomaš Lukša

INFORMACIJOS VIZUALIZAVIMO BŪDAI IR METODAI

Informatikos magistro baigiamasis darbas

Darbo vadovė: doc. dr. Olga Kurasova

Vilnius, 2014 TURINYS

ĮVADAS ...... 3 1. INFORMACIJOS VIZUALIZAVIMO BŪDŲ IR METODŲ APŽVALGA ...... 5 1.1. INFORMACIJOS VIZUALIZAVIMO RAIDA ...... 5 1.2. INFORMACIJA, DUOMENYS, ŽINIOS ...... 10 1.3. INFORMACIJOS VIZUALIZAVIMO BŪDAI ...... 13 1.3.1. Grafikai ...... 13 1.3.2. Lyginamosios diagramos ...... 15 1.3.3. Struktūrinės diagramos ...... 19 1.3.4. Vizualizavo proceso diagramos ...... 21 1.3.5. Matricos ...... 22 1.3.6. Laiko diagramos...... 23 1.3.7. Žemėlapiai ...... 24 1.3.8. Ryšių diagramos...... 25 1.3.9. Iliustracijos ...... 27 1.4. VIZUALIZAVIMO METODAI ...... 29 1.5. DAUGIAMAČIŲ DUOMENŲ VIZUALIZAVIMAS ...... 36 1.5.1. Tiesioginiai vizualizavimo metodai...... 37 1.5.2. Projekcijos metodai ...... 43 1.6. VIZUALIZAVIMO BŪDO PASIRINKIMAS ...... 45 2. EKSPERIMENTINIŲ TYRIMŲ REZULTATAI ...... 49 2.1. Vizualizavimo įrankiai Matlab aplinkoje ...... 49 2.2. Duomenų apie vidutinę temperatūrą Vilniuje vizualizavimas ...... 50 2.3. Duomenų apie naudojimąsi internetu asmeniniais tikslais vizualizavimas ...... 55 2.4. Duomenų apie Lietuvos krepšinio lygos žaidėjus vizualizavimas ...... 62 IŠVADOS ...... 69 LITERATŪROS SĄRAŠAS ...... 71 SANTRAUKA ...... 74 PRIEDAI ...... 76

2

ĮVADAS

Visuomenė kasdien susiduria su didžiuliais informacijos kiekiais. Šiuolaikiniam žmogui nuolatos reikia spręsti užduotį, kaip per kuo trumpesnį laiką suvokti kuo daugiau reikalingos informacijos. Vizualizavimas plačiąja prasme – tai informacijos pateikimo būdas optinio vaizdavimo pagalba, pavyzdžiui, panaudojus grafikus, schemas, paveikslėlius, nuotraukas ir kt. Manoma, kad apie 90 procentų informacijos žmogus suvokia per savo regėjimą. Įdomu tai, kad informacijos vizualizavimo pagalba, galima pateikti informaciją, kurią mes iš esmės negalime įsivaizduoti ar matyti (pavyzdžiui temperatūra). Be to, vizualizavimas padeda formuoti vaizdą mintyse bei suvokti didesnį kiekį įvairios informacijos. Vaizdas yra ryškiausias ir geriausiai įsimintinas, palyginant su kitais pojūčiais. Vizualizavimas padeda spręsti kūrybines ir komercines užduotis, gali tapti labai svarbia sprendimo priėmimo dalimi. Taigi, vizualizavimo pagrindinis tikslas yra perteikti žmonėms naudingą informaciją grafinėmis priemonėmis, taip palengvinus tos informacijos suvokimą. Spartus tobulėjimas ir naujovių diegimas įgalino specialistus grafiškai apdoroti informaciją ir pateikti ją įvairiose techninėse, mokslinėse srityse. Dabar tai yra kone labiausiai pamėgta ir plačiausiai naudojama technologija, kuria dėl jos patogumo ir efektyvumo naudojasi platus tyrinėtojų ir specialistų ratas. Grafikai, schemos, animacija ir kiti vizualizavo būdai naudingi ten, kur neįmanoma pasiekti norimo efekto, pavyzdžiui, skaičių lentelių pagalba. Kasdien susiduriame su vis didesniu informacijos kiekiu, kuriam reikia vis naujesnių vaizdavimo ir sklaidos būdų. Vizualizavimas daug lengviau leidžia pateikti bei suprasti sudėtingą informaciją ir duomenis. Kita vertus, neteisingas vizualizavimo metodų panaudojimas informaciją gali iškraipyti. Duomenų vaizdavimą galima pritaikyti įvairiausiose srityse, pavyzdžiui: moksliniuose tyrinėjimuose, medicinoje, muzikoje, architektūroje, hidrometeorologijoje, astronomijoje, astrologijoje, ekonomikoje, finansų, marketingo srityse, švietime ir daugybėje kitų sričių, kuriose valdomi didžiuliai informacijos srautai.

3

Šio darbo tikslas – ištirti įvairius informacijos vizualizavimo būdus ir metodus bei pateikti rekomendacijas, leisiančias parinkti tinkamiausią vizualizavimo būdą, atsižvelgiant į informacijos pobūdį. Norint pasiekti tikslą būtina išspręsti šiuos uždavinius:  Apžvelgti vizualizavimo raidos etapus;  Nustatytiinformacijos vizualizavimo taikymo galimybes šiuolaikinėje visuomenėje;  Apžvelgti informacijos vizualizavimo būdų ir metodų įvairovę, juos suskirstant į grupes pagal pasirinktus kriterijus;  Pateikti vaizdinius pavyzdžius;  Ištirti informacijos vizualizavimo naudą;  Apžvelgti pagrindinius daugiamačių duomenų vizualizavimo metodus;  Atlikti vizualizavimo tyrimus, naudojant kelis daugiamačių duomenų vizualizavimo metodus.

4

1. INFORMACIJOS VIZUALIZAVIMO BŪDŲ IR METODŲ APŽVALGA

1.1.INFORMACIJOS VIZUALIZAVIMO RAIDA

Nors dažnai manoma, kad informacijos vizualizavimas yra naujas dalykas, tačiau grafinis informacijos vaizdavimas turi gilias šaknis. Vizualizavimo pradžia galima laikyti 16-ąjį amžių ir žemėlapių vaizdavimą. Vėliau vizualizavimas atsirado kartografijoje, statistikoje, medicinoje ir kituose moksluose. 19-ame amžiuje plėtėsi statistinis mąstymas, populiarėjo duomenų surinkimas, vystėsi komercija. Tobulėjant spausdinimo technologijoms, matematikos teorijai ir praktikai, empiriniams stebėjimams bei informacijos registravimo priemonėms, tobulėjo ir plėtėsi grafikos taikymo sritys, grafikos formos ir turinys [1]. Pagrindiniai vizualizavimo vystymosi etapai yra šie:

 Iki 17 amžiaus – pirmieji žemėlapiai ir diagramos;  1600–1699 m. – matavimai ir teorijos;  1700–1799 m. – naujos grafikos formos;  1850 m. – šiuolaikinės grafikos pradžia;  1850–1900 m. – statistinės grafikos auksinis amžius;  1900–1950 m. – modernusis miglotas (tamsusis) amžius;  1950–1975 m. – informacijos vizualizavimo atgimimas;  1975 m. – iki dabar – daugiamatis, interaktyvus ir dinaminis vizualizavimas.

1 pav.Vizualizavimo raidos etapai [2]

5

Toliau aptarti pagrindiniai etapai – vizualizavimo periodai, kurie pavaizduoti 1 paveiksle. Šis skirstymas sąlyginis, tačiau kiekvienas periodas turi sau būdingus ypatumus, atsiradimo priežastis bei vystymąsi.

Laikotarpis iki 17-ojo amžiaus pradžios – ankstyvieji žemėlapiai ir diagramos

Vizualizavimo ištakas galima rasti pirmosiose geometrinėse diagramose – žvaigždžių bei kitų dangaus kūnų išsidėstymo žemėlapiuose, vietovių žemėlapiuose. Jau 200 metų prieš Kristų egiptiečiai panaudojo koordinates žemėlapių vaizdavime. Klaudijaus Ptolemėjaus (gr.Κλαύδιος Πτολεμαιος; ~90 – ~168 m.) žemės rutulio sferinės formos projekcijos žemėlapiai buvo naudojami iki 14-ojo amžiaus.

Ankstyvuose kiekybinės informacijos vaizdavimuose yra grafikas, kuriame pavaizduotas dangaus kūnų padėties keitimasis. Dvimatėje koordinačių sistemoje parodomas planetų judėjimas. Šis grafikas puikiai iliustruoja minimą laikotarpį (2 pav.).

2 pav. 7 dangaus kūnų padėties keitimosi diagrama. 10 amžius [1]

1600–1699 metai. Matavimai ir teorijos

Pagrindinės septynioliktojo amžiaus mokslo problemos susijusios su fizikiniais laiko, erdvės, atstumo matavimais. Tai koordinačių sistemos analitinės geometrijos, tikimybių teorijos, demografinės statistikos, ekonomikos teorijos atsiradimo laikotarpis. Šiuo periodo pavyzdžiu galima laikyti Christopher Scheiner (1630 m.) darbą, kurio esmė – vieno elemento pasikartojimas daug kartų, siekiant iliustruoti dinamiką bei atsirandančius pokyčius. 3 paveiksle pateiktame pavyzdyje parodytos dėmės ant saulės, jų kaita per mėnesį.

6

3 pav. 17 amžiaus vizualizavimo pavyzdys [1] Šiuo laikotarpiu atsiranda ne tik statistinių duomenų, bet ir teorijų ir abstrakčių idėjų pavaizdavimas. 1700–1799 metai. Naujos grafikos formos

Aštuonioliktajam šimtmečiui būdinga tai, kad vizualizuojama ne tik tai, kas akivaizdu. Žemėlapiuose atsiranda kontūrai ir izolinijos. Šio laikotarpio pavyzdžiais laikomi medicininės iliustracijos, pakankamai tikslūs geologiniai žemėlapiai, atsiranda diagramos, vaizduojančios ekonominius, chronologinius duomenis. Pradedamos naudoti geometrinės formos – stačiakampiai, apskritimai ir kt. Atsiranda spalvota spauda. Atsiradus specialiam milimetriniam popieriui, grafikų vaizdavimas tampa daug paprastesnis. Pateiktame pavyzdyje (4 pav.) parodytas vienas pirmųjų papildomų duomenų pavaizdavimas geografiniame žemėlapyje.

4 pav. 18 amžiaus Edmundo Halio geografinis žemėlapis, kuriame atskiriami Pietų ir Vakarų vandenynai [1]

7

Nuo 1850 metų – šiuolaikinės grafikos pradžia

Ankstesni periodai padėjo išvystyti dizaino techniką. Buvo sukurti visi šią dieną naudojami grafikų tipai: stulpelinė ir skritulinė diagramos, histogramos, linijiniai, laiko ir kiti grafikai. Minardas pirmasis padalino stulpelinę diagramą į skirtingo pločio dalis, kas leido pateikti skirtingus rodiklius viename grafike (5 pav.).

5 pav. Minardo diagramoje vaizduojamas komercinių prekių gabenimas Centriniu kanalu [1]

1900 – 1950 metai – tamsusis ar miglotasis amžius

Šį laikotarpį galima pavadinti pasyviu, kadangi vizualizavime ryškių naujovių neatsirado. Tai filosofinių apmastymų amžius, kuomet žmones skirstė į „labiau vizualius“ ir „labiau lentelinius“. Šiuo laikotarpiu sumažėjo ranka pieštų detalių iliustracijų. Atsirado daugiau publikacijų vizualizavimo tema, išleistos knygos. Tuo pačiu grafinių vizualizavimo metodų dėka atsirado daugiau pasiekimų fizikos, astronomijos ir kitose srityse.

Nuo 1950 metų prasideda vizualinės informacijos atgimimas

Vienu metu daugelyje pasaulio valstybių išleidžiami moksliniai darbai, populiarinantys vizualizavimą. John Turkey 1962 metais parašė knygą „Duomenų analizės ateitis“, kurioje atskyrė matematiką nuo statistikos. Vizualizavimas padeda statistikai įgauti didelę prasmę ir formą. Vėl grįžo susidomėjimas grafiniu informacijos pateikimu. Atsiranda duomenų vizualizavimas dvimatėje, trimatėje erdvėje, suklesti programinė įranga, pasirodo C kalba, tobulinami vaizdavimo ir išvesties įrenginiai. 8

1975 m. – iki dabar daugiamatis, interaktyvus ir dinaminis aukštos kokybės vizualizavimas

Šiuo metu mes turime daugybę duomenų, analizavimo įrankių, apie kuriuos ankščiau net negalėjome svajoti. Kiekvienas kompiuteris suteikia įvairiausius būdus rinkti, analizuoti bei vizualizuoti informaciją. Atsirado daugybė interaktyvių sistemų, kurių pagalba galima programuoti ar kitaip reaguoti į pateiktas užduotis. Kiekvienas žmogus, turintis priėjimą prie kompiuterio, nesunkiai MS Office programos pagalba gali pateikti norimą informaciją diagramų, grafikų ar kitokių priemonių pagalba. Vartotojai turi galimybę išryškinti, patobulinti ar kitaip pateikti duomenis trimatėje erdvėje. Atsiranda vis naujų diagramų tipų (pavyzdžiui, paralelinės koordinatės), kompiuteriai tampa pasiekiami visiems, kaip ir duomenų gausa internetinėje erdvėje. Vis didesnę reikšmę įgauna išmanieji telefonai, kurie yra ne kas kitas, kaip mažieji kompaktiški kompiuteriai. Šiame vizualizavimo vystymosi etape gauti, išanalizuoti, pavaizduoti ir pateikti (vizualizuoti) informaciją galima bet kur ir bet kada.

Ši glausta informacijos vizualizavimo raidos apžvalga įdomi tuo, kad leidžia įvertinti ilgą ir įdomų vizualizavimo priemonių kelią iki šių dienų. Matome, kad žmonijos atradimų dėka, besivystant technologijoms, duomenų rinkimo bei statistikos teorijai, kartu augo ir vizualizavimo būdų įvairovė. Dauguma duomenų vizualizavimo naujovių kilo dėl konkrečių praktinių tikslų, norint paaiškinti reiškinius naujais suprantamais būdais.

9

1.2.INFORMACIJA, DUOMENYS, ŽINIOS

Prieš nagrinėjant informacijos vizualizavimo sampratą, visų pirmą reiktų panagrinėti sąvokos „informacija“ reikšmę. Kalbant apie informaciją, neapseinama ir be kitų glaudžiai susijusių sąvokų – duomenys ir žinios. Ir nors šios sąvokos atrodo neatsiejamos viena nuo kitos ir iš pirmo žvilgsnio yra beveik sinonimai, tačiau iš esmės tai visai skirtingi dalykai ir juos būtina atskirti. Informacija – labai plati sąvoka. Ji kilusi iš lotynų kalbos žodžio informatio, reiškiančio „išaiškinimas“, „pranešimas“, „pavaizdavimas“. Tai yra tam žinios apie faktus, įvykius, daiktus, procesus, idėjas, sąvokas ir kitus objektus, kuriuos kuriame nors kontekste turi kokią nors prasmę[3]. Informacijos sąvoką patogu vartoti tada, kai kalbame abstrakčiai, kai mums rūpi pats informacinio ryšio buvimas. Informacijos sąvoka žmogui praktinėje veikloje nėra itin svarbi. Daug svarbiau konkrečiai įvardyti turimą ar ieškomą informaciją, jos turinį, vertę, tinkamumą, svarbą. Informacijos sąvoką galima apibrėžti iš komunikacinių, lingvistinių, socialinių, ekonominių, vadybinių ir kitų pozicijų. Ypač informacija vertinama ekonominėje sferoje, nes ji padeda racionalizuoti darbo procesus, formuoti įmonės strategiją. Ekonomine prasme informacija apibūdinama kaip išteklius, turintis kitiems ištekliams būdingų savybių, nes ją galima pirkti, parduoti, apdoroti, ji aktyviai naudojama vertę kuriančiuose procesuose [4]. Dar viena informacijos sąvoka pateikta G. Dzemydos, O. Kurasovos, J. Žilinsko vadovėlyje„Daugiamačių duomenų vizualizavimo metodai“ [5].Autorių nuomone, informacija – tai duomenys, kurių forma ir turinys yra pateikti tinkamu naudoti sprendimų priėmimo procese būdu. Duomenys virsta informacija, kai jiems suteikiamas kontekstas ir jie susiejami su tam tikra problema ar sprendimu. Taigi, informacija yra pakankamai platus, abstraktus dalykas, tuo ji ir skiriasi nuo duomenų, kurie yra labiau „apčiuopiami“. Informacijos atsiradimas tiesiogiai susijęs su duomenimis. Duomenys, tai objektyviai egzistuojantis faktai, vaizdai arba garsai, kurie gali būti naudingi tam tikram uždaviniui spręsti. Duomenimis tai pat vadiname kompiuteriuose saugomą ir apdorojamą informaciją. Vienareikšmiškai apibrėžti žinias taip pat nėra paprasta, nes daug mokslinių disciplinų šį terminą vartoja reikšti ganėtinai skirtingiems dalykams. Žodžiui „žinios“ iš esmės priskiriamostrys reikšmės. Pirma, jis vartojamas kalbant apie žinojimo būseną, kuria taip pat reiškiamas susipažinimas, pažinimas, žinojimas apie faktus, metodus, principus, technikas ir pan. Antra, žinių sąvoka išreiškiamas pakankamas faktų, metodų, principų ir technikų

10 supratimas, gebėjimas juos pritaikyti ką nors įgyvendinant. Trečia, žinių sąvoka vartojama kalbant apie „užfiksuotus ir sukauptus faktus, metodus, principus, technikas ir t. t. Kai sąvoka vartojama šia prasme, kalbama apie žinojimą, kuris buvo aiškiai išreikštas ir įgytas knygų, formulių, procedūrų vadovų, kompiuterių kodų ir kitu pavidalu“[4]. Žinios – tai žmogaus proto abstrakcija apie duomenis, jų prasmę, naudą ir sąryšius. Turimos žinios gali virsti informacija, kuri gali būti panaudota naujoms žinioms įgyti [5]. Su žiniomis negali būti elgiamasi taip pat kaip su informacija, o informacijos sistemos neįmanoma paprastai performuoti į žinių sistemą. Pagrindinė išvada, su kuria sutinka dauguma teoretikų: informacija ir žinios tarpusavyje glaudžiai susijusios, empiriškai atsakyti į klausimą, kuriuo momentu informacija virsta žiniomis, praktiškai neįmanoma[4]. Informacijos vizualizavimo samprata.Nėra vieningo ir vienareikšmio informacijos vizualizavimo apibrėžimo. Toliaupateikta keletas dažniausiai naudojamų vizualizavimo apibrėžimų:  tai interaktyvus abstrakčių duomenų vaizdavimas, norint išplėsti jų pažinimą [6];  tai dirbtinės atminties suradimas, kuris geriausiai palaiko mūsų natūralų suvokimą[7];  tai vaizdus pateikimas to momento, kuomet jūs gavote tai, ko siekėte, t.y. tikslo pasiekimas [8];  tai failo transformavimas į vaizdinę formą, pvz., kompiuterio monitoriuje [9];  tai duomenų, informacijos ir žinių transformavimo procesas į regimąją formą [10];  tai grafinis informacijos pateikimas [5].

Taigi, informacijos vizualizavimas pirmiausia nagrinėja duomenis, kurie yra abstraktūs, didelės dimensijos ir struktūrizuoti sudėtingu būdu. Tokių duomenų vizualizavimas yra sudėtingas, kadangi vartotojas neturi jokios išankstinės nuomonės, kaip tokie duomenys galėtų atrodyti. Vizualizavimo iššūkis yra surasti regimąją metaforą (angl. visual metaphor), kurią vartotojas galėtų efektyviai suprasti ir jausti. Regimoji metafora perteikia informaciją, kurios vartotojas ieško ir aprūpina sąveikos metodais, kurie leidžia vartotojams dirbti ir tyrinėti duomenis taip efektyviai ir lengvai, kaip tik įmanoma [12]. Informacijos vizualizavimo paskirtis – pagerinti žmonių sugebėjimą suprasti informaciją, panaudojant jų vaizdinį suvokimą. Kuo didesnės apimties duomenys (didesnis objektų arba matmenų skaičius), tuo sunkiau iš duomenų lentelės suvokti objektų visumos ypatybes. Tokių duomenų analizė reikalauja intensyvių tyrimų, specialių žinių ir priemonių. Tai gana sudėtingi uždaviniai, kadangi juos spręsdamas žmogus turi įsigilinti į duomenis, juos interpretuoti, tinkamai

11 pateiktiir padaryti išvadas. Pagrindinė vizualizavimo idėja – duomenis pateikti tokia forma, kuri leistų tyrėjui juos suprasti, daryti išvadas ir tiesioginę įtaką tolesniam jų srautui. Vizualizavimas leidžia geriau suvokti sudėtingas duomenų aibes, gali padėti nustatyti dominančius jos poaibius, atrasti ryšius bei sąveikas. Turint duomenis lentelės pavidalu, galima nubraižyti histogramas, prognozės grafikus ir kitas diagramas, iš kurių išvadas apie duomenis galima padaryti daug lengviau ir greičiau nei iš skaitinių duomenų lentelės, kadangi vizualią informaciją žmogus pajėgus suvokti daug greičiau negu tekstinę[5].

12

1.3.INFORMACIJOS VIZUALIZAVIMO BŪDAI

Tradiciniais vizualizavimo būdais laikomi grafikai, diagramos, schemos, lentelės, ataskaitos, iliustracijos, animacija ir t.t. Tačiau, jei ankščiau vizualizavimą buvo priimta laikyti duomenų analizės pagalbine priemone, tai dabar jis tampa savarankišku, nepriklausomu įrankiu. Žemiau trumpai apibūdinti populiariausi vizualizavimo būdai, kuriuos galima suskirstyti į kelis tipus [12]:

1.3.1. Grafikai

Grafikai parodo duomenų priklausomybę vienas nuo kito. Dažniausiai susideda iš dviejų, vertikalios ir horizontalios x ir y ašių, nors galimi ir trimačiai grafikai. Grafikas yra įprasta techninio analitiko priemonė. Tai populiariausia finansų specialistų, biržos prekiautojų, rinkos prekybos organizatorių priemonė rinkos pokyčiams vertinti bei analizuoti. Grafikų pagalba techniniai analitikai atpažįsta modelius ir tendencijas, kurios gali buti naudingos prekiaujant ir investuojant [13]. Dažniausiai naudojamas ir paprasčiausias grafikų tipas yra linijinis grafikas (angl. line chart). Jis sudaromas, sujungus tam tikrus taškus į vieną liniją. Paprasti linijiniai grafikai ypač naudingi nagrinėjant ilgalaikes tendencijas. Tokiu būdu galima parodyti, pavyzdžiui, kainų svyravimą per nurodytą laikotarpį (6 pav.).

6 pav. Linijinio grafiko pavyzdys [14]

Juostinis grafikas(angl. high/low chart)dažniausiai naudojamas norint pavaizduoti akcijų kainų svyravimus biržoje. Jisparodo mažiausiai tris informacijos elementus: pavyzdžiui, aukščiausią, žemiausią ir uždarymo kainas kiekvienam laiko intervalui. Juostinį grafiką taip pat galima naudoti vaizduojant kasdienės ar metinės temperatūros svyravimus. Kiekvieną laiko intervalą (tai yra dieną, savaitę ar penkias minutes) atitinka vienas brūkšnys [13]. 7 paveiksle pateiktame grafikestulpeliai parodo paskutinės paros kainos svyravimų lygius,t. y. kiekvienas 13 grafiko stulpelis atspindi keturis lygius: konkrečios valiutų poros atsidarymo kainą (žymėjimas kairėje stulpelio pusėje), aukščiausią poros dienos kainą (viršutinis stulpelio lygis), žemiausią dienos kainą (žemutinis stulpelio lygis) ir uždarymo kainą (žymėjimas dešinėje stulpelio pusėje).

7 pav. Juostinio grafiko pavyzdys [14]

Žvakės formos grafikai(dar vadinami Japoniškų žvakių grafiku, angl. candle chart) savo sandara panašūs į juostinius. Abiejų tipų grafikuose naudojamos aukščiausios, žemiausios ir uždarymo kainos, bet žvakės formos grafikuose visada nurodoma ir atidarymo kaina. Rengiant žvakės formos grafiką, aukščiausios ir žemiausios kainos žymimos ant plono brūkšnio,o langelis naudojamas parodyti atidarymo ir uždarymo kainoms. Pavyzdžiui, jei vertybinių popierių uždarymo kaina didesnė už atidarymo, langelis nuspalvinamas balta arba žalia spalva, o jei uždarymo kaina smunka žemiau atidarymo kainos, langelis būna juodos (raudonos) spalvos [14]. Taigi, spalvos padeda greičiau susivokti rinkos pokyčiuose (8 pav.).

8 pav. Žvakės formos grafiko pavyzdys [14]

Taškiniame grafike duomenys vaizduojami taškais (tiksliau – ženkleliais) ir išrinktoms x-ašyje savybėms atitinka y-ašies duomenų reikšmės. Taškiniame grafike dažnai braižoma trendo linija (dar vadinama krypties linija), kuriskirta parodytiryšį tarp duomenų, atkreipti dėmesį į esamų duomenų tendencijas arba ateities duomenų prognozes. Trendo linija susiejama su duomenų seka, tačiau joje nevaizduojami duomenų sekos duomenys. Daugiau 14 apie taškinį grafiką bus kalbama apžvelgiant daugiamačių duomenų vizualizavimo metodus1.5 skyriuje.

9 pav. Taškinio grafiko pavyzdys su kylančia trendo linija [12]

1.3.2. Lyginamosios diagramos

Lyginamosios diagramos parodo ryšius tarp pasirinktų duomenų. Plačiąja prasme, diagrama tai bendras visų schemų bei grafinio duomenų vizualizavimo būdo pavadinimas. Ši sąvoka apima ir grafikus. Stulpelinė diagrama (angl. bar chart). Galima braižyti duomenų, išdėstytų lentelės stulpeliuose arba eilutėse, stulpelinę diagramą. Stulpelinės diagramos kategorijos paprastai vaizduojamos palei horizontaliąją (kategorijos) ašį, o reikšmės – palei vertikaliąją (reikšmių) ašį [12].

10 pav. Stulpelinės diagramos pavyzdys

Histograma(angl. histogram) parodo, kokiomis proporcijomis duomenys pasiskirsto pasirinktuose intervaluose, tas proporcijas nurodo stulpelių aukštis. Histogramos naudingos norint rodyti duomenų pokyčius per tam tikrą laikotarpį arba vaizduoti lyginamus elementus. Histogramose kategorijos paprastai išdėstomos horizontaliojoje ašyje, o reikšmės – vertikaliojoje ašyje (11 pav.).

15

11 pav. Histogramos pavyzdys [15]

Skritulinė diagrama(angl. pie chart).Skritulinė diagrama ženkliai skiriasi nuo aukščiau išvardytų tipų (6-11 pav.), kadangi šiuo atveju nenaudojamos ašys su pažymėtais reikšmių taškais. Skritulinės diagramos vaizduoja vienos duomenų sekos elementų dydį proporcingai elementų sumai. Skritulinėje diagramoje duomenų taškai rodomi kaip viso skritulio procentinės dalys (visas skritulys yra 100 procentų).

12 pav. Skritulinė diagrama

Žiedinė diagrama(angl. ring chart). Kaip ir skritulinė diagrama, žiedinė diagrama vaizduoja dalių ryšį su visuma, bet joje gali būti daugiau nei viena duomenų seka (13pav.).

13 pav. Žiedinėsdiagramos pavyzdys [15]

16

Burbulinė diagrama (angl. bubble chart). Tai grafiko ir diagramos mišinys, kur ant dviejų ašių paskirstyti nurodytų reikšmių taškai.Tik duomenų taškai čia pakeisti burbulais (rutuliais), kurie nesujungiami tarpusavyje, tačiau burbulų tūris išreiškia papildomą duomenų matmenį. Žemiau nurodytoje burbulinėje diagramoje (14 pav.) produktų skaičius rodomas palei horizontaliąją ašį, pardavimų kiekiai rodomi palei vertikaliąją ašį, o rinkos dalies procentus vaizduoja rutulių dydžiai [12].

14 pav. Burbulinės diagramos pavyzdys [15]

Radaro (spindulinė) diagrama (angl. radar chart). Šios diagramos primena voratinklius ar tinklą, kadangi diagramą sudaro iš vieno centro nubrėžtos ašys. Radaro diagrama lygina kelių duomenų sekų sukauptas reikšmes, kur kiekviena reikšmė atitinka tašką ašyje. Ašių skaičius atitinka reikšmių skaičiui, o taškai sujungti linijomis. Skirtingai nei linijinėje diagramoje, radaro diagramoje būna daugiau nei dvi ašys. Tokių diagramų privalumas, kad juose vienu metu galima pavaizduoti kelias nepriklausomas reikšmes, charakterizuojančias bendrą statistinių suvestinių būklę.15 paveiksle matome, kokiais mėnesiais Sodų centro prekyba buvo aktyviausiair kokie produktai tuo metu buvo populiariausi.

15 pav.Radaro diagramos pavyzdys [15]

Plokštuminė (sritinė) diagrama(angl. area chart) pabrėžia pokyčio per tam tikrą laikotarpį dydį ir gali būti naudojamos norint atkreipti dėmesį į bendrą tendencijos reikšmę. Ši

17 diagrama labai panaši į linijinę, tik šiuo atveju sritys tarp skirtingų duomenų reikšmes vaizduojančių linijų nuspalvinamos. Pavyzdžiui, galima braižyti duomenų, vaizduojančių tam tikro laikotarpio pardavimus, plokštuminę diagramą ir taip pabrėžti bendrąją tendenciją (16 pav.).

16 pav. Sritinės diagramos pavyzdys [15]

Debesų žymė(angl. tag cloud)palygina raktinius žodžius ar frazes (reikšmes), esančius teksto ar duomenų rinkinio fragmente, priskirdamas kiekvienam iš jų skirtingą šrifto dydį. O šrifto dydis, šiuo atveju, priklauso nuo parametro vertės. Pavyzdžiui, dvidešimt penki dažniausiai pavartoti žodžiai laikraštyje per mėnesį (17 pav.).

17 pav. Debesų žymės pavyzdys [12]

Šiluminė (spalvinė) diagrama(angl. heatmap)palygina reikšmes duomenų sekoje, priskirdama iš anksto nustatytą spalvą. Spalvinami būna tiek vaizdai, tiek pačios diagramos su reikšmėmis. Spalvos intensyvumas priklauso nuo užduoto parametro (dažniausiai kuo ryškesnė spalva, tuo didesnė reikšmė).18 paveiksle parodytas Šiluminės diagramos pavyzdys, kai ryškia oranžine spalva pažymėti internetinio puslapio elementai, kuriuos vartotojai aplanko dažniausiai [12].

18

18 pav. Šiluminės diagramos pavyzdys [12]

1.3.3. Struktūrinės diagramos

Struktūrinės diagramos– tai grafinės priemonės, parodančios sistemos komponentų struktūros hierarchiją. Jos parodo, kad duomenų srauto elementų diagramos gali būti realizuotos kaip programų dalių hierarchija. Struktūrinės diagramos gali būti naudojamos vaizdiniam programų atvaizdavimui su svarbia informacija. Medžio struktūra(angl. tree).Medžiai yra hierarchinės duomenų struktūros, juose tarp medžio elementų egzistuoja „tėvų - vaikų“ santykiai. Kiekvienas elementas yra susietas su vienu ar daugiau elementų. Ši duomenų struktūra dažniausiai vaizduojama linijomis sujungtais mazgais iš viršaus į apačią. Vienas žinomiausių medžio struktūros pavyzdžių yra šeimos genealoginis medis. 19 paveiksle yra pateiktasgenealoginis medis, sudarytas remiantis Jono Basanavičiaus autobiografija ir Alytaus ekonomijos 1786 ir 1792 m. inventoriais [16].

19 pav. Medžio struktūros pavyzdys [16]

19

Minčių žemėlapis (angl. mindmap) –tai ta pati medžio struktūra, tačiau šiuo atveju šakos dažniausiai „auga“ simetriškai iš centre esančio reikšminio žodžio. Tai puikus būdas performuoti problemą – nusakyti reikšminį žodį ir rasti kiek galima daugiau tiesiogiai susijusių vizualinių sąsajų [12].

20 pav. Minčių žemėlapio pavyzdys [17]

Venno/Eulerio diagrama(angl. Venn/Euler diagram). Venno/Eulerio diagramos iliustruoja matematinius arba loginius ryšius tarp skirtingų objektų ar grupių.Šios diagramos susideda iš apskritimų, kertančių arba esančių vienas kitame. Ta sritis (plotas), kurią apima visi apskritimai, nurodo ką duomenys turi bendro. Pavyzdyje (21 pav.) matome diagramą, atvaizduojančiąGraikų, Rusų ir Lotynų kalbųabėcėles, jos viduryje esančias raides turi kiekviena iš trijų kalbų.

21 pav. Venno/Eulerio diagramos pavyzdys [18]

Plokščias medis(angl. Treemap). Paprasta medžio struktūra puikiai pritaikoma, kai vaizduojamos informacijos nėra labai daug. Tačiau, kai norima pavaizduoti daug duomenų, tokio tipo medis stipriai išsiplečia ir atsiranda daug tuščių nepanaudotų plotų.Naudojant plokščią medį, ši problema išnyksta, nes „Treemap“ struktūra visiškai išnaudoja erdvę ir nepalieka tuščių plotų. Plokščias medis vaizduojamas kaip stačiakampių rinkinys, kurių kiekvienas yra medžio šaka, o stačiakampiai esantys viduje – dukteriniai elementai ir šakos.

20

Stačiakampiai būna įvairaus dydžio, skirtingų spalvų, kurių spalva ir dydis priklauso nuo nurodomų parametrų.

22 pav.Plokščio medžio struktūra [12]

1.3.4. Vizualizavo proceso diagramos

Šio tipo diagramospavaizduoja įvairių procesų seką. Gali apimti vieną ar kelis įvykių vystymosi scenarijus. Formalizuota ar neformalizuota blokinė schema(angl. diagram)parodo esminius veiksmų žingsnius, kuomet tarpusavyje susiję duomenų blokai sujungiami rodyklėmis. Formalizuotos schemos vaizduojamos standartiniu formatu, o blokų dydis ar forma nurodo jų vaidmenį procese. Neformalizuotos blokinės schemos vaizduojamos laisva forma, rodyklės gali būti nukreiptos keliomis kryptimis arba visai neturėti krypties, be to blokai gali būti sujungti į grupes [12]. Blokinės schemos plačiai naudojamos elektronikos srityje, pavyzdžiui aprašant elektroninių prietaisų valdymą (23 pav.).

23 pav. LCD displėjaus valdymo grandinės blokinė schema [19]

21

Ciklinio proceso diagrama(angl. cyclical process diagram) parodo pasikartojančių veiksmų esminius elementus. Ciklinė dalis vaizduojama kaip žiedas, kurį sudaro elementai sujungti rodyklėmis. Proceso pradžią ir pabaigą nurodo įeinančios ar išeinančios iš žiedo rodyklės.

24 pav. Vizualizavimo procesą vaizduojanti ciklinio proceso diagrama

Senkio diagrama (angl. Sankey diagram) nurodo proceso intensyvumą bei pagrindinius žingsnius pasirinktame etape. Tai įvairių išsišakojančių bei susijungiančių linijų visuma, kuri gali turėti begalę taškų, bei vystymosi scenarijų. Tokia diagrama, pavyzdžiui, galėtume pavaizduoti energinių resursų paskirstymą įvairiems ūkiams (25 pav.).

25 pav. Senkio diagramos pavyzdys [12]

1.3.5. Matricos

Matrica (angl. matrix)– tai stačiakampė elementų (dažniausiai skaičių) lentelė, kurioje duomenys paskirstyti į stulpelius ir eilutes. Lentelėje gali būti patalpinta įvairius tipo informacija: tekstinė, skaitinė, grafinė. Kalendorius yra viena dažniausiai naudojamų matricų kasdieniame gyvenime (26 pav.).

22

26 pav. Matricos pavyzdys

1.3.6. Laiko diagramos

Laiko diagramos parodo duomenų priklausomybę nuo laiko. Tokių diagramų yra keletą rūšių. Laiko skalė (angl. timeline). Parodo duomenų reikšmes horizontalioje ašyje, atitinkančioje tam tikrą laikotarpį (27 pav.).

27 pav. Evoliucijos laiko skalė [20]

Ganto diagrama (angl. Gantt diagram).Ganto grafikai ypatingi tuo, kad nesudėtinga ir patogi jų forma leidžia įvertinti projekto įgyvendinimo lygį bei gamybos išteklius, kurie bus reikalingi planui realizuoti. Ganto grafikai naudojami planuojant ar kontroliuojant įvairius rodiklius. Svarbus veiksnys čia yra laikas. Ganto grafikai – tai bazinė laiko koordinatė, nurodanti viso projekto vykdymo laiką bei kiekvieno darbo ar elemento pradžią ir pabaigą. Šie grafikai užtikrina kiekvienos užduoties chronologinius duomenis ir grafiškai pavaizduoja numatomus projekto darbus linijinio grafiko pagalba [21].

23

28 pav. Projekto planas, sudarytas Ganto diagramos pavyzdžiu [22]

1.3.7. Žemėlapiai

Žemelapis– tai simboliais perteiktas tam tikros vietovės vaizdinis modelis, kuriame pažymimas vizualinis santykis tarp tam tikrų komponentų (objektų, regionų ir pan.). Dauguma žemėlapių yra dviejų dimensijų geometriškai tiksli trijų dimensijų erdvės reprezentacija (pvz., geografinis žemėlapis). Žemėlapiams kurti taikomi sudėtingi matematikos dėsniai, pasitelkiama topografinių ar aeronuotraukų informacija, informacijos ir statistikos rašytinių šaltinių duomenys. Yra įvairių žemėlapių rūšių – geografinis, kelių, visuomeninio transporto maršrutų schema ir kt.

29 pav. Lietuvos valstybinės reikšmės kelių žemėlapis [23]

Kartograma– tai grafiškas tam tikrų statistinių duomenų pavaizdavimas žemėlapyje. Tai gali būti žemėlapis, kuriame spalvomis arba štrichais vaizduojami kokio nors reiškinio santykiniai rodikliai, pvz., gyventojų skaičius 1 km2(30 pav.).

24

30 pav. Kartografinės medžiagos pateikimas [24]

Architektūrinis planas– tai tikslus grafiškas pastato ar kambario vidinis išplanavimas. Leidžia geriau suvokti atstumus, išsidėstymą, padeda planuoti erdves.

31 pav. Namo architektūrinis planas [12]

1.3.8. Ryšių diagramos

Ryšių diagramos parodo duomenų vidinius ryšius. Taikoma norint sistematizuoti didelės apimties loginę informaciją. Žiedinė ryšių diagrama (angl. circos diagram). Tai žiedo formos diagrama su pažymėtomis reikšmėmis, kurioje duomenų ryšiai parodomi sujungtomis linijomis žiedo viduje. Esant dideliam reikšmių (parametrų) skaičiui, žiedo vidus gali būti visiškai užpildytas. Ryšiai gali nurodyti ir kryptį [12]. 32 paveiksle pavaizduotas vieno genomo viduje esančių chromosomų ryšių vizualizavimas.

32 pav. Žiedinės ryšių diagramos pavyzdys [25] 25

Arkinė diagrama (angl. arc diagram) – tai linijinė diagrama, kurioje pažymėtos reikšmės, o tarpusavio ryšiai parodomi arkomis (lankais). Žemiau pateiktame 33 paveiksle matome penkių pasaulio religijų: krikščionybės, islamo, induizmo, budizmo ir judaizmo šventųjų knygų panašumų ir skirtumų vizualizavimą[26].

33 pav. Arkinės diagramos pavyzdys[25]

Dendrograma (angl. dendrogram), naudojama siekiant grafiškai parodyti atskirų objektų ar grupių artumą. Tai medžio pavidalo diagrama, kur linijos sujungiamos kai reikšmių parametrai sutampa. Kuo ankščiau linijos sujungiamos, tuo reikšmės artimesnės viena kitai. 34 paveikslepateiktame pavyzdyje matome Oksfordo universiteto mokslininkų sukurtą dendrogramą, kurioje analizuojamos Eurovizijos dainų konkurse dalyvaujančių šalių balsavimo tendencijos 1992 – 2003 metų periode. Aukšta koreliacija įrodo, kad egzistuoja balsavimo grupės [27].

34 pav. Eurovizijos balsų paskirstymo dendrograma [27]

26

1.3.9. Iliustracijos

Iliustracijos parodo procesus ar reiškinius neformalizuotu būdu.

Iliustracija– tai vaizdingas (paveikslėlių, piešinių pagalba) procesų, reiškinių paaiškinimas.Tai tam tikras neformalizuotos blokų schemos analogas. Iliustracijos puikiai tinka gamybos procesams neformaliai pavaizduoti (35 pav.) [12].

35 pav. Apsitraukiančių etikečių gamybos proceso iliustracijos pavyzdys [28]

Komiksas– tai nuoseklus tam tikro proceso ar reiškinio vaizdavimas piešiniais (paveikslėliais), kur kiekvienas piešinis yra siužeto etapas. Mašinos parkavimo instrukcija, yra puikus komikso pavyzdys (pav. 36).

36 pav. Komikso pavyzdys[12]

Vizualizavimo priemonių yra daugybė. 2007 metais Ralfas Lengleris ir Martinas Eppleris (Ralph Lengler, Martin J. Eppler) savo darbe susistemino vizualizavimo metodus ir pateikė periodinę vizualizavimo metodų lentelę (Priedas Nr. 1), kurioje išskyrė net 100 atskirų metodų. Lentelės sudarymo principai panašūs į Mendelejevo periodinės cheminių elementų lentelės sudarymo principą [29]. Vizualizavimo metodus jie apibrėžia, kaip sisteminį, 27 taisyklėmis pagrįstos grafinės informacijos pateikimą palankiu būdu, padedančią suprasti bei pavaizduoti sudėtingas sąvokas, idėjas, pasidalinti patirtimi, palengvinti supratimą. Periodinė lentelė ne tik įvardija metodus, bet ir pateikia pavyzdžius, užtenka „užeiti“ į norimą langelį. Autoriai išskiria 6 metodų grupes: duomenų, informacijos, koncepcijų, metaforų, strategijų ir kompleksinį vizualizavimą.

28

1.4.VIZUALIZAVIMO METODAI

Vizualizavimo metodai – tai sisteminis, taisyklėmis pagrįstas, dinaminis ir/ar statinis grafinis informacijos pateikimas, padedantis suprasti sudėtingus reiškiniusar kurti naujas idėjas, analizuoti ir apibendrinti teorinius bei praktinius dalykus [29]. Vizualizavimo metodus galima suskirstyti pagal taikymo sritį, vizualizavimo lygius, informacijos pateikimo būdus bei pagal vartotojo naudojamų vizualizavimo duomenų tipo bei pagal kitus parametrus [30]. Žemiau trumpai apžvelgti įvairūs žinomi vizualizavimo metodų skirstymai, bei detaliau išnagrinėti kai kurie iš jų. Informacinių technologijų plėtra sąlygojo didžiulio informacijos kiekio atsiradimą visuotiniuose tinkluose. Yra nemažai būdų informacijai surasti, tačiau jie efektyvūs tik tuomet, kai vartotojai turi konkretų tikslą bei supratimą kur ieškot ir kokios informacijos reikia. Kitais atvejais į pagalbą ateina informacijos vizualizavimo metodai. Pagal taikymo sritį, išskiriami tokie vizualizavimo metodai [30]:  Mokslinis vizualizavimas;  Informacijos vizualizavimas. Nors šie metodai skirti skirtingiems duomenų tipams vizualizuoti, tačiau jie taiko panašias technikas, elementus bei vizualizavimo taisykles. Mokslinis vizualizavimas padeda mokslininkams, inžinieriams efektyviau pažinti įvairius fizikinius reiškinius, kuriuos sunku aptikti dideliuose informacijos apimtyse. Informacija gali būti gauta įvairiaisbūdais: imituojant procesus, registruojant skirtingų daviklių, medicininių skanerių, teleskopų ar kitų prietaisų parodymus. Mokslinį vizualizavimą išskiria vizualizuojamo objekto fizinės savybės, jų gamtinė prigimtis (žmogaus kūnas, DNR, molekulės, Žemė ir kt.). Mokslinio vizualizavimo atributais laikomi įvairūs specialūs simboliai (pvz. rodyklė parodanti vėjo kryptį žemėlapyje), trimačiai vaizdai (pvz. magnetinio rezonanso duomenys) bei paviršių (angl. isosurfaces) vaizdavimas (spalvoti kontūrai žemėlapiuose, nurodantys temperatūros pokyčius tam tikrose zonose). Vizualizavimas medicinoje - tai neinvazinės medicininės diagnostikos sritis,kuomet fizinių metodų pagalba tiriamas žmogaus organizmas, siekiant gauti vidaus organų vaizdą. Tokiais atvejais naudojamos garso bangos (ultragarsas), elektromagnetinės spinduliuotės skirtinguose diapazonuose, nuolatinis ar laikinas elektromagnetinis laukas, elementariosios dalelės ir kt. vizualizavimo metodai. Informacijos vizualizavimas, dažniausiai neturi išankstinių geometrinių ar fizinių struktūrų, kuriuose atvaizduojama informacija. Kaip pavyzdį, galima pateikti hierarchinę informacijos vizualizavimo aplinką ar medžio struktūrą, kurios pagalba galima pavaizduoti

29 sąsajas, ryšius tam tikroje elementų struktūroje. Vizualizuojama gali būti tiek konkreti, tiek aiškiai neapibrėžta (nestruktūrizuota) informacija. Pirmosios pavyzdžiu galėtų buti įvairūs žinomi statistiniai duomenys (paprasčiausias būdas vizualizuoti grafikų, diagramų pagalba). Norint grafiškai pavaizduoti nestruktūrizuotą informaciją (pavyzdžiui, elektroninių laiškų archyvai), reikėtų informaciją atskirti bei išanalizuoti.

Galima išskirti tris vizualizavimo lygius [31]:  duomenų vizualizavimas – padeda „perskaityti“ skaičius, pateikia duomenis, tarkim grafikų pagalba, kas leidžia pastebėti dėsningumus.  informacijos vizualizavimas – visų pirmą sujungia įvairius faktus į istoriją ir tuomet vizualizavimo priemonių pagalba interpretuoja įvykius.  žinių vizualizavimas – tai asmens idėjų, minčių išdėstymas vizualizavimo priemonių pagalba.

Dažniausiai vizualizavimo metodai yra skirstomi pagal tai, kurių duomenų tipams vienas ar kitas metodas yra taikomas [30; 32]. Išskiriami septyni duomenų tipai: Vienos dimensijos duomenys (1-D).Dimensijų skaičius – tai parametrų skaičius, kuriuo mes galime aprašyti mus dominančią erdvę. Jeigu mes norime kuo tiksliau ir kuo nuodugniau aprašyti erdvę – mes pasitelkiam vis daugiau parametrų jai aprašyti. Tačiau kai kuriems duomenims aprašyti užtenka vos vienos dimensijos, jiecharakterizuojami tik vienu atributu. Pavyzdžiui, chronologiniams duomenims aprašyti, užtektų tik vieno atributo (parametro) – laiko. Dažniausiai vienos dimensijos būna abstrakti informacija, kurią atvaizduoja vienmačiai objektai. 1-D vaizdavimas naudojamas norint apžvelgti vieną ar visą seriją dokumentų. Skirtingomis spalvomis paprastai pažymimi vizualinio objekto tam tikri parametrai. Pavyzdžiui, SeeSoft [33] sistemoje, spalva nurodo eilės kodo amžių, jos išleidimo numerį, kodo autorių, be to spalva gali nurodyti ar buvo eilėje taisomos klaidos bei pildomos naujos funkcijos[30].

30

37 pav. Duomenų vaizdavimas SeeSoft sistemoje [33] Dviejų dimensijų informacijos vizualizavimo aplinka (2-D). Dviejų dimensijų informacijai vizualizuoti reikalingi du parametrai. Puikių dviejų dimensijų duomenų pavyzdžiu yra geografiniai duomenys, kuriuos gali charakterizuoti tik du parametrai – ilguma ir platuma. Dviejų dimensijų aplinkos taikymo pavyzdžiai: geografinės informacinės sistemos (GIS), kompiuterių lustų dizainas, laikraščių dizainas ir fotografijos. Nors atrodo, kad vizualizuoti vienmačius ir dvimačius duomenys yra paprasta, tačiau praktikoje tenka susidurti su sunkumais. Pavyzdžiui, tais atvejais, kai ilgame laiko intervale vizualizuojamas didelis kiekis duomenų, tai perkeliant paveikslėlį į ekraną, tenka žymiai sumažinti mastelį. Todėl prarandama galimybė ryškiai ir aiškiai matyti vaizdą.

Trijų dimensijų vizualizavimas (3-D). Trimatis vizualizavimo objektas toks, kuris priklausomai nuo naudotojo poreikių gali būti apžiūrimas iš bet kurio erdvės taško aplink jį – t.y. naudotojas pats gali pasirinkti, kaip elementas atrodo ekrane, tai pat pažvelgti į jo vidų. Trimačių vaizdų kūrimas yra sudėtingas ir reikalauja specialių žinių, todėl nėra toks populiarus įprastose situacijose. Trimačiai vaizdai plačiai naudojami medicinoje, architektūroje, kur trimatis vizualizavimas leidžia stebėti vidines ir neištyrinėtas objektų savybes. Trijų dimensijų aplinka gali būti apibūdinama kaip „dirbtinė“ ar „sintetinė“ darbo vieta ar pasaulis. Yra tokių kompiuterinių pasaulių, kurie sudaro tikro trimačio pasaulio įspūdį, nors realiai neegzistuoja. Tai galėtų būti virtuali biblioteka, kurioje vartotojas gali judėti ir rinktis įvairias knygas ir istorijas. Trijų dimensijų vizualizavimo pavyzdžiu yra WebBook sistema, kuri web-puslapius vaizduoja kaip trimačią biblioteką (38 pav.).

31

38 pav.Trimatis WebBook vaizdas [35]

Dabartinės programavimo kalbos, apimančios 3-D yra pirmiausia Virtual Reality Modeling Language (VRML)/eXtensible 3D (X3D) ir Scalable Vector Graphics (SVG)[32]. Vienas įdomiausių 3-D vizualizavimo metodų pritaikymas yra „kubinė akis“ (angl. Cubic Eye)[36]. Tai trimatė platforma, kuri vaizduoja kaip žmonės mato ir sąveikauja su duomenimis. Kubinė akis išsivystė iš tradicinio dvimačio vartotojo interfeiso į atliekamą realiuoju laiku trimatę aplinką, kuri sukelia vertingesnį, malonesnį pojūtį. Kubinės akies įrankiai leidžia programinės įrangos kūrėjams susisteminti turinį, funkcijas ir interfeisus į viengubus ir sudėtinius kubus ir taip išnaudoti ne tik kubų paviršiaus, bet ir jų viduje esančias erdves. Šio metodo privalumas, kad galima atskleisti ir manipuliuoti turiniu ir duomenimis.

39 pav. „Kubinės akies“ pavyzdys, kai sąveika tarp plokščių yra naudojama siekiant sukurti žaidimo aplinką, įtraukiant vartotojus [36]

Daugiamatė informacijos vizualizavimo aplinka (Multi-D). Daugiamatės informacijos vizualizavimas pateikia duomenis, kurių pradinis pavidalas nėra erdvinis, o parametrų skaičius rinkinyje yra didesnis nei trys. Daugiamačio vizualizavimo objektai turėtų būti maždaug vienodos svarbos, be to, jie neturėtų turėti aiškios struktūros ir tarpusavio ryšių. Vienos, dviejų, trijų dimensijų ir

32 laikinosios informacijos vizualizavimo schemos gali būti nagrinėjamos kaip daugiamatės informacijos vizualizavimo poaibis [34]. Daugiamačių duomenų kompiuteriniam vaizdavimui bei analizei reikalingi specialūs vizualizavimo metodai, kaip pavyzdžiui Andrews kreivės ar lygiagrečios koordinatės. Šie metodai plačiau apžvelgti 1.5 skyriuje.

Hierarchinė informacijos vizualizavimo aplinka.Hierarchijos, dar žinomos kaip medžio (angl. tree) struktūros, tai duomenų mazgų rinkiniai, kur kiekvienas mazgas turi unikalų tėvą (mazgą pagal hierarchiją esantį aukščiau), bei gali turėti daug vaikų (mazgai pagal hierarchiją esantys žemiau). Tai ne tik hierarchijos struktūra, bet ir ją apimantys ryšiai. Uždaviniai gali būti susiję su vienu mazgu ar sąsaja, mazgų rinkiniu ar visa struktūra. Hierarchiniai duomenys yra labai įvairūs ir naudojami skirtingose situacijose. Hierarchijos natūraliai atsiranda sistematikoje, organizacijų struktūroje, genealogijoje ir dešimtainių trupmenų struktūroje. Tradicinis hierarchijos pristatymas paprastai susideda iš dviejų dimensijų aplinkos, kur mazgai-vaikai yra patalpinti po mazgais-tėvais medžio formos struktūroje. Tokioje struktūroje specifinių mazgų peržiūra ir paieška gali būti paini, klaidinanti ar sunkiai įvykdoma. Naujesnės vizualizavimo technologijos (pavyzdžiui, Plokščio medžio struktūra, 22 pav.) parodo daug daugiau mazgų ar net visą medį, tai leidžia vartotojui įsivaizduoti visą medžio struktūrą ir mažina dezorientaciją [34].

Tinklinės informacijos vizualizavimas. Tinklinė struktūra (angl. network) naudojama tais atvejais, kai hierarchinė struktūra negali tinkamai parodyti visus sudėtingus ryšius tarp vizualizavimo objektų. Tai sudėtinga padaryti, pavyzdžiui, cituojant informacijos šaltinius mokslinėje publikacijose ar nustatant ryšius tarp tekstinių dokumentų [30]. Duomenys būna susiję tarpusavyje tam tikrais ryšiais. Tokių ryšių pavaizdavimui naudojami grafai, kurie susideda iš mazgų ir ryšių, sudarydami tinklą. Mazgai atspindi duomenų esmę, o ryšiai atspindi santykius tarp dviejų mazgų. Dėl didelės informacijos apimties, dalis informacijos paslepiama. Kadangi sudaryti hierarchiją ar struktūrą iš duomenų rinkinių taškų nelengva, todėl jie skirstomi į klases, skirtingiems tinklų atvejams. Tinklo diagramos dažnai naudojamos internetinio tinklo struktūrai pavaizduoti [34]. Tinkliniam duomenų vizualizavimui naudojami metodai: Netmap, NetViz, MatrixBrowser, Grokker ir kt. [32]

33

Įmontuotų spyruoklių metodas (angl. spring-embedder model) ir jo atmainos yra populiarus tinklinių ryšių vizualizavimo algoritmų pavyzdys. Šio metodo pagalba galima pamatyti, kaip jūsų draugai yra susiję vienas su kitu „Facebook"tinklapyje (40 pav.) [37].

40 pav. Tinklinio draugų rato „Facebooke“ vizualizavimo pavyzdys [37]

Laikinių duomenų vizualizavimas (Temporal). Informacija vizualizuojama chronologine tvarka. Siekiant aptikti informacijos laikinį aspektą, naudojami vizualiniai kintamieji, tokie kaip vieta ir padėtis bei animacija. Vizualiniai objektai įprastai įsikuria palei ašį, nurodančią jų atsiradimo laiką, antra ašis gali būti naudojama kiekvieno laikinio objekto kai kurių atributų vaizdavimui [30].

Pagal vartotojo sąsaja su vizualizuojamais duomenimis galima išskirti statistinį ir interaktyvųjį metodus. Statistinis, tai grafiškas statistinių duomenų vizualizavimas. Interaktyvus metodas, tai operatyvus vartotojo ir sistemos bendradarbiavimas, siekiant tiesiogiai manipuliuoti vaizduojamaisiais objektais bei pasirenkant, kokia informaciją kokią informaciją pateikti, išryškinti ar paslėpti. Išskiriami septyni bendradarbiavimo tipai [30; 32]:  apžvalga – bendras visų objektų vaizdinis pristatymas;  mastelio nustatymas, kuomet dominanti informacija pateikiama didesniu šriftu;  filtravimas, kuomet neįdomūs ar nereikalingi vartotojui duomenys nuslepiami;  detalumo reikalavimas, esant poreikiui, rodo išsamią informaciją apie objektus;  tarpusavio ryšiai, nurodo informacijos objektų tarpusavio santykius;  istorija, saugo vartotojo veiksmų informaciją, kas leidžia pakartoti, pakeisti ar patikslinti duomenis;  ištrauka, leidžia išskirti dalį informacijos pagal kelis parametrus.

34

Reikėtų pažymėti, kad geriausiai žmogaus akys suvokia dvimatę informaciją. Tačiau norint gauti tikslesnę informaciją ar ištirtiduomenisnuodugniau, naudojama daugiau parametrų, didesnis dimensijų skaičius. Naudojant dviejų, trijų ar didesnio kiekio dimensijų informacijos vaizdavimą, vartotojas gali pamatyti įvairius duomenų dėsningumus:  klasterius ar objektų skirstymas į klases;  topologinius ypatumus;  tendencijas;  informacija apie duomenų pasiskirstymą;  kitas priklausomybes.

35

1.5.DAUGIAMAČIŲ DUOMENŲ VIZUALIZAVIMAS

Besiplečiant šiuolaikinėms technologijoms, tobulėjant kompiuteriams ir programinei įrangai, kartu daugėja ir saugomų duomenų kiekiai. Svarbu ne tik surinkti duomenis, bet ir juos suvokti, interpretuoti, atskirti svarbią informaciją nuo menkavertės. Duomenų vizualizavimo pagrindinis tikslas ir yra suprantama bei aiškia forma pateikti turimą informaciją. Dažniausiai nekyla problemų analizuojant bei interpretuojant nedidelės apimties dvimačius ar trimačius duomenys, tuomet pakanka įprastų diagramų ar grafikų vizualizavimui. Kai duomenys yra daugiamačiai, t. y. kai nurodo sudėtingą objektą ar reiškinį, apibūdinamą daugeliu parametrų (požymių, savybių, rodiklių, ypatybių), kurie gali būti ne tik skaitiniai, bet loginiai, tekstiniai ir kt., juos suvokti yra nelengvas uždavinys.Su daugiamačiais duomenimis (daugiau nei trijų dimensijų)nuolat susiduriama medicinoje, ekonomikoje, ekologijoje ir daugelyje kitų sričių. Tokių duomenų analizė nelengvas uždavinys, nes reikalauja intensyvių tyrimų, specifinių žinių ar įgūdžių. Nagrinėjant daugiamačius duomenis, nuolat susiduriame su dviem pagrindinėmis sąvokomis – taiobjektas ir parametras. Sąvoka objektas gali apimti įvairius dalykus: žmones,produktus, gamtos reiškinius ir kt., tai yra tai kas konkrečiu atveju analizuojama. Objektai apibūdinamibendrais parametrais, kurie vadinami požymiais, savybėmis, rodikliais, komponentėmis ar kintamaisiais.Kiekvienas parametras turi tam tikras skaitines reikšmes, iš kuriųįmanoma sudaryti skaičių lentelę. Kuo didesnės dimensijos (matavimųskaičius)duomenys, tuosunkiau iš lentelės išgauti informacijos apie santykius tarp atskirų objektų [38]. Dažnai iškyla būtinybė nustatyti ir giliau pažinti daugiamačių duomenų struktūrą: susidariusias grupes (klasterius), itin išsiskiriančius objektus (taškus atsiskyrėlius), objektų tarpusavio panašumą ar skirtingumą ir pan.Daugiamačių duomenų analizei taikomi klasifikavimo, klasterizavimo, statistinės analizės ir kiti metodai. Jais galima nustatyti stebimų duomenų artimumą, sudaryti taisykles, pagal kurias tokio tipo duomenys būtų rūšiuojami, vertinti atskirų parametrų įtaką daromam sprendimui. Klasikinis daugiamačių duomenų pavyzdys – R. Fišerio dar 1936 m. paskelbta keturmačių duomenų lentelė. Šie duomenys vis dar dažnai naudojami įvairių duomenų analizės metodų eksperimentiniuose tyrimuose. Buvo išmatuota 150-ies irisų žiedų vainiklapių plotas, vainiklapių ilgis, taurėlapių plotas ir taurėlapių ilgis. Matuoti trijų veislių irisų žiedai, po 50 kiekvienos veislės: Iris Setosa, Iris Versicolor ir Iris Virginica. Sudaryti 4-mačiai vektoriai – kiekvieną vieną žiedą apibūdina po keturis skaičius. Gauta lentelė, kurioje 150 eilučių ir 4 stulpeliai. Geometriškai tai 150 taškų keturmatėje erdvėje [5].

36

Kuo didesnės dimensijos duomenys, tuo sunkiau iš skaitinės duomenų lentelės išgauti informacijos apie santykius tarp atskirų objektų. Daugiamačių duomenų tiesioginis vaizdavimas būna sudėtingas, ir įvairių daugiamačių vizualizavimo metodų naudojimas padeda analizuoti ir atvaizduoti žmogui suprantamesne forma sudėtingais ir dažnai nežinomais tarpusavio ryšiais susietus daugiamačius duomenis. Dažnai neįmanoma pateikti visų duomenų parametrų neprarandant jokios informacijos, todėl būtina ieškoti būdų, leidžiančių tuos praradimus minimizuoti. Metodų įvairovė yra pakankamai plati, todėl būtina įvairių metodų analizė, norint išsirinkti geriausiai tinkančius [38]. Daugiamačių duomenų vizualizavimo metodai intensyviai plėtojami siekiant didinti duomenų analizės efektyvumą, suprantamiau pateikti ir objektyviau įvertinti duomenų gavybos bei analizės rezultatus. Šie metodai plėtojami dviem pagrindinėmis kryptimis: Tiesioginio vizualizavimo metodais kiekvienas daugiamačio objekto parametras yra pateikiamas tam tikra vizualia forma. Projekcijos, dar vadinamieji matmenų skaičiaus mažinimo metodai (angl. dimension reduction techniques), leidžiantys daugiamačius duomenų objektus atitinkančius vektorius pateikti mažesnio skaičiaus matmenų erdvėje [5; 38].

1.5.1. Tiesioginiai vizualizavimo metodai

Daugiamačių duomenų tiesioginio vizualizavimo metoduose nėra apibrėžto formalaus matematinio vizualizavimo kokybės kriterijaus. Visi daugiamačius objektus apibūdinantys parametrai pateikiami žmogui priimtina vizualia forma. Šiuos metodus galima suklasifikuoti į geometrinius, simbolinius ir hierarchinio vizualizavimo [5].

Geometriniai vizualizavimo metodai. Geometriniai vizualizavimo metodai yra tokie, kuriuose analizuojamus daugiamačius duomenis atitinkančių vektorių komponenčių reikšmės yra vaizduojamos naudojant pasirinktos geometrinės figūros ašis. Pagrindinė tokių metodų idėja – vizualizuoti duomenų transformacijas Dekarto arba kitoje koordinačių sistemoje [5]. Išskiriami tokie geometriniai metodai:  Taškinių grafikų (angl. scatter plots).  Taškinių grafikų matricos (angl. matrix of scatter plots).  Linijinių grafikų (angl. line graphs, multiline graphs).  Perstatymų matricos (angl. permutation matrix).

37

 Apžiūros grafikų (angl. survey plots).  Andrews kreivių (angl. Andrews curves).  Lygiagrečiųjų koordinačių (angl. paralell coordinates).  Spindulinio vizualizavimo (RadViz), jo modifikacijų.

Taškiniai grafikai yra vienas dažniausiai naudojamų duomenų pateikimo plokštumoje arba trimatėje erdvėje būdų. Įprastai šiuo būdu atvaizduojami dvimačiai arba trimačiai taškai. Taškiniai grafikai yra panašūs į linijinius grafikus, kadangi naudojamos horizontali ir vertikali ašis duomenų taškams sudėlioti. Turint dvimatį arba trimatį vektorių, jo pirmos komponentės reikšmė pažymima x ašyje, antros – y ašyje, trečios (jei tokia yra) – z ašyje. Per pažymėtus taškus išvedamos tiesės statmenos ašims. Taškas plokštumoje (erdvėje) atidedamas ten, kur šios tiesės susikerta. Taškiniai grafikai, kuriose naudojamos įvairios spalvos ar formos, gali būti taikomi analizuojant duomenis, kurie turi daugiau nei tris komponentes. Tačiau tada rezultatas nebus toks aiškus, kaip analizuojant dvimačius ar net trimačius duomenis. Viena priežastis yra ta, kad tik x, y ašių naudojimas ir z ašies, spalvos, formos naudojimas neturi vienodo aiškaus vizualizavimo efekto. Šis metodas gali padėti rasti susidariusias grupes, taškus-atsiskyrėlius (angl. outliers), trendus ir koreliacijas tarp kelių duomenų parametrų. Taškiniai grafikai parodo, kiek vienas kintamasis veikia kita. Jie dažniausiai apima didelės apimties duomenis. Kuo taškai išsidėsto arčiau vienas kito, tuo didesnė koreliacija ir stipresnis ryšis tarp duomenų. Galima teigiama ir neigiama koreliacijos. Teigiama dviejų kintamųjų koreliacija yra tada, kai aukštas vieno kintamojo matas reguliariai susijęs su aukštu kito kintamojo matu. Neigiama koreliacija yra tada, kai aukštas vieno kintamojo matas reguliariai susijęs su žemu kito kintamojo matu.

41 pav. Taškinio grafiko pavyzdys bei teigiamos ir neigiamos koreliacijos pavyzdžiai.

38

Taškinių grafikų matricos rodo ryšius tarp kelių parametrų (kintamųjų), paimtus vienu metu. Tai atkirų taškinių grafikų kombinacija, leidžianti vaizduoti kelis atributus vienu metu. Tokio tipo matricos gali atskleisti daugiau informacijos, nurodyti priklausomybes, klasterius ar išimtis [40]. Pavyzdyje (42 paveikslėlyje) matome 4x4 taškinių grafikų matricą, kurioje pavaizduoti ryšiai tarp vidutinės namo vertės bei kambarių (A), miegamųjų (B) bei namų ūkių (C) skaičiaus. Ši taškinių grafikų matrica rodo, kad kambariai, miegamieji ir namų ūkiai koreliuoja (susiję) tarpusavyje. Ir jeigu aukšta koreliacija tarp A ir B, bei tarp B ir C, tuomet aukšta koreliacija bus tarp A ir C [41].

42 pav. Taškinių grafikų matricos pavyzdys [41]

Lygiagrečiųjų koordinačių metodas(angl.parallel coordinates) – tai gana plačiai paplitęs būdas vizualizuoti didelės dimensijos duomenis. Lygiagrečiųjų koordinačių metodas gali būti taikomas gana didelio skaičiaus matmenų duomenims vizualizuoti. Tačiau tada tenka koordinates išdėstyti labai arti viena kitos. Taip sutankinus koordinates, sunku suvokti vizualizuotų duomenų struktūrą. Atvaizdavus didelę duomenų aibę, t. y. kai objektų skaičius yra didelis, suvokti gautus rezultatus tampa taip pat labai sudėtinga, dažnai beveik neįmanoma. Lygiagrečios koordinatės, o ypač hierarchinės lygiagrečiosios koordinatės, gali būti naudojamos duomenims klasterizuoti. Kaip atrodo irisų duomenys lygiagrečiosiose koordinatėse, parodyta žemiau esančiame paveikslėlyje. Skirtingos spalvos atitinka skirtingas irisų veisles. Kaip matome, geriausiai veislės atsiskiria pagal vainiklapio ilgį ir vainiklapio plotį. Pagal taurėlapio ilgį ir taurėlapio plotį veislių atskirti neįmanoma [5].

39

43 pav. Lygiagrečiųjų koordinačių pavyzdys (irisų duomenų aibė) [5]

Andrews kreivių metodas primena lygiagrečių koordinačių metodą, tačiau jame daugiamatis taškas vaizduojamas ne tiesių atkarpomis, o trigonometrinės funkcijos kreive. Šis duomenų vizualizavimo metodas kaip ir lygiagrečių koordinačių metodas irgi per daug nesuardo geometrinės struktūros.

44 pav. Andrews kreivės, vaizduojančios irisų duomenis [5]

Simboliniai metodai. Simboliniai metodai (angl. iconographic display) padeda ne tik daugiamačius duomenis atvaizduoti dvimatėje ar trimatėje erdvėje, bet ir padėti lengviau juos suvokti. Šiais metodais kiekvienas analizuojamas objektas, kurį nusako n-matis vektorius, vaizduojamas pasirinktu simboliniu ženklu (glyph). Simbolio spalva, forma ar padėtis priklauso nuo analizuojamų vektorių komponenčių reikšmių[5]. Simboliniai metodai geriausiai tinka duomenų klasterių nustatymui, jie padeda atrasti tiek paprastus ryšius ar priklausomybes tarp kintamųjų, tiek sudėtingus sąryšius, kuriuos sunku aprtinkti tiesiog analizuojant duomenis. Pagrindinė idėja – duomenys yra pateikiami kaip atskiri grafiniai objektai (veidai, žvaigždės ar kt.), kur kintamųjų reikšmės atitinka tam tikrus bruožus arba objektų matmenis (akių, nosies dydis, linijos ilgis ir pan.)[42].

40

Galima išskirti tokius simbolinius metodus:[5]  Černovo veidų (angl. Chernoff faces).  Žvaigždžių (angl. star glyphs).  Brūkšnelinės figūros (angl. stick figure).  Spalvotos piktogramos (angl. color icon).

Černovo veidai, tai veidų scheminis vaizdavimas, kuomet atskiriems veido bruožams priskiriamos atitinkamos charakteristikos. Tokiu būdu Černovo veidų išraiškos ar formos keisis priklausomai nuo duomenų rinkinio. Kiekviena duomenų komponentė nustato kažkurios veido dalies dydį, padėtį ar formą. Tai leistų suprasti bendrą sistemos būklę bei pamatyti nukrypimus nuo normos. Pavyzdžiui, pernelyg didelės akys gali reikšti nukrypimą nuo normos kitų charakteristikų fone. Kartais šis metodas padeda atrasti paslėptus ryšius tarp duomenų, kuriuos negali aptikti kiti metodai[43]. Michael D. Lee ir Rachel E. Reilly savo darbe [44] nagrinėjo simbolinius metodus. Šiam tikslui jie išanalizavo 20 gyvūnų pagal keturioliką skirtingų požymių, panaudodami dvejetainės sistemos principą, ir sudarytoje lentelėje pažymėjo gyvūnus atitinkančius nurodytą požymį - „1“, o neatitinkančius - „0“ (Priedas Nr.2). Gautus duomenis jie atvaizdavo Černovo veidų metodu (45 pav.). Pagal gautą rezultatą, galima iš karto pastebėti susidariusias panašias gyvūnų grupes bei atskirti mažiausiai bendro turinčius individus. Tarkim 13 ir 14 veidai gavosi vienodi, todėl galima daryti išvadą, kad keturiolikos skirtingų požymių nepakanka šiuos gyvūnus atskirti (tai būtų dramblys ir žirafa). O 6 ir 7 veidai tarpusavyje turi daug bendro, bet visiškai skiriasi, pavyzdžiui nuo 20 veido (bite, musė ir tunas).

. 45 pav. Veidai vizualizuoja skirtingus gyvūnus pagal Černovo veidų metodą [44]

41

Vienas iš populiariausių simbolinių metodų yra žvaigždžių metodas.Kiekvienas vizualizuojamas objektas vaizduojamas stilizuota žvaigžde. Iš vieno taško nubraižoma tiek spindulių, kiek yra objektą apibūdinančių parametrų. Kampai tarp spindulių turi būti vienodi, o spindulio ilgis priklauso nuo jį atitinkančio parametro reikšmės (46 pav.). Išoriniai spindulių galai yra sujungiami linijomis.

46 pav. Žvaigždžių metodų pavaizduoti gyvūnai [44]

Brūkšnelinė figūra susideda iš penkių sujungtų segmentų vadinamų galūnėmis (angl. limbs). Viena galūnė pavadinama kūnu (angl. body). Kiekviena galūnė turi kelis parametrus (ilgis, storis, spalva, pasukimo kampas ir kt.), kuriais gali būti išreiškiami analizuojamų duomenų parametrai. Dažniausiai šiuo metodu atvaizduojami daugiamačiai duomenys (penkių ar daugiau dimensijų). Keturi parametrai gali būti išreikšti kiekvienos galūnės orientacija, penktasis – kūno pasvirimu, i jei parametrų bus daugiau, juos galima išreikšti galunių storiu ar spalva. 47paveiksle pavaizduota bazinės konfigūracijos figūra ir brūkšninių figūrų grupė[38].

47 pav. Brūkšnelinės figūros pavyzdys [38]

Hierarchinio vizualizavimo metodai. Taikant hierarchinio vizualizavimo metodus (angl. hierarchical display), vieni daugiamačius objektus apibūdinantys parametrai bandomi „įsprausti“ į kitus parametrus. 42

Išskiriami tokie hierarchinio vizualizavimo metodai:[5] • Matmenų įterpimo (angl. dimensional stacking). • Grotelių (angl. trellis display). • Fraktalų (angl. fractal foam). • Hierarchinių lygiagrečiųjų koordinačių (angl. hierarchical parallelcoordinates).

1.5.2. Projekcijos metodai

Daugiamačiai duomenys dažnai būna labai didelės apimties, todėl juos nelenga vertinti, efektyviai pateikti bei interpretuoti. Tačiau transformavus daugiamačius duomenis į dvimatę ar trimatę vaizdo erdvę ir juos vizualizavus, daug lengviau pamatyti duomenų struktūrą bei suvokti sąryšius tarp jų. Šiam tikslui naudojama vizualizavimo metodų grupė – projekcijos metodai, dar vadinami dimensijos mažinimo metodais [45]. Egzistuoja daug įvairių projekcijos metodų, kurie vienas nuo kito gali skirtis atvaizduojančios funkcijos charakteristikomis, kaip ji gaunama ir koks optimizavimo kriterijus yra naudojamas. Yra išskiriami tiesiniai ir netiesiniai projekcijos metodai. Pagrindinis skirtumas tarp jų yra toks, kad tiesiniai projekcijos metodai ieško tiesinio poerdvio (tokio, kaip tiesė ar plokštuma), o netiesiniai metodai ieško netiesinio poerdvio. Tiesiniai metodai yra patrauklesni, kadangi jie reikalauja mažiau skaičiavimų, tačiau, netiesiniai metodai yra daug veiksmingesni. 48 paveiksle matomas skirtumas tarp tiesinės ir netiesinės projekcijos. Taškai vienas nuo kito yra išdėstyti vienodais atstumais. Jei mes projektuosime juos į vienmatę erdvę tiesine projekcija (į tiesę), atstumai tarp taškų nebus išlaikyti (48 a) pav.). Tačiau netiesinęs projekcijos atveju radus netiesinę kreivę, atstumai tarp artimiausių taškų „kaimynų“ išlieka (48 b) pav.) [45].

a) b) 48 pav. Skirtumas tarp teisinės (a) ir netiesinės (b) projekcijos [45]

43

Projekcijos metodai: 1) Tiesinės projekcijos metodai:  Pagrindinių komponenčių analizė (angl. principal component analysis),  Projekcijos paieškos metodas (angl. projection pursuit),  Faktorinė analizė (angl. factor analysis),  Tiesinė diskriminantinė analizė (angl. linear discriminant analysis),  Nepriklausomų komponenčių analizė (angl. independent component analysis).

2) Netiesinės projekcijos metodai:  Daugiamatės skalės (angl. multidimensional scaling),  Sammono projekcija (angl. Sammon mapping),  Pagrindinės kreivės (angl. principal curves),  Trianguliacijos metodas (angl. triangulation),  Isomap metodas (angl. isomap),  Lokaliai tiesinis atvaizdavimas (angl. locally linear embedding)[38].

Daugiamačių duomenų vizualizavimas padeda ne tik atvaizduoti duomenis dvimatėje ar trimatėje erdvėje, bet geriau suvokti turimus duomenis,efektyviai pateikti ir įvertinti duomenų tyrimo rezultatus. Tai yra svarbus duomenų analizės įrankis, kuris palengvina jų interpretavimą,padeda geriau suvokti daugiamačių duomenų struktūrą – susidariusias grupes, žymiai išsiskiriančius objektus ar duomenų tarpusavio ryšius.

44

1.6.VIZUALIZAVIMO BŪDO PASIRINKIMAS

Tuos pačius duomenis galima pateikti įvairiais būdais ir kuris bus tinkamiausias priklauso nuo sprendžiamos užduoties. Populiariausi vizualizavimo būdai – brėžiniai, grafikai ir diagramos. Norint vizualizuoti projekto planą, galime naudoti bet kokias kompiuterines priemones, kurių pagalba galime kurti lenteles, braižyti grafikus ir diagramas (pvz. MS Word, MS Excel ir t.t.). Surinkti duomenys vizualizuojami, kad būtų išvengta visų duomenų peržiūrėjimo. Taigi duomenys vizualizuojami, nes žmogaus akiai malonesnis yra vaizdus duomenų pateikimas, negu ilgas duomenų nagrinėjimas didelės apimties lentelėse. Kuris diagramos ar grafiko tipas yra tinkamiausias konkrečioje situacijoje, priklauso nuo daugybes faktorių. Svarbu ir patirtis – duomenų grafiniame vaizdavime nepaprastai daug vietos kūrybai, tik nereikia pamiršti, kad pagrindiniai jų sudarymo principai yra aiškumas, paprastumas ir suprantamumas. Be to, statistiniai grafikai negali visiškai pakeisti lentelių, nes jie pateikia gerokai mažiau informacijos, ir vaizduojamų reikšmių dydį iš grafikų galima nustatyti tik apytikriai. Dabartinėje visuomenėje sukurta daugybėpriemonių, padedančių vizualizuoti informaciją, vartotojai gali rinktis įvairius metodus ir nupiešti šimtus grafikų, diagramų, schemų tipų. Todėl vizualizavimo metodo pasirinkimas, ypač jei pasirinkti turi pats vartotojas, yra nelengva užduotis. Tą pačią informaciją mes galime vizualizuoti skirtingais būdais. Pasirinktas vizualizavimo metodas turi atlikti savo paskirtį, t.y. pažvelgus į vizualizuojamą informaciją, mes iš karto turime pamatyti duomenų tarpusavio ryšius ar skirtumus, kas mus padėtų priimti sprendimus ar padaryti išvadas. Pasirenkant vizualizavimo būdą ar metodą, rekomenduojama:  Išanalizuoti, ar turime pateikti visus duomenis ar tik jų dalį;  Pasirinkti vaizdavimo proporcijas, dydį bei mastą;  Pasirinkti metodą, kuris geriausiai parodys pasirinktų duomenų dėsningumus. Vizualizuodami dvimačius ar trimačius duomenis dažniausiai pasirenkame populiariausius būdus, tai būtų linijinis grafikas, skritulinė diagrama, histograma ir pan. Linijinį grafiką pasirenkame norėdami parodyti reiškinių pokyčius per tam tikrą laikotarpį (pvz. valiutų kurso pokyčiai), ar norėdami palyginti kelias skaičių sekas (tokiais atvejais kelios linijos braižomos toje pačioje koordinačių ašyje).

45

Taškinį grafiką rekomenduojama pasirinkti norint parodyti ir palyginti skaitines reikšmes, pvz., mokslinius, statistinius arba inžinerinius duomenis. Jis naudingas, kai siekiama parodyti kelių duomenų sekų skaitinių reikšmių ryšį. Skritulinę diagramą rekomenduojama pasirinkti, jei yra tik viena duomenų seka, kurią norima braižyti,kai norima parodyti procentinį dalių santykį, palyginus su visuma, t.y. analizuojant reiškinių sudėtį ar struktūrą. Skritulinėje diagramoje nė viena iš reikšmių neturi būti neigiama ar lygi nuliui. Stulpelinė diagrama yra naudinga kai norima greta palyginti įvairių kategorijų duomenis, kai yra keliose duomenų sekos. Ši diagrama pasirenkama, kai duomenys sudaryti iš teigiamų, neigiamų ir nulinių reikšmių. Histograma naudojama lyginant reikšmes per tam tikrą laikotarpį, jos naudingos norint rodyti duomenų pokyčius laike. Hierarchinius vizualizavimo metodus (pvz., medžio ar plokščio medžio metodus) pasirenkame norėdami parodyti organizacijų ar procesų struktūras. Jeigu turime didelės apimties, kelių dimensijų informaciją ir norėtume nurodyti priklausomybes, klasterius ar išimtis, renkamės vieną iš daugiamačių vizualizavimo metodų (pvz., taškinių grafikų matrica, Černovo veidų metodas, lygiagrečios koordinatės ar kt.) arba naudojame dimensijų mažinimo metodus, kuomet daugiamačiai duomenys perkeliami į dvimatę ar trimatę vaizdo erdvę, kas padeda daug paprasčiau suvokti duomenų struktūrą ir ryšius tarp jų. Taigi, vizualizavimo būdo pasirinkimas priklauso nuo pasirinktos užduoties ir duomenų rūšies. Ir čia esminis vaidmuo tenka žmogui, kuris daro išvadas ir priima galutinį sprendimą. Kaskart pateikiant informaciją vizualizavimo priemonių pagalba, mes įveikiame tam tikrus žingsnius (etapus). Vizualizavimas, tai tam tikras procesas, kuomet yra renkama informacija, ji analizuojama, vėliau planuojama kaip ir kokiu būdu ją pateiksime ir tik tuomet seka galutinis rezultatas. Norint pasiekti geriausią vizualizavimo rezultatą, rekomenduojama vizualizavimo procesą suskirstyti į tokius etapus.  Tikslo bei auditorijos nustatymas. Svarbu suprasti, kam ir kokią informaciją mes norime pateikti. Priklausomai nuo to, ar tai bus veiklos ataskaita, mokslinio straipsnio iliustracija ar tam tikri statistiniai duomenys, mes pasirenkame viena iš daugelio vizualizavimo būdu. Be to visuomet reikia turėti omeny kam ši informacija skirta – ar žmogus susipažinęs su tema ar jam reikalingi papildomi paaiškinimai, ar užtektų paprastų grafikų ar panaudoti

46 vaizdingesnes bei sudėtingesnes priemones. Pagrindinis tikslas ne tik pateikti informaciją, bet kad pastaroji būtų aiški ir suprantama auditorijai.  Duomenų rinkimas. Kaskart reikėtų surinkti kuo daugiau įvairesnės informacijos – dalis jos bus pagrindinė, likusi pagalbinė. Norint atkreipti dėmesį į svarbiausius, aktualiausius dalykus, informacija analizuojama ir pateikiama jau išnagrinėta.  Vizualizavimo metodo bei būdo parinkimas. Tai kaip atrodys galutinis rezultatas tiesiogiai priklausys nuo užbrėžto tikslo bei turimų duomenų. Svarbu, ką mes norime pademonstruoti – ar duomenis sulyginti, ar parodyti jų tarpusavio ryšį, ar atkreipti dėmesį į pokyčius per tam tikrą laiką. Šiame darbe buvo aprašyti nemažai galimų vizualizavimo metodų. Kurį konkrečiu atveju pasirinkti, priklausys ne tik nuo vizualizuojamo objekto, bet ir nuo vizualizuojančio sugebėjimų.  Juodraščio sudarymas. Optimalų vizualizavimo rezultatą pasieksime, jei išbandysime įvairius skirtingus metodus ir iš jų išsirinksime geriausią.  Vizualizavimo programinis realizavimas. Galutinis vaizdas priklauso ne tik nuo pasirinkto metodo, bet ir kokiame kontekste informacija bus naudojama – ar pateikta popieriuje, kompiuteryje, ar mobiliajame telefone, tai bus vienintelis vizualizavimo objektas ar tik kažkokios informacijos ar programos dalis. Gautas vaizdas bus sėkmingas, jei jis bus suprantamas, informatyvus bei naudingas. Vizualizavime galime išskirti keletą krypčių: Mokslinių (apskaičiuotų ar eksperimentinių) duomenų vizualizavimas. Dauguma šiuolaikinių matematinės programinės įrangos paketų (pvz. Maple, Matlab, MathCAD) skirti kurti grafikams, paviršiams ir trimačiams objektams pagal iš anksto pateiktus skaičiavimus. Vizualizavimas patogia forma pateikia didelius duomenų kiekius analizei ir yra plačiai naudojamas apdorojant įvairius matavimus bei skaičiavimus. Geometrinis projektavimas ir modeliavimas. Ši sritis susijusi su aprašomosios geometrijos užduočių vykdymu – brėžinių, eskizų braižymu, trimačių vaizdų kūrimu. Šiems uždaviniams vykdyti sukurtos specialios programinės sistemos, tokios kaip AutoCAD ir yra plačiai naudojamos architektūroje, inžinerijoje. Vaizdinių atpažinimas. Grafinės informacijos atpažinimas bei klasifikavimas yra vienas iš pagrindinių dirbtinio intelekto užduočių. Tai ir skenavimas ar veidų atpažinimas, pvz. oro uostuose. Yra sukurtos specializuotos teksto atpažinimo programos, tokios kaip FineReader. Vaizduojamasis menas. Šiai krypčiai galima priskirti grafinę reklamą, kompiuterinius videofilmus, nuotraukų apdorojimą, animaciją ir kitą. Šios srities kompiuterinei grafikai kurti 47 puikiai tinka Adobe Photoshop (rastrinių vaizdų apdorojimas), CorelDRAW (vektorinės grafikos kūrimas), 3ds max (trimatis modeliavimas). Kompiuterinei grafikai galima priskirti ir virtualius žaidimus ir skaitmeninius vaizdus (televizija). Nurodytas klasifikavimas yra sąlyginis, visuomet gali atsirasti naujovių, nepriskiriamų nei vienai iš aukščiau išvardytų krypčių[46]. Daugiamačiams duomenims vizualizuoti kuriamos ir vystomos įvairiausios duomenų analizės sistemos. Pavyzdžiui, XGobi yra vizualizavimo sistema, dirbanti „Windows“ ir „Unix“ terpėse, kurios dėka galima braižyti taškinius grafikus, taškinių grafikų matricas, lygiagrečias koordinates, ieškoti projekcijos ar peržiūrėti visas galimas projekcijas. XGViz yra programoje realizuotas daugiamačių skalių metodas. Paprastai duomenys pateikiami plokštumoje, o XGViz leidžia pateikti juos ir trimatėje erdvėje. Xmdv sistemoje realizuoti taškiniai grafikai, žvaigždžių metodas, lygiagrečių koordinačių metodas, dimensijų įterpimo metodas. DataDesk sistema skirta tiriamajai duomenų analizei (angl. exploratory data analysis), čia akcentuojamos duomenų struktūros, trendų, klasterių ir taškų atsiskyrėlių vizualios, interaktyvios paieškos priemonės. JMP yra interaktyvi statistinė sistema, naudojama vizualizavimui ir duomenų analizei. Daug duomenų analizės galimybių turi viena populiariausių mokslininkų tarpe sistema Matlab [47].

Informacijos vizualizavimo nauda yra neabejotina. Duomenų analizės sistemos padeda:  greičiau įsisavinti naują informaciją;  pamatyti ryšius, dėsningumus sudėtingoje ir didelės apimties informacijoje;  pateikti informaciją kurią mes iš esmės negalime įsivaizduoti ar regėti;  skatina tyrinėjimus ir atradimus.

48

2. EKSPERIMENTINIŲ TYRIMŲ REZULTATAI

Šiame skyriuje aprašyti naudoti vizualizavimo įrankiai bei pateikti eksperimentinių tyrimų rezultatai, vizualizuojant kelis duomenų rinkinius įvairiais būdais ir metodais. Tiriama, kuris vizualizavimo būdas tinkamesnis priklausomai nuo vizualizuojamų duomenų specifikos. Vizualizuojami keli duomenų rinkiniai:  duomenys apie vidutinę temperatūrą Vilniuje;  duomenys apie naudojimąsi internetu asmeniniais tikslais;  duomenys apie Lietuvos krepšinio lygos (LKL) žaidėjus.

2.1.Vizualizavimo įrankiai Matlab aplinkoje

Šiuo metu sukurta daug vizualizavimo įrankių ir priemonių. Statistikos paketai, tokie kaip SPSS, Statistica, SAS/STAT turi duomenų vizualizavimo įrankius. Plačiai naudojama MS Excel programa (ar kita panaši skaičiuoklė) taip pat turi nemažą kiekį grafikų ir diagramų braižymo įrankių. Matlab aplinkoje yra funkcijų, leidžiančias įvairias informacijos vizualizavimo formas. Šiame darbe eksperimentiniuose duomenų vizualizavimo tyrimuose naudota Matlab aplinka. Matlab paketas tinka algoritmų kūrimui, duomenų analizei ir vizualizavimui bei skaičiavimų atlikimui. Ši aplinka pasirinkta dėl jos vizualizavimo būdų ir metodų gausos bei didelio funkcionalumo. Joje yra įgyvendinti ne tik grafikų bei diagramų formos, kurios yra ir MS Excel programoje, bet ir daugiamačių duomenų vizualizavimo bei kiti metodai. Be to, Matlab aplinkoje galima programuoti savas funkcijas bei scenarijus pasinaudojant standartines Matlab funkcijas. Todėl Matlab aplinka ypač tinkama vizualizavimo būdų bei metodų įgyvendinimui ir jų analizei. Matlab yra visi grafiniai įrankiai, reikalingi moksliniams, inžinieriniams, statistiniams duomenims vizualizuoti. Ši aplinka turi aukšto lygio funkcijas dvimačiam ir trimačiam duomenų vaizdavimui, grafikų, diagramų, animacijos brėžimo funkcijas, galimybės eksportuoti duomenis į visus populiariausius formatus. Šiame tiriamajame darbe Matlab pagalba nubraižytos linijinės, stulpelinės, skritulinės diagramos. Matlab aplinkoje yra daugybė daugiamačių duomenų vizualizavimo įrankių – Andrew kreivės, Lygiagrečiosios koordinatės, Černovo veidai, Žvaigždžių metodas ir kiti. Šiemetodaitaip pat naudotitiriamajame darbe. Vaizdams palyginti, vienas iš grafikų nubraižytas naudojant C# kalbos galimybes.

49

2.2.Duomenų apie vidutinę temperatūrą Vilniuje vizualizavimas

Duomenys apie vidutinę metinę, liepos bei sausio mėnesio temperatūrą Vilniuje 2005– 2012 metų laikotarpyje paimti Iš Lietuvos statistikos departamento duomenų bazės1. Duomenys pateikti 3priede. Vizualizavimui naudoti 2.1 skyriuje aprašyti įrankiai. Duomenys, atsisiųsti iš minėtos duomenų bazės, buvo perkelti į MS Excel lentelę (failas „.xlsx“, lentelė „orai“) (49 pav.).

49 pav.Duomenys apie vidutinę temperatūrą Vilniuje MS Excel lentelėje

Tuomet naudojant Matlab funkciją xlsread duomenys perkelti į Matlab aplinką, įvykdžius tokį scenarijų: file='vilnius.xlsx'; sheet1 = 'Orai'; [num, text] = xlsread(file, sheet1, 'a1:e11');

Įvykdžius scenarijų, duomenys išskirti pagal tipus, num pažymėta temperatūra, o text – žodiniai paaiškinimai. Pradžioje temperatūros svyravimams vaizduoti pasirinkta stulpelinė diagrama. Siekiant gauti stulpelinę diagramą, pateiktą 50 paveiksle, įvykdytas toks scenarijus: file='vilnius.xlsx'; sheet1 = 'Orai'; [num, text] = xlsread(file, sheet1, 'a1:e11'); figure suptitle('Metinė, Sausio ir Liepos mėn. vidutinė temp. Vilniuje'); bar(num) legend('metinė','sausio mėn','liepos mėn') str = { '2012'; '2011'; '2010'; '2009';'2008';'2007';'2006';'2005'}; set(gca, 'XTickLabel',str, 'XTick',1:numel(str), 'fontsize',16,'fontweight', 'bold')

1http://osp.stat.gov.lt/web/guest/statistiniu-rodikliu-analize?portletFormName=visualization&hash=39e0e4da- 41ab-4545-9d2a-41f70d6fb196 50 ylabel('temperatūra', 'fontsize',16,'fontweight', 'bold'); xlabel('metai', 'fontsize',16,'fontweight', 'bold') set(gcf, 'Position', get(0,'Screensize'));

50 pav.Duomenų apie vidutinę temperatūrą Vilniuje stulpelinė diagrama

Linijinė diagrama gauta įvykdžius tokį scenarijų, pateikta 51 paveiksle: figure suptitle('Metinė, Sausio ir Liepos mėn. vidutinė temp. Vilniuje' ); hold on plot(num(1:8,1),'-.g*', 'LineWidth',2) plot(num(1:8,2),'-.r+', 'LineWidth',2) plot(num(1:8,3),'-.b','LineWidth',2) str = { '2012'; '2011'; '2010'; '2009';'2008';'2007';'2006';'2005'}; set(gca, 'XTickLabel',str, 'XTick',1:numel(str), 'fontsize',16,'fontweight', 'bold') legend('liepos mėn','metinė','sausio mėn') ylabel('temperatūra', 'fontsize',16,'fontweight', 'bold'); xlabel('metai', 'fontsize',16,'fontweight', 'bold') set(gcf, 'Position', get(0,'Screensize'));

51 pav.Duomenų apie vidutinę temperatūrą Vilniuje linijinė diagrama

51

Įprasta informaciją, susijusią su temperatūra, pateikti šiluminės diagramos pavidalu. Siekiant gauti šiluminę diagramą, pateiktą 52 paveiksle, įvykdytas toks scenarijus: figure; imagesc(num); axis image; drawnow; colormap('jet'); suptitle('Metinė, Sausio ir Liepos mėn. vidutinė temp. Vilniuje' ); str = { '2012'; '2011'; '2010'; '2009';'2008';'2007';'2006';'2005'}; set(gca, 'YTickLabel',str, 'YTick',1:numel(str), 'fontsize',16,'fontweight', 'bold') str = { 'metinė ','sausis ','liepa '}; set(gca, 'XTickLabel',str, 'XTick',1:numel(str), 'fontsize',10,'fontweight', 'bold') colorbar ylabel('metai', 'fontsize',16,'fontweight', 'bold'); xlabel(' temperatūra ', 'fontsize',16,'fontweight', 'bold'); set(gcf, 'Position', get(0,'Screensize'));

52 pav.Duomenų apie apie vidutinę temperatūrą Vilniuje linijinė diagrama Šiluminė diagrama iš kitų pateiktų rezultatų (50, 51 pav.) išsiskiria savo ryškumu. Joje puikiai matomi šalčiausi bei karščiausi mėnesiai, tačiau sunkiau suvokiama informacija, susijusi su temperatūros pokyčių tendencija per tam tikrą laikotarpį.

Temperatūrų svyravimams vaizduoti galima naudoti diagramų tipus, kuriuos įprasta naudoti visiškai kitose srityse, pavyzdžiui finansų, inžinierijoje ar statistikoje. Žemiau pateiktuose 53, 54 paveisluose šiam tikslui parinktos juostinės diagramos rūšis(angl. stem) bei stačiakampė diagrama (angl. box). 53 paveiksle pateiktam pavyzdžiui gauti buvo įvykdytas toks scenarijus: stem(num, 'LineWidth',2) suptitle('Metinė, Sausio ir Liepos mėn. vidutinė temp. Vilniuje' );

52 str = { '2012'; '2011'; '2010'; '2009';'2008';'2007';'2006';'2005'}; set(gca, 'XTickLabel',str, 'XTick',1:numel(str), 'fontsize',16,'fontweight', 'bold') ylabel('temperatūra', 'fontsize',16,'fontweight', 'bold'); xlabel('metai','fontsize',16,'fontweight', 'bold'); set(gcf, 'Position', get(0,'Screensize')); legend('metinė','sausio mėn','liepos mėn')

53 pav.Duomenų apie apie vidutinę temperatūrą Vilniuje juostinė diagrama

54 paveikslui gauti buvo įvykdytas toks scenarijus: boxplot(num) suptitle('Metinė, Sausio ir Liepos mėn. vidutinė temp. Vilniuje' ); str = { 'metinė','sausio mėn','liepos '}; set(gca, 'XTickLabel',str, 'XTick',1:numel(str) , 'fontsize',16,'fontweight', 'bold') ylabel('temperatūra ', 'fontsize',16,'fontweight', 'bold'); set(gcf, 'Position', get(0,'Screensize'));

54 pav.Duomenų apie apie vidutinę temperatūrą Vilniuje stačiakampė diagrama

53

Nors 50 – 54paveiksluose pateikti tie patys duomenys, tačiau pateikimo forma skiriasi, o tas įtakoja ir informacijos suvokimą. Norint nustatyti, kada sausio ir liepos mėn. buvo šilčiausi (šalčiausi), verta rinkti stulpelinę ar šiluminę diagramas. Pažvelgus į jas (50, 52 pav.) matome, kad tiriamame laikotarpyje sausio mėnuo buvo šilčiausias 2007 bei 2008 metais, tais pačiais metais liepos mėnuo buvo pats šalčiausias, o 2010 ir 2006 metais buvo atvirkščiai. Tačiau, vidutinė metų temperatūra per tiriamą laikotarpį beveik nekito, ypač tai akivaizdu, žiūrint į linijinę (50 pav.) ar juostinę diagramą (52 pav.). Pastebima tendencija, kad esant šaltam sausiui, liepos mėnuo būna karštas ir atvirkščiai. Norint stebėti vieno mėnesio kitimo tendenciją, tinkamesnė yra linijinė diagrama, kadangi „nesimaišo“ kito mėnesio duomenis vaizduojantys stulpeliai, kaip yra žiūrint į stulpelinę diagramą. Stačiakampė diagrama (54 pav.) geriausiai parodo kurio mėnesio temperatūra per tiriamąjį laikotarpį labiausiai kito (sausio mėn.).

54

2.3.Duomenų apie naudojimąsi internetu asmeniniais tikslais vizualizavimas

Šiam tyrimui taip pat panaudoti duomenys iš Lietuvos statistikos departamento svetainės2,kur pateikti duomenys apie asmenis, kurie naudojasi internetu asmeniniais tikslais 2007–2013 metų laikotarpyje (4 priedas). Minėti duomenys buvo perkelti į MS Excel lentelę. Tuomet naudojant Matlab funkciją xlsread, duomenys iš MS Excel lentelės perkelti į Matlab aplinką, įvykdžius tokį scenarijų: file='tyrimas2.xls'; sheet1 = 'Sheet1'; [num, text] = xlsread(file, sheet1, 'a1:m9');

Įvykdžius tokį scenarijų, duomenys išskirti pagal tipus, num pažymėtos procentinės dalys, o text – žodiniai paaiškinimai. Šiems duomenims vizualizuoti pasirinkta skritulinė ir stulpelinė diagramos, kadangi jos skirtos parodyti ryšius tarp pasirinktų duomenų bei padeda palyginti turimus duomenys. Pradžioje duomenims apie naudojimąsi internetu vaizduoti pasirinktaskritulinė diagrama. Siekiant gauti skritulinę diagramą, pateiktą 56 paveiksle, įvykdytas toks scenarijus (55 pav.):

55 pav. Skritulinės diagramos sudarymas file='tyrimas2.xls'; sheet1 = 'Sheet1'; [num, text] = xlsread(file, sheet1, 'a1:m9'); pie(num(1,1:11)); legend('Ryšiams','Siuntė/gavo elektroninius laiškus',' Skambino naudodamiesi internetu, vaizdo konferencijos', 'Dalyvavo pokalbių svetainėse ir pan.', 'Ieškojo informacijos apie prekes ir paslaugas', 'Naudojosi paslaugomis, susijusiomis su kelionėmis ir apgyvendinimu', 'Atsisiuntė programinę

2http://osp.stat.gov.lt/web/gues0t/statistiniu-rodikliu-analize?portletFormName=visualization&hash=4b0fe8ad- 8901-43ed-b471-bdcb4ed257ef 55

įrangą',' Skaitė naujienas, siuntėsi laikraščius, žurnalus', 'Ieškojo darbo,siuntė prašymus dėl darbo', 'Ieškojo informacijos, susijusios su sveikatos priežiūra', 'Naudojosi internetinės bankininkystės paslaugomis') suptitle('Asmenys, kurie naudojosi internetu asmeniniais tikslais 2013 metais')

56 pav.Asmenys, kurie naudojosi internetu asmeniniais tikslais 2013 metais, skritulinė diagrama

Atlikus vizualizavimą paaiškėjo, kad skritulinė diagrama 2.3. skyriuje pasirinktiems duomenims vizualizuoti netinkama, kadangi tokioje diagramoje vaizduojama tik vienaduomenų seka elementų dydžiai proporcingi elementų sumai. Taigi, visą turimą informaciją galėtume pateikti 7 arba 11 diagramose, o vienoje diagramoje nėra galimybių perteikti visos turimos informacijos. 56 paveiksle pateiktas pavyzdys, kuomet pateikti tik vienųmetų (2013 m.) duomenys. Šiuo atveju tikslinga pasirinkti stulpelinę diagramą, kadangi joje vienu metu galime pateikti kelis užduotus parametrus. Galima pateikti skirtingus metus ir nurodyti kokius konkrečius veiksmus asmenys atliko dažniausiai (naudojosi internetu ryšiams, siuntė laiškus, ieškojo informacijos ar kt.). Siekiant gauti stulpelinę diagramą, pavaizduotą 57 paveiksle, įvykdytas toks scenarijus: bar(num) suptitle('Asmenys, kurie naudojosi internetu asmeniniais tikslais') legend('Ryšiams', 'Siuntė / gavo elektroninius laiškus', 'Skambino naudodamiesi internetu, vaizdo konferencijos', 'Dalyvavo pokalbių svetainėse ir pan.', 'Ieškojo informacijos apie prekes ir paslaugas', 'Naudojosi paslaugomis, susijusiomis su kelionėmis ir apgyvendinimu', 'Atsisiuntė programinę įrangą', 'Skaitė naujienas, siuntėsi laikraščius, žurnalus', 'Ieškojo darbo, siuntė prašymus dėl darbo', 'Ieškojo informacijos,

56 susijusios su sveikatos priežiūra', 'Naudojosi internetinės bankininkystės paslaugomis') ylabel('Asmenys, kurie naudojosi internetu asmeniniais tikslais procentais', 'fontsize',12,'fontweight', 'bold'); xlabel('metai', 'fontsize',12,'fontweight', 'bold'); str = {'2013'; '2012'; '2011'; '2010'; '2009';'2008';'2007'}; set(gca, 'XTickLabel',str, 'XTick',1:numel(str) ,'fontsize',10,'fontweight', 'bold')

57 pav. Asmenys, kurie naudojosi internetu asmeniniais tikslais 2007-2013 laikotarpiu. Stulpelinės diagramos pavyzdys, kai stulpeliai vaizduojami vertikaliai

Palyginimui, nuspręsta nubraižyti stulpelinę diagramą, kurioje stulpeliai vaizduojami horizontaliai (58 pav.), tam kad galima būtųįvertinti, kuris būdas yra tinkamiausias ir „malonesnis akims“. Šiam tikslui buvo įvykdytas toks scenarijus: barh(num) suptitle('Asmenys, kurie naudojosi internetu asmeniniais tikslais') xlabel('Asmenys, kurie naudojosi internetu asmeniniais tikslais procentais', 'fontsize',16,'fontweight', 'bold'); ylabel('metai', 'fontsize',16,'fontweight', 'bold'); legend('Ryšiams','Siuntė / gavo elektroninius laiškus', 'Skambino naudodamiesi internetu, vaizdo konferencijos',' Dalyvavo pokalbių svetainėse ir pan.', 'Ieškojo informacijos apie prekes ir paslaugas', 'Naudojosi paslaugomis, susijusiomis su kelionėmis ir apgyvendinimu', 'Atsisiuntė programinę įrangą', 'Skaitė naujienas, siuntėsi laikraščius, žurnalus', 'Ieškojo darbo, siuntė prašymus dėl darbo', 'Ieškojo informacijos, susijusios su sveikatos priežiūra',' Naudojosi internetinės bankininkystės paslaugomis') str = {'2013'; '2012'; '2011'; '2010'; '2009';'2008';'2007';}; set(gca, 'YTickLabel',str, 'YTick',1:numel(str), 'fontsize',10,'fontweight', 'bold')

57

58 pav. Asmenys, kurie naudojosi internetu asmeniniais tikslais 2007-2013 laikotarpiu. Stulpelinės diagramos pavyzdys, kai stulpeliai vaizduojami horizontaliai

Vertinant informacijos suvokimo galimybes, tarp diagramų,pavaizduotų 57 ir 58 paveiksluose, skirtumų nepastebėta, todėl galima pasirinkti bet kurį variantą. Bet kuriuo atveju stulpelinėje diagramojepuikiai matosi, kad interneto naudojimas kiekvienais metais auga. Tik keli parametrai išliko daugmaž nepakitę, tai: „Naudojosi paslaugomis, susijusiomis su kelionėmis ir apgyvendinimu“, „Atsisiuntė programinę įrangą“, „Ieškojo darbo, siuntė prašymus dėl darbo“. Taigi, duomenims apie interneto naudojimąsi skirtingais tikslais ir per tam tikrą laikotarpį vizualizuoti nebetinka diagramos ar grafikai, kurie sugeba pavaizduoti tik vieną duomenų seką (pvz., burbulinė, skritulinė diagramos).

Vaizdų palyginimui tie patys duomenys buvo perkelti į C#aplinką (Priedas Nr.5) ir gauta 59paveiksle pavaizduota stulpelinė diagrama.

58

59 pav. Asmenys, kurie naudojosi internetu asmeniniais tikslais 2007-2013 laikotarpiu. Stulpelinės diagramos, gautos su C# programa, pavyzdys

Šiuo atveju stulpelinėje diagramoje ašims buvo priskirtos kitokios reikšmės. Spalvomis buvo pažymėti ne tikslai, o nurodyti skirtingi metai. Tokiu atveju, mes negalime iš karto matyti interneto naudojimosi tendencijas laiko atžvilgiu, tačiau šis variantas iš karto atkreipia dėmesį, kokius veiksmus asmenys atlieka dažniausiai (skaitė naujienas, laikraščius ir kt.), ir kokiais tikslais naudojosi internetu rečiau (domėjosi kelionėmis ir apgyvendinimu).

Dar vienas būdas pavaizduoti turimus duomenis yra sudėtinė histograma (stulpelinės diagramos tipas), kuris pateiktas žemiau esančiame pavyzdyje (60 a, b pav.). Šiuo atveju duomenys palyginimui pateikti 2D ir 3D paveiksluose. Diagramoms nubraižyti buvo įvykdytas toks scenarijus: bar(num, 0.5, 'stack'); suptitle('Asmenys, kurie naudojosi internetu asmeniniais tikslais') str = {'2013'; '2012'; '2011'; '2010'; '2009';'2008';'2007';}; set(gca, 'XTickLabel',str, 'XTick',1:numel(str), 'fontsize',10,'fontweight', 'bold') legend('Ryšiams','Siuntė / gavo elektroninius laiškus', 'Skambino naudodamiesi internetu, vaizdo konferencijos',' Dalyvavo pokalbių svetainėse ir pan.', 'Ieškojo informacijos apie prekes ir paslaugas', 'Naudojosi paslaugomis, susijusiomis su kelionėmis ir apgyvendinimu', 'Atsisiuntė programinę įrangą', 'Skaitė naujienas, siuntėsi laikraščius, žurnalus', 'Ieškojo darbo, siuntė prašymus dėl darbo', 'Ieškojo informacijos, susijusios su sveikatos priežiūra',' Naudojosi internetinės bankininkystės paslaugomis') xlabel('metai','fontsize',10,'fontweight', 'bold'); ylabel('Asmenys, kurie naudojosi internetu asmeniniais tikslais procentais', 'fontsize',10,'fontweight', 'bold');

59 set(gca, 'YTickLabel', [0 10,20,30,40,50,60,70,80,90,100], 'fontsize',10,'fontweight', 'bold') bar3(num); suptitle('Asmenys, kurie naudojosi internetu asmeniniais tikslais') str = {'2013'; '2012'; '2011'; '2010'; '2009';'2008';'2007';}; set(gca, 'yTickLabel',str, 'YTick',1:numel(str) , 'fontsize',10,'fontweight', 'bold') legend('Ryšiams','Siuntė / gavo elektroninius laiškus', 'Skambino naudodamiesi internetu, vaizdo konferencijos',' Dalyvavo pokalbių svetainėse ir pan.', 'Ieškojo informacijos apie prekes ir paslaugas', 'Naudojosi paslaugomis, susijusiomis su kelionėmis ir apgyvendinimu', 'Atsisiuntė programinę įrangą', 'Skaitė naujienas, siuntėsi laikraščius, žurnalus', 'Ieškojo darbo, siuntė prašymus dėl darbo', 'Ieškojo informacijos, susijusios su sveikatos priežiūra',' Naudojosi internetinės bankininkystės paslaugomis') zlabel('Asmenys, kurie naudojosi internetu asmeniniais tikslais procentais', 'fontsize',10,'fontweight', 'bold'); ylabel('metai', 'fontsize',10,'fontweight', 'bold');

a)

b)

60 pav. Asmenys, kurie naudojosi internetu asmeniniais tikslais 2007-2013 laikotarpiu. Sudėtinė histograma a) ir trimatė sudėtinė histograma b)

60

Sudėtinės histogramos vaizduoja atskirų elementų ryšį su visuma, lyginant kiekvienos reikšmės svarbą bendroje tarpkategorinėje sumoje. Iš 60 paveiksle pateiktų diagramų matyti, kuriuos veiksmus asmenys atliko palyginti dažniau, tačiau šios diagramos neparodo visų turimų duomenų, o trimatis variantas atrodo perkrautas stulpeliais ir todėl vertinti informaciją darosi dar sudėtingiau.

Taigi, daroma išvada, kad duomenų vertinimas priklauso ne tik nuo pasirinktos vizualizavimo priemonės, bet ir nuo to, kokias reikšmes mes priskirsime ašims bei kurį vizualizavimo būdą pasirinksime – dvimatį ar trimatį. Vienu atveju (57, 59 pav.) mes matome interneto naudojimo augimo tendenciją, kitu (59 pav.) geriau galime vertinti populiariausias sritis, dar kitu atveju (60 pav.) galime vertinti atskirų elementų ryšį su visuma. Taip pat svarbu parinkti tinkamą vizualizavimo būdą, priešingu atveju galime gauti nepilną informaciją (56, 60 pav.).

61

2.4.Duomenų apie Lietuvos krepšinio lygos žaidėjus vizualizavimas

Šiam tyrimui panaudoti keturių 2013–2014 metų sezono geriausių LKL komandų (Vilniaus Lietuvos rytas, Klaipėdos Neptūnas, Kauno Žalgiris, Prienų TonyBet) krepšininkų statistinius duomenis3 (6 priedas). Krepšinis yra labai populiarus Lietuvoje, todėl įdomu vizualizavimo priemonių pagalba išanalizuoti, kurie žaidėjai yra geriausi savo srityje ir išsiskiria iš kitų.

Nėra lengva vizualizuoti bei glaustai ir aiškiai pateikti tokios apimties (nagrinėjamos keturios komandos, 50 krepšininkų) ir daug požymių (13 parametrų) turinčius duomenis.Sudėtinga iš pirmo žvilgsnio nustatyti kuris iš daugelio vizualizavimo būdų šioje situacijoje tiks labiausiai, todėl duomenims analizuoti pritaikyti kelį daugiamačių duomenų vizualizavimo metodai: Černovo veidai, lygiagrečiosios koordinatės, Andrews kreivės, šiluminė diagrama.

Krepšininkų duomenims analizuoti pasirinkta šiluminė diagrama, kadangi tai yra neįprastas ir plačiai netaikomas vizualizavimo būdas tokio tipo duomenims. Nors šis vizualizavimo būdas dažniausiai naudojamas oro temperatūrai vaizduoti, tačiau jis puikiai tinka ir kitiems daugiamačiams duomenims analizuoti. Šiame tyrime vizualizuojama ne Matlab aplinkoje, o pagal internete aptiktą Šiluminės diagramos panaudojimo pavyzdį4. Visų pirmą duomenys buvo perkelti į MS Excel lentelę, vėliau formatas pakeistasį csv, kad HeatMap programa galėtų nuskaityti duomenis. Toliau buvo įvykdytas toks scenarijus ir gauta 61 paveiksle pateikta diagrama. lkl <- read.csv("C:/Users/tomas/Desktop/lkltyrimas/lkl1.csv", sep=",") lkl_matrix <- data.matrix(lkl) lkl <- lkl[order(lkl$PTS),] row.names(lkl) <- lkl$Name lkl <- lkl[,2:13] lkl_heatmap <- heatmap(lkl_matrix, Rowv=NA, Colv=NA, col = cm.colors(256), scale="column", margins=c(5,10))

3www.lkl.lt duomenys, paimti 2014 m. balandžio 7 d. 4http://flowingdata.com/2010/01/21/how-to-make-a-heatmap-a-quick-and-easy-solution/ 62

G Sužaista rungtinių MIN Laikas aikštelėje P2 Dvitaškiai procentais P3 Tritaškiai procentais P1 Baudų metimai proc. REB Atkovoti kamuoliai AS Rezultatyvūs perdavimai TO Prarasti kamuoliai ST Perimti kamuoliai EFF Efektyvumas PTS Taškai

61 pav. LKL žaidėjų statistinius duomenis vaizduojanti šiluminė diagrama

61 paveiksle matome penkiasdešimties žaidėjų rezultatus ar kitus požymius (amžius, ūgis) atspindinčią diagramą. Kuo ryškesnė violetinė spalva, tuo didesnis skaičius (reikšmė), balta spalva reiškia vidurkį, o kuo žydra spalva yra ryškesnė, tuo mažesnį skaičių (reikšmę) parodo.

Taigi vos žvilgtelėjus į diagramą, galima daryti išvadas apie žaidėjus. Pavyzdžiui, iš karto matyti, kad aukščiausias lygos žaidėjas yra Mindaugas Kupšas, o žemaūgiai yra Mindaugas Girdžiūnas, Domantas Šeškus ir kt. Vyriausias yra Šarūnas Jasikevičius, o jauniausias Edvinas Šeškus. Išryškėjo žaidėjai, kurie yra naudingi ir rodo puikius rezultatus (, Juan Palacios), o kurie kol kas nedemonstruoja gero žaidimo (Edvinas Šeškus). Šiluminė diagrama leidžia susidaryti nuomonę apie komandų žaidėjus, taip pat padeda prognozuoti, pavyzdžiui, kurie žaidėjai bus pripažinti sezono geriausiais (šansų turi Paulius Jankūnas, Juan Palacios, Vaidas Vasylius ir dar keli kiti).

Kaip atrodo krepšininkų duomenys Andrews kreivėse bei lygiagrečiosiose koordinatėse, parodyta žemiau pateiktuose 62, 63 paveiksluose. Lygiagrečiųjų koordinačių ir Andrews kreivių metodai paprastai naudojami gana didelio skaičiaus matmenų duomenims vizualizuoti. Šie metodai dažnai naudojami duomenims klasterizuoti ar skirtumams nustatyti.

63

Krepšininkų duomenims vizualizuoti Andrews kreivių metodu (62 pav.), buvo įvykdytas toks scenarijus:

[num,txt] = xlsread('lkl.xlsx'); P2=num(:,3); P3=num(:,4); P1=num(:,5); Reb=num(:,6); AS=num(:,7); TO=num(:,8); ST=num(:,9); EFF=num(:,10); Point=num(:,11); Age=num(:,12); Height=num(:,13); X = [P2 P3 P1 Reb AS TO ST EFF Point Age Height]; varNames={'P2'; 'P3'; 'P1'; 'Reb'; 'AS'; 'TO'; 'ST'; 'EFF'; 'Point'; 'Age'; 'Height'}; varNames; h=figure(1); set(h,'DefaultAxesColorOrder',[ 1 0 0;0 0 1; 1 1 0; 0 1 0;]); labels = {'Sepal Length','Sepal Width',... 'Petal Length','Petal Width'}; labels = num2str((1:size(num))'); andrewsplot(num(1:50,3:13), 'group', Age>40, 'standardize','on', 'group',labels); suptitle (' Andrews kreivės') legend('off') legend('Vilniaus Lietuvos Rytas','Prienų TonyBet','Klaipėdos Neptūnas','Kauno Žalgiris')

62 pav. Duomenų apie LKL žaidėjus vizualizavimas Andrews kreivių metodu

Krepšininkų duomenims vizualizuoti lygiagriačiųjų koordinačių metodu (63 pav.) buvo įvykdytas toks scenarijus:

64

h=figure(2); set(h,'DefaultAxesColorOrder',[ 1 0 0;0 0 1; 1 1 0; 0 1 0;]); labels = {'Sepal Length','Sepal Width',... 'Petal Length','Petal Width'}; labels = num2str((1:size(num))'); parallelcoords(num(1:50,3:13), 'group', Age>40, ... 'standardize','on', 'labels',varNames,'quantile',0.25,'group',labels) set(gca, 'XTick',1:11, 'XTickLabel',{'2P' '3P' '1P' 'REB' 'AS' 'TO' 'ST' 'EFF' 'Taškai' 'Age' 'Height'}, 'XGrid','on', 'fontsize',10,'fontweight', 'bold') legend('off') ylabel('Koordinatu reikšmė', 'fontsize',12,'fontweight', 'bold'); xlabel('Koordinatės','fontsize',12,'fontweight', 'bold'); suptitle (' Lygiagrečios koordinatės')

63 pav.. Duomenų apie LKL žaidėjus vizualizavimas Lygiagrečiųjų koordinačių metodu

Krepšininkų duomenims vizualizuoti bei analizuoti Andrews kreivių ir Lygiagrečių koordinačių metodai nėra tinkami. Gaunama aibė kreivių (laužčių), tarp kurių sudėtinga įžvelgti ryšius. Šie metodai yra nepatogūs daugiamačių duomenų vizualizavimui, kai duomenys turi labai daug skirtingų parametrų (procentai, amžius, ūgis, vienetai ir pan.) ir yra sudaryti iš didelio objektų kiekio. Šiuo atveju, kai analizuojami 50 krepšininkų pagal daugybę skirtingų parametrų, grafikai yra perkraunami linijomis, todėl sunku įžvelgti tyrinėjamų duomenų ypatybes.

Dar vienas įdomus ir vaizdingas daugiamačių duomenų vizualizavimo metodas yra Černovo veidų metodas (64 pav.). Tam tikriems žaidėjų savybėms ar rezultatams priskirus

65 nustatytus Černovo veidų bruožus, mes galima pakankamai tiksliai matyti krepšininkus, kurių žaidimas ar asmeninės savybės yra tarpusavyje panašios, o kurie krepšininkai žymiai išsiskiria iš visų kitų. Vizualizavimas buvo atliktas pagal tokį scenarijų: annotation(figure,'textbox',... [0.767935578330893 0.00604229607250755 0.10688140556369 0.980419361865346],... 'Interpreter','none',... 'String',{'1.','2.Edvinas Šeškus','3.Juan Palacios','4.','5.Martynas Gesevičius','6.Gediminas Orelikas','7.Zabian Dowdell','8.Tautvydas Lydeka','9.Omar Cook','10.','11.Eimantas Bendžius','12.','13.Stevan Jelovac','14.Žygimantas Janavičius','15.Domantas Šeškus','16.Laimonas Kisielius','17.','18.Paulius Ivanauskas','19.Artūras Valeika','20.Gintaras Kadžiulis','21.Vaidas Čepukaitis','22.Dainius Šalenga','23.Martynas Linkevičius','24.Arvydas Šikšnius','25.Martynas Mažeika','26.Mindaugas Girdžiūnas','27.Justas Sinica','28.Rolandas Jakštas','29.Arvydas Eitutavičius','30.Tyrone Brazelton','31.Vytautas Šarakauskas','32.Simas Galdikas','33.Marius Runkauskas','34.','35.Valdas Vasylius','36.Arnas Butkevičius','37.Vytenis Čižauskas','38.Artūras Gudaitis','39.','40.Siim-Sander Vene','41.Vytenis Lipkevičius','42.Tadas Klimavičius','43.Paulius Jankūnas','44.','45.Šarūnas Jasikevičius','46.Kaspars Vecvagars','47.Artūras Milaknis','48.Mindaugas Kupšas','49.Tomas Dimša','50.Justin Dentmon'},... 'FontSize',7,... 'FontName','Arial',... 'FitBoxToText','off'); glyphplot(num(1:50,3:13),'glyph','face');figure(gcf) suptitle('Lietuvos krepšinio lygos žaidėjai ')

64 pav. Duomenų apie LKL žaidėjus vizualizavimas Černovo veidų metodu

66

Kadangi šis metodas yra įdomus ir vaizdingas, sukurta nemažai jo variacijų. Černovo veidai gali atrodyti ir taip (65 pav.)5: lkl <- read.csv("C:/Users/tomas/Desktop/lkltyrimas/lkl1.csv", sep=",") lkl[1:50,] library(aplpack) faces(lkl[,3:13])

65pav. Duomenų apie LKL žaidėjus vizualizavimas Černovo veidų metodu

Kitas puikus vizualizavimo metodas pateiktas 66 paveiksle. Tai vienas iš simbolinių metodų –žvaigždžių metodas, kuomet vizualizuojami objektai (šiuo atveju krepšininkai) vaizduojami stilizuota žvaigžde. Iš vieno taško nubraižoma tiek spindulių, kiek yra objektą apibūdinančių parametrų, o spindulio ilgis priklauso nuo jį atitinkančio parametro reikšmės (kuo ilgesnis spindulys, tuo didesnė reikšmė). Trumpiausius spindulius turinčios žvaigždės vaizduoja mažiausius rezultatus parodžiusius žaidėjus ir atvirkščiai. Krepšininkų duomenys vizualizuoti pagal tokį scenarijų: annotation(figure,'textbox',... [0.767935578330893 0.00604229607250755 0.10688140556369 0.980419361865346],... 'Interpreter','none',... 'String',{'1.Steponas Babrauskas','2.Edvinas Šeškus','3.Juan Palacios','4.Renaldas Seibutis','5.Martynas Gesevičius','6.Gediminas

5http://flowingdata.com/2010/08/31/how-to-visualize-data-with-cartoonish-faces/

67

Orelikas','7.Zabian Dowdell','8.Tautvydas Lydeka','9.Omar Cook','10.Antanas Kavaliauskas','11.Eimantas Bendžius','12.Darius Songaila','13.Stevan Jelovac','14.Žygimantas Janavičius','15.Domantas Šeškus','16.Laimonas Kisielius','17.Mindaugas Lukauskis','18.Paulius Ivanauskas','19.Artūras Valeika','20.Gintaras Kadžiulis','21.Vaidas Čepukaitis','22.Dainius Šalenga','23.Martynas Linkevičius','24.Arvydas Šikšnius','25.Martynas Mažeika','26.Mindaugas Girdžiūnas','27.Justas Sinica','28.Rolandas Jakštas','29.Arvydas Eitutavičius','30.Tyrone Brazelton','31.Vytautas Šarakauskas','32.Simas Galdikas','33.Marius Runkauskas','34.Edgaras Ulanovas','35.Valdas Vasylius','36.Arnas Butkevičius','37.Vytenis Čižauskas','38.Artūras Gudaitis','39.Martynas Pocius','40.Siim-Sander Vene','41.Vytenis Lipkevičius','42.Tadas Klimavičius','43.Paulius Jankūnas','44.Robertas Javtokas','45.Šarūnas Jasikevičius','46.Kaspars Vecvagars','47.Artūras Milaknis','48.Mindaugas Kupšas','49.Tomas Dimša','50.Justin Dentmon'},... 'FontSize',7,... 'FontName','Arial',... 'FitBoxToText','off'); glyphplot(num(1:50,3:13));figure(gcf); suptitle('Lietuvos krepšinio lygos žaidėjai ')

66 pav. Duomenų apie LKL žaidėjus vizualizavimas žvaigždžių metodu

Išanalizavus LKL krepšininkų duomenis, daroma išvada, kad geriausias būdas išskirti žaidėją iš grupės, yra šiluminė diagrama. Norint įžvelgti panašumus ar skirtumus, tinkamiausias būtų Černovo veidų ar žvaigždžių metodai, o Andrews kreivių bei lygegrečių koordinačių metodai analizuoti krepšininkus netinka, kadangi gauti paveikslai gavosi perkrauti linijomis, o tarp daugybės kreivių sudėtinga įžvelgti duomenų ryšius.

68

IŠVADOS

Atlikus informacijos vizualizavimo būdų ir metodų analitinę apžvalgą bei atlikus eksperimentinius tyrimus, gautos tokios išvados:  Vizualizavimo būdų ir metodų yra daugybė,atsirandant naujiems duomenims ar informacijos tipams, sukuriami ir nauji vizualizavimo metodai.Kuris metodas, diagramos ar grafiko tipas yra tinkamiausias konkrečioje situacijoje priklauso nuo daugybės faktorių – duomenų apimties ir paskirties, auditorijos ar vizualizuojančio asmens sugebėjimų. Svarbiausia nepamiršti, kad pagrindiniai principai yra – aiškumas, paprastumas ir suprantamumas.  Grafiniame duomenų vaizdavime vaidovaujamasi ne vien taisyklėmis, čia daug vietos kūrybai. Jei informacijos kiekiai yra nedideli, tuomet ją įvertinti nėra sudėtinga, tačiau jei duomenys didelės apimties ar yra daugiamačiai, tuomet informacijai suvokti vizualizavimo priemonės tampa ypač naudingos. Yra sričių, kur įprasta taikyti vos kelių rūšių vizualizavimo metodus, pavyzdžiui, finansų srityje paprastai naudojami linijiniai ar juostiniai grafikai. Kitais atvejais, reikia mokėti analizuoti duomenis, išmanyti vizualizavimo programas ir gebėti pasirinkti tinkamiausią vizualizavimo būdą ir metodą.  Daugiamačių duomenų vizualizavimas padeda atvaizduoti duomenis dvimatėje ar trimatėje erdvėje, geriau suvokti turimus duomenys, efektyviai pateikti ir įvertinti duomenų tyrimo rezultatus, padeda geriau suvokti daugiamačių duomenų struktūrą – susidariusias grupes, žymiai išsiskiriančius objektus ar duomenų tarpusavio ryšius.  Pasirenkant vizualizavimo metodą ar būdą, rekomenduojama išanalizuoti turimą informaciją, nuspręsti, ar turime pateikti visus duomenis ar tik jų dalį, pasirinkti vaizdavimo proporcijas, dydį bei mastą. Pasirinktas metodas turi būti aiškus, vaizdingas ir optimaliai parodyti pasirinktų duomenų dėsningumus. Visuomet rekomenduojama išbandyti bent kelis tinkamus metodus, atlikti jų analizę ir tik tuomet pateikti galutinį rezultatą.  Eksperimentinių tyrimų metu paaiškėjo, kad tiems patiems duomenims vizualizuoti tinka bent keli vizualizavimo metodai. Informaciją apie temperatūros svyravimus puikiai parodo šiluminė, juostinė ar linijinė diagramos; duomenims apie interneto naudojimąsi vizualizuoti geriausiai tinka

69

stulpelinė diagrama, o skritulinė diagrama yra netinkama, kadangi negali perteikti visų turimų duomenų viename paveiksle. Krepšininkų duomenims vizualizuoti galima taikyti Černovo veidų ar žvaigždžių metodus, šiluminę diagramą, o Andrews kreivės ar lygiagrečiosios koordinatės šiuo atveju netinka, nes iš daugybės kreivių sudėtinga įžvelgti duomenų ryšius.  Eksperimentiniai tyrimai parodė, kad vizualizavimo priemonių pagalba galima pamatyti dėsningumus (jei sausio mėnėsio temperatūra žemesnė nei vidutinė, tikėtina, kad liepos mėnuo bus karštesnis nei įprasta), tendencijas (interneto naudojimas asmeniniais tikslais kasmet auga), daryti prognozes (spėti, kurie krepšininkai bus pripažinti sezono geriausiais) ar kitaip interpretuoti duomenis. Analizuojant informaciją, pateiktą teksto ar lentelių pavidalu, atlikti tuos pačius veiksmus būtų sudėtingiau ir tai užimtų daugiau laiko.

70

LITERATŪROS SĄRAŠAS

1. FriendlyM. A Brief History of Data Visualization, Handbook of Data Visualization http://idir.bouiflou.free.fr/Data/E- Books/Handbook%20of%20Data%20Visualization.pdf, žiūrėta 2014-05-05;

2. Žilinskas A. Vizualizavimas.http://www.mii.lt/antanas/uploads/visualization/lectures/ lect1_introd/ivadas.pdf, žiūrėta 2014-05-12; 3. Informacijos technologija, Terminai ir apibrėžimai. 1 dalis. Pagrindiniai terminai, Lietuvos standartizacijos departamentas. 1996. 4. Atkočiūnienė Z.Informacijos ir žinių vadyba informacijos ir komunikacijos mokslų sistemoje, INFORMACIJOS MOKSLAI, ISSN 1392–0561, 2006; 5. Dzemyda G., Kurasova O., Žilinskas J. Daugiamačių duomenų vizualizavimo metodai, 2008; 6. CardS., Jock Mackinlay, Bem Shneiderman. Readings in information Vizualization: Using Vision to Think,1999; 7. Bertin, J. Semiology of graphics: diagrams, networks, maps. University of Wisconsin Press, 1983; 8. Свободный словарь терминов, понятий и определений по экономике, финансам и бизнесу, http://termin.bposd.ru/publ/3-1-0-14721, žiūrėta 2014-05-05; 9. American Heritage Dictionary of the English Language, Fourth Edition Har, 2000; 10. Gershon N, Eick SG, Card S. Information Visualization. ACM Interactions, 1998; 11. Kosara R., Hauser H. An Interaction View on Information Visualization. State-of-the- Art Proceedings of EUROGRAPHICS, 2003, http://www.kosara.net/papers/Kosara_EG_2003.pdf, žiūrėta 2014-05-05; 12. Vetrov J. Визуализация данных: классификация, 2009, http://experiment.ru/technologies/data-visualization-1/, žiūrėta 2014-05-05; 13. Kirkpatrick II Ch., Dahlguist J. Techninė analizė. Išsamusis vadovas finansų rinkos techniniams analitikams, 2013. 14. LHV Finansų portalas, FX Techninė analizė, 2012, https://fp.lhv.lt/news/4642257, žiūrėta 2014-05-05;

15. Galimų naudoti diagramų tipai, http://office.microsoft.com/lt-lt/excel- help/HA010342187.aspx, žiūrėta 2014-05-05;

16. Lietuvos nacionalinis muziejus, http://www.lnm.lt/ekspoziciniai-padaliniai/122- virtualios-parodos/jono-basanaviiaus-gimtin/515-gimtosios-okabali-apylinks, žiūrėta 2014-05-05;

71

17. Gedvilas P., Minčių žemelapi pritaikymo sritys, 2011, http://www.kalbam.lt/?attachment_id=4848, žiūrėta 2014-05-05; 18. Matthew, Common characters between Latin, Greek and Cyrillic alphabets, 2012, http://www.languagetrainers.com/blog/2012/06/12/common-characters-between-latin- greek-and-cyrillic-alphabets/, žiūrėta 2014-05-05; 19. LCD vaizduoklio valdymo blokas, http://www.scritube.com/limba/lituaniana/LCD- vaizduoklio-valdymo-blokas1441122115.php, žiūrėta 2014-05-05; 20. Encyclopedia of Creation Science, http://creationwiki.org/Theory_of_evolution, žiūrėta 2014-05-05; 21. ObrazcovasV., Valdymo ir administravimo metodai, Vadovėlis, 2005; 22. Ganto diagrama, http://svetaine.zwazaaz.eu/dokumentacija/projekto-planas/, žiūrėta 2014-05-05; 23. Lietuvos automobilių kelių direkcija prie Susisiekimo ministerijos, http://www.lakd.lt/lt.php/lietuvos_keliai/keliu_tinklas/536, žiūrėta 2014-05-05; 24. ButkevičienėE, Kiekybinių duomenų internetiniuose archyvuose analizė, http://www.lidata.eu/index.php?file=files/mokymai/kiek1/kiek1.html&course_file=kiek 1_4_3.html, žiūrėta 2014-05-05; 25. KrzywinskiM., Circos, 2005, http://mkweb.bcgsc.ca/, žiūrėta 2014-05-05; 26. SteinweberPh., KollerA. Similar Diversity, 2007; 27. Physicists uncover Eurovision biases, University of Oxford News, http://mahalanobis.twoday.net/stories/711243/, žiūrėta 2014-05-05; 28. PakMarkas. http://www.pakmarkas.lt/apsitraukiancios-etiketes.html, žiūrėta 2014-05- 05; 29. LenglerR., EpplerM. Towards A Periodic Table of Visualization Methods for Management, http://www.visual-literacy.org/periodic_table/periodic_table.pdf, žiūrėta 2014-05-05; 30. Peskova О. О визуализации информации, ISSN 0236-3933. Вестник МГТУ им. Н.Э.Баумана. Сер. “Приборостроение”, 2012; 31. Dobrova I., Три уровня визуализации: данных, информации, знания, 2011, http://infographer.ru/3dimentions/, žiūrėta 2014-05-05; 32. Shneiderman B. The Eyes Have It: A Task by Data Type Taxonomy for Information Visualizations. In Proceedings of the IEEE Symposium on Visual Languages, 1996; 33. Eick S.G., Steffen J. L., Sumner E. E., Seesoft: A tool for visualizing line-oriented software // IEEE Transactions on Software Engineering, 1992; 34. Reed M., Heller D. On-line Library of Information Visualization Environments (OLIVE). University of Mariland;

72

35. Card S.K., Robertson G.G., York W, The WebBook and the Web Forager: Video Use Scenarios for a World-Wide Web Information Workspace, http://www.sigchi.org/chi96/proceedings/videos/Card/skc2txt.html, žiūrėta 2014-05-05; 36. CubicEye.http://www.cubiceye.net/, žiūrėta 2014-05-05; 37. Visualizing your facebook network.https://orgtheory.wordpress.com/2009/02/25/visualizing-your-facebook- network, žiūrėta 2014-05-05; 38. MedvedevV., Tiesioginio sklidimo neuroninių tinklų taikymo daugiamačiams duomenims vizualizuoti tyrimai, 2007, daktaro disertacija; 39. Scatter Plots.http://mste.illinois.edu/courses/ci330ms/youtsey/scatterinfo.html, žiūrėta 2014-05-05; 40. Exploring Data in Two Dimensions,SAS/INSIGHT User's Guide, http://v8doc.sas.com/sashtml/insight/chap5/sect3.htm, žiūrėta 2014-05-05; 41. Scatter Plots.http://www.evl.uic.edu/aej/424/kyoung/Training-scatterplot.html, žiūrėta 2014-05-05; 42. Графические методы анализа данных, Электронный учебник по статистике, http://www.statsoft.ru/home/textbook/modules/stgraph.html#smoothing, žiūrėta 2014- 05-05; 43. Soboleva A.., Когнитивная визуализация знаний с помощью лиц Чернова , 2006, http://masters.donntu.edu.ua/2006/fvti/soboleva/library/text7.htm; 44. Lee M.D., Reilly R.E. An Empirical Evaluation of Chernoff Faces, Star Glyphs, and Spatial Visualizations for Binary Data; 45. Karbauskaitė R., Daugiamačių duomenų vizualizavimo metodų, išlaikančių lokalią struktūrą, analizė, 2010, daktaro disertacija; 46. Poliakov A. J. Методы и алгоритмы компьютерной графики в примерах на Visual C++, 2002; 47. Dzemyda G., Pasižvalgymas po daugiamatę erdvę, neris.mii.lt/mt/straipsniai/200706/erdve, žiūrėta 2014-05-05;

73

SANTRAUKA

Informacijos vizualizavimo tikslas – yra greitai, aiškiai ir patikimai interpretuoti didelės apimties bei sudėtingus duomenis. Yra daugybė informacijos vizualizavimo metodų, kurie buvo sukurti per pastaruosius tris dešimtmečius. Vizualizavimo priemonių evoliuciją lėmė poreikis analizuoti bei suvokti vis didesnius informacijos ar daugiamačių duomenų kiekius. Norint išvengti klaidinančios ar sunkiai suvokiamos informacijos, svarbu pasirinkti tinkamą vizualizavimo būdą ar metodą. Pirmojoje magistrinio darbo dalyje apibrėžiama informacijos vizualizavimo samprata, apžvelgiama vizualizavimo būdų ir metodų įvairovė, nurodomi vizualizavimo proceso etapai bei aptartos vizualizavimo priemonių taikymo galimybės bei problematika. Antrojoje darbo dalyje konkrečiai duomenų rūšiai buvo pritaikyti įvairūs vizualizavimo būdai. Daugiausia naudojant Matlab programinę įrangą, buvo parenkami tinkamiausi vizualizavimo būdai ir metodai. Iliustruoti pavyzdžiai parodė, kad vizualizavimo būdo ir metodo pasirinkimą lemia ne tik analizuojamų duomenų rūšys, bet ir tai kokią informaciją norima išgauti.

74

SUMMARY

Information visualization techniques and methods The main aim of information visualization is to allow rapid, precise and reliable interpretation of large and complex datasets. There are a large number of information visualization techniques that have been developed over the last three decades to support the exploration of large data sets. So determining the best method for exploring and analyzing often vast volumes of data has become increasingly complex. The evolution of information visualization tools has contributed a great deal to the problem of making sense of large multidimensional datasets in support of a specified decision making process but, importantly, the visualization tool selected for any specific analysis must be appropriate to the context of the data. In this way, we can avoid conveying confusing or misleading data to the end uses. This Master’s thesis considers the main definitions and aspects of visualization that need to be considered in determining the appropriate technique to be applied to a variety of data types. The first section provides an overview of the steps to be taken in the visualization process, problems that are likely to arise and solutions illustrated by a series of examples. The second section of this thesis outlines the application of a number of information visualization methods to different datasets, using the Matlab environment.In each example, it is illustrated how the visualization techniques applied can present different levels of understanding and reliability in the interpretations derived from them.

75

PRIEDAI

Priedas Nr. 1

Periodinė vizualizavimo metodų lentelė

76

Priedas Nr.2

20 skirtingų gyvūnų pagal keturioliką požymių suskirstymas, panaudojus dvejetainės sistemos principą

ailis adinima kraido K žindo Namų dantys pelekai plėšrus uodega S Vandens Stuburas Kiaušiniai plunksnos nuodingas Kvėpavimas Nr. Pav s 1 Moliuskas 0 0 1 0 0 1 0 0 0 0 0 0 0 0 2 Krabas 0 0 1 0 0 1 1 0 0 0 0 0 0 0 3 Šamas 0 0 1 0 0 1 1 1 1 0 0 1 1 0 4 Karpis 0 0 1 0 0 1 0 1 1 0 0 1 1 1 5 Menkė 0 0 1 0 0 1 0 1 1 0 0 1 1 0 6 Bitė 1 0 1 0 1 0 0 0 0 1 1 0 0 1 7 Musė 1 0 1 0 1 0 0 0 0 1 0 0 0 0 8 Blusa 0 0 1 0 0 0 0 0 0 1 0 0 0 0 9 Vieversys 0 1 1 0 1 0 0 0 1 1 0 0 1 0 10 Papūga 0 1 1 0 1 0 0 0 1 1 0 0 1 1 11 Lokys 1 0 0 1 0 0 1 1 1 1 0 0 0 0 12 Šernas 1 0 0 1 0 0 1 1 1 1 0 0 1 0 13 dramblys 1 0 0 1 0 0 0 1 1 1 0 0 1 0 14 Žirafa 1 0 0 1 0 0 0 1 1 1 0 0 1 0 15 Leopardas 1 0 0 1 0 0 1 1 1 1 0 0 1 0 16 Liūtas 1 0 0 1 0 0 1 1 1 1 0 0 1 0 17 Ožys 1 0 0 1 0 0 0 1 1 1 0 0 1 1 18 Ruonis 1 0 0 1 0 1 1 1 1 1 0 1 0 0 19 Rupužė 0 0 1 0 0 1 0 1 1 1 0 0 0 0 20 Tunas 0 0 1 0 0 1 1 1 1 0 0 1 1 0

77

Priedas Nr. 3

Vidutinė temperatūra Vilniuje 2005-2012 metų laikotarpyje

Vidutinė temperatūra Vilniuje | °C

Metai Metinė Sausio mėn. Liepos mėn.

2012 6,5 -3,9 19,5

2011 7,5 -3,3 19,6

2010 6,5 -10,4 21,8

2009 6,9 -3,8 18,0

2008 7,9 -0,4 15,8

2007 7,7 0,6 17,0

2006 7,1 -7,8 20,8

2005 6,7 -0,9 19,1

78

Priedas Nr. 4

Asmenys, kurie naudojosi internetu asmeniniais tikslais, procentais.

Asmenys, kurie naudojosi internetu asmeniniais tikslais, proc. Skambino Ieškojo Naudojosi Skaitė Ieškojo Ieškojo Naudojosi Dalyvavo Siuntė / gavo naudodamiesi informacijos paslaugomis, Atsisiuntė naujienas, darbo, siuntė informacijos, internetinės pokalbių Metai Ryšiams elektroninius internetu, apie prekes ir susijusiomis programinę siuntėsi prašymus dėl susijusios su bankininkystė svetainėse ir laiškus vaizdo paslaugas su kelionėmis įrangą laikraščius, darbo sveikatos s pan. konferencijos ir žurnalus priežiūra paslaugomis 2013 apgyvendinim 61,6 55,1 47,7 48,7 56,5 13,3 15,7 62,2 12,2 40,7 46,4 2012 59,6 53,4 46,8 46,7 57,1 13,9 0 61,1 13,2 0 42,7 2011 56,2 50,7 42,9 42,6 53,6 14,6 14,6 55,8 13,5 37,2 40,1 2010 53,1 48,6 37,4 40 47,6 17,3 15,9 51,4 14,5 30,2 36 2009 49,3 45,7 33,2 35,9 43 13,8 17,5 47,8 14,7 28,2 31,8 2008 44,8 40,9 23,6 0 36,2 15,1 13,7 43,1 10,1 21,4 27,1 2007 40,8 38,7 19 19,1 36,3 13,9 15,5 31,7 10,1 19,2 21

79

Priedas Nr. 5

Asmenys, kurie naudojosi internetu asmeniniais tikslais 2007–2013 laikotarpiu. Stulpelinės diagramos sudarymas su C# programa.

using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Windows.Forms; using Excel = Microsoft.Office.Interop.Excel; namespace WindowsFormsApplication1 { publicpartialclassForm1 : Form { public Form1() { InitializeComponent(); } privatevoid Form1_Load(object sender, EventArgs e) { } privatevoid button1_Click(object sender, EventArgs e) { Excel.Application excelApplication = new Excel.Application(); Excel.Application stulp; Excel.Workbook tyrimasWorkBook = excelApplication.Workbooks.Add(); Excel.Worksheet lentele; object misValue = System.Reflection.Missing.Value; stulp = new Excel.Application(); tyrimasWorkBook = stulp.Workbooks.Add(misValue); lentele = (Excel.Worksheet)tyrimasWorkBook.Worksheets.get_Item(1);

stulp.Cells[1, 4] = "Asmenys, kurie naudojosi internetu asmeniniais tikslais";

stulp.Cells[2, 1] = ""; stulp.Cells[2, 2] = "Asmenys, kurie naudojosi internetu asmeniniais tikslais procentais"; stulp.Cells[2, 3] = ""; stulp.Cells[2, 4] = "2013"; stulp.Cells[2, 5] = "2012"; stulp.Cells[2, 6] = "2011"; stulp.Cells[2, 7] = "2010"; stulp.Cells[2, 8] = "2009"; stulp.Cells[2, 9] = "2008"; stulp.Cells[2, 10] = "2007"; stulp.Cells[3, 1] = ""; stulp.Cells[3, 2] = ""; stulp.Cells[3, 3] = "Ryšiams"; stulp.Cells[3, 4] = "61.6"; stulp.Cells[3, 5] = "59.6"; stulp.Cells[3, 6] = "56.2"; stulp.Cells[3, 7] = "53.1"; stulp.Cells[3, 8] = "49.8"; stulp.Cells[3, 9] = "44.8"; stulp.Cells[3, 10] = "40.8"; stulp.Cells[4, 3] = "Siuntė/gavo el. laiškus"; stulp.Cells[4, 4] = "55.1"; stulp.Cells[4, 5] = "53.4"; stulp.Cells[4, 6] = "50.7"; 80 stulp.Cells[4, 7] = "48.6"; stulp.Cells[4, 8] = "45.7"; stulp.Cells[4, 9] = "40.9"; stulp.Cells[4, 10] = "38.7"; stulp.Cells[5, 3] = "Skambino naudodamiesi internetu"; stulp.Cells[5, 4] = "47.7"; stulp.Cells[5, 5] = "46.8"; stulp.Cells[5, 6] = "42.9"; stulp.Cells[5, 7] = "37.4"; stulp.Cells[5, 8] = "33.2"; stulp.Cells[5, 9] = "23.6"; stulp.Cells[5, 10] = "19"; stulp.Cells[6, 3] = "Dalyvavo pokalbių svetainėse"; stulp.Cells[6, 4] = "48.7"; stulp.Cells[6, 5] = "46.8"; stulp.Cells[6, 6] = "42.6"; stulp.Cells[6, 7] = "40.0"; stulp.Cells[6, 8] = "35.9"; stulp.Cells[6, 9] = "0"; stulp.Cells[6, 10] = "19.1"; stulp.Cells[7, 3] = "Ieškojo informacijos apie prekes ir paslaugas"; stulp.Cells[7, 4] = "56.5"; stulp.Cells[7, 5] = "57.1"; stulp.Cells[7, 6] = "53.6"; stulp.Cells[7, 7] = "47.6"; stulp.Cells[7, 8] = "43.0"; stulp.Cells[7, 9] = "36.2"; stulp.Cells[7, 10] = "36.3"; stulp.Cells[8, 3] = "Domėjosi kelionėmis ir apgyvendinimu"; stulp.Cells[8, 4] = "13.3"; stulp.Cells[8, 5] = "13.9"; stulp.Cells[8, 6] = "14.6"; stulp.Cells[8, 7] = "17.3"; stulp.Cells[8, 8] = "13.8"; stulp.Cells[8, 9] = "15.1"; stulp.Cells[8, 10] = "13.9"; stulp.Cells[9, 3] = "Atsisiuntė programinę įrangą"; stulp.Cells[9, 4] = "15.7"; stulp.Cells[9, 5] = "0"; stulp.Cells[9, 6] = "14.6"; stulp.Cells[9, 7] = "15.9"; stulp.Cells[9, 8] = "17.5"; stulp.Cells[9, 9] = "13.7"; stulp.Cells[9, 10] = "15.5"; stulp.Cells[10, 3] = "Skaitė naujienas,laikraščius ir kt."; stulp.Cells[10, 4] = "62.2"; stulp.Cells[10, 5] = "61.1"; stulp.Cells[10, 6] = "55.8"; stulp.Cells[10, 7] = "51.4"; stulp.Cells[10, 8] = "47.8"; stulp.Cells[10, 9] = "43.1"; stulp.Cells[10, 10] = "31.7"; stulp.Cells[11, 3] = "Ieškojo darbo, siuntė prašymus dėl darbo"; stulp.Cells[11, 4] = "12.2"; stulp.Cells[11, 5] = "13.2"; stulp.Cells[11, 6] = "13.5"; stulp.Cells[11, 7] = "14.5"; stulp.Cells[11, 8] = "14.7"; stulp.Cells[11, 9] = "10.1"; stulp.Cells[11, 10] = "10.1"; stulp.Cells[12, 3] = "Domėjosi sveikatos priežiūra"; stulp.Cells[12, 4] = "40.7"; stulp.Cells[12, 5] = "0"; stulp.Cells[12, 6] = "37.2"; stulp.Cells[12, 7] = "30.2"; stulp.Cells[12, 8] = "28.2"; stulp.Cells[12, 9] = "21.4"; stulp.Cells[12, 10] = "19.2";

81

stulp.Cells[13, 3] = "Internetinė bankininkystė"; stulp.Cells[13, 4] = "46.4"; stulp.Cells[13, 5] = "42.7"; stulp.Cells[13, 6] = "40.1"; stulp.Cells[13, 7] = "36"; stulp.Cells[13, 8] = "31.8"; stulp.Cells[13, 9] = "27.1"; stulp.Cells[13, 10] = "21"; Excel.Range chartRange; Excel.ChartObjects xlCharts = (Excel.ChartObjects)lentele.ChartObjects(Type.Missing); Excel.ChartObject myChart = (Excel.ChartObject)xlCharts.Add(500, 450, 550, 500); Excel.Chart chartPage = myChart.Chart; chartRange = lentele.get_Range("c1:c13", "j2:j13"); chartPage.SetSourceData(chartRange, misValue); chartPage.ChartType = Excel.XlChartType.xlColumnClustered; chartPage.Export(@"C:\Users\\tomas\\Desktop\\tyrimas\\diagrama.jpg", "JPG", misValue); pictureBox1.Image = newBitmap(@"C:\Users\\tomas\\Desktop\\tyrimas\\diagrama.jpg"); tyrimasWorkBook.SaveAs("C:\\Users\\tomas\\Desktop\\tyrimas\\tyrimas", Excel.XlFileFormat.xlWorkbookNormal, misValue, misValue, misValue, misValue, Excel.XlSaveAsAccessMode.xlExclusive, Excel.XlSaveConflictResolution.xlLocalSessionChanges, misValue, misValue, misValue, misValue); tyrimasWorkBook.Close(true, misValue, misValue); stulp.Quit(); releaseObject(lentele); releaseObject(tyrimasWorkBook); releaseObject(stulp);

} privatevoid releaseObject(object obj) { try { System.Runtime.InteropServices.Marshal.ReleaseComObject(obj); obj = null; } catch (Exception ex) { obj = null; MessageBox.Show("Exception Occured while releasing object " + ex.ToString()); } finally { GC.Collect(); } }

} }

82

Priedas Nr. 6

LKL 2013-2014 metų sezono Vilniaus Lietuvos ryto (pažymėta raudonai), Prienų TonyBet (pažymėta mėlynai), Klaipėdos Neptūno (pažymėta geltonai) ir Kauno Žalgirio (pažymėta žaliai) krepšininkų statistiniai duomenys

Eil. Nr. Žaidėjo vardas, pavardė P2 P3 P1 REB AS TO ST EFF Taškai Amžius ŪGIS 1 Steponas Babrauskas 45,5% 48,8% 88,5% 7,0 0,9 2,7 1,1 8,4 7,9 29 1,97 2 Edvinas Šeškus 0,0% 0,0% 0,0% 2,0 0,0 0,5 0,0 -0,5 0,0 19 1,90 3 Juan Palacios 59,7% 33,3% 60,5% 15,1 2,7 5,3 1,8 22,5 16,1 28 2,03 4 Renaldas Seibutis 53,2% 43,8% 69,7% 6,4 4,1 2,3 1,2 13,5 11,6 28 1,96 5 Martynas Gesevičius 48,2% 46,4% 82,6% 5,5 2,4 2,4 1,3 11,8 10,8 25 1,93 6 Gediminas Orelikas 58,8% 37,9% 79,2% 6,2 0,9 2,0 0,6 7,0 7,7 23 2,00 7 Zabian Dowdell 44,4% 55,6% 50,0% 2,8 0,9 1,1 1,0 7,3 4,9 29 1,91 8 Tautvydas Lydeka 75,0% 0,0% 71,4% 4,8 2,8 2,0 0,7 8,1 7,9 30 2,08 9 Omar Cook 40,0% 51,6% 58,3% 2,2 6,3 0,9 2,9 11,6 5,7 32 1,86 10 Antanas Kavaliauskas 66,7% 0,0% 50,0% 1,6 2,0 0,0 0,0 2,0 5,0 29 2,08 11 Eimantas Bendžius 55,6% 27,3% 100,0% 1,6 0,2 0,5 1,0 2,7 3,5 23 2,04 12 Darius Songaila 50,0% 0,0% 83,3% 7,8 2,7 2,7 1,0 10,7 10,1 36 2,04 13 Stevan Jelovac 62,0% 45,2% 90,5% 8,0 0,9 3,2 0,7 4,2 9,5 24 2,08 1 Žygimantas Janavičius 56,1% 37,0% 62,2% 6,4 4,2 2,4 1,1 13,1 11,7 25 1,92 2 Domantas Šeškus 75,0% 16,7% 100,0% 0,4 0,3 0,2 0,4 0,9 1,6 21 1,82 3 Laimonas Kisielius 43,0% 34,4% 72,5% 7,8 2,3 3,0 1,5 9,2 9,9 29 2,03 4 Mindaugas Lukauskis 54,8% 31,2% 90,2% 8,4 2,5 3,4 2,3 13,9 14,5 34 1,98 5 Paulius Ivanauskas 44,7% 24,4% 67,6% 2,4 2,0 1,0 0,3 2,7 3,2 26 1,95 6 Artūras Valeika 62,4% 30,8% 63,9% 13,2 2,6 3,9 1,1 16,5 12,1 28 2,07 7 Gintaras Kadžiulis 60,2% 41,3% 78,0% 5,2 3,2 2,1 1,5 13,0 12,8 34 1,92 8 Vaidas Čepukaitis 60,7% 0,0% 58,5% 6,6 0,6 2,0 0,6 6,4 6,0 24 2,07 9 Dainius Šalenga 51,3% 31,0% 63,6% 8,0 3,5 3,2 1,7 18,3 14,7 36 1,99 10 Martynas Linkevičius 54,7% 37,5% 77,8% 13,0 1,3 4,3 1,4 12,2 8,9 28 1,96 11 Arvydas Šikšnius 53,8% 18,8% 100,0% 4,6 1,7 1,3 0,0 4,3 4,7 26 1,96 1 Martynas Mažeika 45,5% 46,4% 84,8% 5,2 3,0 2,5 0,6 11,5 12,5 29 1,93 2 Mindaugas Girdžiūnas 51,5% 41,7% 80,0% 3,8 2,1 1,2 0,7 7,1 7,0 25 1,89 3 Justas Sinica 87,5% 52,9% 87,5% 5,6 1,0 0,7 0,7 13,3 12,0 28 2,03 4 Rolandas Jakštas 37,5% 0,0% 40,0% 6,6 0,3 0,7 0,2 1,8 2,0 21 2,02 5 Arvydas Eitutavičius 45,7% 24,4% 66,7% 4,8 2,6 1,0 0,6 5,4 5,1 31 1,88 6 Tyrone Brazelton 57,1% 0,0% 100,0% 4,0 5,5 2,5 1,0 13,9 15,1 28 1,83 7 Vytautas Šarakauskas 69,8% 34,9% 60,0% 11,6 0,9 1,6 0,7 10,5 10,7 32 2,05 8 Simas Galdikas 64,8% 0,0% 42,9% 10,4 1,1 1,7 0,7 9,6 8,0 27 2,05 9 Marius Runkauskas 61,3% 41,1% 91,7% 6,0 1,8 1,6 0,4 10,9 10,8 27 1,89 10 Edgaras Ulanovas 53,5% 34,5% 67,7% 8,8 1,9 1,4 1,1 10,5 7,5 22 1,97 11 Valdas Vasylius 56,6% 41,3% 86,8% 10,8 1,9 1,5 0,9 15,5 13,5 30 2,02 12 Arnas Butkevičius 73,7% 30,0% 64,3% 4,8 1,4 1,0 1,1 5,2 7,8 21 1,96 1 Vytenis Čižauskas 43,5% 30,3% 58,8% 5,4 2,6 1,1 1,4 6,4 5,7 21 1,89 2 Artūras Gudaitis 33,3% 0,0% 61,1% 7,9 0,3 0,8 0,7 5,6 3,4 20 2,08 3 Martynas Pocius 44,7% 35,3% 90,5% 5,1 1,6 1,1 0,6 7,8 8,8 27 1,96 4 Siim-Sander Vene 38,5% 0,0% 100,0% 7,0 1,0 0,8 0,5 2,8 3,0 23 2,03 5 Vytenis Lipkevičius 57,4% 23,8% 81,5% 6,0 1,8 0,8 1,1 7,5 6,1 24 1,98 6 Tadas Klimavičius 65,4% 12,5% 53,3% 8,4 0,8 1,1 0,7 8,3 5,8 31 2,04 7 Paulius Jankūnas 63,3% 34,8% 78,0% 16,0 2,0 1,8 1,0 17,1 11,2 29 2,05 8 Robertas Javtokas 52,9% 100,0% 70,6% 10,8 1,5 1,3 0,2 10,8 8,8 34 2,11 9 Šarūnas Jasikevičius 46,9% 61,5% 100,0% 2,8 3,0 2,1 0,5 7,5 7,9 38 1,93 10 Kaspars Vecvagars 30,0% 33,3% 75,0% 1,8 1,3 1,6 0,5 2,3 4,1 20 1,93 11 Artūras Milaknis 68,4% 46,9% 83,3% 3,0 0,8 0,6 0,8 6,9 8,1 27 1,95 12 Mindaugas Kupšas 50,7% 0,0% 60,0% 6,4 0,4 0,5 0,5 6,5 6,6 23 2,15 13 Tomas Dimša 65,6% 15,0% 36,8% 2,2 1,1 0,8 0,8 2,5 3,9 20 1,95 14 Justin Dentmon 54,2% 38,0% 85,0% 7,5 3,6 2,0 1,8 14,0 11,8 28 1,83

83