Building Knowledge Graphs Processing Infrastructure and Named Entity Linking Klang, Marcus

Total Page:16

File Type:pdf, Size:1020Kb

Building Knowledge Graphs Processing Infrastructure and Named Entity Linking Klang, Marcus Building Knowledge Graphs Processing Infrastructure and Named Entity Linking Klang, Marcus 2019 Document Version: Publisher's PDF, also known as Version of record Link to publication Citation for published version (APA): Klang, M. (2019). Building Knowledge Graphs: Processing Infrastructure and Named Entity Linking. Department of Computer Science, Lund University. Total number of authors: 1 General rights Unless other specific re-use rights are stated the following general rights apply: Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of accessing publications that users recognise and abide by the legal requirements associated with these rights. • Users may download and print one copy of any publication from the public portal for the purpose of private study or research. • You may not further distribute the material or use it for any profit-making activity or commercial gain • You may freely distribute the URL identifying the publication in the public portal Read more about Creative commons licenses: https://creativecommons.org/licenses/ Take down policy If you believe that this document breaches copyright please contact us providing details, and we will remove access to the work immediately and investigate your claim. LUND UNIVERSITY PO Box 117 221 00 Lund +46 46-222 00 00 Building Knowledge Graphs: Processing Infrastructure and Named Entity Linking Marcus Klang Doctoral Dissertation, 2019 Department of Computer Science Lund University ISBN 978-91-7895-286-1 (printed version) ISBN 978-91-7895-287-8 (electronic version) ISSN 1404-1219 LU-CS-DISS: 2019-04 Dissertation 64, 2019 Department of Computer Science Lund University Box 118 SE-221 00 Lund Sweden Email: [email protected] WWW: http://cs.lth.se/marcus-klang Typeset using LATEX Printed in Sweden by Tryckeriet i E-huset, Lund, 2019 © 2019 Marcus Klang Abstract Things such as organizations, persons, or locations are ubiquitous in all texts cir- culating on the internet, particularly in the news, forum posts, and social media. Today, there is more written material than any single person can read through during a typical lifespan. Automatic systems can help us amplify our abilities to find relevant information, where, ideally, a system would learn knowledge from our combined written legacy. Ultimately, this would enable us, one day, to build automatic systems that have reasoning capabilities and can answer any question in any human language. In this work, I explore methods to represent linguistic structures in text, build processing infrastructures, and how they can be combined to process a compre- hensive collection of documents. The goal is to extract knowledge from text via things, entities. As text, I focused on encyclopedic resources such as Wikipedia. As knowledge representation, I chose to use graphs, where the entities corre- spond to graph nodes. To populate such graphs, I created a named entity linker that can find entities in multiple languages such as English, Spanish, and Chi- nese, and associate them to unique identifiers. In addition, I describe a published state-of-the-art Swedish named entity recognizer that finds mentions of entities in text that I evaluated on the four majority classes in the Stockholm-Umeå Corpus (SUC) 3.0. To collect the text resources needed for the implementation of the algorithms and the training of the machine-learning models, I also describe a document repre- sentation, Docria, that consists of multiple layers of annotations: A model capable of representing structures found in Wikipedia and beyond. Finally, I describe how to construct processing pipelines for large-scale processing with Wikipedia using Docria. Contents Preface v Acknowledgements ix Popular Science Summary in Swedish xi Introduction 1 1 Introduction ............................. 1 2 Natural Language Processing (NLP) ................ 4 3 Corpus ................................ 9 4 Infrastructure ............................ 15 5 Evaluation .............................. 27 6 Machine Learning .......................... 33 7 Data Representation for Machine Learning ............. 36 8 Models ............................... 42 9 Document Database ......................... 48 10 Named Entity Recognition ..................... 50 11 Named Entity Linking ....................... 52 12 Conclusion ............................. 56 Bibliography ............................... 58 Paper I – Named Entity Disambiguation in a Question Answering System 67 Paper II – WIKIPARQ: A Tabulated Wikipedia Resource Using the Par- quet Format 71 Paper III – Docforia: A Multilayer Document Model 81 Paper IV – Multilingual Supervision of Semantic Annotation 87 Paper V – Langforia: Language Pipelines for Annotating Large Collec- tions of Documents 99 iv Contents Paper VI – Overview of the Ugglan Entity Discovery and Linking System105 Paper VII – Linking, Searching, and Visualizing Entities in Wikipedia 119 Paper VIII – Comparing LSTM and FOFE-based Architectures for Named Entity Recognition 127 Paper IX – Docria: Processing and Storing Linguistic Data with Wikipedia133 Paper X – Hedwig: A Named Entity Linker 141 Preface List of Included Publications I Named entity disambiguation in a question answering system. Marcus Klang and Pierre Nugues In Proceedings of the The Fifth Swedish Language Technology Conference (SLTC 2014), Uppsala, November 13-14 2014. II WIKIPARQ: A tabulated Wikipedia resource using the Parquet for- mat. Marcus Klang and Pierre Nugues. In Proceedings of the Ninth International Conference on Language Re- sources and Evaluation (LREC 2016), pages 4141–4148, Portoro, Slovenia, May 2016. III Docforia: A multilayer document model. Marcus Klang and Pierre Nugues. In Proceedings of The Sixth Swedish Language Technology Conference (SLTC 2016), Umeå, November 2016. IV Multilingual supervision of semantic annotation.. Peter Exner, Marcus Klang, and Pierre Nugues. In Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers, pages 1007–1017, Osaka, Japan, December 2016. The COLING 2016 Organizing Committee. V Langforia: Language pipelines for annotating large collections of doc- uments. Marcus Klang and Pierre Nugues. In Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: System Demonstrations, pages 74–78, Osaka, Japan, December 2016. The COLING 2016 Organizing Committee. VI Overview of the Ugglan entity discovery and linking system. Marcus Klang, Firas Dib, and Pierre Nugues. vi Preface In Proceedings of the Tenth Text Analysis Conference (TAC 2017), Gaithers- burg, Maryland, November 2017. VII Linking, searching, and visualizing entities in Wikipedia. Marcus Klang and Pierre Nugues. In Nicoletta Calzolari (Conference chair), Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Koiti Hasida, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis, and Takenobu Tokunaga, editors, Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), pages 3426–3432, Miyazaki, Japan, May 7-12, 2018 2018. Euro- pean Language Resources Association (ELRA). VIII Comparing LSTM and FOFE-based architectures for named entity Marcus Klang and Pierre Nugues. In Proceedings of the The Seventh Swedish Language Technology Confer- ence (SLTC 2018), pages 54–57, Stockholm, October 7-9 2018. IX Docria: Processing and storing linguistic data with Wikipedia. Marcus Klang and Pierre Nugues. In Proceedings of the 22nd Nordic Conference on Computational Linguis- tics, Turku, October 2019. X Hedwig: A Named Entity Linker Marcus Klang To be submitted. Contribution Statement Marcus Klang is the main contributor to all the papers included in this doctoral thesis when listed as first author. He was the main designer and implementor of the research experiments and responsible for most of the writing. In the paper Overview of the Ugglan Entity Discovery and Linking System, Firas Dib contributed the FOFE-based named entity recognizer that was used as part of the mention detection system. Peter Exner was the main contributor in the papers A Distant Supervision Approach to Semantic Role Labeling and Multi- lingual Supervision of Semantic Annotation, with Marcus Klang contributing the named entity linker used to produce part of the input to the system. In the paper Linking, Searching, and Visualizing Entities for the Swedish Wikipedia, Marcus Klang contributed infrastructure tools and resources. The supervisor Prof. Pierre Nugues contributed to the design of the experi- ments, writing of articles, and reviewed the content of the papers. vii List of Additional Publications The following papers were related, but not included in this thesis. Specifically, papers XI, XIII, XIV were succeeded by paper IV. XI Using distant supervision to build a proposition bank. Peter Exner, Marcus Klang, and Pierre Nugues. In Proceedings of the The Fifth Swedish Language Technology Conference (SLTC 2014), Uppsala, November 13-14 2014. XII A platform for named entity disambiguation. Marcus Klang and Pierre Nugues. In Proceedings of the workshop on semantic technologies for research in the humanities and social sciences (STRiX), Gothenburg, November 24-25 2014. XIII A distant supervision approach to semantic role labeling. Peter Exner, Marcus Klang, and Pierre Nugues. In Proceedings of the Fourth Joint Conference on Lexical and Computa- tional
Recommended publications
  • Pdf Liste Totale Des Chansons
    40ú Comórtas Amhrán Eoraifíse 1995 Finale - Le samedi 13 mai 1995 à Dublin - Présenté par : Mary Kennedy Sama (Seule) 1 - Pologne par Justyna Steczkowska 15 points / 18e Auteur : Wojciech Waglewski / Compositeurs : Mateusz Pospiezalski, Wojciech Waglewski Dreamin' (Révant) 2 - Irlande par Eddie Friel 44 points / 14e Auteurs/Compositeurs : Richard Abott, Barry Woods Verliebt in dich (Amoureux de toi) 3 - Allemagne par Stone Und Stone 1 point / 23e Auteur/Compositeur : Cheyenne Stone Dvadeset i prvi vijek (Vingt-et-unième siècle) 4 - Bosnie-Herzégovine par Tavorin Popovic 14 points / 19e Auteurs/Compositeurs : Zlatan Fazlić, Sinan Alimanović Nocturne 5 - Norvège par Secret Garden 148 points / 1er Auteur : Petter Skavlan / Compositeur : Rolf Løvland Колыбельная для вулкана - Kolybelnaya dlya vulkana - (Berceuse pour un volcan) 6 - Russie par Philipp Kirkorov 17 points / 17e Auteur : Igor Bershadsky / Compositeur : Ilya Reznyk Núna (Maintenant) 7 - Islande par Bo Halldarsson 31 points / 15e Auteur : Jón Örn Marinósson / Compositeurs : Ed Welch, Björgvin Halldarsson Die welt dreht sich verkehrt (Le monde tourne sens dessus dessous) 8 - Autriche par Stella Jones 67 points / 13e Auteur/Compositeur : Micha Krausz Vuelve conmigo (Reviens vers moi) 9 - Espagne par Anabel Conde 119 points / 2e Auteur/Compositeur : José Maria Purón Sev ! (Aime !) 10 - Turquie par Arzu Ece 21 points / 16e Auteur : Zenep Talu Kursuncu / Compositeur : Melih Kibar Nostalgija (Nostalgie) 11 - Croatie par Magazin & Lidija Horvat 91 points / 6e Auteur : Vjekoslava Huljić
    [Show full text]
  • Queen of Country
    TThehe mmonthlyonthly mmagazineagazine ddedicatededicated ttoo LLineine ddancingancing IIssue:ssue: 116464 • ££33 BBourdagesourdages RRebaeba NNancyancy MMorganorgan QQUEENUEEN OOFF CCOUNTRYOUNTRY 01 9 771366 650031 14 DANCES INCLUDING : SENORITA – SLOW RAIN – TANGO TONIGHT – I LIED! cover.indd 1 27/11/09, 10:41:21 am Line Dance Holidays from 20102010 £69.00 JANUARY 10th Birthday Party Southport Sensation £109 Bournemouth Bonanza £119 3 days/2 nights Prince of Wales Hotel, Lord Street 10th Birthday Party Glasgow Gallop £99 3 days/2 nights Carrington House Hotel Artistes – Paul Bailey (Friday) Gemmani (Saturday) 3 days/2 nights Thistle Hotel Artistes – Tim McKay (Friday) Broadcaster (Saturday) Dance Instruction and Disco: Chrissie Hodgson Artistes – Diamond Jack (Friday) Magill and Paul Bailey (Saturday) Dance Instruction and Disco:Rob Fowler Starts: Friday 26 February Finishes: Sunday 28 February 2010 Dance Instruction and Disco: Yvonne Anderson Starts: Friday 5 February Finishes: Sunday 7 February 2010 Starts: Friday 8 January Finishes: Sunday 10 January 2010 Highland Palace Hop £147 No more singles available 3 days/2 nights Atholl Palaces Hotel, Pitlochry Scarborough Valentine Scamper £95 Artistes –Carson City (Saturday) 3 days/2 nights Clifton Hotel, North Cliff Dance Instruction and Disco: Willie Brown now Morecambe New Year Party Cheapy £69 Artistes – Lass Vegas (Saturday) Starts: Friday 26 February Finishes: Sunday 28 February 2010 3 days/2 nights Headway Hotel £6 off Dance Instruction and Disco:Kim Alcock Dance Instruction and
    [Show full text]
  • Offline Product / Content Experience on the Ground Research Reports Money
    Ofine context descriptive value web KA video content Lite/Kolibri/Learning Equality Internet in a product feedback Box video content device product feedback software compressed ZIM content product users product / content Orange product Foundation Medical practitioner local content money money (remote product users medical help clinic) users Patient product Wikifundi product Khan Academy content (remote product specs Wikimedicine clinic) money ? project content curation money distribution Columbia research research reports Kiwix / team Prisoners OpenZIM ZIM content build Kiwix app ofine editing capability product feedback compressed ZIM contentcompressed ZIM content software compressed ZIM content software Other Kiwix money RACHEL Kiwix content reusers research reports Rachel product and content Grant based money distributors (Gabriel compressedmoney ZIM content Thullen) money ofine product / content users Governments Experience App and users WMF Grants Play store content re sellers WMF Experience Phone Education Wikipedia App resalers WMF School training School administrator Partnerships teachers (low s (low ofine product / content resource resource WMF school) school) Phone Product manufacturer WMF ofine product / content s Comms app with content users product feedback users NGOs and online teaching tools Unicef content (wiki edu) product / content Wikipedia app user (Android) distribution Mobile network experience on the ground operators Students Other ofine (low Wikipedia Endless Wikipedia resource editors apps school) XOWA Egranary ofine product / content Content Wif access curators Refugees points (Wikipedia 1.0).
    [Show full text]
  • Öppet Arkiv 2014
    10 ÅR MED CAROLA 1000 ÅR PÅ 2 TIMMAR 20:00 1985-1986 21 - MED ESS I LEKEN 24 MINUTER 2003 24-TIMMARS, EN ANNORLUNDA REGATTA 300 ÅR AV ÖGONBLICK 900 SEK A FÖR AGNETHA AB DUN OCH BOLSTER ABBA IN CONCERT ABSOLUT SAMTAL ADVENTSGUDSTJÄNST ADVENTSGUDSTJÄNST FRÅN JUKKASJÄRVI KYRKA AGENDA SPECIAL, 2005 AGNES AGNETHA FÄLTSKOG - THE HEAT IS ON AKTUELLT FRÅN MOSEBACKE MONARKI AKTUELLT SPECIAL - MANDELA I STOCKHOLM ALBERTS UNDERLIGA RESA ALFRED NOBEL - MR DYNAMITE ALICE BABS OCH DUKE ELLINGTON I PRAISE GOD AND DANCE, EN JAZZMÄSSA AV DUKE ELLINGTON ALICE BABS, SVEND ASMUSSEN OCH ULRIK NEUMANN UNDERHÅLLER ALICE VISOR ALLA TIDERS MELODIFESTIVAL ALLAN REDO ALLIS MED IS ALLSÅNG PÅ SKANSEN 1979 ALLSÅNG PÅ SKANSEN 1991 ALLSÅNG PÅ SKANSEN 1992 ALLSÅNG PÅ SKANSEN 1996 ALLSÅNG PÅ SKANSEN 1998 ALLSÅNG PÅ SKANSEN 1999 ALLSÅNG PÅ SKANSEN 2000 ALLSÅNG PÅ SKANSEN 2001 ALLSÅNG PÅ SKANSEN 2002 ALLSÅNG PÅ SKANSEN 2003 ALLSÅNG PÅ SKANSEN 2004 ALLSÅNG PÅ SKANSEN 2005 ALLT OCH LITE TILL ALPINT : WORLD CUP - ÅRE SLALOM 1977 ALPINT: WORLD CUP - ÅRE 1977 ALPINT: VÄRLDSCUPEN I UTFÖRSÅKNING 1979 ALPINT: VÄRLDSCUPEN I UTFÖRSÅKNING 1981 AMAZING GRACE ANDERLUND & ZETTERSSON U P A ANDERSSONS ÄLSKARINNA ANDRA 'PIPEL' ANNA PÅ NYA ÄVENTYR ANNA PÅ NYA ÄVENTYR 1999 ANTIKRUNDAN 1989 ANTIKRUNDAN 1990 ANTON NILSSON APELSINMANNEN ARBETSPLATS: SHERATON ARGA GUBBEN HADE FEL - VILKET SKULLE BEVISAS ARMÉNS TATTOO -88 ARNE DOMNÉRUS, RUNE GUSTAFSSON, BENGT HALLBERG, EGIL JOHANSEN, GEORG RIEDEL OCH CLAES ROSENDAHL MÖTE ARON OCH NORA ARRAN ARRAN 1995 ARTISTSHOW 1984 ASPIRANTERNA ATT RIVA EN MUR
    [Show full text]
  • A Tabulated Wikipedia Resource Using the Parquet Format Klang
    WikiParq: A Tabulated Wikipedia Resource Using the Parquet Format Klang, Marcus; Nugues, Pierre Published in: Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016) 2016 Link to publication Citation for published version (APA): Klang, M., & Nugues, P. (2016). WikiParq: A Tabulated Wikipedia Resource Using the Parquet Format. In Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016) (pp. 4141-4148). European Language Resources Association. http://www.lrec- conf.org/proceedings/lrec2016/pdf/31_Paper.pdf Total number of authors: 2 General rights Unless other specific re-use rights are stated the following general rights apply: Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of accessing publications that users recognise and abide by the legal requirements associated with these rights. • Users may download and print one copy of any publication from the public portal for the purpose of private study or research. • You may not further distribute the material or use it for any profit-making activity or commercial gain • You may freely distribute the URL identifying the publication in the public portal Read more about Creative commons licenses: https://creativecommons.org/licenses/ Take down policy If you believe that this document breaches copyright please contact us providing details, and we will remove access to the work immediately and investigate your claim. LUND UNIVERSITY PO Box 117 221 00 Lund +46 46-222 00 00 WikiParq: A Tabulated Wikipedia Resource Using the Parquet Format Marcus Klang, Pierre Nugues Lund University, Department of Computer science, Lund, Sweden [email protected], [email protected] Abstract Wikipedia has become one of the most popular resources in natural language processing and it is used in quantities of applications.
    [Show full text]
  • SVT:S Öppet Arkiv 2017 Sida 1 Av
    SVT:s Öppet arkiv 2017 Program-ID Programtitel Episodnummer Avsnittsnamn 1 127 984 "utan-tvivel-ar-man-inte-klok"---tage-danielsson 1 "utan tvivel är man inte klok" - tage danielsson 1 357 554 1000-ar-pa-2-timmar 1 avsnitt 1 1 357 554 1000-ar-pa-2-timmar 2 avsnitt 2 1 356 320 10-ar-med-carola 1 10-ar-med-carola 1 357 538 300-ar-av-ogonblick 1 1700-talet 1 357 538 300-ar-av-ogonblick 2 1800-talet 1 357 538 300-ar-av-ogonblick 3 1900-talet 1 374 221 40-talister 1 kommer-hem-och-ar-snall 1 358 394 88-oresrevyn 1 88-oresrevyn 1 355 522 abba-dabba-dooo 4 abba-dabba-dooo 1 169 205 ab-dun-och-bolster 1 ab-dun-och-bolster 1 367 022 absolut-samtal 1 43-1991 1 367 022 absolut-samtal 3 273-1991 1 367 022 absolut-samtal 4 34-1991 1 367 022 absolut-samtal 5 104-1991 1 367 022 absolut-samtal 6 174-1991 1 367 022 absolut-samtal 7 85-1991 1 361 446 adventsgudstjanst-fran-jukkasjarvi-kyrka 1 adventsgudstjanst-fran-jukkasjarvi-kyrka 1 365 430 a-for-agnetha 1 a-for-agnetha 1 375 270 afrikaner-i-sverige 1 karlek-fotboll-och-trummor 1 375 300 agaton-sax 1 den-ljudlosa-sprangamnesligan 1 375 300 agaton-sax 2 kolossen-pa-rhodos 1 375 300 agaton-sax 3 det-gamla-pipskagget 1 374 622 ainbusk-singers---bondbrudar-i-narbild 1 ainbusk-singers---bondbrudar-i-narbild 1 355 635 aktuellt 0 samling-för-eftertanke-ceremoni-för-tsunamins-offer 1 355 635 aktuellt 1 forsta-nyhetssandningen-om-mordet-pa-olof-palme 1 355 635 aktuellt 2 rapport-13-86-10.00 1 355 635 aktuellt 4 fantombilden 1 355 635 aktuellt 5 smith-och-wesson-kaliber-357 1 355 635 aktuellt 6 abc-anna-lindh-knivskadad-pa-nk
    [Show full text]
  • FOU2008 2 Idrottens Anläggningar
    Idrottens anläggningar – ägande, driftsförhållanden och dess effekter FoU-rapport 2008:2 FoU-rapporter 2004:1 Ätstörningar – en kunskapsöversikt (Christian Carlsson) 2004:2 Kostnader för idrott – en studie om kostnader för barns idrottande 2003 2004:3 Varför lämnar ungdomar idrotten (Mats Franzén, Tomas Peterson) 2004:4 IT-användning inom idrotten (Erik Lundmark, Alf Westelius) 2004:5 Svenskarnas idrottsvanor – en studie av svenska folkets tävlings- och motionsvanor 2003 2004:6 Idrotten i den ideella sektorn – en kunskapsöversikt (Johan R Norberg) 2004:7 Den goda barnidrotten – föräldrar om barns idrottande (Staffan Karp) 2004:8 Föräldraengagemang i barns idrottsföreningar (Göran Patriksson, Stefan Wagnsson) 2005:1 Doping- och antidopingforskning 2005:2 Kvinnor och män inom idrotten 2004 2005:3 Idrottens föreningar - en studie om idrottsföreningarnas situation 2005:4 Toppningsstudien - en kvalitativ analys av barn och ledares uppfattningar av hur lag konstitueras inom barnidrott (Eva-Carin Lindgren, Hansi Hinic) 2005:5 Idrottens sociala betydelse - en statistisk undersökning hösten 2004 2005:6 Ungdomars tävlings- och motionsvanor - en statistisk undersökning våren 2005 2005:7 Inkilning inom idrottsrörelsen - en kvalitativ studie 2006:1 Lärande och erfarenheters värde (Per Gerrevall, Samanthi Carlsson och Ylva Nilsson) 2006:2 Regler och tävlingssystem (Bo Carlsson, Kristin Fransson) 2006:3 Fysisk aktivitet på Recept (FaR) (Annika Mellquist) 2006:4 Nya perspektiv på riksidrottsgymnasierna(Maja Uebel) 2006:5 Kvinnor och män inom idrotten
    [Show full text]
  • Těžba Grafových Dat Z Wikipedie
    Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra informatiky a výpočetní techniky Bakalářská práce Těžba grafových dat z Wikipedie Plzeň 2016 Martin Mach PROHLÁŠENÍ Prohlašuji, že jsem bakalářskou práci vypracoval samostatně a výhradně s použitím citovaných pramenů. V Plzni dne 4. května 2016.................................. Martin Mach ABSTRAKT Cílem této práce je vytvořit nástroj umožňující zpracování historických událostí z Wikipe- die do podoby grafu. Vzhledem k povaze zdroje dat a požadavku na interakci s uživatelem byl za platformu zvolen webový prohlížeč Google Chrome a jeho systém rozšíření. Vytvo- řený nástroj umožňuje výběr preferovaných článků, na základě nichž jsou nabízeny další články dle odhadu jejich relevance. Obsah článků je zpracováván a jsou z něj získávány informace specifické pro typ dané historické události. Mezi jednotlivými články jehledán vzájemný vztah, který potom, spolu s typem tohoto vztahu, tvoří hrany získaného grafu. Vytvořené řešení poskytuje uživateli možnost zpracovat historické události do formy re- šerše reprezentované grafem. Množství získávaných informací a jejich vzájemnou spojitost je možné ovlivnit pomocí systému modulů. Výsledek je poté možno zobrazit na časové ose, případně je možné upravit výstup aplikace tak, aby mohl být zobrazen nástrojem dle volby uživatele. KLÍČOVÁ SLOVA Wikipedie, těžba dat, graf, historická událost, časová osa, Google Chrome, rozšíření ABSTRACT The purpose of this thesis is to create a tool which would allow to process historical events from Wikipedia into the form of a graph. Due to the nature of the data source and the requi- rement for user interaction it was decided to choose Google Chrome and its extensions as a platfrom. The tool allows user to choose articles of his choice, based on which it will find and recommend other articles according to their estimated relevance.
    [Show full text]
  • Studier I Svensk Språkhistoria 14
    Studier i svensk språkhistoria 14 HARRY LÖNNROTH | BODIL HAAGENSEN | MARIA KVIST | KIM SANDVAD WEST (red.) aaa VAASAN YLIOPISTON TUTKIMUKSIA 305 II © Vasa universitet Pärmbild: Petra B. Fritz, https://flic.kr/p/fHDgeg ISBN 978-952-476-799-6 (tryckt) 978-952-476-800-9 (online) URN:ISBN:978-952-476-800-9 ISSN 2489-2556 (Vaasan yliopiston tutkimuksia 305, tryckt) 2489-2564 (Vaasan yliopiston tutkimuksia 305, online) Suomen yliopistopaino – Juvenes Print 2018 III FÖRORD Den fjortonde konferensen i serien Svenska språkets historia hölls i Vasa, Finlands soligaste stad i hjärtat av Österbotten. Som värd för konferensen stod enheten för nordiska språk vid Vasa universitet. Som tema för konferensen hade vi valt ”Flerspråkighet och språkhistoria”, ett stort och aktuellt tema. En bärande tanke för oss arrangörer var att flerspråkighet inte är något nytt fenomen, och för att fördjupa vår förståelse av detta mång- facetterade fenomen behöver vi mer språkhistorisk forskning och ökad språk- historisk medvetenhet. Och många nappade på vår inbjudan! I konferensen deltog cirka 60 personer från 13 universitet och fyra forskningsorganisationer. De tre inbjudna plenarföreläsarna var Lars-Erik Edlund, professor i nordiska språk vid Umeå universitet, Anna Helga Hannesdóttir, professor i nordiska språk vid Göteborgs universitet, och Nils Erik Villstrand, professor i nordisk historia vid Åbo Akademi och docent i de nordiska ländernas historia vid Vasa universitet. Utöver plenarföredragen hölls det 36 sektionsföredrag och 4 poster- presentationer på konferensen. I denna konferensvolym publiceras två plenar- föredrag och 15 sektionsföredrag. Artiklarna har gått igenom referentgranskning. Till slut vill vi tacka FD Sanna Heittola som har tagit hand om den tekniska redigeringen.
    [Show full text]
  • Öppet Arkiv 2015
    Programnamn Öppet Arkiv 2015 10 ÅR MED CAROLA 1000 ÅR PÅ 2 TIMMAR 20:00 1985-1986 21 - MED ESS I LEKEN 24 MINUTER 2003 24-TIMMARS, EN ANNORLUNDA REGATTA 300 ÅR AV ÖGONBLICK 401 7 TILL 9 900 SEK A FÖR AGNETHA AB DUN OCH BOLSTER ABSOLUT SAMTAL AD LIB 1991 AD LIB 1993 ADVENTSGUDSTJÄNST ADVENTSGUDSTJÄNST FRÅN JUKKASJÄRVI KYRKA AGENDA SPECIAL, 2005 AGNES AGNETHA FÄLTSKOG - THE HEAT IS ON AKTUELLT FRÅN MOSEBACKE MONARKI AKTUELLT SPECIAL - HOLMÉR I FÖRHÖR AKTUELLT SPECIAL - MANDELA I STOCKHOLM ALBERT OCH HERBERT 1974 ALBERT OCH HERBERT 1976 ALBERT OCH HERBERT 1977 ALBERTS UNDERLIGA RESA ALBERTS UNDERLIGA RESA 1997 ALFRED NOBEL - MR DYNAMITE ALICE BABS OCH DUKE ELLINGTON I PRAISE GOD AND DANCE, EN JAZZMÄSSA AV DUKE ELLINGTON ALICE BABS, SVEND ASMUSSEN OCH ULRIK NEUMANN UNDERHÅLLER ALLA TIDERS MELODIFESTIVAL ALLAN REDO ALLIS MED IS ALLSÅNG PÅ SKANSEN 1979 ALLSÅNG PÅ SKANSEN 1990 ALLSÅNG PÅ SKANSEN 1991 ALLSÅNG PÅ SKANSEN 1992 ALLSÅNG PÅ SKANSEN 1992 ALLSÅNG PÅ SKANSEN 1996 ALLSÅNG PÅ SKANSEN 1998 ALLSÅNG PÅ SKANSEN 1999 ALLSÅNG PÅ SKANSEN 2000 ALLSÅNG PÅ SKANSEN 2001 ALLSÅNG PÅ SKANSEN 2002 ALLSÅNG PÅ SKANSEN 2003 ALLSÅNG PÅ SKANSEN 2004 ALLSÅNG PÅ SKANSEN 2005 ALLSÅNGSKONSERT MED KJELL LÖNNÅ 1990 ALLT OCH LITE TILL ALPINT : WORLD CUP - ÅRE SLALOM 1977 ALPINT: WORLD CUP - ÅRE 1977 ALPINT: VÄRLDSCUPEN I UTFÖRSÅKNING 1979 ALPINT: VÄRLDSCUPEN I UTFÖRSÅKNING 1981 ALTERNATIVFESTIVALEN AMALA, KAMALA AMAZING GRACE ANDERLUND & ZETTERSSON U P A ANDERSSONS ÄLSKARINNA ANDRA ORD 1976 ANDRA 'PIPEL' ANGNE & SVULLO ANNA OCH GÄNGET ANNA PÅ NYA ÄVENTYR ANNA PÅ
    [Show full text]
  • Inbjudan Till Melodifestivalen 2004
    Inbjudan till Melodifestivalen 2004 Melodifestivalen 2003 blev en stor framgång. Över 60 000 människor följde tävlingarna på plats och drygt två miljoner tittare såg varje deltävling och 3,8 miljoner följde den direktsända finalen i Sveriges Television. Nu är det dags för alla kompositörer och textförfattare att lämna in sina bidrag till Melodifestivalen 2004. Sveriges Television inbjuder alla intresserade att skicka in sina bidrag till: Melodifestivalen 2004 Sveriges Television 109 14 Stockholm Tävlingsbidragen måste vara poststämplade senast den 30 september 2003. Alla upphovsmän måste skriva på och bifoga den tävlingsblankett som finns i regelverket för tävlingen. Regelverket finns tillgängligt på svt.se och kan dessutom erhållas om man skickar in ett brev med bifogat frankerat (dubbelt porto) och färdigadresserat returkuvert till adressen ovan. Boende i Stockholm kan även hämta reglerna i receptionen på Sveriges Television Oxenstiernsgatan 26 eller 34. Öppet vardagar mellan klockan 09.00-17.00. Slutligen vill vi passa på att uppmärksamma tva viktiga förändringar i Melodifestivalen 2004: - Tio platser av tävlingens 32 ges med förtur till bidrag med svensk text. Läs mer i punkt 5. - SVT förbehåller sig rätten att specialinbjuda fyra av de 32 bidragen. Läs mer i punkt 11. För ytterligare information kontakta: Thomas Hall, projektledare SVT Fiktion, 08-784 44 41 eller via mail [email protected] TÄVLINGSREGLER MELODIFESTIVAL 2004 1. Melodifestivalen 2004 är den nationella tävling som utser den melodi som ska representera Sverige i 2004 års Eurovision Song Contest, ESC. ESC arrangeras av European Broadcasting Union (EBU). 2. Alla svenska medborgare och/eller i Sverige folkbokförda (senast per den 30:e september 2003) personer har rätt att deltaga i tävlingen som kompositörer och textförfattare.
    [Show full text]
  • SVT:S Öppet Arkiv 2015 Sida 1 Av
    SVT:s Öppet arkiv 2015 ID-nr Programnamn Episodnamn Utbud 1370140-1 401 Prod Year 1970 Drama 1356320-1 10 ÅR MED CAROLA Prod Year 1993 Artistshow 1357554-1 1000 ÅR PÅ 2 TIMMAR Episod 1 Humaniora 1357554-2 1000 ÅR PÅ 2 TIMMAR Episod 2 Humaniora 1361824-24 20:00 1985-1986 Episod 24: Special - Stina möter Silvia Politik, samhälle 1358953-1 21 - MED ESS I LEKEN Prod Year 1977 Blandat nöje 1358955-1 21 - MED ESS I LEKEN Prod Year 1979 Blandat nöje 1367093-42 24 MINUTER 2003 Episod 42: Timbuktu Blandat nöje 1367093-78 24 MINUTER 2003 Episod 78: Leif GW Persson Blandat nöje 1367093-0 24 minuter 2003 1359448-1 24-TIMMARS, EN ANNORLUNDA REGATTA Prod Year 1975 Idrottstävling 1357538-1 300 ÅR AV ÖGONBLICK Episod 1 Politik, samhälle 1357538-2 300 ÅR AV ÖGONBLICK Episod 2 Politik, samhälle 1357538-3 300 ÅR AV ÖGONBLICK Episod 3 Politik, samhälle 1358773-1 7 TILL 9 Episod 1 Blandat nöje 1358773-5 7 TILL 9 Episod 5 Blandat nöje 1358773-6 7 TILL 9 Episod 6 Blandat nöje 1366976-1 900 SEK Episod 1 Blandat nöje 1366976-2 900 SEK Episod 2 Blandat nöje 1366976-3 900 SEK Episod 3 Blandat nöje 1366976-4 900 SEK Episod 4 Blandat nöje 1366976-5 900 SEK Episod 5 Blandat nöje 1366976-6 900 SEK Episod 6 Blandat nöje 1366976-7 900 SEK Episod 7 Blandat nöje 1366976-8 900 SEK Episod 8 Blandat nöje 1366976-9 900 SEK Episod 9 Blandat nöje 1365430-1 A FÖR AGNETHA Prod Year 1985 Musik 1169205-1 AB DUN OCH BOLSTER Prod Year 1988 Drama 1367022-1 ABSOLUT SAMTAL Episod 1 Kulturgestaltning 1367022-2 ABSOLUT SAMTAL Episod 2 Kulturgestaltning 1367022-3 ABSOLUT SAMTAL Episod 3
    [Show full text]