Open Linked Data E Nuovi Approcci Al Trattamento Del Significato Linguistico
Total Page:16
File Type:pdf, Size:1020Kb
TAL 2014 Evoluzione delle interfacce di dialogo e Open Data Open Linked Data e nuovi approcci al trattamento del significato linguistico Guido Vetere IBM Italia - Centro Studi Avanzati K-Drive Knowledge Driven Data Exploitation © 2009 IBM Corporation La dimensione del significato 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Visioni della semantica lessicale concettuale Geeraerts D. (2010), Theories of Lexical Semantics, Oxford University Press 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Visioni della semantica lessicale testuale Geeraerts D. (2010), Theories of Lexical Semantics, Oxford University Press 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Dati linguistici aperti lessici tesauri ontologie corpora annotati 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Dati ed evidenze linguistiche in Watson conoscenze di sfondo evidenze testuali 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Inferenze linguistiche guidate dai dati Q: 1506 What's the name of King Arthur's sword? …..where Arthur is believed to have thrown his sword, Excalibur, to be received by the Lady of the Lake;..... Kateryna Tymoshenko, Alessandro Moschitti and Aliaksei Severyn. "Encoding Semantic Resources in Syntactic Structures for Passage Reranking", accepted to the 14th Conference of the European Chapter of the Association for Computational Linguistics (EACL-2014), Gothenburg, Sweden, 2014. 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Dati linguistici: l'importanza di tenerli aperti ©2011-2014 Winsord 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Dati linguistici dell'italiano 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Senso Comune 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Problemi (sempre) aperti 19 75 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Semantica, vaghezza e ontologia persona soggetti situazioni Achille C. Varzi, Vaghezza e ontologia in Storia dell'ontologia, a cura di Maurizio Ferraris, Bompiani, Milano, 2008 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Semantica, vaghezza e ontologia giovane soggetti situazioni Achille C. Varzi, Vaghezza e ontologia in Storia dell'ontologia, a cura di Maurizio Ferraris, Bompiani, Milano, 2008 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Cosa c'è in una relazione lessicale? WHAT'S IN THIS LINK? giovane immaturo 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Precisare la vaghezza K-Drive Knowledge Driven Data Exploitation Grant agreement no.: 286348 Panos Alexopoulos, Boris Villazón- Terrazas, Jeff Z. Pan: Towards Vagueness-Aware Semantic Data. URSW 2013 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Modellare concetti linguistici Concept G. Vetere, I. Oltramari, A., Chiari, I, Jezek, E., Vieu, L. e F.M. Zanzotto. 2012. «Senso Comune, an Open Knowledge Base for Italian », Revue TAL Journal Special Issue of Entity the on "Free Language Resources", vol. 52, n. 3, pp. 217-43 Physical Reality c o m m i t m e n t Abstract Concrete Entity Entity Linguistic Reality Tokens Types Meaning Sense see also Word Lexeme 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Conclusioni Apertium project lexicons Penn Discourse Treebank Printed Book Auction Catalogues YAGO Arabic Corpora Perceo Corpus Deutsches Morphologie-Lexikon TEP: Tehran English-Persian Parallel Arabic Online Commentary Dataset v1.1 plWordNet Intercontinental Dictionary Series Corpus Asian Wordnet Prague Czech-English Dependency Treebank Lemon Wiktionary TMC: Tehran Monolingual Corpus Autotyp ➔Corpora, dizionari, tesauri,PROIEL ontologie sono crucialiLemon nello Wordnet sviluppo delle Linktecnologie Grammar (Parser) della BabelNet PropBank Lexvo.org diverse VOA corpora baby nameslingua Punjabi Morphology, corpus and lexicon lingvoj.org Bijankhan corpus cornell Movie dialog corpus Resnik's Bible corpora Multi layer sentiment analysis Persian Link Grammar Hamshahri CLEF corpus Cornetto RST discourse treebank Open Data Thesaurus Persian Dependency Treebank Corpora of misspellings Russian WordNet VU WordNet ➔La loro 'apertura' non è solo una politica di distribuzione, ma risponde(PerD a requisitiT) di Corpus of Historical American English Salsa WALS Persian Treebank (PerTreeBank) Corpus of Moderntrasparenza, Scottish Writing interoperabilità, (CMSW) SemCor Corpus integrabilità Zhishi-me ASC) Danish Wordnet Sentiment-annotated quotation corpus JRC-Names MUC-6 Discourse Graphbank SFB632, QUIS-corpora SentiWS Multext-East div. name lists SFN RKB Explorer Wordnet ➔ Multi-Lingual Semantic Network dobes Integrare basi di conoscenzasloWNet linguistica non è banale,Sanskrit Englishpoiché Lexicon ha a chemultitree fare con molti English-Persianproblemi Parallel Corpus filosofici SMULTRON ConceptNet Name List ethnologue soas SIMPLE Ontology, Lexicon NEGRA corpus GeoWordNet SPLLOC Ontos News Portal NomBank GermaNet TamilWordNet Catalan WordNet NunavutHansard ➔ Grammis E importante che i modellitds e le pratiche di distribuzioneFrench TimeBank e integrazioneOCAS dei dati Haitian Creole Lang Data, Carnegie Mellon TDS ontology IcePaHC ODIN Hebrew WordNetlinguistici riescano in Thequalche Manually modoAnnotated a Sub-Corpus preservare laOmegaWiki natura del 'segno' OLAC Hindi WordNet The Open American National Corpus OPUS Omega 4 Inuktitut - A Multi-dialectal Outline Dictionary The Tower of Babel Wiktionary OntoNotes iso 639-n TIGER corpus ISOcat Open Thesaurus Japanese WordNet TimeBank Talk Bank oralliteratures JRC-Acquis TüBa-D/Z corpus GOLD PanLex konstanz universals archive upsid OLiA paradisec LCS Database US Census name lists WikiWord Thesaurus Le Petit Prince Verb Semantics Ontology Rosetta-project LEGO VerbNet Pali English Lexicon Lemon Wikicorpus DBpedia Linguee German-English dictionary Wiktionary RDF dump wiktionary.dbpedia.org linguist list WOLD PHOIBLE ll-map WOLF African Bibles Guido Vetere LSG ("Líonra Séimeantach na Gaeilge") Wordnet ( W3C ) [email protected] word lists Macedonian WordNet Wordnet (Princeton) Manually Annotated Sub-Corpus (M 20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation.