TAL 2014 Evoluzione delle interfacce di dialogo e Open Data

Open Linked Data e nuovi approcci al trattamento del significato linguistico

Guido Vetere IBM Italia - Centro Studi Avanzati

K-Drive Knowledge Driven Data Exploitation

© 2009 IBM Corporation La dimensione del significato

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Visioni della semantica lessicale

concettuale

Geeraerts D. (2010), Theories of Lexical Semantics, Oxford University Press

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Visioni della semantica lessicale

testuale

Geeraerts D. (2010), Theories of Lexical Semantics, Oxford University Press

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Dati linguistici aperti

lessici tesauri ontologie

corpora annotati

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Dati ed evidenze linguistiche in Watson

conoscenze di sfondo evidenze testuali

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Inferenze linguistiche guidate dai dati

Q: 1506 What's the name of King Arthur's sword?

…..where Arthur is believed to have thrown his sword, Excalibur, to be received by the Lady of the Lake;.....

Kateryna Tymoshenko, Alessandro Moschitti and Aliaksei Severyn. "Encoding Semantic Resources in Syntactic Structures for Passage Reranking", accepted to the 14th Conference of the European Chapter of the Association for Computational Linguistics (EACL-2014), Gothenburg, Sweden, 2014.

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Dati linguistici: l'importanza di tenerli aperti

©2011-2014 Winsord

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Dati linguistici dell'italiano

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Senso Comune

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Problemi (sempre) aperti

19 75

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Semantica, vaghezza e ontologia

persona soggetti situazioni Achille C. Varzi, Vaghezza e ontologia in Storia dell'ontologia, a cura di Maurizio Ferraris, Bompiani, Milano, 2008

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Semantica, vaghezza e ontologia

giovane soggetti situazioni Achille C. Varzi, Vaghezza e ontologia in Storia dell'ontologia, a cura di Maurizio Ferraris, Bompiani, Milano, 2008

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Cosa c'è in una relazione lessicale?

WHAT'S IN THIS LINK?

giovane immaturo

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Precisare la vaghezza

K-Drive Knowledge Driven Data Exploitation Grant agreement no.: 286348

Panos Alexopoulos, Boris Villazón- Terrazas, Jeff Z. Pan: Towards Vagueness-Aware Semantic Data. URSW 2013

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Modellare concetti linguistici Concept G. Vetere, I. Oltramari, A., Chiari, I, Jezek, E., Vieu, L. e F.M. Zanzotto. 2012. «Senso Comune, an Open Knowledge Base for Italian », Revue TAL Journal Special Issue of Entity the on "Free Language Resources", vol. 52, n. 3, pp. 217-43 Physical Reality c o m m i t m e n t Abstract Concrete Entity Entity

Linguistic Reality Tokens Types

Meaning Sense

see also Word Lexeme

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation Conclusioni Apertium project lexicons Penn Discourse Treebank Printed Book Auction Catalogues YAGO Arabic Corpora Perceo Corpus Deutsches Morphologie-Lexikon TEP: Tehran English-Persian Parallel Arabic Online Commentary Dataset v1.1 plWordNet Intercontinental Dictionary Series Corpus Asian Wordnet Prague Czech-English Dependency Treebank Lemon Wiktionary TMC: Tehran Monolingual Corpus Autotyp ➔Corpora, dizionari, tesauri,PROIEL ontologie sono crucialiLemon nello Wordnet sviluppo delle Linktecnologie Grammar (Parser) della BabelNet PropBank Lexvo.org diverse VOA corpora baby nameslingua Punjabi Morphology, corpus and lexicon lingvoj.org cornell Movie dialog corpus Resnik's Bible corpora Multi layer sentiment analysis Persian Link Grammar Hamshahri CLEF corpus Cornetto RST discourse treebank Open Data Thesaurus Persian Dependency Treebank Corpora of misspellings Russian WordNet VU WordNet ➔La loro 'apertura' non è solo una politica di distribuzione, ma risponde(PerD a requisitiT) di Corpus of Historical American English Salsa WALS Per­si­an Tree­bank (Per­Tree­Bank) Corpus of Moderntrasparenza, Scottish Writing interoperabilità, (CMSW) SemCor Corpus integrabilità Zhishi-me ASC) Danish Wordnet Sentiment-annotated quotation corpus JRC-Names MUC-6 Discourse Graphbank SFB632, QUIS-corpora SentiWS Multext-East div. name lists SFN RKB Explorer Wordnet ➔ Multi-Lingual Semantic Network dobes Integrare basi di conoscenzasloWNet linguistica non è banale,Sanskrit Englishpoiché Lexicon ha a chemultitree fare con molti English-Persianproblemi Parallel Corpus filosofici SMULTRON ConceptNet Name List ethnologue soas SIMPLE Ontology, Lexicon NEGRA corpus GeoWordNet SPLLOC Ontos News Portal NomBank GermaNet TamilWordNet Catalan WordNet NunavutHansard ➔ Grammis E importante che i modellitds e le pratiche di distribuzioneFrench TimeBank e integrazioneOCAS dei dati Haitian Creole Lang Data, Carnegie Mellon TDS ontology IcePaHC ODIN Hebrew WordNetlinguistici riescano in Thequalche Manually modoAnnotated a Sub-Corpus preservare laOmegaWiki natura del 'segno' OLAC Hindi WordNet The Open OPUS Omega 4 Inuktitut - A Multi-dialectal Outline Dictionary The Tower of Babel Wiktionary OntoNotes iso 639-n TIGER corpus ISOcat Open Thesaurus Japanese WordNet TimeBank Talk Bank oralliteratures JRC-Acquis TüBa-D/Z corpus GOLD PanLex konstanz universals archive upsid OLiA paradisec LCS Database US Census name lists WikiWord Thesaurus Le Petit Prince Verb Semantics Ontology Rosetta-project LEGO VerbNet Pali English Lexicon Lemon Wikicorpus DBpedia Linguee German-English dictionary Wiktionary RDF dump wiktionary.dbpedia.org linguist list WOLD PHOIBLE ll-map WOLF African Bibles Guido Vetere LSG ("Líonra Séimeantach na Gaeilge") Wordnet ( W3C ) [email protected] word lists Macedonian WordNet Wordnet (Princeton) Manually Annotated Sub-Corpus (M

20 gennaio 2014 Guido Vetere, IBM - TAL 2014 © 2014 IBM Corporation