Ontdekken van Impressionisten m.b.v. afstanden tot bekende Impressionisten Afstudeerproject Bachelor AI 2004/2005 1 juli 2005 Michiel Nieuwenhuijsen Universiteit van Amsterdam E-mail:
[email protected] Roeland Weve Universiteit van Amsterdam E-mail:
[email protected] Supervisors: Maarten van Someren Victor de Boer Samenvatting In dit document beschrijven we onze methode voor het zoeken in documenten naar nog onbekende Impressionisten. Deze Impressionisten worden gevonden door te kijken naar de afstand tot bekende Impressionisten. We beschrijven de verschillende modules waaruit onze methode is opgebouwd. Enkele modules zijn: het zoeken naar personen in documenten, vergelijken of twee persoonsnamen bij dezelfde persoon horen, en het berekenen van een score om een bepaalde zekerheid te krijgen of een naam wel of niet tot het domein hoort. Ook kijken we hoe deze methode zich verhoudt tot andere IE- methodes. Om de werking van onze methode te evalueren, zullen we een aantal tests uitvoeren op het domein van Impressionisme. Omdat het onderzoek geïnspireerd is op het werk van Victor de Boer, zullen we kijken in hoeverre onze methode vergelijkbaar is met die van hem. Tevens zullen we kort bekijken of deze methode ook op andere domeinen toepasbaar is. Te denken valt aan andere kunststromingen, personen uit een bepaald sportteam proberen te halen of mensen die eenzelfde soort beroep uitoefenen bij elkaar proberen te vinden. Tot slot bespreken we nog op welke punten de methode fouten maakt, en hoe deze fouten beperkt zouden kunnen worden. Afstudeerproject Bachelor AI 2004/2005 2 Inhoudsopgave 1. Inleiding .............................................................................................................................................. 4 2. Information Extraction ........................................................................................................................ 5 2.1 Relation Instantiation ...................................................................................................................