Méthode D'indexation Qualitative: Application À Un Plan De Veille Relatif Aux Thérapies Émergentes Contre La Maladie D
Total Page:16
File Type:pdf, Size:1020Kb
Méthode d’indexation qualitative : application à un plan de veille relatif aux thérapies émergentes contre la maladie d’Alzheimer Nathalie Vaugeois-Sellier To cite this version: Nathalie Vaugeois-Sellier. Méthode d’indexation qualitative : application à un plan de veille relatif aux thérapies émergentes contre la maladie d’Alzheimer. Sciences de l’information et de la communication. Université Paris-Est, 2009. Français. NNT : 2009PEST1036. tel-00534003 HAL Id: tel-00534003 https://tel.archives-ouvertes.fr/tel-00534003 Submitted on 8 Nov 2010 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. École Doctorale Information Communication Modélisation et Simulation (ED ICMS n° 431) Thèse de doctorat En Sciences de l’Information et de la Communication Nathalie VAUGEOIS SELLIER Méthode d’indexation qualitative Application à un plan de veille relatif aux thérapies émergentes contre la maladie d’Alzheimer Thèse dirigée par Serge CACALY Soutenue le 3 décembre 2009 Jury : Serge CACALY, Maître de Conférences HDR Université Paris-Est Marne La Vallée Jacky KISTER, Directeur de Recherche CNRS Université Aix-Marseille 3 Henri DOU, Professeur Emérite Université Aix-Marseille 3 Amos DAVID, Professeur Université Nancy 2 Renaud EPPSTEIN, Maître de Conférences Université Paris-Est Marne La Vallée Christian KRUMEICH, Directeur Scientifique société MAAG RESUME Dans le contexte de recherche et développement d’un nouveau traitement thérapeutique, le chercheur veut surveiller ses thématiques de recherche pour actualiser ses connaissances. Il a besoin d’accéder à l’information qui lui est utile directement sur son ordinateur. La prise en compte de la complexité d’un système biologique, révèle la très grande difficulté à traduire de façon linguistique toute une réflexion hypothétique. Nous proposons dans ce travail, un procédé détaché du système de langue. Pour ce faire, nous présentons une méthodologie basée sur une indexation qualitative en utilisant un filtrage personnalisé. L’index n’est plus d’ordre linguistique mais de type « liaisons de connaissances ». Cette méthode d’indexation qualitative appliquée à « l’information retrieval » contraste avec l’indexation documentaire et l’utilisation d’un thésaurus tel que le MeSH lorsqu’il s’agit d’exprimer une requête complexe. Le choix du sujet d’expérimentation sur la base de données Medline via PubMed constitue une démonstration de la complexité d’expression d’une problématique de recherche. Le thème principal est un traitement possible de la maladie d’Alzheimer. Cette expérience permet de mettre en avant des documents contenus dans Medline qui ne répondent pas ou peu à une indexation en mots-clés. Les résultats obtenus suggèrent qu’une « indexation en connaissances » améliore significativement la recherche d’information dans Medline par rapport à une simple recherche sur Google pratiquée habituellement par le chercheur. Assimilable à une veille scientifique, cette méthodologie ouvre une nouvelle collaboration entre professionnels de l’information et chercheurs. 2 MOTS-CLES Indexation qualitative, recherche d’information, plan de veille personnalisé, métadonnées, forme sémiotique interne, descripteur mémoriel 3 RESUME DES CHAPITRES DE LA THESE Partie I – Indexer pour la recherche d’information Chapitre 1. Du document à la connaissance Ce chapitre commence par une description du contexte de la recherche d’information dans la cadre de l’industrie pharmaceutique. Le document, moyen pour transmettre l’information, est défini comme un ensemble de données. L’interprétation dynamique de l’information, sa compréhension et son analyse sont des processus neuronaux à la base de toute connaissance. L’actualisation de la mémoire en fonction du contexte et de l’expérience constitue la reconstruction d’une connaissance. La connaissance est alors présentée comme fondement implicite de l’acte de langage, base de notre approche qualitative de l’indexation. Chapitre 2. Pour une indexation qualitative en recherche d’information Un aperçu des trois dimensions (forme, sens, médium) du document numérique vient en support de la description de la nature (descriptive et structurale) des métadonnées attachées à l’énoncé. Ce chapitre aborde d’abord l’approche classique de l’indexation pour la recherche d’information, pour finalement mettre en évidence la nécessité de ne pas s’attacher aux mots, mais d’envisager une nouvelle forme d’indexation qualitative. Chapitre 3. « Information Retrieval » (IR) et veille scientifique Le processus d’IR associe les méthodes de recherche documentaire à celles de la veille scientifique. Dans notre contexte, la mise en évidence de l’importance du demandeur d’information amène à la prise en compte d’un profil de veille personnalisé, en fonction des connaissances et expériences implicites propres au demandeur. Chapitre 4. De l’information utile à une notion de pertinence Dans ce chapitre la notion de pertinence en lien avec la qualité de l’information est abordée. La pertinence d’un document en réponse à un besoin informationnel est relative à la perception de l’utilisateur. La qualité de l’information est inhérente à la personne et non à la donnée numérique. 4 Partie II – La méthode qualitative Chapitre 1. Complexité biologique et thérapeutique : simple veille ? La complexité des phénomènes biologiques amène à des difficultés d’expression d’une requête qui prendrait en compte tous les facteurs biologiques et toutes les hypothèses formulées en réponse à une problématique de recherche. Plutôt que de s’attacher à la requête, il peut être intéressant d’avoir recours à une indexation qui permette de repérer un énoncé selon une interprétation telle qu’elle aurait pu être réalisée par le chercheur dans son acte de lecture. Chapitre 2. La méthodologie MEVA La méthodologie MEVA est une indexation qualitative marquée par l’originalité des descripteurs utilisés. Ils sont dits mémoriels en référence à la similitude avec le processus cérébral de l’interprétation d’un énoncé. L’index MEVA s’apparente donc à un processus de pré-lecture. Il fonctionne par rapport à des niveaux de connaissances traduisant des liaisons thématiques ; si MEVA actualise une liaison thématique qui intéresse le chercheur, le document ressortira pertinent. Chapitre 3. Expérimentation sur l’exemple Alzheimer L’application à une problématique de recherche sur un traitement possible de la maladie d’Alzheimer via une immunoglobuline injectée par voie intraveineuse met en évidence l’avantage de l’indexation MEVA pour apporter des documents pertinents qui ne répondent pas ou peu à une indexation en mots. En conclusion, le procédé MEVA est qualitatif. Il prend en compte les angles de vue du chercheur et redonne uniquement les documents indexés suivant des descripteurs mémoriels du plan de veille. Cette opération est reproductible et reconductible à différents moments permettant ainsi un suivi et une actualisation des connaissances, elle est aussi répétable sur d’autres bases des données structurées ou encore sur Google. Les perspectives offertes par MEVA sont multiples dans le domaine biomédical. D’autre part, l’apport de la méthodologie MEVA peut faire naître une nouvelle interaction entre chercheurs et professionnels de l’information. 5 Qualitative indexing process Applied to build a search strategy plan about stand out topics on Alzheimer’s disease therapy 6 ABSTRACT In the context of research and development for a new therapeutic treatment, the researcher seeks to monitor relevant research topics in order to update field-specific knowledge. Direct computer access to relevant information is required. The complexity of biological systems increases the great difficulty of translating some hypothetical reflections in a linguistic manner or by semiotics. In this study, we propose a detached process of the system of language. To do this, we will present a methodology based on a qualitative indexing using personalized filtering. The index is no longer of a linguistic nature but a sort of “connection of knowledge”. This method of qualitative indexing applied to information retrieval is in contrast with documentation indexing systems and the use of thesauruses such as MeSH when it pertains to formulating a complex request. The choice of the experimentation subject using Medline database via PubMed proves the complexity of research problem formulation. The main theme is a possible treatment of Alzheimer's disease. This experiment makes it possible to highlight the documents contained in Medline which provide few or no answers by indexing keywords. The results obtained suggest that an indexing knowledge significantly improves search results for information via Medline in comparison to “Google” searches habitually carried out by the researcher. Comparable to scientific awareness, this methodology opens new collaboration possibilities between information professionals and research. KEYWORDS Qualitative indexation, information retrieval, personalised search strategy plan, metadata, external semiotic form, memory descriptor 7 TABLE DES MATIÈRES INTRODUCTION .........................................................................................