BULLETIN

DE

L’AFIA

JUILLET 2005 N¡ 60

Association Française pour l’Intelligence Artificielle Présentation du bulletin Comité de rédaction Jérôme EUZENAT Le Bulletin de l'Association Française pour l'Intelligence Artificielle vise Co-rédacteur en chef à fournir un cadre de discussion et d'échanges au sein de la communauté INRIA Rhône-Alpes universitaire et industrielle. Ainsi, toutes les contributions, pour peu qu'elles 655, avenue de l’Europe Montbonnot St-Martin, aient un intérêt général pour l'ensemble des lecteurs, sont les bienvenues. 38334 Saint-Ismier En particulier, les annonces, les comptes rendus de conférences, les notes [email protected] de lecture et les articles de débat sont très recherchés. Le Bulletin de l'AFIA publie également des dossiers plus substantiels sur différents thèmes liés à Philippe MORIGNOT Co-rédacteur en chef l'IA. Le comité de rédaction se réserve le droit de ne pas publier des contri- AXLOG Ingéniérie butions qu'il jugerait contraire à l'esprit du bulletin ou à sa politique éditoria- 19-21, rue du 8 mai 1945, 94110 Arcueil le. En outre, les articles signés, de même que les contributions aux débats, [email protected] reflètent le point de vue de leurs auteurs et n'engagent qu’eux-mêmes. Catherine BARRY-GRÉBOVAL Rubrique « Présentation de laboratoires È Pour contacter l’AFIA LaRIA, Equipe Ingénierie des Connaissances, Président : Serveur WEB Université de Picardie Jules Verne Michèle SEBAG http : //www.afia-france.org 5, rue du Moulin Neuf L.R.I., Bât. 490, 80000 Amiens Université Paris-Sud, Adhésions, Liens avec les adhérents [email protected] 91405 ORSAY Jérémie MARY Tel : +33 (0)169 15 76 02 LRI, Bâtiment 490 Brigitte GRAU Rubriques Ç Sommaires des revues È Fax : +33 (0)1 69 15 65 86 Université Paris-Sud et Ç petites annonces È [email protected] 91405 ORSAY LIMSI — CNRS http://www.lri.fr/~sebag Mél. : [email protected] B.P. 133, 91403 ORSAY Cedex [email protected] Parrainage de manifestations Contributions au bulletin Sylvie PESTY Marc-Philippe HUGET Jérôme EUZENAT Laboratoire Leibniz, Institut IMAG Rubrique Ç Thèses et habilitations » Philippe MORIGNOT 46, Avenue Félix Viallet ESIA-LISTIC voir ci-contre 38031 Grenoble CEDEX Université de Savoie Mél. : [email protected] B.P. 806 74016 Annecy cedex Membres d’honneur [email protected] Marie-Odile Cordier (1999), Jean-Paul Haton (1999), Jacques Pitrat (1999), Amedeo NAPOLI Jean-Marc David (2000), Daniel Kayser (2000), Claude Vogel (2000), Rubrique Ç livres È LORIA Henri Farreny (2001), Alain Colmerauer (2002), Jean-Louis Laurière (2002), B.P. 239 Gérard Sabah (2003), Jean-Claude Latombe (2004), Yves Kodratoff (2004), F-54 506 Vandœuvre lès Nancy [email protected] Malik Ghallab (2005). Personnes morales adhérentes à l'AFIA Sylvie PESTY Rubriques ADIT, AI*IA, CEA, CNET-PARIS-A, ENS Mines, ENST-PARIS, ESIEA, « Conférences et comptes rendus È Laboratoire Leibniz-IMAG IGN, ILOG, INRETS, INRIA, INSTITUT FRANCAIS DU PÉTROLE, 46 Avenue Félix Viallet PEUGEOT S.A., Université de Savoie, Université PARIS 9 DAUPHINE. F-38031 Grenoble Cedex [email protected]

Bureau de l’AFIA Nicole TOURIGNY Michèle SEBAG, président Rubrique « IA au Québec » Serge DUPUY, secrétaire Université Laval - Pavillon Adrien-Pouliot Québec, Canada, G1K 7P4 Jérémie MARY, trésorier [email protected] Comité : Emmanuel d’ANGELO, Jean-Paul BAQUIAST, Jacques BLANC-TALON, Gilles BISSON, Laurent CANDILLIER, Alain CARDON, Amal EL FALLAH, Jérôme EUZENAT, Olivier FRANCOIS, Christophe JACQUEMIN, Nicolas LACHICHE, Vincent LEMAIRE, Patrick MARTY, Eunika MERCIER-LAURENT, Philippe MORIGNOT, Jean-Denis MULLER, Gérald PETITJEAN, Sylvie PESTY, Michèle SEBAG, Marc SCHOENAUER, Réa. Numéricopy – 01 46 31 64 53 Olivier TEYTAUD, Fabien TORRE, Samuel WIECZOREK, ISSN 1273-1323 Jean-Daniel ZUCKER. Dépôt légal à parution B ULLETIN DE L’AFIA 2 numéro 60 - juillet 2005 L’AFIA continue de se réorganiser

Le texte que vous êtes en train de lire sur la présente page est composé de symboles (les caractères d’imprimerie), agrégés en mots, puis phrases, puis paragraphes, pour for- mer une page de texte. Vous la comprenez. Maintenant, imaginons que ce texte soit écrit dans une langue qui vous soit inconnue. Que resterait-il de cette page ? (Comment la comprendriez-vous ?) Un papyrus sans doute, ou une carte aux trésors peut-être ? Mais en tout cas vous la comprendriez comme une image, unité graphique dans votre contexte plus vaste. Plus généralement, vous reconnaîtrez sans doute dans cette image non plus des carac- tères typographiques, mais des formes (formes des caractères, proximité des caractères intra-mots, espace entre les mots ou entre les phrases, disposition des paragraphes, etc). DITORIAL Et si les images se suivent en séquence pour former une bande dessinée, un film (éventuellement interactif, comme dans un jeu vidéo), vous pourrez même attribuer des E intentions, stratégies, buts, plans et actions à certaines de ces formes (par exemple, pour les chevaliers et démons, de l’article de Laurent Fischer) C’est à cette notion d’image en I.A. que s’intéresse le dossier de ce Bulletin, coor- donné par Eunika Mercier-Laurent (IAE, Lyon 3) et Patrick Saint-Jean (ENSC). Ce Bulletin reproduit aussi une interview de Tom Mitchell, Directeur du Centre pour l’Apprentissage et la Découverte Automatique (CMU). Amedeo Napoli (LORIA) nous propose la recension de l’Introduction à la logique, de René David, Karim Nour et Christophe Raffally, et Olivier Teytaud (LRI) nous offre un groupe thématique de recensions sur la notion d’aléatoire (génération de nombres aléa- toires, convergence faible et processus empiriques, théorie des sondages, théorie probabi- liste de reconnaissance de formes). Le laboratoire LIRIS de l’Université Lyon I et le laboratoire KIN de la société ARCE- LOR sont ensuite à l’honneur, ce dernier étant un exemple de jonction entre les milieux académiques et industriels. Enfin, un compte-rendu de l’atelier « Connaissance et Documents Temporels È orga- nisé par la plateforme AFIA, et un compte-rendu de la conférence sur la planification, tenue en juin dernier à Monterey en Californie achèvent le sommaire de ce Bulletin. Ensuite l’AFIA continue de se ré-organiser : d’abord, le Comité Stratégie (composé de Serge Dupuy, Jean-Paul Baquiast et Jean-Denis Muller) a défini en quels termes il fal- lait penser l’I.A., ce qui fera vraisemblablement l’objet d’une communication dans un pro- chain Bulletin. Ensuite, un Responsable Communication coté Industrie a été nommé (Gérald Petitjean) et un autre coté Académie est en passe d’être nommé. Enfin, toujours dans l’optique d’une plus grande synergie entre les internautes et notre site web (http://www.afia-france.org), nous sommes en train d’effectuer une refonte complète de ce site, pour une plus grande convivialité et ergonomie. Nous prévoyons également de mettre la table des matières des Bulletins en ligne sur ce site (et non plus seulement l’éditorial), avec éventuellement la liste des laboratoires et dossiers déjà présentés et d’autres surprises encore. Nous renouvelons encore notre appel à contribution : si vous, cher lecteur, avez un sujet que vous aimeriez faire partager à la communauté française d’I.A. (chants d’amour ou coups de gueule, ou plus sérieusement recensions de livres que vous avez aimés, comp- te-rendus de conférences que vous avez aimées, etc), n’hésitez pas à nous faire parvenir vos textes, nous serions ravi de les publier.

Philippe MORIGNOT et Jérôme EUZENAT Rédacteurs en chef du Bulletin de l’AFIA B ULLETIN DE L’AFIA numéro 60 - juillet 2005 3 PRIX AFIA

Nous publions ici un résumé de l’article qui a reçu le prix de l’AFIA à la conférence Ingéniérie des Connaissances de 2005.

Aligner des ontologies lourdes : une méthode basée sur les axiomes

Frédéric Fürst LARIA - Laboratoire de Recherche en Informatique d'Amiens (CNRS-FRE 2733) 33 rue Saint Leu - 80039 Amiens Cedex 01 [email protected]

Francky Trichet LINA - Laboratoire d'Informatique de Nantes Atlantique (CNRS-FRE 2729) 2 rue de la Houssinière - BP 92208 - 44322 Nantes Cedex 03 [email protected]

Les ontologies de domaine sont actuellement au expressions linguistiques (labels éventuellement coeur de nombreuses applications de l'Ingénierie des étendus à l'aide de thesaurus, définitions en langage Connaissances, en particulier le Web Sémantique, car naturel, etc.) des concepts et relations pour décou- elles ont pour objectif de supporter la gestion des vrir des analogies entre primitives conceptuelles ; connaissances et le raisonnement sur ces connaissances, 2 - les algorithmes s'appuyant sur la comparaison des dans une optique d'interopérabilité sémantique entre instances des concepts et relations ; agents humains et/ou artificiels. Dans ce cadre, l'aligne- 3 - les algorithmes s'appuyant sur la comparaison des ment d'ontologies, permettant d'établir des liens séman- propriétés des primitives conceptuelles. tiques entre concepts et relations de deux ontologies Nos travaux s'inscrivent dans le cadre de cette troi- supposées bâties sur des domaines connexes, est une sième approche exploitant le niveau axiomatique des question centrale ; cet alignement ayant pour but de per- ontologies. Cependant, contrairement à la plupart des mettre la manipulation conjointe de plusieurs ontolo- travaux similaires ou seuls la propriété de subsomption gies au sein d'une même application, ou de permettre à est utilisée, notre algorithme d'alignement repose sur deux applications utilisant des ontologies différentes de l'ensemble des propriétés exprimant la sémantique des communiquer. primitives. Ces propriétés couvrent aussi bien les pro- Etant données deux ontologies O1 et O2 contenant priétés classiquement utilisées dans les ontologies dites chacune une hiérarchie de concepts, un ensemble (par- légères (lightweight ontologies), telles que les sub- fois hiérarchisé) de relations entre ces concepts, et un somptions, les propriétés algébriques des relations, les ensemble de propriétés de ces concepts et relations, ali- abstractions de concepts, entre autres, mais aussi des gner O1 et O2 consiste principalement à identifier des propriétés du domaine ne pouvant être exprimées que appariements (c1,c2) de concepts et des appariements sous forme d'axiomes, dont la sémantique formelle est (r1,r2) de relations d'O1 et O2. Ces appariements peu- celle d'une implication logique. L'intégration de tels vent représenter des identités entre primitives concep- axiomes de domaine dans une ontologie, en plus des tuelles (c'est-à-dire concepts et relations), mais égale- propriétés classiques des ontologies légères, permet ment des subsomptions ou d'autres liens conceptuels alors de parler d'ontologies lourdes (heavyweight onto- (exclusion, incompatibilité, etc.). Les algorithmes d'ali- logies), dont l'émergence est actuellement en cours et gnement permettent de découvrir ces appariements et reconnue depuis quelques années comme nécessaire de les valuer en fonction de leur validité. vis-à-vis des objectifs applicatifs des ontologies. Les algorithmes existants peuvent être classés en Pouvoir comparer à la fois les propriétés classiques trois grandes catégories selon les éléments pris en (que nous appelons schémas d'axiomes) et les axiomes compte pour découvrir les appariements : de domaine nécessite de pouvoir représenter ces deux 1 - les algorithmes s'appuyant sur la comparaison des types d'axiomes. Pour cela, nous proposons OCGL B ULLETIN DE L’AFIA 4 numéro 60 - juillet 2005 PRIX AFIA

(Ontology Conceptual Graph Language), un langage lement à des implications logiques, doit se faire de inspiré du modèle des Graphes Conceptuels, permettant façon topologique, indépendamment des labels des la représentation d'ontologies lourdes dans un formalis- concepts et relations en jeu, puisqu'on désire comparer me graphique. Ce langage est implémenté dans l'atelier la sémantique de ces axiomes. C'est pourquoi ces d'ingénierie ontologique TooCoM (A Tool to axiomes sont d'abord représentés à un niveau plus abs- Operationalize an Ontology in the Conceptual Graph trait à l'aide d'une ontologie de représentation du langa- Model, http://sourceforge.net/projects/toocom/), qui ge OCGL, elle-même exprimée en OCGL, et donc nom- intègre également l'algorithme d'alignement. mée MetaOCGL.

Notre algorithme est basé sur deux principes : (1) Ces deux principes nous permettent, à partir de deux l'utilisation de la stabilité de modélisation et de la rare- ontologies lourdes exprimées en OCGL (une transfor- té d'une propriété conceptuelle pour fixer le poids de mation XSLT d'OWL vers OCGL est disponible), de cette dernière dans l'évaluation des appariements et (2) découvrir et de valuer des appariements de concepts et l'utilisation de méta-représentations des axiomes de de relations. L'article décrit également une expérience domaine pour comparer leurs structures. La stabilité de d'alignement menée sur deux ontologies du domaine modélisation d'une propriété (schéma d'axiome ou axio- des relations familiales. Le matériel de cette expérience me de domaine) correspond à son degré de stabilité et ses résultats sont disponibles sur le site de TooCoM. d'une ontologie à l'autre ; sa rareté est relative à sa fré- quence d'apparition dans les ontologies. La comparai- Site de TooCoM : son des axiomes de domaine, qui correspondent formel- http://sourceforge.net/projects/toocom/

Du coté des éditeurs … Voici quelques livres que des éditeurs proposent aux membres de l’AFIA de reviewer. Si vous souhaitez effectuer une recension d’un de ces ouvrages, envoyez un email avec le titre, les auteurs et l’éditeur du livre que vous souhaitez reviewer, ainsi que vos coordonnées postales à [email protected] : nous vous enverrons ce livre (que vous garderez pour prix de votre recension). Généralement, la recension sera envoyée aux auteurs du livre, afin qu’il puisse répondre à la recension, s’ils le souhaitent (la recension et la réponse s’il y en a une seront publiées dans le Bulletin).

1. Jacques Richalet, Guy Lavielle et Joëlle Mallet. La commande prédictive. Eyrolles, Paris, décembre 2004, 256 pages. 2. Patrick Naïm, Pierre-Henri Wuillemin, Philippe Leray, Olivier Pourret et Anna Becker. Réseaux bayésiens. Eyrolles, Paris, mai 2004, 224 pages. 3. Gérard Dreyfus, Manuel Samuelides, Jean-Marc Martinez, Mirta B. Gordon, Fouad Badran, Sylvie Thiria et Laurent Hérault. Réseaux de neurones. Eyrolles, Paris, Avril 2004, avril 2004, 408 pages. 4. Philippe Lacomme, Christian Prins et Marc Sevaux. Algorithmes de graphes. Eyrolles, Paris, octobre 2003, 422 pages. 5. Johann Dréo, Alain Pétrowski, Patrick Siarry et Eric Taillard. Métaheuristiques pour l’optimisation diffi- cile. Eyrolles, Paris, septembre 2003, 356 pages. 6. Yann Collette et Patrick Siarry. Optimisation multiobjectif. Eyrolles, Paris, octobre 2002, 322 pages. 7. Antoine Cornuéjols, Laurent Miclet et Yves Kodratoff. Apprentissage artificiel. Eyrolles, Paris, août 2002, 638 pages. 8. Christelle Gueret, Christian Prins et Marc Sevaux. Programmation linéaire. Eyrolles, Paris, octobre 2000, 384 pages.

B ULLETIN DE L’AFIA numéro 60 - juillet 2005 5 DÉBAT

Impressions sur le rôle de correspondant régional

Arnaud DELHAY Laboratoire Lannionais de l’IRISA

Il y a quelques temps, le bureau de l’AFIA a propo- est donc important à ce niveau pour promouvoir l’action sé de désigner des correspondants régionaux pour l’as- de l’AFIA. sociation. J’ai accepté cette tâche qui semblait être inté- ressante pour le laboratoire dont je fais partie et pour ses En ce qui concerne les collègues connaissant membres. J’ai également souhaité par ce geste contri- l’AFIA, il semble que l’image de l’association soit buer (un tout petit peu) à l’action de l’association. bonne, que l’association apporte des informations inté- ressantes à ses adhérents et qu’elle prenne des initia- Avant de commencer à décrire mon rôle de corres- tives enrichissantes (comme les cours en ligne … dom- pondant, il me semble important de rappeler dans quel mage que cela ne soit pas encore assez populaire). Son contexte s’effectue ma recherche et celle de mes col- rôle de soutien aux conférences est également connu. lègues. Mon laboratoire, le Laboratoire Lannionais de l’IRISA (LLI), est située à Lannion, à environ 160 km En conclusion, je dirais que l’AFIA est relativement de Rennes, dans un endroit tout à fait charmant appelé bien connue, mais qu’il faut faire un effort de commu- la Côte de Granit Rose 1, quoiqu’un peu éloigné de notre nication vers les jeunes chercheurs (dès la thèse) pour la université de tutelle, Rennes I. Tous les membres de faire connaître. Toutefois, j’ai l’impression que les col- mon laboratoire, qui regroupe 3 équipes, sont des ensei- lègues (et moi-même) n’utilisent pas complètement ce gnants-chercheurs et deux de ces équipes, CORDIAL et soutien à l’IA. Le PortAI est à mon avis mal connu et BADINS, sont intéressées par les activités liées à l’IA. sous-employé. Si chacun voulait bien remplir les don- Je me suis donc proposé pour être le correspondant nées concernant les activités de son laboratoire ou de local (plutôt que régional, car je ne couvre pas vérita- son équipe, je pense que cela apporterait beaucoup à la blement une région au sens administratif du terme) du communauté. J’aimerais bien retrouver les éléments LLI pour l’AFIA. Tous ces détails situent la localité de d’enquête sur les thématiques que nous trouvons dans mon rôle de correspondant, représentant une dizaine de les différents bulletins. permanents. L’implication dans l’association n’est pas extraordi- Les impressions principales que je tire d’une année naire à Lannion, mais nous comptons des adhérents « d’activité » sont que les collègues, en particulier les fidèles et nous nous intéressons à ses activités. Je me nouveaux arrivants semblent peu concernés ou peu rends compte à l’écriture de ce papier qu’il me reste informés de l’existence de l’AFIA. La question princi- encore beaucoup de travail de communication à faire pale à laquelle j’ai eu à répondre est donc « qu’est-ce pour informer les collègues ne serait-ce que de l’exis- que l’AFIA ? ». Je mets à la disposition du laboratoire tence de certains services offerts par l’AFIA qui la version papier et électronique du bulletin qui me seraient très appréciés. Je viens d’ailleurs de rencontrer semble consulté, sans pour autant dire qu’on se l’ar- une jeune collègue qui devrait bientôt rejoindre les rache. Personnellement, je le trouve enrichissant pour adhérents… quelqu’un qui cherche à découvrir des référents dans un domaine particulier de l’IA. Le rôle de correspondant

1. Que vous aurez le plaisir de découvrir en mai 2006 si vous par- ticipez à la Conférence CAp ! B ULLETIN DE L’AFIA 6 numéro 60 - juillet 2005 L’I.A. AU QUÉBEC

Nouvelles du Québec

Nicole Tourigny

Voici deux résumés de thèses soutenues en mai 2005 au département d’informatique et de génie logiciel (http://ww.ift.ulaval.ca) de l’Université Laval (http://www.ulaval.ca). Ces travaux ont été réalisés dans le cadre du Laboratoire des Systèmes Intelligents (LSI), composé d’équipes (groupes). Ces résumés reprennent ceux utilisés pour l’annonce de la soutenance par l’auteur concerné.

Titre : FATMAS : A Methodology to Design erreurs causées par l’environnement du SMA. Fault-tolerant Multi-agent Systems L’environnement d’un SMA représente toutes les com- Diplôme: Ph.D. posantes que le système ne contrôle pas mais avec les- Auteur : Sehl Mellouli quelles il interagit. Cette thèse présente une méthodolo- Soutenance : 28 avril 2005 gie de conception de SMA tolérants aux fautes, Groupe : Groupe de recherche en informatique nommée FATMAS, qui permet au concepteur du SMA computationnelle de détecter et de corriger, si possible, les erreurs causées par les composantes du SMA. Cette méthodologie per- Examinateurs : mettra ainsi de délimiter la frontière entre le SMA (interne) et son environnement (externe). La frontière Guy Mineau, Ph.D. (directeur de thèse), Université d’un SMA est déterminée par les différentes compo- Laval santes (matérielles ou logicielles) que le système Bernard Moulin, Ph.D. (co-directeur), Université contrôle. Ainsi, le SMA, à l’intérieur de cette frontière, Laval. pourra corriger les erreurs provenant de ces compo- Sylvain Delisle, Ph.D. (examinateur) Université du santes. La méthodologie proposée doit couvrir les trois Québec à Trois-rivières phases d’un développement logiciel qui sont l’analyse, Andrea Omicini, Ph.D. (examinateur) Université de la conception et l’implémentation tout en intégrant, Bologne, Italie dans son processus de développement, une technique Marie-Pierre Gleizes, Ph.D. (examinatrice) permettant au concepteur du système de délimiter la Université Toulouse, France frontière du SMA et ainsi de détecter les sources d’er- reurs et y remédier afin que le système multi-agent soit Résumé : tolérant aux fautes (SMATF).

Chaque agent, dans un système multi-agent (SMA), pour diverses raisons, peut rencontrer des problèmes pendant l’exécution de ses tâches, ce qui peut induire un ------disfonctionnement du SMA. Cependant, le SMA doit être en mesure de détecter les sources de problèmes (d’erreurs) afin de les contrôler et ainsi continuer son exécution correctement. Un tel SMA est appelé un Titre : A Pragmatic and Semantic Unified SMA tolérant aux fautes. Il existe deux types de sources Framework for Agent Communication d’erreurs pour un agent : les erreurs causées par son Diplôme: Ph.D. environnement et les erreurs dues à sa programmation. Auteur : Jamal Bentahar Dans la littérature, il existe plusieurs techniques qui Soutenance : 16 mai 2005 traitent des erreurs de programmation au niveau des Groupe : Groupe de recherche en informatique agents. Cependant, ces techniques ne traitent pas des cognitive B ULLETIN DE L’AFIA numéro 60 - juillet 2005 7 L’I.A. AU QUÉBEC

Examinateurs : contributions principales de cette thèse sont : 1. Une approche pragmatique formelle basée sur les engage- Bernard Moulin, Ph.D. (directeur de thèse), ments sociaux et les arguments ; 2. Un nouveau forma- Université Laval lisme pour la communication entre agents appelé Brahim Chaib-draa, Ph.D. (co-directeur), Université Réseau d’Engagements et d’Arguments; 3. Un modèle Laval logique basé sur la logique temporelle et la logique Yves Lespérance, Ph.D. (examinateur), York dynamique définissant la sémantique des éléments utili- University sés dans l’approche pragmatique; 4. Une technique de Josée Desharnais, Ph.D. (examinatrice), Université vérification de modèles basée sur une méthode à Laval tableaux pour vérifier une famille de protocoles Frank Dignum, Ph.D. (examinateur) Utrecht flexibles de communication entre agents appelée proto- University, The Netherlands coles à base de jeux de dialogue; 5. Une Spécification formelle et une implémentation d’un nouveau protoco- Résumé : le de persuasion à base de jeux de dialogue.

Le succès des applications multi-agents nécessite un ------système sophistiqué de communication. Cette thèse propose un cadre unifié pour la pragmatique et la Pour plus d’informations, vous pouvez contacter les sémantique de la communication entre agents logiciels personnes concernées à partir du site du département dans un système multi-agent. La pragmatique traite la d’informatique et de génie logiciel (http://www.ift.ula- façon avec laquelle les agents utilisent les actes com- val.ca) de l’Université Laval. Il me fera également plai- municatifs lorsqu’ils participent aux conversations. Elle sir de répondre à vos questions. Vos commentaires est liée à la dynamique des interactions entre agents et à seront appréciés. la manière avec laquelle les actes individuels sont reliés pour construire des conversations complètes. La séman- Nicole Tourigny, Ph.D., professeure titulaire tique, quant à elle, porte sur la signification de ces actes. Directrice LSI Elle établit la base pour une signification concise et non Département d'informatique et de génie logiciel ambiguë des messages échangés entre les agents. Ce Faculté des sciences et de génie cadre unifié vise à résoudre trois problèmes majeurs Pavillon Adrien-Pouliot dans le domaine de communication entre agents : 1. Université Laval L’absence d’un lien entre la pragmatique et la séman- Québec, CANADA tique ; 2. L’inflexibilité des protocoles actuels de com- G1K 7P4 munication entre agents; 3. La vérification des méca- [email protected] nismes de communication entre agents. Les http://ericae.ift.ulaval.ca/

B ULLETIN DE L’AFIA 8 numéro 60 - juillet 2005 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

Intelligence Artificielle et Image

Coordonnateurs : Eunika Mercier-Laurent (IAE Lyon 3, [email protected]), Patrick Saint-Jean (ENSC, ACM SIGGRAPH, [email protected])

Ç Avec l'image numérique, un mode http://www.siggraph.org/siggra- d'autres, ainsi que quelques idées pour d'automatisation radicalement diffé- ph_2005_keynote une recherche applicative. rent apparaît. L'image n'est plus le En France, RFIA intègre ce sujet dans produit d'une trace matérielle (phy- le programme depuis 1988. Un Groupe sique ou énergétique), mais d'un calcul Introduction 1 de Travail ASTI y est consacré ainsi que automatique effectué par un ordina- les programmes PRIAM et RIAM. Des teur. Sa morphogénèse, son mode de La puissance des ordinateurs a permis évènements comme Imagina et Laval distribution (conservation, duplication, le développement rapide de diverses virtual regroupent des chercheurs et des circulation), et par là son statut sémio- techniques pour le traitement d'image et professionnels de l'image. La création tique et son économie symbolique la vision artificielle. Après les consoles de Pôles Image témoigne de l'intérêt changent radicalement. L'image de jeux, l'image est arrivée sur les télé- stratégique pour ces domaines. Selon atteint un niveau d'automatisation phones portables, les PDA et autres cordis.lu deux programmes de la sans commune mesure avec les Çdevices È. Les applications sont nom- Commission Européenne et 258 projets niveaux précédents (optiques, méca- breuses : jeux, communication, forma- y sont consacrés. Au niveau internatio- niques, électroniques). Après avoir tion et e-learning, réalité virtuelle, desi- nal le SIGGRAPH fait le point annuel emprunté aux mathématiques et à la gn, maintenance, e-business, médecine, sur les techniques, les outils et les appli- physique, elle a désormais recours à robotique, jouets, domotique, sécurité, cations. AAAI s'intéresse également au des techniques de simulation sophisti- cinématographie… sujet. quées issues des sciences cognitives et Toutes ces applications sont ou pour- Ce dossier présente des acteurs que des sciences du vivant. Ce faisant, elle raient être intelligentes et efficaces. Les nous avons sollicités qui ont répondu à acquiert des capacités qui semblaient spécialistes de l'image (computer gra- l'appel. Nous citons quelques-uns qui jusqu'à maintenant n'appartenir qu'au phics) n'invoquent que très rarement sont impliqués dans le sujet et qui n'y règne animal, et à l'homme en particu- l'expression intelligence artificielle, figurent pas. Merci à tous ceux qui sou- lier : la vie et l'intelligence. È bien que depuis la sortie du film de haitent être visibles dans la suite de ce Edmond Couchot, théoricien de l'art, Steven Spielberg on la cache moins. dossier de nous contacter. Professeur émérite de l'Université Ce dossier a pour objectif de faire le Paris-VIII, extrait de la conférence de point sur les recherches menées conjoin- Eunika Mercier-Laurent, l'Université de tous les savoirs du 9 tement par des spécialistes de différents Patrick Saint-Jean. juillet 2004 domaines de l'IA, ceux de l'image et d'autres domaines associés. Quelques George Lucas, le père du cinéma sujets : compréhension de l'image, Paris ACM SIGGRAPH numérique, et producteur d'exploits représentation et découverte de connais- Professionnal cinématographiques visionnaires sances, interaction dynamique avec uti- and Student Chapter comme Star Wars et Indiana Jones, a lisateur, immersion et bien d'autres. révélé sa motivation et ses plans futurs : Les approches et les techniques IA Association 1901, non commerciale et à -Ç I am a storyteller at heart È symboliques et numériques sont certai- but non lucratif. - Looking to the future, Lucas nement utilisées et peuvent être utilisées expressed his belief that advancements d'avantage dans le traitement d'image, Contact : Patrick Saint-Jean in artificial intelligence will vastly vision artificielle, simulation, divertisse- Tel : 01 49 73 96 11 change technology and particularly the ment pour améliorer les applications Email : [email protected] game industry. Ç I want to get to the actuelles. Ce dossier aborde quelques Web : http://paris.siggraph.org point where you can talk to a game and applications existantes et en proposera Adresse : 16, Villa Thérèse the game will talk back. È 94240 - L’Hay les Roses - Lucas stressed that his quest for innovation was a quest for Ç immacu- 1. La plupart des images de ce dossier étant en Membres de l’équipe concernés par le late reality È. couleur, elles ne donnent sans pas toute leur mesu- thème : Extrait de la conférence invitée de re en niveaux de gris. Aussi nous invitons les lec- teurs intéressés à se reporter à la version en ligne de George Lucas au SIGGRAPH 2005, ce Bulletin sur le site de l’AFIA : www.afia-fran- Patrick Saint-Jean, Chair Paris ACM voir http://paris.siggraph.org ce.org SIGGRAPH Chapter, chargé du Groupe B ULLETIN DE L’AFIA numéro 60 - juillet 2005 9 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

Image de l’ASTI (Sciences et film d’animation, de scénario, de jeux, culturelle sur la vogue des pseudo- Technologie de l’Information), MC à et de systèmes interactifs). sciences. Revue de Psychoéducation et l’ENS Cachan, Département Design, d'Orientation), les sciences, arts et tech- Ingénieur, docteur en biologie de Paris L’I.A. et l’image au SIGGRAPH nologies ont besoin de se repositionner à XIII, travaille d’une part sur la polyago- des fins d’objectivation du subjectif gie en espace virtuel (PolyAgogic Contact : Patrick Saint-Jean culturel pour mieux l’appréhender, le CyberSpace), et d’autre part sur les Tel : 01 49 73 96 11 capter, le simuler, le contrôler et l’inté- Texturologies Quantiques, systèmes de Email : [email protected] grer dans des processus de véracité représentation, de mesure et d’auto- Web : http://creaci.free.fr (analyse, interprétation) impliquant les organisation, dans des processus d’intel- De façon générale, aborder l’I.A. et propriétés mentales et émotionnelles de ligence (langage), de vie (développe- l’image, c’est ouvrir un champ R&D l’être humain. ment, évolution), de conscience vaste du fait qu’avec le film d’animation La notion d’image numérique, flux (représentation, émergence de sens) et numérique, la 3D temps réel (Open- 2D pixelisé et matérialisé, constant ou d’âme (anima, sensorium, émergence GL), le jeu et la réalité virtuelle, aug- variable dans le temps, se rapproche d’imaginaire, d’émotion et de compor- mentée et simulée, pouvant faire appel à plus de la notion de vision numérique. tement) artificielles pour le Design du l’interactivité, tout processus global en De la robotique au personnage de syn- concept multimédia (spatialisation de chaîne directe ou bouclée, faisant inter- thèse, il n’y a qu’un pas, l’un pouvant l’information, aide au scénario, partition venir soit une caméra ou une prise de être la maquette virtuelle de l’autre, multimédia) pour le spectacle de la mesures 2D, soit un support de visuali- mais aussi dépasser l’austère physiono- connaissance. sation et d’expression 2D (écrans, moni- mie de robot pour devenir l’acteur syn- Pierre Berger, Trésorier de Paris teur de contrôle de processus ou de pro- thétique vraisemblable, suffisamment ACM SIGGRAPH Chapter, journaliste jection), sans oublier les mémoires crédible (believable characters), vision co-éditeur d’ASTI-Hebdo, et artiste d’image non visualisée (base de don- de tous les fantasmes et de tous les peintre numérique en quête d’intelligen- nées, pages composites multimédia ou espoirs, comme de tous les monstres et ce artificielle (projet Roxame). hypertextes pour l’Internet), et les de toutes les chimères. Paraître, c’est Les autres membres (Thierry Frey, images mentales virtuelles en robotique déjà créer une image dont la perception Bernard Ferrif, Pierre Hénon, Anne- (image de Ç soi È, de son environnement répond aux exigences des autres ou à ses Marie Kempf, Jean-Paul Couder, et des autres, image de l’image que se propre désirs. Renaud Jungmann, Alexis Casas, font les autres de Ç vous È), sont suscep- L’interactivité a déplacé ou plutôt Thierry Le Boité, Frank Pettita) de par tibles d’accueillir un processus d’I.A. étendu la problématique de l’intelligen- leurs responsabilités ou leur activités de particulier, spécifique et intrinsèque dès ce artificielle du jeu des états, des posi- recherche, d’enseignement, d’édition ou qu’il y a génération de propositions et tions, des formes statiques, au jeu des de développement sont également de choix avec prise de décision et action transitions d’état, des mouvements, des impliqués ou confrontés à l’intelligence selon des règles (automates), des stratégies et de leurs apparences. Le artificielle (jeux, animation numérique, connaissances dictées ou apprises (sys- bras robotisé avec retour de force effet spéciaux, Réalité Virtuelle, Web). tèmes experts), ou des processus (adap- (Phantom, plug-in pour 3DsMax ou La bibliothèque numérique d’ACM tabilité, moteur d’I.A.). La forme et sa Maya) de SensAble, permet de dépasser (Association for Computing Machinery) reconnaissance dans l’image est généra- le 2D de l’écran en touchant réellement comporte près de 53000 articles ayant le lisée à son traitement informatique la matière virtuelle et où le terme Ç artificial intelligence È dans le (image abstraite de données, structure et designer/sculpteur numérique creuse, titre, et la base de données bibliogra- traces de processus) et à sa mise en lisse, casse avec appréhension tactile, phique Computer Graphics d’ACM SIG- forme dans l’information et la commu- mettant en boucle sa propre vision GRAPH (Special Interest Groups on nication. (comme il le voit) et la formation Graphics) en comporte 93. Une L’introduction du subjectif objectivé d’images mentales (comme il le sent). recherche Web sur Google fournit près de et l’objectivation subjectivée dans les L’intelligence artificielle se place 900 pages Ç pertinentes È sur 15 millions. systèmes numériques d’information, de également dans les effets spéciaux représentation, de recherche et même de comme le moteur d’IA de Cinema 4D Thème général de l’équipe : loisir (entertainment), posent de nou- de MediaWorks avec Thinking par- velles problématiques où se projettent ticles, un système de particules basé sur Promotion de l’image et de la culture ceux qui veulent « mécaniser, électrifier, l’événementiel. numérique sous toutes ses formes en électroniser, technologiser et cybernéti- De la caricature théâtrale au plus près relation avec ACM SIGGRAPH ser » l’être humain, et ceux qui veulent du simulacre ou de la simulation, le per- (Computer Graphics and Interactive rendre biologique, vivant, émotif, sonnage dans sa dynamique est considé- Techniques) et les activités profession- conscient, logique, social et intelligent ré comme un caractère, un auto- nelles de ses membres (acquisition, ana- voire humain la machine, le robot, le nome ou contrôlable générateur lyse, traitement, synthèse, visualisation système informatique et le réseau numé- d’images, d’expressions visuelles. et processus de l’image, multimédia rique. Face à l’arrivée des pseudo- Personnages crédibles (Believable interactif, de la R&D à la production de sciences (Larivée, S : L'influence socio- Characters) : Les personnages ou B ULLETIN DE L’AFIA 10 numéro 60 - juillet 2005 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

acteurs synthétiques contrôlés par l’I.A. forme et de structuration ; l'enchaîne- ¥ Act-3D, B.V. (www.quest3d.com) a sont-ils de l’ordre du possible, et où ment est inintelligent et instable ; l'inter- créé Quest3D, un programme de logi- nous conduisent-ils ? Là est la question action est limitée, pilotés suivant les ciel pour les artistes 3D, de multimé- qui sera posé cet été au SIGGRAPH, le auteurs et les navigateurs. Cependant, les dia et les réalisateurs de réalités vir- Mercredi 3 Août dans le cadre des choses changent. Des avancées en intel- tuelles. Quest3D est orienté pour des Panels. La capacité de traitement aug- ligence artificielle ont pu être appliqué productions de temps réel 3D, comme mente à la même vitesse que les espé- au WWW, le transformant en un univers l'architecture, la formation à la réalité rances, demandes et besoins des Ç wetware-orienté » (d’après le roman de virtuelle, le divertissement et les pré- joueurs, qui soulève bien plus de ques- Rudy Rucker, en opposition au hardware sentations interactives. Les points cul- tions que de réponses : et software du système lui-même, le wet- minants de Quest3Dª incluent la ¥ Où en sommes-nous (et nos carac- ware représente le système nerveux simulation de phénomènes physiques, tères) en termes d'intelligence artifi- humain des développeurs, opérateurs et la connectivité de base de données, la cielle ? administrateurs utilisateurs), globale- gestion de réseau à utilisateurs mul- ¥ Comment évolue le divertissement ment distribué et massivement parallèle. tiples, l'intelligence artificielle, le interactif dans les jeux sur les Les développeurs de tous les domaines rendu optimisé de paysages et de Playstation3 et Xbox2, avec des envi- du Web discuteront cette problématique foules et des possibilités graphiques ronnements massivement multi- et d'autres possibilités pour le futur du puissantes. joueurs à jeu de rôle en ligne ? Web. ¥ Activeworlds, Inc. est réalisateur d'un ¥ Comment l'I.A. affecte-t-elle le déve- On remarquera également que le navigateur 3D, avec plus de 1.5 mil- loppement des caractères crédibles à Computer Science and Artificial lion de téléchargements, qui assure la forte expression émotionnelle ? Intelligence Laboratory du livraison efficace de contenus 3D via ¥ Comment pouvons-nous doser les Massachusetts Institute of Technology l'Internet. Avec 3Dlive, vous vous priorités et équilibrer les techniques (MIT) est fortement présent cette année retrouvez dans des environnements graphiques pour soutenir le réalisme dans de nombreuses communications au 3D où des caractères contrôlables à perçu dans un caractère ? SIGGRAPH. distance vous aident à la visite guidée ¥ Y a-t-il des règles ou des orientations Les savoirs et savoir-faire ne sont pas et commentée de laboratoires, de que nous puissions faire ressortir des que dans les Universités et Laboratoires, galeries ou de boutiques avec une caractères les mieux réussis du jeu ? l’Industrie présente au SIGGRAPH force de vente obtenue par intelligen- ¥ Quels éléments subliminaux peuvent 2005, développe ses produits à forte ce artificielle. corrompre l'illusion des caractères composante d’intelligence artificielle. crédibles ? Parmi eux : Dans ce Panel, les experts en matière d'industrie, les artistes, les animateurs de caractère, et les développeurs pour- ront partager leurs pensées profondes qui devraient nous aider à nous faire une idée, avec en image de fond les techno- logies graphiques, pour découvrir quelques gemmes crédibles (le quanta émotionnel) du caractère d’un person- ¥ AFA Products Group, Inc. apporte nage, et pour répondre à quelques ques- des solutions en matière de rapide iso- tions de principe fondamental. lation d’objets en mouvement comme Une autre virtualité, que le jeu, est le s’ils bougeaient en superposition Web ou, plutôt, le Web ne serait-il pas d’une séquence d’images (incrusta- un des plus grand jeu virtuel où l’I.A. tion) pour permettre des travellings apporte ou pourrait apporter toute sa ou des fenêtres de correction de cou- contribution, autrement que de le trans- leur (TRAX’IM). former en Ç Big Brother È. ¥ Deshiva Intelligent Systems Co. est WWAI : Comment le Web se dévelop- l'un des organismes importants chi- pe-t-il ? Dans une Super-Organisation nois pour le développement de l'ani- sociale ou dans une masse d'information mation 2D/3D, des jeux, du Design fortement déconnectée ? Nouveau ques- virtuel, de la fabrication virtuelle et tionnement le jeudi 1er après-midi. Alors des produits d'application intelligents. que le World Wide Web pourrait devenir ¥ DigiPen Institute of Technology est le centre nerveux pour une super-organi- un établissement d’enseignement se sation sociale, il demeure terriblement concentrant sur le graphique, le traite- rudimentaire dans toutes ses frustrations. ment d'images (dont l’intelligence Les documents manquent de mise en artificielle), le 2D et le rendu 3D. B ULLETIN DE L’AFIA numéro 60 - juillet 2005 11 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

¥ Massive Software est spécialisée dans numérique omniprésent, l’intelligence ve dans le hall face à des trucs qui la vie artificielle pour l’animation artificielle infuse et se diffuse discrète- m'attirent l'oeil, me font un choc, numérique dans la création d’anima- ment mais fondamentalement dans de m'intriguent et me plaisent énormé- tion d’agents-contrôlés (pilotés) auto- nombreuses disciplines pour même sou- ment, sans que je n'y comprenne nomes, pour le cinéma et la télévi- vent se mettre en avant à titre de marke- rien... È ; sion, dont les plus connus se trouvent ting dans la production industrielle. - après le repas, le couple des gestion- dans des effets visuels de foules. Cette étendue provoque des expériences naires de la cantine, poussant un ¥ MUSE Technologies est spécialisée nouvelles et des mises en situation grand chariot de vaisselle, s'arrête dans une gamme complète de logi- motrices de renouveaux ou de réécritu- devant les panneaux. Elle : Ç Dis, ciels, de matériels, et de solutions re, voire de nouvelles écritures dans de lequel on pourrait mettre dans notre pour la visualisation de données, la nouveaux contextes. Les arts, sciences séjour ». Lui « ... Tu n'imagines pas le simulation, la Réalité virtuelle, et la et technologies du graphisme en sont prix que ça coûte, ces trucs là ». collaboration gérée en réseau. des domaines actuels privilégiés en ¥ Stottler Henke Associates,Inc. déve- plein essor avec la Réalité Virtuelle, Etat technique actuel du projet loppe des logiciels intelligents pour Augmentée et Simulée qui nécessitera résoudre les problèmes qui défient la non seulement beaucoup d’intelligence 1. Précédents solution en utilisant des approches pour ne pas seulement paraître mais être Roxame a un prédécesseur presti- traditionnelles, en se spécialisant dans et encore plus pour interpréter l’appa- gieux, le logiciel Aaron, développé au les logiciels d'intelligence artificielle rence d’une situation et le paraître situa- début des années 1980 par Harold pour les simulations d'e-enseigne- tionnel de l’être. Cohen [6]. Tout en répondant lui aussi ment et apprentissage (e-learning) et au Ç test de Turing È, ce projet a eu peu de jeu, la gestion et la découverte de Publications accessibles par : de suites et pourrait se ranger dans la la connaissance, la planification et la http://www.siggraph.org/s2005/ avec ligne des multiples systèmes experts qui gestion des délais, et celles d'aide à la recherche sur Ç Intelligence artificielle È sont retombés dans l'oubli à partir des décision (http://www.stottlerhenke. (artificial intelligence) ou plus directe- années 1990. Mais il est toujours bien com/ai_general/using_ai.htm). Son ment : présent sur Internet. site nous révèle l’Histoire de l’I.A. http://www.siggraph.org/cgi- Roxame a aussi un grand frère, réali- depuis l’écriture d’un papyrus de bin/cgi/idCatResults.html&CategoryID sé en 1979, Max « robot à maximisation 3000 ans avant jésus-christ ! sans =10 de variété », conçu pour concrétiser doute à compléter (http://www.stottle- une théorie de l'autonomie comme inté- rhenke.com/ai_general/history.htm). grale, sur la vie d'un système, de son ¥ Mais c’est peut être BioGraphic espérance de variété [1]. Le développe- Technologies (BGT) qui développe Projet Roxame ment de cette théorie a été aussi une des AI.Implant, le logiciel (ou SDK) le raisons de concevoir Roxame. plus performant en intelligence artifi- Contact : Cependant, jusqu'à présent, la volonté cielle pour les développeurs de jeu, Pierre Berger [email protected] d'obtenir des résultats plaisants à l'oeil, producteurs d’animation, et dévelop- Adresse : 24 avenue du Général de pour disposer d'une sorte de « théorème peurs de simulation, à l’heure actuel- Gaulle, 78600 Maisons-Laffitte. d'existence » l'a emporté sur le travail le (http://www.biographictech.com/). http://www.roxame.com d'élaboration théorique. Imago by students from ETPA Toulouse Thème général 2. Constituants techniques de base Le projet a visé d'abord à élaborer le Roxame est un « système artiste- minimum d'éléments nécessaires : une peintre È, transposant à l'art le concept palette de 16 couleurs inspirées par la de « système expert ». Lancé il y a pratique antérieure de l'aquarelle par quatre ans, on peut considérer qu'elle a l'auteur, et une série de générateurs de passé son « test de Turing È puisque plu- formes (pixels, lignes, rectangles, sieurs salons de peinture ont accepté ses ellipses). Pour obtenir des effets plai- oeuvres, et qu'elles sont perçues comme sants, ce premier jeu a été complété avec D’autres entreprises plus orientées des oeuvres d'art même par des per- - des opérateurs de mélange (additif et sur la vente de produits intelligents sont sonnes non prévenues. A preuve deux soustractif), également présentes. anecdotes à la Siana (Semaine interna- - des formules de flou et de dégradé... tionale des arts numériques et alterna- - un algorithme de tracé, aléatoire dans tifs, INT d'Evry, avril 2005) , dont nous des proportions variables, afin que les Conclusion gardons volontairement l'expression traits, ou les bords des surfaces, aient spontanée : l'air « naturel » d'un tracé à main Dans la Société de l’information, - un informaticien, passé là par hasard, levée, c'est à dire ni trop rectiligne, ni banalisée comme l’ordinateur et le écrit dans un courriel : Ç Je me retrou- trop erratique, B ULLETIN DE L’AFIA 12 numéro 60 - juillet 2005 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

- le tout s'organisant en séquences de pements. Les axes les plus intéressants L'imprévisibilité brute de la fonction générations aléatoires. sont les suivants Çrandom È s'effacera derrière les vraies Le système a ensuite été muni d'algo- Le système pourrait progresser indé- bonnes surprises nées de la richesse rithmes pour le traitement d'images finiment par simple enrichissement de la même des moyens et des critères du sys- fournies de l'extérieur (filtres plus ou gamme des formes et des couleurs, la tème artiste. moins sophistiqués, contourage, seg- complexité et la finesse des traitements, L'autonomie est un point essentiel mentation). l'étendue du dictionnaire, etc. Mais pour beaucoup d'artistes aujourd'hui. Ils Enfin, générateurs de formes et traite- d'autres questions, on pourrait presque la recherchent surtout dans le mouve- ment de documents se combinent, par dire d'autres « mystères » de l'art s'of- ment, comme le dit par exemple Antoine exemple dans une génération en alter- frent de manière plus intéressante à l'ex- Schmitt Ç Si cela fonctionne, au sens nance de quadrilatères et d'ellipses dans périmentation. d'une oeuvre, tout à coup elle prend chacune des régions obtenues par la seg- vie... et, à partir d'un certain moment, je mentation. 1. Explicitation des règles esthétiques ne peux plus la toucher, la modifier, Jusqu'à présent, les modes créatifs de parce que j'aurais l'impression de la 3. Programmation et expression phy- Roxame ont été mis au point empirique- détruire, ou au moins de l'abîmer, de la sique ment, sans formulation explicite de dévoyer. È [8]. De nombreux travaux sur Des raisons de convenance pratique règles esthétiques. Où trouver ces cri- ce thème sont répertoriés par Alain ont jusqu'à maintenant limité le projet tères ? Il n'existe pas de méthode géné- Lioret [5] au langage C++ (13 000 lignes à mi rale pour élaborer un tableau. Les der- 2005). Ce langage se prête à la réécritu- niers à s'y être essayés ont été re à bas niveau de toutes les fonctions Kandinsky [3] et Klee [4] au Bauhaus. graphiques dans une optique artistique, Pire : le monde de l'art contemporain par exemple le classique Ç line to È, rejette l'idée même d'une recherche du adapté ici à des tracés « à main levée ». beau, et ne s'intéresse plus qu'aux rup- Une base de donnée associée, appelée tures, à la provocation. Il n'y a plus d'es- par la programmation et y renvoyant thétique, sinon "à l'état gazeux" [7] (par appel de fonctions), fournit un volet Ce thème va dominer les travaux dans Ç linguistique È ou plus modestement les mois à venir. Des critères esthétiques Ç terminologique È pour la description permettaient notamment de répondre à des objets et des actions du système. une question souvent posée : Ç A quel 3. Pilotage à partir dans une boucle Étant donné qu'un mot peut désigner moment s'arrête-t-elle de peindre ? ». vision/action aussi bien une forme géométrique Actuellement, le programme est séquen- Jusqu'à présent aussi, Roxame (de qu'une image photographique, un modè- tiel et s'arrête quand la dernière instruc- même qu'Aaron), Ç ne voit pas È ce le abstrait, une couleur ou état émotif, ce tion a été exécutée. Il serait beaucoup qu'elle fait. Voir, c'est essentiellement dictionnaire offre une sorte de pivot plus intéressant de considérer l'œuvre reconnaître des formes, décrire une pour l'ensemble des problèmes et des finie « quand il n'a plus rien à y ajou- scène. Cela n'est possible, que dans une développements que nous envisageons ter È, ce qui implique une évaluation de mesure assez étroite, très éloignée des pour l'avenir. l'Ïuvre et des actions possibles. capacités de notre oeil et de l'importan- Enfin, l'expression physique du tra- te partie de notre cerveau qui se vail a son importance pour un artiste consacre à ces fonctions. peintre. Après de simples présentations Mais nous pouvons nous concentrer sur écran puis une impression sur papier sur les quelques formes et paramètres de type aquarelle ou photographique, le que nous pouvons à la fois générer et système fait appel à une impression à jet reconnaître : couleurs et ensembles de d'encre sur papier mat, suivie de plu- couleurs, quelques formes, caractéris- sieurs couches de vernis acrylique. tiques générales d'une scène. Dans cette L'expérience a montré l'importance de panoplie limitée, nous aimerions faire ce « détail » pour l'appréciation des fonctionner des boucles vision/action, oeuvres par tous les publics. transposant la boucle, essentielle pour un 2. Passage de l'imprévisibilité stochas- peintre humain, qui va de la main à la toile, L'IA au centre des développements en tique à une véritable autonomie de la toile à l'œil et de l'œil à la main. cours Dans la mesure où nous pourrons Le champ reste merveilleusement expliciter ces critères, ce sont alors eux ouvert car, comme l'écrit Lioret [5] Construit progressivement de maniè- qui guideront, par évaluation comparée Ç Nous n'avons pas encore (et peut-être re empirique, plus ascendante que des- des actions possibles, les choix succes- ne l'aurons-nous jamais) la connaissan- cendante, le système se présente aujour- sifs de la construction, et non plus une ce et la compréhension de toute la por- d'hui comme une plate-forme combinaison empirique de règles impé- tée produite par les résultats de tels sys- permettant différents types de dévelop- ratives et de tirages aléatoires. tèmes, qui ne sont pas qu'aléatoires, qui B ULLETIN DE L’AFIA numéro 60 - juillet 2005 13 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

ne sont pas du seul ressort de l'humain, ni Description : avec les automatiques : en pré ou post- de celui de la machine seule. È traitement de l'algorithme automatique. Notre activité de recherche est concentrée sur la visualisation et l'extra- Pré-traitement graphique ction de connaissances. L'extraction de Un exemple de pré-traitement est celui connaissances dans les données (ECD) qui consiste à préparer les données avant peut être définit comme le processus d'utiliser un algorithme d'induction non trivial de découverte de connais- d'arbre de décision. La plupart des algo- sances nouvelles, potentiellement utiles rithmes d'arbres de décision ne savent et compréhensibles dans les données. La faire que des coupes univariées (ne fai- fouille de données est le coeur de ce sant intervenir qu'un seul attribut (colon- processus. Ce domaine relativement ne) des données, la coupe est parallèle récent de l'ECD regroupe des travaux de aux axes). Dans le cas d'une frontière Eléments bibliographiques plusieurs domaines : les bases de don- oblique, celle-ci sera approximée par des nées, l'apprentissage, les statistiques, coupes successives formant un Ç escalier [1] P. Berger, L'informatique libère l'humain, l'analyse de données et la visualisation. È. L'arbre obtenu aura beaucoup de L'Harmattan, 1999. Dans les approches usuelles, la visua- nÏuds et sera difficilement interprétable. [2] F. Forest, Pour un art actuel. L'art à l'heu- re d'Internet, L'Harmattan 1998. lisation n'intervient généralement que Une solution est alors de visualiser ces [3] W. Kandisnky, Point et ligne sur plan, lors de deux étapes particulières du pro- données, de tracer interactivement la Gallimard, 1991. cessus de fouille de données : coupe oblique puis de calculer un nouvel [4] P. Klee, Cours du Bauhaus. Weimar 1921- - dans l'une des toutes premières étapes attribut : la distance à la droite. Ce simple 22. Contributions à la théorie de la forme pic- pour Ç voir » les données ou leur dis- pré-traitement graphique permet d'une turale. Editions des musées de Strasbourg tribution, part d'améliorer la compréhensibilité des 2004. [5] A. Lioret, Emergence de nouvelles esthé- - dans l'une des toutes dernières étapes résultats (la taille de l'arbre a diminuée) tiques du mouvement. L'Harmattan 2004. du processus pour prendre connais- et d'autre part d'améliorer le taux de pré- [ 6] P. McCorduck, Aaron's code. Meta-art, sance des résultats. cision de l'algorithme. artificial intelligence and the work of Harold Entre ces deux étapes il y a exécution Cohen, Freeman 1991. d'un algorithme automatique de fouille. Post-traitement graphique [7] Y. Michaud, L'art à l'état gazeux, Essai sur Le but de nos travaux est d'augmenter le Dans le cas de post-traitement gra- le triomphe de l'esthétique. Hachette 2003. rôle de la visualisation dans ce proces- phique, l'algorithme de visualisation est [8] A. Schmitt. Interview dans Stic-Hebdo no 27 (http://www.asti.asso.fr/pages/Hebdo/ sus. Ceci peut être mené à bien de plu- utilisé pour aider l'utilisateur à com- sh27/sh27.htm) sieurs façons : prendre le résultat obtenu par l'algorith- - en faisant collaborer des méthodes me automatique. L'idée ici est de trouver On trouvera l'ensemble des références visuelles avec les méthodes automa- une représentation graphique pour expli- de l'auteur ainsi qu'une sélection tiques (en pré-traitement ou en post- quer plus facilement les résultats obtenus d'oeuvres sur le site http://www.roxa- traitement), par les algorithmes de classification. me.com - en remplaçant l'algorithme automa- Nous avons développé des algorithmes tique de fouille par un algorithme gra- de visualisation de résultats d'arbres de phique interactif, on parle alors de décision et de SVM (Support Vecteur fouille visuelle de données ou Machine, cf. fig.1). Equipe : ESIEA – Pôle ECD ÇVisual Data Mining È. Par ailleurs une limite des algo- Adresse : 38, rue des Docteurs Calmette rithmes de visualisation est la difficulté et Guérin, Parc Universitaire de Laval- à traiter des données de grandes tailles. Changé, 53000 Laval. L'approche coopérative utilisant simul- tanément des algorithmes automatiques Contact : [email protected] et graphiques est un moyen efficace [email protected] pour dépasser ces limites, on parle de Ç passage à l'échelle ». Thème général : Visualisation et extrac- Nous allons décrire les travaux menés tion de connaissances dans ces directions. Figure 1 : A gauche distribution des points en fonction de la distance à l'hy- Membres de l'équipe concernés : Collaboration entre méthodes gra- perplan, à droite visualisation des indivi- - François Poulet phiques interactives et automatiques dus les plus proches de l'hyperplan - Lydia Boudjeloud (Segment Classe 7) - Edwige Fangseu-Badjio Dans le processus d'ECD, il y a au - Thanh-Nghi Do moins deux moyens de faire collaborer Ces quelques outils illustrent l'intérêt (jusqu'en Janvier 2005). les méthodes graphiques interactives de faire coopérer entre elles des B ULLETIN DE L’AFIA 14 numéro 60 - juillet 2005 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

méthodes automatiques et graphiques semble de données initial, à droite les 4 données Breast Cancer du Kent Ridge interactives. La compréhensibilité des premières coupes de l'arbre Bio-medical Data Set Repository, per- résultats est ainsi accrue et la précision met de passer de 24481 dimensions à 10 des algorithmes automatiques peut être Traitement de données symboliques dimensions sans perte d'information (le améliorée. Cet algorithme d'arbre de décision a taux de précision est même augmenté de ensuite été étendu pour traiter des don- plus de 5%). Cette réduction de dimen- Fouille visuelle de données nées symboliques de type intervalle ou sions permet aussi d'interpréter graphi- taxonomique. Lorsque l'on a affaire à quement les résultats obtenus ce qui est La dernière possibilité pour augmen- des données de types intervalles et totalement impossible avec l'ensemble ter la part de la visualisation dans les continues, dans le cas d'une projection de données initial. outils de fouille est de remplacer l'algo- 2D, il y a 3 cas possibles : rithme automatique par un algorithme - deux variables continues, on affiche graphique interactif. On parle alors de un point, fouille visuelle de données. Ce type - un variable continue et une variable d'approche, relativement récent présente intervalle, on affiche un segment, aux moins les avantages suivants : - deux variables intervalles, on affiche - la confiance dans le modèle obtenu et une croix. sa compréhension sont accrues Le principe de construction interacti- puisque l'utilisateur a participé à sa ve de l'arbre de décision reste inchangé. création, Il s'agit actuellement du seul algorithme - on peut utiliser les capacités d'arbre de décision capable de traiter humaines en reconnaissance de simultanément des données continues, formes, intervalle et taxonomiques (cf. fig.3). - on peut bénéficier de l'expertise du domaine tout au long du processus de Traitement de grands ensembles de Figure 3 : Version intervalle de l'en- fouille, si l'utilisateur est le spécialis- données semble de données iris te des données. Nous avons développé un algorithme La plupart des algorithmes de fouille Approche symbolique pour la classi- de construction interactive d'arbres de actuels ne sont pas bien adaptés aux fication supervisée de grands ensembles décision. Celui-ci est basé sur une repré- grands ensembles de données (jusqu'à de données sentation des données sous la forme des un milliard d'individus et plusieurs mil- projections 2D de l'ensemble des paires liers de dimensions). Plusieurs Pour pouvoir traiter des ensembles de d'attributs. Les résultats de l'algorithme approches peuvent être suivies pour données ayant un très nombre d'indivi- ont été comparés avec des algorithmes pouvoir effectuer un tel traitement. dus, nous utilisons une représentation de automatiques tels que CART, C4.5 et Nous avons développé plusieurs algo- plus haut niveau des données. La pre- OC1. Ils montrent que l'on obtient un rithmes permettant de traiter des mière étape du traitement consiste alors taux de précision à peu près équivalent ensembles de grandes tailles et utilisant à utiliser un algorithme de classification aux algorithmes automatiques avec une à la fois des méthodes automatiques et non supervisée sur les individus de taille d'arbre souvent inférieure. graphiques. chaque classe. Pour chaque cluster, on retient les valeurs minimum et maxi- Approche coopérative pour la classi- mum sur chaque attribut pour créer des fication supervisée de grands ensembles variables intervalle. On utilise ensuite de données l'algorithme de création interactive d'arbre de décision sur ces données sym- Une première solution est d'utiliser boliques. On peut ainsi traiter des des algorithmes de SVM en coopération ensembles de données de tailles arbitrai- avec des algorithmes de visualisation. rement grandes en nombre d'individus. Dans ce cas précis nous avons utilisé un algorithme de SVM norme 1 pour rédui- Approche hybride pour la classifica- re le nombre de dimensions de l'en- tion non supervisée et la détection d'out- semble de données. Une fois ce nombre liers de dimensions ramené à une ou deux dizaine(s), on peut utiliser l'algorithme Dans ce dernier cas nous nous inté- de création interactive d'arbre de déci- ressons à la détection d'outliers dans des sion pour effectuer la classification des ensembles de données ayant un très données. Il est intéressant de remarquer grand nombre de dimensions Figure 2 : Construction interactive que la réduction du nombre de dimen- (colonnes). Le problème des données en d'arbre de décision, à gauche l'en- sions par exemple sur l'ensemble de très grandes dimensions est que les B ULLETIN DE L’AFIA numéro 60 - juillet 2005 15 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

notions de proximité ou de distance per- en considérant les deux aspects, numé- (3D, surface, mouvement), la détection dent de leur signification et que tout rique et symbolique. (à partir de modèle de forme ou d'appa- individu devient un outlier potentiel. rence) et la segmentation. L'image s'en- Pour éviter ce problème nous utilisons Sous l'aspect numérique, l’équipe se tend dans le sens le plus général, comme un algorithme génétique pour la sélec- focalise principalement sur les toute représentation 2D, 3D ou 4D d'un tion d'un sous-ensemble de dimensions. approches géométriques (caractérisa- phénomène mesuré ou calculé. Une On arrive ainsi à ramener le nombre de tion par géométrie discrète, modélisa- photographie ou une échographie sont dimensions utilisées à environ une tion par cartes et pyramides, modèles de des exemples d'image. dizaine. De plus, avec l'aide du spécia- style) et statistiques (analyse harmo- liste des données, il est possible de qua- nique, méthodes variationnelles et EDP, A long terme, l'objectif du thème est lifier l'outlier : est-ce une erreur (valeur modèles statistiques) du traitement et de la conception d'un système à base de impossible) ou un individu ayant un l’analyse d’images. Il s'agit de proposer connaissances capable de produire auto- comportement différent des autres indi- de nouvelles méthodes et de nouveaux matiquement des logiciels de traitement vidus ? Ceci est absolument impossible outils pour traiter les images. d'images à partir des spécifications d'un à effectuer si le spécialiste des données Sous l'aspect symbolique, l'équipe utilisateur naïf. A court terme, nous doit examiner plusieurs dizaines de mil- s'intéresse à la capitalisation des visons la maîtrise du savoir-faire et la liers de valeurs. connaissances du développement d'ap- capitalisation des connaissances au tra- plications de traitement d'images. Le vers de l'étude de productions exis- Bibliographie : développement d'une application est en tantes. Les efforts de recherche actuels effet considérée comme une activité par- du thème se concentrent sur deux pro- F.Poulet: "Full-View: A Visual Data-Mining ticulièrement complexe. Si les traite- jets complémentaires qui sont préa- Environment", IJIG: International Journal of ments relèvent bien d'une approche lables à la réalisation du système à base Image and Graphics, 2(1):127-144, 2002. T.N.Do, F.Poulet: "Enhancing SVM with purement numérique, le développement de connaissances : Visualization", Discovery Science 2004, d'une application complète n'est pas un Projet 1- L'élaboration d'une théorie E.Suzuki and S.Arikawa (Eds), LNAI-3245, problème numérique. En effet, la plu- cognitive du développement d'appli- Springer-Verlag, 2004, 183-194. part des problèmes de traitement cations qui s'appuie sur la définition F.Poulet, P.Kuntz: "Visualisation et d'images sont considérés comme mal d'une modélisation destinée à captu- Extraction de Connaissances",numéro spé- posés, c'est à dire qu'ils sont impossibles rer toute la sémantique des applica- cial Revue des Nouvelles Technologies de à résoudre en l'état parce qu'il y a trop tions ; l'Information, RNTI-E-4, Cépaduès, 2005. F.Poulet: "SVM and Graphical Algorithms: a d'inconnues. Seules des connaissances Projet 2- La définition d'un modèle de Cooperative Approach", IEEE-ICDM'2004, sur le domaine de l'application permet- formulation de problèmes de niveau 4th International Conference on Data tent de guider leur résolution. L'équipe application n'utilisant que des Mining, Brighton, UK, Nov.2004, 499-502. se propose alors de faire le lien entre la connaissances images, puis sa mise L.Boudjeloud, F.Poulet: "Visual Interactive spécification des problèmes placés dans en œuvre par un système d'interaction Evolutionary Algorithm for High leur domaine et la résolution numérique, Homme/Machine. Dimensional Data Clustering and Outlier Detection",PAKDD'2005, IXth Pacific Asia en s'appuyant sur les approches et tech- Conference on Knowledge Discovery and niques de l'Intelligence Artificielle et de Projet 1- Modélisation d'applications Data Mining, Hanoi, Vietnam, May 2005. l'Ingénierie des Connaissances. de traitement d'images

Description des travaux ou projets en Notre vision de la modélisation d'une lien avec le thème application se fonde sur l'idée force GREYC (équipe image) qu'une application de traitement Le thème « Ingénierie des connais- d'images s'étudie et se conçoit selon Adresse : 6, boulevard Maréchal Juin, sances en traitement d'images È a pour quatre points de vue distincts mais com- 14050 Caen cedex objet d'étude le développement d'appli- plémentaires, dont la sémantique est Site web : http://www.greyc.ensicaen. cations de traitement d'images. La moti- capturée par quatre modèles spéci- fr/EquipeImage/ vation est non seulement d'aider les spé- fiques : le modèle du système, le modèle Contact : Régis Clouard ; cialistes du traitement d'images à du domaine, le modèle des tâches et le [email protected] produire des applications, mais aussi de modèle du programme. Chaque modèle Membres de l'équipe concernés : constituer un patrimoine des connais- s'élabore sur une hypothèse simplifica- Régis Clouard, Arnaud Renouf, sances expertes. trice qui permet une vision partielle et Marinette Revenu L'étude se limite strictement au traite- abstraite de l'application. ment d'images. Nous considérons le 1. Le modèle du système correspond au Thème général de l'équipe IMAGE : traitement d'images comme circonscrit point de vue fonctionnel sur l'applica- aux six classes d'objectifs de transfor- tion d'où l'on cherche à savoir quels Les activités de recherche de l'équipe mation d'images en images : la restaura- sont les objectifs à atteindre par l'ap- Image du GREYC portent sur le traite- tion, la compression, l'amélioration sub- plication. Il repose sur l'hypothèse ment et l'analyse du contenu des images jective et objective, la reconstruction téléologique qui suggère une spécifi- B ULLETIN DE L’AFIA 16 numéro 60 - juillet 2005 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

cation des objectifs de l'application, qu'une solution conceptuelle s'élabore plète de problèmes définissant des orientée tâches à accomplir plutôt comme un arbre de tâches hiérar- applications de traitement d'images. Il qu'orientée données à construire. chiques qui associe en plusieurs s'agit d'une part de définir un modèle de L'approche systémique fournit alors niveaux, les objectifs de traitement la formulation de telles applications le contexte théorique pour modéliser initiaux aux chaînes d'algorithmes indépendamment de tout domaine et une application de traitement numériques adaptés à leur accomplis- d'autre part de définir un modèle d'inter- d'images comme un système fonc- sement. La construction d'une solu- action permettant de guider l'utilisateur tionnant. Celle-ci conduit à représen- tion s'envisage alors comme un pro- dans sa formulation. ter une application par la liste des blème de planification hiérarchique, Le modèle de formulation d'applica- tâches à accomplir, les contraintes de qui fait appel à des stratégies pour tions de traitement d'images organise et régulation (niveaux de détail, critères définir les étapes de traitement (ex: structure les informations nécessaires et à optimiser, erreurs acceptables), les analyse ascendante, descendante ou suffisantes au développement de telles contraintes de rétroaction (éléments à mixte) puis à des tactiques pour choi- applications. Ce modèle se fonde sur les inclure et à exclure et les règles d'éva- sir les méthodes numériques (ex: clas- deux modèles précédents que sont le luation) et les contraintes de l'envi- sification de pixels, détection de modèle du système et le modèle du ronnement d'exécution (performance, contours, fusion division de régions) domaine. Il en reprend les mêmes hypo- ressource, qualité). Par exemple, pour et enfin à des techniques pour choisir thèses et les mêmes fondements théo- la tâche « extraire les plaques d'im- les algorithmes (ex: détection de riques. Ceci fait qu'une application se matriculation È, un niveau de détail contours par différenciation, par dif- formule à partir d'objectifs exprimés par est « détecter toutes les occurrences férence entre dilatation et érosion ou la liste des tâches à accomplir sur les de plaque È, un critère à optimiser est séparation de texture). Ce sont les images avec son réseau de contraintes et « maximiser la détection » avec l'er- informations collectées par le modèle de la classe d'images définie par inten- reur acceptable « préférer les fausses du système et le modèle du domaine sion sous la forme d'une liste de caracté- alarmes aux oublis È, et une contrain- qui permettent d'orienter et d'évaluer ristiques invariantes partagées par toutes te de performance est de Ç limiter le la planification. les images de la classe. temps d'exécution à une seconde ». 4. Enfin, le modèle de programme cor- Le modèle d'interaction conduit la 2. Le modèle du domaine correspond au respond au point de vue logiciel sur session de formulation des problèmes point de vue contextuel sur l'applica- l'application d'où l'on cherche à ainsi que la validation des résultats. Il tion d'où l'on cherche à connaître détailler comment est codée l'applica- s'appuie pour cela sur une ontologie uti- quelle est la classe d'images traitée tion. Il repose sur l'hypothèse qu'un lisateur qui propose une liste des tâches par l'application. Il est basé sur l'hy- programme de traitement d'images se de traitement et des contraintes asso- pothèse phénoménologique qui réduit conçoit comme un graphe d'opéra- ciées permettant la spécification des la définition d'une classe d'images à teurs s'échangeant des images et des objectifs, et une liste des concepts une dénotation des seules informa- valeurs numériques. Un opérateur réi- visuels et des caractéristiques de la chaî- tions qui ont une influence sur la fie un algorithme de traitement. La ne d'acquisition permettant la définition manifestation visuelle des objets de la programmation prolonge la concep- de la classe d'images (Fig. 4). scène. L'approche sémiotique nous tion de la solution conceptuelle. Elle Ce modèle est utilisé pour concevoir fournit ici le contexte théorique pour se pose comme un problème de un système d'interaction homme-machi- modéliser la classe d'images en consi- contrôle, qui consiste à sélectionner ne. L'interface pilote le système de réso- dérant qu'il faut distinguer trois des opérateurs implémentant les algo- lution de tâches de traitement d'images niveaux d'information : le niveau rithmes de la solution conceptuelle, BORG (déjà développé au sein de notre signal (la description des effets de ajuster leurs paramètres et les enchaî- laboratoire) pour construire des résultats l'acquisition, le type et la qualité du ner. intermédiaires, autorisant ainsi une for- signal résultant), le niveau perceptif Sur la de base de cette modélisation, mulation itérative et incrémentale. (la description du rendu visuel de nous avons développé un atelier logiciel BORG permet de construire des pro- l'image par les caractéristiques des dédié au traitement d'images. Cet atelier grammes de traitement d'images à partir primitives visuelles Ð par exemple la se présente comme un éditeur de formu- d'une requête quantitative formelle. forme, la taille ou la couleur des laires élaborés à partir des quatre Pour communiquer, les deux systèmes régions, des contours ou des points modèles. Nous y étudions aussi la défi- partagent une ontologie du traitement d'intérêts) et le niveau sémantique (la nition d'une représentation plus formel- d'images. Le système d'interaction doit description des concepts et des objets le des informations qui nous permettra alors profiter de l'utilisateur pour de la scène en terme de primitives de développer des mécanismes d'analy- résoudre le problème de l'ancrage des visuelles). se du contenu des formulaires à des fins symboles, c'est à dire donner une valeur 3. Le modèle des tâches correspond au de vérification. quantitative aux caractéristiques défi- point de vue méthodologique sur l'ap- nies par l'utilisateur sous forme qualita- plication d'où l'on cherche à com- Projet 2- Formulation d'applications tive. Par exemple, il faut traduire la prendre comment est conçue l'appli- de traitement d'images caractéristique : Ç couleur= rouge È par cation. Il repose sur l'hypothèse L'étude porte sur la formulation com- Ç la teinte ❑∈ [0,PI/3] ∪ [3PI/2, 2PI]. Il B ULLETIN DE L’AFIA numéro 60 - juillet 2005 17 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

champ d'application de ces systèmes d'Ç Intelligence Artificielle È, commen- çons par identifier les différents besoins auxquels l'I.A. doit répondre dans un jeu. L'application principale de l'I.A. dans les jeux est souvent liée au déplacement des acteurs, que ce soit les ennemis, ou le personnage du joueur lui-même lorsque les déplacements se font par Ç point and click È. L'objectif est simple : trouver le chemin le plus effica- ce entre la position actuelle et le point d'arrivée. En général, on cherchera le trajet le plus court, sans traverser ni Figure 4 : Architecture globale du système de formulation d’applications de traite- murs ni autre acteur. Certains jeux ment d’images. posent plus de problèmes que d'autres, comme les jeux de stratégie, par implique aussi l'utilisateur pour la vali- exemple, qui doivent déplacer des dation des résultats conduisant si néces- groupes d'individus. La recherche de saire à une modification de la formula- chemin (path finding) est un point cri- tion. L’IA, on croit souvent en affronter, tique de jouabilité. En effet, un système tout le monde en parle beaucoup, et au de déplacement foireux mettra à terre Bibliographie final, les joueurs n'en savent pas grand- n'importe quel concept, si bien pensé chose. Pour avoir passé les 10 dernières soit-il. Un autre point critique dans les ¥ A. Renouf, R. Clouard, M. Revenu, "Un années de ma vie dans des équipes de jeux de stratégie réside souvent dans la modèle de formulation d'applications de trai- développement de jeu, à des postes gestion des ressources : sur quels cri- tement d'images", ORASIS'05, Fournols, mai allant de graphiste 3D à producteur exé- tères décider de l'objectif suivant 2005. cutif, j’ai eu l’occasion de découvrir un lorsque la source est épuisée ? Là aussi, ¥ A. Renouf, R. Clouard, M. Revenu, "Un un système mal pensé peut détruire la modèle de formulation d'applications de trai- peu mieux ce que cachait ce terme. En tement d'images", 16e journées franco- espérant que cette expérience vous per- jouabilité. Simuler la communication phones d’Ingénierie des Connaissances mettra de mieux comprendre l’envers du des acteurs d'un jeu entre eux ou avec le (IC), Nice, juin 2005. décor… et le comportement de vos joueur peut également se révéler cri- ¥ R. Clouard, "Une méthode de développe- adversaires. tique. Donner l'illusion de la personnali- ment d'applications de traitement d'images", Le problème de l'I.A. c'est qu'il y a té et de l'intelligence à un acteur (tac- Traitement du signal, Vol. 21, No. 4, p. 277- beaucoup à dire à son sujet. A commen- tiques, stratégies…) ou d'un 293, décembre 2004. ¥ R. Clouard, A. Elmoataz, M. Revenu, "Une cer d'abord par le fait que l'on qualifie comportement collectif à une troupe méthodologie de développement d'applica- de plus en plus d'I.A. des systèmes qui relève du domaine de l'I.A. Comme tions de traitement d'images", 13e Congrès ne le sont pas vraiment, intelligents. Le nous le verrons plus loin, plusieurs solu- Reconnaissance des Formes et Intelligence terme générique d'I.A. est bien pratique tions existent, possédant divers degrés Artificielle (RFIA), Vol. III, p. 1033-1042, pour englober à peu près tout ce qui va de complexité de mise en œuvre et de Angers, janvier 2002. devoir prendre une décision un peu plus résultat, et la frontière est étroite entre ¥ R. Clouard, A. Elmoataz, C. Porquet, M. compliquée que « Si le compteur de ce qui fonctionne et ce qui pousse l'ex- Revenu, "Borg: A knowledge-based system for automatic generation of image proces- points de vie du joueur passe sous zéro périence de jeu en avant. Cela dit, on sing programs", IEEE Trans. on Pattern alors Game Over È. Pour cerner le peut d’ores et déjà dégager deux Analysis and Machine Intelligence, Vol. 21, grandes tendances au sein des solutions No. 2, p. 128-144, février 1999. existantes : les solutions dites classiques et les solutions de type adaptatives.

Les solutions classiques : l’I.A. sym- bolique

L’I.A. dans les jeux Dans la famille des solutions clas- siques, nous avons les automates à état Publié dans Joystick n¡141 (novembre fini. On appelle ces systèmes automates 2002) Dossier Intelligence Artificielle ¨ Rockstar Studios - GTA3 n’utilise pas car ils n'ont aucune autonomie décision- partie 1 d’IA très avancée, mais donne une impres- nelle, ils ne font que suivre un chemin Par Fido sion crédible de vie urbaine. logique. Ce sont des listes d'états reliés B ULLETIN DE L’AFIA 18 numéro 60 - juillet 2005 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

davantage « curieux ») donnant accès à tique. En effet, face à des situations non des comportements moins tranchés et prévues ou ambiguës, le système peut donc plus naturels. La série des Sims, de être amené à prendre des décisions tota- Maxis, et celle des Petz, d’Ubi Soft lement inadaptées. Ici aussi, l'utilisation (simulateurs de cabots), utilisent ce type de la logique floue permet de prendre de solution. des décisions plus adaptées face à des situations imprévues et surtout d'avoir des comportements plus humains. Dans S.W.A.T., de Yosemite Software, un ter- roriste plutôt nerveux peut décider de ¨ Rockstar Studios - Voici un exemple de fuir ou d'attaquer. Dans Age of Empires, ce que peut donner un système de scripte un système expert définit les stratégies (assez rigide) bien utilisé. d'attaque et de défense des villes. par des transitions logiques. Par exemple, « être en train de courir » est un état, Ç marcher È en est un autre et Çralentir È est une transition entre les ¨ Ensemble Studios - La recherche de deux. Half-Life, de Valve Software, et chemin de Age Of Empires est gérée par un GTA3, de Rockstar Studios, utilisent algorithme de type A*. très bien ce système de prise de décision pour les ennemis… et les vielles dames. Les systèmes les plus utilisés dans la C'est une solution puissante, facile à gestion de déplacement utilisent un mettre en œuvre et à déboguer. Le seul algorithme de recherche du nom de A* problème, c’est qu’elle devient fasti- (prononcer a-étoile, ou a-star pour faire dieuse à produire si le système est com- genre) : l'espace est divisé sous la forme ¨Winward Studios - Dans Enemy plexe. Dans ce cas, il faut écrire tous les d'un graphe représentant les différents Nations, un système complexe de tableau vir- états, toutes les transitions et les relier chemins qu'il est possible d'emprunter, tuel partageant les besoins stratégiques per- logiquement. et l'algorithme permet de sélectionner le met de fragmenter les problèmes à de nom- chemin le plus court d'un point à un breux sous-programmes. autre du graphe. On retrouve ce système au cœur de la série Age of Empires, L'idée que plusieurs personnes tra- d’Ensemble Studios, ainsi que dans les vaillent mieux qu'une seule a donné jeux utilisant le même moteur comme naissance aux techniques multi agents. Star Wars - Galactic Battlegrounds de Un agent est un petit bout de program- Lucas Arts. me plus ou moins autonome. Il participe au fonctionnement du système ou bien gère un acteur simple. Parmi ces tech- niques, le système de tableau noir (blackboard) décrit un problème sur ¨Valve Software - Doté d’un système tableau virtuel et chaque agent en résout d’IA rudimentaire et rigide, Half Life a su une partie en posant sur le tableau une néanmoins tirer son épingle du jeu. solution ou un nouveau sous-problème. Peu utilisée car de conception très com- Pour le développeur, donc, dès que plexe, cette solution devait être au cœur les cas particuliers et les paramètres de Close Combat, d’Atomic Games. A deviennent nombreux, cette solution ¨ Ensemble Studios - Le Système expert ma connaissance seul Enemy Nation, de perd de son intérêt. Pour le joueur, l'in- de Age Of Empires définit les stratégies d’at- Winward Studios, a osé appliquer ce convénient de ce type de solution est sa taque et de défense des villes. type de système pour l'élaboration des prédictibilité. En effet, devant une situa- stratégies militaires. tion donnée, la décision du système est Pour répondre aux besoins de déci- toujours la même. L'utilisation de la sions stratégiques, on utilise générale- Les solutions adaptatives : l'I.A. logique floue (fuzzy logic) permet d'uti- ment des systèmes experts. Des règles Ç située » liser des opérations logiques sur des fixées par le programme permettent de valeurs imprécises (« assez loin », Ç plu- définir un ensemble de stratégies ser- Les solutions adaptatives sont com- tôt chaud ») permettant d'activer simul- vant de base à la prise de décision en plémentaires des solutions classiques, tanément plusieurs états, mais à des fonction des situations du jeu. La puisqu’elles tentent de remédier au pro- niveaux différents (« en colère » mais conception des règles est une étape cri- blème principal de ces dernières qui B ULLETIN DE L’AFIA numéro 60 - juillet 2005 19 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

n'utilisent que les solutions prévues par sivité…). Le système se « souvient » de des premiers jeux de stratégie temps réel leur programme. Ces agents sont la façon dont ses actions sont notées par à avoir poussé l'I.A. aussi loin. capables d'interroger leur environne- le joueur et essaye de reproduire ces ment. Ils savent se situer, car ils possè- solutions dans des cas similaires. Dans dent un « système perceptif », et ils peu- certains cas, le réseau de neurones peut vent prendre des décisions en fonction être utilisé pour régler la valeur d'un de la situation. Un système capable de paramètre en fonction d'un ensemble s'adapter à l'imprévu doit donc trouver d'autres paramètres, le réseau simule les ou inventer une solution Ç par lui- situations et choisit ou propose un cer- même È, que ce soit par « auto préap- tain nombre de choix intéressants. prentissage » ou par « pseudo déduc- tion ». Les techniques répondant à ce besoin, souvent inspirées de la biologie, sont gourmandes en puissance de calcul. © Bullfrog – Un système multi agents La montée en puissance des processeurs évolué permet le déplacement d'un grand de ces dernières années et le fait qu'ils nombre de créatures dans . n'aient plus à se soucier de l'affichage (en particulier la 3D), directement géré ©Creatures Lab - Les comportements des Les systèmes « multi agents situés » par les cartes vidéo, libère suffisamment Norms de Creatures sont simulés par de ont naturellement leur place dans le de temps de calcul pour que des solu- petits réseaux de neurones travaillant chacun domaine du jeu puisqu'il s'agit de simu- tions complexes puissent être utilisées. dans une spécialité. ler des populations d'individus. Pour obtenir un système assez simple à Dans Creatures, de Creatures Labs, mettre en Ïuvre et suffisamment puis- les créatures (Norns) utilisent plusieurs sant pour simuler de façon crédible les petits réseaux de neurones dédiés à des déplacement de troupes, on programme taches précises (perception, actions, de simples individus ne connaissant que concentration de l'attention…). Les leur points d'arrivée et ne communi- Norns apprennent pendant le temps de quant que leur position et les points jeu, ce qui est assez coûteux en temps de d'ancrage pour leurs voisins. Les forma- calcul mais efficace pour ce type de tions de vaisseaux de Homeworld, de gameplay. En associant un système d'al- Relic, en sont un bon exemple. Une gorithmes génétiques, le jeu peut faire solution similaire permet de gérer les © Ð Dans Black and évoluer les générations de Norns en déplacements de façon naturelle dans White, la créature apprend à évaluer ses sélectionnant les individus susceptibles , de Bullfrog, à l'aide motivations grâce à un réseau de neurones. d'avoir des réponses plus adaptées à leur de règles simples pour les déplace- milieu lors de croisements ou ments : Alignement, Cohésion et Parmi celles-ci, les réseaux de neu- d'échanges de gènes. Séparation. rones tiennent une place importante dans les jeux de stratégies car ils per- mettent de prendre des décisions en tenant compte d'un grand nombre d'in- formations et de situations différentes. Les réseaux de neurones peuvent être entraînés en dehors du temps de jeu pour apprendre les stratégies convenant au jeu (déplacements, attaques, recon- naissance de forme…) le moteur simu- lera des parties « contre lui-même » de façon à apprendre un maximum de © Masa - Dans conflict zones, l'I.A. très © Relic – Le déplacement des vaisseaux situations et savoir y répondre efficace- évoluée permet l'émergence de comporte- de HomeWorld est un bon exemple de systè- ment. L'exemple le plus parlant d'utili- ments crédible au sein des troupes. me multi agents. sation de réseau de neurones est Black and White, de Lionhead Studios, où la Conflict Zone, de Masa, utilise à prio- L'inconvénient des systèmes adapta- créature apprend à évaluer ses motiva- ri une I.A. assez complexe à base de tifs et d'apprentissage est de savoir défi- tions en fonction des actes du joueur graphes de comportements évolutifs. En nir l'espace d'apprentissage et ses (récompense/punition…), de son état effet, les différents acteurs du jeu limites d'une part et l'incertitude du (fatigue, faim…) et de certains modifi- Çapprennent » réellement les actions du résultat des solutions qui se basent sur cateurs (collier d'apprentissage, d'agres- joueur sinon leurs tactiques. C'est l'un l'apprentissage. En effet, l'émergence de B ULLETIN DE L’AFIA 20 numéro 60 - juillet 2005 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

comportements est par définition peu fabriquaient des robots et les confron- PS2 et Dreamcast. Direct I.A. arrive prédictible, c'est ce qui en fait la puis- taient à des formes plus ou moins géo- bientôt en version commerciale. sance et l'intérêt. métriques. L'arrivée de mondes massi- Gageons que les autres développeurs vement multijoueurs met à leur portée sauront quoi faire d'un tel moteur. Le Futur de l'I.A. un terrain d'expérimentation parfait. (Merci à Stéphane Maruejouls – Gabriel Robert écrit actuellement une Programmeur principal de Conflict Tout ça c'est très bien, « mais où est thèse au sein du le Laboratoire Zone) HAL ? È, demandait Marvin Minsky, du d'Informatique de Paris 6 (www.lip6.fr), M.I.T., à la dernière GDC (Game dont le sujet est Ç Contribution des Ray Kurzweil : étonnant visionnaire Developers Conference). Quoi ? Toi le méthodologies animat et multi agents à Ray Kurzweil a monté et vendu de Jeune Du Fond, tu ne connais pas HAL, l'élaboration des jeux en ligne, persis- nombreuses sociétés basées sur l'utilisa- l'ordinateur psychopathe de 2001 tants et massivement multi utilisa- tion de l'I.A. depuis 1964, prophétise l'Odyssée de L'espace filmé par Kubrick teurs È. L'objet des travaux (à Nevrax) dans un de ses livres l'avènement de la en 1968 ? Ni Minsky ? Peut-être accompagnant cette thèse est de créer machine plus intelligente que l'homme Kubrick alors ? Bon, tant pis. Quoi qu’il des PNJ (Personnages Non Joueurs) de d'ici à quelques décennies à peine (The en soit, dès le début de l'informatique, type adaptatifs –appelés animats- les Age of Spiritual Machines, When on a imaginé que les ordinateurs pense- méthodologies associées à ce domaine Computers Exceed Human Intelligence raient un jour. Et de fait, on n'en est pas sont inspirées de la biologie et peuvent - 1999). Je recommande chaudement la si loin. Ce que l'on vise aujourd'hui ce être appliquées à des animats indivi- lecture de ce livre à condition de possé- sont plutôt des systèmes capables de se duels ou à des systèmes multi agents. En der une solide maîtrise de l'anglais. déplacer et de réagir à des situations gros faire des bots pas cons (adaptatifs), plus ou moins prévues, cela dans le qui apprennent (comportements émer- Jean-Michel Truong : inclassable domaine du jeu ou de la robotique. gents), et qui sachet se comporter de Non content d'avoir un cursus impres- L'objectif de demain est un peu plus façon naturelle (profil psychologique). sionnant : psychologue et philosophe de complexe. Avant de simuler un vrai cer- Objectif louable s'il en est. formation, enseignant et chercheur uni- veau (même de poule), il faudrait savoir Je tiens à remercier tout particulière- versitaire, expert en I.A., fondateur de la comment tout ça fonctionne vraiment. ment Gabriel pour la clarté de ses tra- première société européenne spécialisée Aujourd'hui, on sait grosso modo de vaux et sa bonne humeur permanente en I.A., consultant en transfert de tech- quoi les différentes zones sont respon- ainsi que son tuteur Sameh Chafick nologies avancées, Jean-Michel Truong sables, mais il manque encore un peu le (Lead programmeur I.A. à Nevrax) pour est un romancier visionnaire de talent. A plan du machin. Des chercheurs y tra- sa période de promo sur les questions à lire absolument : Reproduction Interdite vaillent : décodage de l'ADN, nanotech- 2 francs. (1989), Le successeur de pierre (1999) nologies exploratoires… Mais c'est et Totalement inhumaine (2001). Ses encore une autre histoire. Pour l'instant, Conflict Zone : Direct I.A. autres livres sont de ouvrages tech- le futur proche du jeu serait plutôt à la Conflict Zone (Masa) a été développé niques, à découvrir sur son site : gestion de scénarios dynamiques et évo- autour du moteur d'I.A. comportemental www.jean-michel-truong.net. Entre lutifs, aux didacticiels qui s'adaptent au générique « Direct I.A. ». Basé sur une science fiction et philosophie, on retrou- niveau du joueur, aux jeux perpétuels gestion de graphe décisionnel à plu- ve le thème de l'I.A. dans tous ses dont les acteurs sont capables d'évoluer sieurs entrées, ce système permet romans, traité de façon crédible et avec avec l'apprentissage et la reproduction l'émergence de comportements non style. Je vous recommande là encore de comportements. Aujourd'hui, une explicitement programmés. L'utilisation une visite sur son site et la lecture de ses bonne I.A. ne se mesure pas à son degré d'un graphe par rapport à un arbre per- romans. de réalisme : elle doit avant tout être cré- met une grande souplesse dans le par- dible et surtout elle doit amener du plai- cours décisionnel. En effet, l'utilisation Marvin Minsky : pionnier de l'I.A. sir au joueur. d'un arbre implique de suivre la Marvin Minsky a beaucoup contribué Çbranche È sur laquelle on se trouve, à la communauté des chercheurs en Le monde de la recherche pas un graphe. A partir de concepts intelligence artificielle, à la robotique, simples comme se protéger, se soigner, aux mathématiques, à la linguistique, Aujourd'hui le monde de la recherche attaquer, se faire blesser, un soldat aux systèmes optiques et à la psycholo- se tourne de plus en plus sérieusement accompagné d'un médecin continuera à gie cognitive (rien que ça). En 1951, il a vers l'industrie du jeu vidéo. En effet, attaquer là où un soldat seul fuira construit le premier simulateur de pouvoir développer des solutions d'I.A. sachant qu'il ne pourra survivre. Dans ce réseau de neurones : le SNARC. Ces et les tester sur des milliers de joueurs jeu, les commandants utilisent en plus dernières années, il a surtout travaillé à dans des environnements riches et de ce type de comportement un système essayer de donner aux systèmes une proches de la réalité est pour eux une d'apprentissage tactique. Les résultats sorte de raisonnement avec des mor- aubaine. Jusqu'à présent, pour mener à survivent d'une partie à l'autre sous ceaux de bon sens dedans. Il expose ses bien les expériences de perception, réac- forme de paramètres codés dans un théories sur la structure et les fonction tion et déplacement, les chercheurs fichier. A noter que ce jeu tourne sur PC, de l'intellect humain dans Ç The Society B ULLETIN DE L’AFIA numéro 60 - juillet 2005 21 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

of Mind È qui est aussi le nom de son de l’action Motivationnelle et pond à une motivation (Toates and cours au MIT (Massachussets Institute Hiérarchique à Systèmes de Classeurs Jensen 1991). Le niveau d’une motiva- of Technology). Minsky explique entre pour personnages non joueurs adaptatifs tion fluctue en fonction des actions autre la difficulté d'interprétation de la Les jeux vidéo évoluant vers des uni- accomplies, un niveau bas signifiant la phrase : Ç je te dis un mensonge È par un vers toujours plus réalistes, leur peuple- satisfaction du besoin correspondant. système informatique. Il fait appel aux ment par des personnages non joueurs Plusieurs motivations peuvent être défi- travaux de Freud sur l'interprétation de (PNJ) aux comportements crédibles nies, certaines étant compatibles et l'humour. Je vous conseille vivement devient une problématique importante. d’autres conflictuelles. Cette distinction une visite sur son site. La thèse de Gabriel Robert décrit correspond au fait que les actions cor- MHiCS (Motivational - Hierarchical - respondantes peuvent se réaliser soit Quelques liens pour aller plus loin : Classifier Systems), une architecture de parallèlement soit séquentiellement, L’incontournable Gamasutra : sélection de l’action équipant ces per- selon qu’elles recrutent ou non les www.gamasutra.com sonnages en implémentant des méca- mêmes effecteurs. Communautés de développeurs spéciali- nismes issus de l’approche animat, qui Le processus décisionnel indiquant sés en I.A. : vise à la conception d’entités autonomes quelle action effectuer se situe au der- http://www.gameai.com/ai.html et adaptatives capables de survivre dans nier niveau de l’architecture. Il fait suite Idem : http://ai-depot.com/GameAI/ des environnements imprévisibles. Son à une diffusion hiérarchique de valeurs Et encore : originalité réside dans le fait qu’elle de motivations – situés dans un premier http://ai.eecs.umich.edu/people/laird/G possède à la fois des règles comporte- niveau Ð vers différents systèmes de ame-AI-Resources.htm mentales transparentes (systèmes de règles « condition-action » – situés dans En France : http://animatlab.lip6.fr classeurs), plusieurs motivations fluc- un deuxième niveau. Ils vont rendre Ray Kurzweil : tuant en continu et des capacités d’adap- activables des actions – situées dans un http://www.kurzweiltech.com/ray.htm tation en ligne. Elle a été testée avec troisième niveau – qui pourront s’ac- Marvin Minsky : succès dans une version du jeu Half- complir en fonction des ressources dis- http://web.media.mit.edu/~minsky/ Life face à des PNJ confirmés. Ce tra- ponibles – situées dans un quatrième Pour les anglophobes : vail contribue, d’une part, à une avancée niveau. www.jean-michel-truong.net dans la conception de systèmes de clas- Nous avons adoptée une diffusion seurs fonctionnant dans des environne- hiérarchique dite à libres flux (Free- Laurent Fischer (Octobre 2002) ments complexes et il participe, d’autre Flow Hierarchy : FFH) définie par [email protected] part, à une avancée dans la conception (Rosenblatt and Payton 1989), car elle de PNJ dont l’autonomie décisionnelle semble se révéler la plus efficace est augmentée. (Tyrrell 1993). Dans ce type d’architec- ture, plusieurs éléments d’un niveau AnimatLab supérieur peuvent envoyer leurs activa- Laboratoire d'Informatique tions à tous les éléments des niveaux de Paris 6 (LIP6) inférieurs – et non à un seul, comme dans un Ç winner-takes-all È (Tinbergen Adresse : 8 rue du Capitaine Scott 1951). Au dernier niveau, les actions les 75015 Paris plus activées peuvent donc être choisies http://animatlab.lip6.fr/ en parallèle, ce qui permet d’effectuer des actions compatibles entre elles (e.g., Contact (pour ce projet) : marcher et tenir un drapeau), ou un [email protected] compromis d’actions (e.g., se diriger vers une destination tout en évitant des Membres de l'équipe concernés par le obstacles) en fonction des ressources sujet : d’action recrutées. Bien entendu, une Gabriel Robert et Agnès Guillot seule action peut être choisie s’il y a incompatibilité totale entre ses res- Thème général de l'équipe : sources et celles d’autres actions secon- daires. Les thèmes de recherche de l'AnimatLab sont axés sur les trois prin- Une architecture motivationnelle Références : cipaux processus adaptatifs que la natu- signifie que toute action effectuée par un re a inventés pour assurer la survie des animat dépend d’un « besoin » (e.g., la 1. Rosenblatt K. and D. Payton. 1989. "A fine-grained alternative to the subsumption êtres vivants : l'apprentissage, le déve- faim) dont l’urgence est liée à la fois à architecture for mobile robot control". In loppement et l'évolution. des facteurs sensoriels internes (déplé- Proceedings of the IEEE/INNS International tion énergétique) et/ou externes (vue de Joint Conference on Neural Network.IEEE MHiCS, une architecture de sélection nourriture appétissante), et qui corres- Press, 317-324. B ULLETIN DE L’AFIA 22 numéro 60 - juillet 2005 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

2. Tinbergen, N. 1951. L'étude de l'instinct. ¥ Une vingtaine de Professeurs à l’appariement pour inférer une solu- 3. Toates F. and P. Jensen. 1991. "Ethological Chercheurs externes à la Faculté des tion globale optimale. Par exemple, and Psychological Models of Motivation - Towards a Synthesis". In From animals to Sciences, intervenants dans les pour l’algorithme de programmation animats.MIT Press, 194-205. Projets de Recherche, les encadre- dynamique, on cherche à modéliser le 4. Tyrrell, Toby. 1993. "Computational ments et les co-encadrements de doc- comportement du seuil de corrélation Mechanisms for Action Selection". PhD torants dans le cadre de l'UFR ainsi que l’introduction de fonctions Thesis. University of Edinburgh 5. Robert, G. and Guillot, A. (2003). MHiCS, ACSYS dirigée par le groupe coût pertinentes supplémentaires pour a modular and hierarchical classifier systems GRIIARF; fiabiliser le processus. Nous suggérons architecture for bots. In Mehdi, Q., Gough, ¥ 3 doctorants en thèse d'état. aussi de revisiter l’algorithme en intro- N., and Natkin, S., editors, Game-on, pages ¥ 20 doctorants au sein du GRIIARF duisant un mécanisme de remise en 140-144. 6. Robert G. Thèse LIP6/AnimatLab, ¥ 21 doctorants préparant la thèse natio- cause (backtracking) des solutions Université Pierre et Marie Curie, Paris, sou- nale encadrés par les partenaires dans locales pour prévenir les problèmes tenue le 11 mai 2005, http://animatlab. le cadre de l’UFR ACSYS d’initialisation et autoriser plus de flexi- lip6.fr/papers/these_gabriel_robert.pdf bilité pour le choix du seuil de corréla- Thème général de l’équipe : tion. Parallèlement, on pense reconsidé- rer le problème d’optimisation et GRIIARF : Les principaux axes de recherches l’exprimer dans le formalisme de la Groupe de Recherche développés au sein du laboratoire sont : ÇProgrammation Logique avec en Informatique Intelligence ¥ Intelligence artificielle : Contraintes È avec une « Modélisation Artificielle et Reconnaissance Algorithmique (Complexité, Distribuée ». Les points à apparier de de Formes Contraintes, programmation par l’image esclave (variables) entreront en contraintes, CSP distribués et valués), réaction pour se mettre en relation avec Laboratoire appartenant à l’UFR Raisonnement (Aide à la décision, les points candidats de l’image homo- ACSYS : Architecture et Conception de Diagnostic, Planification, ordonnan- logue (ensemble restreint de points Systèmes Informatiques. cement, Raisonnement temporel), appelés domaine des variables). Le but Systèmes multi-agents et systèmes étant de converger vers une solution Adresse : GRIIARF, Faculté des distribués optimale globale avec remise en cause Sciences, 4 Avenue Ibn Battouta B.P. ¥ Traitement d'image et du signal, des solutions élémentaires. On définira 1014, Agdal, Rabat. Traitement du langage naturel, autant de coûts qu’il en faudra : score de Site Web : Traitement de l'information et cryp- corrélation, ordre, gradient de disparité, http://www.fsr.ac.ma/GRIIARF/ tographie continuité figurale, etc. • Réseaux et Télécommunications. Contact : [email protected] ¥ Traitement des images biomédicales : Description des travaux ou projets Détection automatique des lésions du Responsables : El Houssine Bouyakhf / en liaison avec le thème du dossier sein par analyse de texture appliquée Fakhita Regragui aux images mammographiques : Tél : + (212) 37 77 18 34 / Les travaux en liaison avec le thème Le but de ce projet de recherche + (212) 37 77 89 73 de ce dossier développés au sein du est la mise au point d’un système d’aide Fax : + (212) 37 77 89 73 laboratoire le sont dans le cadre de au diagnostic sur des images mammo- GSM : + (212) 61 22 56 28 sujets de thèses et/ou de projets de graphiques pour permettre le traitement Email : [email protected] recherche : automatique des images afin de guider [email protected] le spécialiste dans sa décision. L’outil [email protected] ¥ Mise en correspondance d’images capable de différencier un tissu sain stéréoscopiques : Application aux d’un tissu pathologique se base sur une Membres de l’équipe concernés par le images de télédétection : analyse de texture. Etant donné que les thème : Outre les techniques de bas niveau, lésions recherchées ont des textures nous examinons plusieurs pistes issues variées, l’approche multi résolution Le laboratoire est constitué de de philosophies différentes. En effet, s’avère la mieux adaptée pour aborder membres permanents, internes à la dans un niveau d’abstraction plus élevé, ce problème. La texture est définie Faculté des Sciences de Rabat, et de la mise en correspondance peut être vue comme la répétition spatiale du même membres externes. Il est composé de: comme un problème d’optimisation glo- motif dans différentes directions de l’es- ¥ 11 enseignants chercheurs de la bale. Elle met en jeu des contraintes de pace. L’analyse par ondelettes appliquée Faculté des Sciences de Rabat; cohésion plus fortes entre les candidats à l’image permet de décomposer celle-ci B ULLETIN DE L’AFIA numéro 60 - juillet 2005 23 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

en une image faible résolution qui est hiver . Ce comptage pourrait se baser de méthode automatique ou semi- une approximation de l’image originale sur le découpage de l’image en zones automatique faisant appel aux tech- et 3 images de détails selon la verticale, affectées chacune à un agent. Il sera le niques de l’IA (basées sur des l’horizontale et la diagonale. Ces résultat d’un consensus entre les diffé- approches heuristiques). Et de monter images de détails sont de haute résolu- rents agents ; ce qui garantirait une cer- un système coopératif (SMA) affec- tion et contiennent l’information sur la taine fiabilité. tant un algorithme de compression texture. La caractérisation de la texture Le développement des otolithe se fait par zone d’intérêt et veillant sur l’op- se basera sur la détermination des pro- normalement en formant : des zones timisation du taux de compression priétés statistiques du 1er ordre et 2nd opaques (croissance rapide) qui apparaît globale. ordre à l’aide du calcul des paramètres sombre ; des zones hyalines (croissance - étendre cette approche aux images (énergie des images de détails, entropie, lente) qui apparaît claire. Donc une animées. statistiques des textures…). Ces para- alternance de larges zones opaques avec mètres permettent de générer les vec- des zones hyalines, et un cycle annuel ¥ Indexation d’objets 3D teurs d’attributs de l’image qui seront est formé par une zone opaque et une Ce travail s’inscrit dans le cadre utilisés par les algorithmes de décision zone hyaline. d’une thèse, en collaboration avec afin de déceler les régions suspectes l’équipe Robotique et Intelligence dans une mammographie. ¥ Compression adaptative d’image fixe Artificielle du LAAS du CNRS. Il porte et dynamique : sur l’indexation d’Objets 3D en exploi- ¥ Etude des méthodes de détection de Notre but est de trouver une méthode tant simultanément des indices géomé- contour et comptage des anneaux sai- qui permet de compresser une image triques sur la forme de l’objet et des sonniers des otolithes du peuplement avec des techniques différentes selon indices photométriques couleur. Le sardinier des cotes marocaines en uti- l’importance de l’information transmi- modèle de l’objet sera appris automati- lisant les techniques d’analyse se, de telle sorte à ne pas dégrader quement à partir des méthodes déjà dis- d’images : l’image dans certaines zones qualifiées ponibles. Le contexte est la reconnais- La sardine représente l’une des d’intérêt, et de dégrader de façon accep- sance et la localisation d’objets en vue espèces les plus abondantes au large des table les autres zones qualifiées de de les saisir par un robot assistant de cotes marocaines. Cinq pêcheries se contexte. l’homme, équipé de vision stéréosco- sont développées du Nord au Sud : la Nous nous intéressons ici à l’élabora- pique et d’un bras manipulateur, et pêcherie méditerranéenne, la pêcherie tion d’une méthode de compression contrôlé à distance via Internet. Nord, la pêcherie traditionnelle de la adaptative. Cette méthode consiste région Safi_Agadir (zone A), la pêcherie aujourd’hui à extraire manuellement les ¥ Traitement d’image appliqué à l’or- Cap Noun_cap Boujdour (zone B), et la zones qualifiées d’intérêt, appliquer une thodontie pêcherie Sud de Cap Boujdour au Cap technique irréversible telle que les En médecine dentaire, l'orthodontie Blanc (zone C). Actuellement, la ges- Ondelettes à celle-ci, tout en conservant est utilisée pour réhabiliter une bonne tion de ces pêcheries se base sur l’hypo- une qualité visuelle élevée. Le contexte occlusion des dents et rétablir la fonc- thèse de stocks. Le peuplement peut être compressé par une méthode tion du système stomatognatique. Le Sardinier des cotes marocaines, se sub- classique telle que JPEG. Nous avons diagnostic des disharmonies dento- divise en quatre unités de stock : un appliqué cette méthode aux images car- maxillaire nécessite le calcul de l'en- stock méditerranéen, et trois stock atlan- tographiques et biomédicales et nous combrement et une détermination pré- tiques (stock nord, stock central, stock avons obtenu des résultats encoura- cise de l'arcade dentaire inférieure. sud, subdivisé en stock de zones geants. D'autre part, plusieurs moulages sont A,B,C). L’objectif premier de ce projet Dans la suite de notre travail, nous utilisés pour chaque patient durant la est donc d’identifier les caractéristiques envisageons : période de traitement; leur stockage du contour des différents types d’oto- - de tester cette approche adaptative à pose un sérieux problème. Dans ce pro- lithes après détermination de l’approche l’aide d’autres techniques de com- jet, nous nous proposons de : de segmentation et d’extraction de pression sur plusieurs types d’images - faire la modélisation mathématique contours adaptée . Le deuxième objectif portant une ou plusieurs zones d’inté- de la forme d'arcade idéale à partir de de ce projet est basé sur le comptage rêt. Nous testerons les performances mesures faites sur l'image du moulage des anneaux saisonniers existants entre de ces techniques en termes du taux en forme occlusale. Cette modélisa- le nucleus et le bord de l’otolithe afin de de compression et de la qualité visuel- tion sera basée sur l’optimisation déterminer l’age de la sardine car la le surtout au niveau des zones d’inté- d’une fonction coût. Elle sera suivie croissance de ce dernier se fait selon les rêt compressées. par une étude de classification par saisons : rapide au printemps, tardive en - d’extraire des zones d’intérêt à l’aide diverses approches (classiques, B ULLETIN DE L’AFIA 24 numéro 60 - juillet 2005 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

réseaux de neurones, floues) pour Membres de l’équipe concernés par le 3. Théorie des jeux dégager le nombre de classes et le thème : Pascal Gribomont, François François Van Lishout débute actuelle- type de formes d’arcades caractéri- Van Lishout ment des recherches en théorie des jeux sant la population marocaine ; à connaissance imparfaite. Pour rappel, - faire la reconstruction 3D du moulage Thème général de l’équipe : il s’agit de jeux où les différents joueurs à partir d'images 2D prises sous diffé- n’ont pas une connaissance totale de rents angles. Nos sujets de recherche ont tous l’état du jeu (exemple : au poker on ne comme tronc commun la logique et se connaît pas les cartes des adversaires). Il Bibliographie divisent en plusieurs catégories : s’intéresse principalement à la détection (voir aussi : de stratégie d’adversaire. http://www.fsr.ac.ma/GRIIARF/) 1. Vérification des systèmes parallèles Les domaines d’applications de ces - M. BENABDELLAH, M. GHARBI, F. De nos jours, l’essentiel des pro- techniques dépassent de loin les simples REGRAGUI, E.H. BOUYAKHF, grammes parallèles développés par le jeux classiques mais peuvent s’étendre à Adaptative compression based on the wave- monde industriel sont vérifiés à l’aide tout ce qui peut se modéliser comme un let of the cartografic images, International Computer Systems and Information de scénarios typiques de fonctionne- jeu entre plusieurs joueurs. Les sites de Technology Conference ICSIT’05, Alger ment du programme. Ce genre de test ventes aux enchères d’articles en ligne july 19-21, 2005. manuel n’est malheureusement que par exemple peuvent être considérés - A. MGHARI, F. REGRAGUI, E. H. rarement exhaustif et laisse donc la comme une aire de jeu où des ache- BOUYAKHF. Artificial Neural Network for Discrimination of Visual Evoked Potentials. porte ouverte à des comportements teurs/vendeurs essaient de maximiser AMSE Journal of Advances in modeling, imprévus. La vérification des systèmes leurs profits en spéculant sur la valeur signal processing and pattern recognition, parallèles a pour vocation d’automatiser des biens. Dans ce contexte particulier, Volume 46 N¡ 4, 2003 pp. 41-57 le processus de test. Pour ce faire, de il est intéressant de se demander s’il est - M. BELAÏSSAOUI, E.H. BOUYAKHF, L’algorithme « Optimal Distributed nombreuses approches existent. Nous possible de détecter la stratégie d’achat Intelligent BackTracking È, Revue Sciences nous intéressons à la vérification par des autres utilisateurs et déterminer et Technologies de l’Information, hors série invariant. Une propriété d’invariance ainsi la manière optimale de mener ses / JFPLC 2003 pp. 303-310 - A.IDRISSI, D. BENSLIMANE, E.H. est une propriété du système vraie tout enchères. BOUYAKHF, Modeling and Solving Air au long de son exécution. Le genre de Toutefois, avant de pouvoir répondre Traffic Control Problem with Distributed propriété qui nous intéresse est l’absen- à ce genre de question dans des Constraints IJCAI 01 International Joint ce d’interblocage, d’exclusion mutuelle domaines étendus, il faut d’abord y arri- Conference on Artifical Intelligence, August 4-10th 2001, Seattle, USA entre les processus, … Ces propriétés ver pour de vrais jeux. Il s’agit d’une - M. BENKHALIFA, A. MOURADI, E.H. peuvent s’exprimer en logique de part de trouver la manière statistique BOUYAKHF, Integrating WordNet Hoare. optimale de jouer (et ce sur base de Knowledge to Supplement Training Data in Semi-Supervised Agglomerative Hierar- L’utilisation des méthodes de vérifi- l’équilibre de Nash) mais ensuite chical Clustering for Text Categorization. cation par invariant nécessite toujours d’adapter cette stratégie à des adver- International Journal of Intelligent Systems, une bonne connaissance de cette logique saires particuliers sur base des parties volume 16, N¡ 8, August 2001 pp. 929-948 de la part de l’utilisateur, ainsi que des déjà jouées contre ceux-ci. La logique techniques de programmation assez spé- modale convient parfaitement pour cifiques, rendant ainsi une utilisation modéliser des jeux à connaissance Equipe Ç Logique pratique peu conviviale. Le futur du imparfaite et c’est cette approche que et Intelligence Artificielle È domaine consiste donc selon nous à nous nous proposons actuellement d’ap- pousser plus loin l'automatisation de profondir. Institut Montefiore (Département manière à rendre ces techniques plus d’Electricité, Electronique et accessibles. Informatique), Université de Liège Description des travaux en lien avec le 2. Programmation fonctionnelle et pro- thème du dossier : Contact : François Van Lishout grammation logique Tél : +32 43662619 Dans le cadre des cours que nous Dans le cadre de nos charges d’ensei- Email : enseignons, nous avons choisi le gnement, il nous a semblé intéressant de [email protected] SCHEME pour l’apprentissage de la fournir des applications graphiques se Web : http://www.montefiore.ulg.ac.be programmation fonctionnelle et le basant sur les langages de programma- /~vanlishout PROLOG pour les applications IA. tion enseignés. Pour ce faire, nous avons Adresse : Grande Traverse 10, Campus Nous utilisons régulièrement ces lan- réalisé deux projets : du Sart-Tilman, B-4000 Liège gages dans nos applications. B ULLETIN DE L’AFIA numéro 60 - juillet 2005 25 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

1. Utilisation de la programmation trer la faisabilité de ce procédé, nous P. Gribomont. Eléments de programmation fonctionnelle pour la création avons réalisé un programme graphique en Scheme. Dunod, Paris, 2000. P. Gochet et P. Gribomont. Logique. Hermès, d’images jouant à un bon niveau au jeu de puis- Paris. Le logiciel de traitement d'image the sance 4. Le détail de chacune des phases - Tome 1 : Méthodes pour l’information fon- GIMP est un logiciel très convivial à de développement ainsi que les codes damentale (1991, 2e éd. 1998) utiliser pour modifier des images et obtenus sont fournis sur le site web - Tome 2 : Méthodes pour l’étude des pro- grammes (1994) créer des animations. Il offre une série donné en référence. Ici, nous parlerons - Tome 3, avec A. Thayse : Méthodes pour d'outils très pratiques pour développer brièvement de la communication entre l’intelligence artificielle (2000) toutes sortes de montages. Toutefois, les deux codes et de la création de l’exé- L. Moreau, D. Ribbens, P. Gribomont. cutable. Advanced Programming Techniques Using pour obtenir des effets particuliers non Scheme. Journée Francophones des triviaux, les outils de base de GIMP sont Le swi-prolog possède une interface Langages Applicatifs (Como, Italie). parfois insuffisants et dans ce cas il faut puissante pour interagir avec le C stan- Collection didactique de l’INRIA, vol. 1998, recourir à la programmation. Le langage dard de Kernighan & Ritchie. Celle-ci pp. 69-90. P. Gribomont. Simplification of boolean veri- permet soit la communication bidirec- utilisé par GIMP pour ajouter de nou- fication conditions. Theoretical Computer velles fonctionnalités est le SCHEME. tionnelle entre un code C et un code pro- Science, vol. 239, pp. 165-185, 2000. Ajouter une fonctionnalité qui écrit log (et ce sans limite d'emboîtement du un nom à plus de 100 endroits différents C appelant du prolog, appelant lui- sur une image, en respectant des critères même du C, appelant du prolog, ...), soit de symétrie précis, ne semble pas facile d'écrire la fonction principale du pro- Laboratoire de méthodes à réaliser à la main. En effet, avec les gramme en C et d'utiliser le prolog architecturales outils de base de GIMP, il faudrait utili- comme une machine logique enfouie Université de Liège ser l'application d'écriture pour ajouter dans le programme. C'est cette deuxiè- le nom une première fois, puis répéter me approche que nous avons utilisée, Le laboratoire de méthodes architec- l'opération autant de fois que désiré aux mais les concepts fondamentaux restent turales de l'ULG (Université de Liège) a les mêmes dans les deux cas. endroits présélectionnés. En utilisant crée un groupe de travail ayant pour but En résumé, une série de fonctions C SCHEME ce sera beaucoup plus la mise en oeuvre d'une interface gra- prédéfinies est fournie avec le swi-pro- simple. Il suffit en effet d'écrire un petit phique réactive, capable de capturer et log et il suffit d’utiliser ces fonctions programme de 15 lignes qui va systéma- d'interpréter, en temps réel, les tracés pour appeler les prédicats prolog. Pour tiquement écrire le nom à intervalles dessinés à main levée. Il s'agit du Lucid être un peu plus précis, on peut recenser réguliers. De plus, si le programme est Group. Le groupe existe maintenant trois types principaux de fonctions : bien écrit, de simples paramètres per- depuis trois ans et les progrès réalisés celles permettant au code C d’instancier mettront d’obtenir des variantes du pro- sont impressionnants : leur programme les arguments des prédicats prolog blème (augmenter le nombre d’occur- EsQUIsE SMA est aujourd'hui capable qu’on veut appeler, celles permettant de rence du nom, changer la taille de de comprendre les croquis créatifs réali- réaliser l’appel proprement dit et finale- l’écriture, superposer plusieurs écritures sés par l'architecte et ce bien qu'ils ment celles permettant au code C d’ob- de différentes tailles,…). soient totalement originaux et donc tenir les valeurs renvoyées suite à l’ap- On trouvera une série d’exemples inconnus du système auparavant. pel. d’images et d’animations en SCHEME Pour ce faire le programme se base Il existe différentes méthodes pour sur le site donné en référence ci-des- notamment sur le modèle SMA (systè- lier les fichiers C et prolog entre eux. sous. me multiagent) qui consiste à program- Une des plus simple consiste à utiliser la mer des agents ayant chacun une res- fonction plld (également fournie avec le 2. Création d’interfaces graphiques en ponsabilité particulière (la recon- swi-prolog) qui permet à partir des dif- C pour programmes PROLOG naissance de texte, de ligne pointillée, la férents fichiers de créer un seul exécu- Le PROLOG convient bien pour consulation d'un dictionnaire architectu- table. Toutefois, celui-ci aura une taille développer la partie intelligente des ral, l'effacement des ratures,...) et qui non négligeable étant donné qu'il doit applications de type IA, mais est plus communiquent entre-eux afin de déter- contenir un noyau pour exécuter le pro- difficile à manipuler lors de la phase miner ce que l'utilisateur avait vraiment log. graphique. Nous proposons donc de voulu représenter. La quasi totalité de contourner ce problème en réalisant leur système repose sur du COMMON- l’interface graphique en C (à l’aide de la Références : LISP et voici donc encore un très beau plate-forme GTK) et la partie IA en http://www.montefiore.ulg.ac.be/~va cas d'application de la programmation SWI-PROLOG, puis en Ç fusionnant È nlishout/ fonctionnelle dans un domaine autre que finalement les deux codes. Pour démon- l'informatique. B ULLETIN DE L’AFIA 26 numéro 60 - juillet 2005 DOSSIER : INTELLIGENCE ARTIFICIELLE ET IMAGE

Quelques informations en plus Réalité Virtuelle de PIXEL (n¡ 58 de D'abord, la réalité virtuelle doit être Surveillance de l'Environnement mai-juin 2001) immersive et entourer le spectateur soit CEA Direction des Applications http://www.pixelmag.com/: directement (avec écrans ou lunettes par Militaires exemple), soit indirectement (le specta- http://www-dase.cea.fr « Certains mélangent maintenant les teur est représenté par un avatar à l'in- termes "images de synthèse » et « réali- térieur du monde virtuel). Et puis, ce Une revue té virtuelle ». Le mois dernier encore, spectateur (ou son avatar) doivent pou- http://www.pixelcreation.fr une revue se disant spécialisée en info- voir se déplacer dans cet environnement graphie (mais il est vrai plutôt tournée virtuel, voire même interagir avec lui ou Laval-virtual vers le grand public) citait Jar Jar Binks avec les autres participants. Cela va http://www.laval-virtual.org/ (l'extraterrestre en 3D héros du dernier donc plus loin qu'un simple film, et les Notes par Jean-Paul Baquiast et film Star Wars I) Ç comme exemple du applications potentielles sont très Christophe Jacquemin sur devenir des avatars È. Ce qui voudrait variées ». http://www.admiroutes.asso.fr/lare- donc dire que tout personnage 3D est un vue/2001/13/index.htm avatar, et tout film avec des effets numé- riques une réalité virtuelle... Une définition de la réalité virtuelle Evidemment non. Le concept de de Benoît Kuhn, dans le numéro spécial Réalité Virtuelle suppose deux choses.

Extrait de pages de François van Lishout http://www.montefiore.ulg.ac.be/~vanli- shout/Welcome.html?scheme/applications.html

Vos recensions dans le Bulletin Vous avez récemment lu un livre sur l’I.A. et vous l’avez aimé ? Faites-nous part de ce coup de coeur ! Nous la publierons (avec review minimale, bien évidemment) pour en faire bénéficier le plus grand nombre.

B ULLETIN DE L’AFIA numéro 60 - juillet 2005 27 INTERVIEWS

Tom Mitchell

Traduction par Samuel Wieczorek de l’interview en anglais disponible à http://www.cs.cmu.edu/interviews/mitchell/index.html

Tom Mitchell est le directeur du Centre pour l’apprentissage et la découverte automatiques (Center for Automated Learning and Discovery) et professeur Fredkin d’I.A. et d’apprentissage, de l’Université Carnegie Mellon. Il est né en Pennsylvanie et pratique la planche à voile et le ski. Ici, vous pouvez en découvrir plus au sujet de son travail, de sa vie, et de sa cabane près du lac !

Pouvez-vous me parler un peu de vous ? la théorie, de travailler sur un programme qui réalise Commençons par vos origines. réellement quelque chose d’important dans le monde ; Je suis originaire de Pennsylvanie. Je suis né dans la les associer est une bonne chose que Carnegie Mellon petite ville de Blossburg (située au centre de la réalise, je pense, mieux qu’ailleurs. La seconde diffé- Pennsylvanie). Mais j’ai grandi dans le nord de l’état de rence est qu’il y a cette absence formidable de frontières New York. J’ai fait mes études supérieure au MIT à entre les disciplines. Par exemple, en ce moment, je col- Boston, puis à l’université de Stanford en Californie où labore avec un professeur de psychologie tout en diri- j’ai vécu pendant 5 ans. Ensuite, je suis venu enseigner geant le CALD qui est un immense rassemblement de à l’université Rutgers dans le New Jersey durant 6 ans. compétences en informatique et en statistiques qui se Je suis finalement venu ici en 1986. J’ai été un peu par- côtoient tout le temps. Il n’y a pas de problème bureau- tout… cratique organisationnel à Carnegie Mellon, c’est comme si on s’attendait à ce que vous travaillez natu- Alors, pourquoi avez-vous choisi Carnegie rellement ensemble. Mais c’est en réalité assez unique Mellon ? que Carnegie Mellon soit ouvert à ce point. Oh, ça a été facile… J’ai choisi Carnegie Mellon parce que j’étais déjà professeur à l’université Rutgers, Comme votre recherche se concentre beaucoup et je suis venu ici en tant que professeur invité durant un sur l'apprentissage automatique, avez-vous eu beau- an. J’ai alors commencé à passer du bon temps ! J’ai coup de connaissances dans (ou appréciez-vous) les enseigné un cours en collaboration avec Allan Newell et sciences biologiques ? Geoff Hinton, ce qui était très bien. Et à la fin de l’an- Vous savez, c’est amusant. Je n’ai pas beaucoup de née, lorsque j’étais supposé rentrer, nous avons tous été connaissances en biologie, mais j’apprends de plus en d’accord pour que je reste ici !! C’est un environnement plus en ce moment. Je suis une sorte d’étudiant, parce tellement propice pour faire de la recherche en IA ou en que durant ces deux dernières années, j’ai changé par informatique. Cà a donc été vraiment facile pour moi. rapport à mon métier précédent qui était seulement basé sur la façon dont nous pouvions amener des ordinateurs Pensez-vous que l’environnement soit très diffé- à apprendre. Je cherche maintenant à appliquer ceci à rent du MIT ou de Stanford ? l’étude de données d’imagerie du cerveau. Je gagne à Je pense que oui. J’ai été étudiant aux deux endroits, apprendre certaines choses à propos des neurosciences et il me semble qu’il y a deux grandes différences : la et je me considère comme un étudiant dans ce domaine première est qu’ici, il y a une très forte priorité sur l’in- qui me fascine. formatique expérimentale - qui est, pour complimenter B ULLETIN DE L’AFIA 28 numéro 60 - juillet 2005 INTERVIEWS

Comment vous sentez-vous par rapport à l’im- système pour analyser beaucoup de données et décou- brication de ces deux sciences : informatique et vrir des régularités ? ». Et donc, les gens ont mis au sciences naturelles ? Que pensez-vous que le futur point de tels systèmes au lieu de chercher comment les apportera avec la combinaison des deux ? humains apprenaient et essayer de reproduire ces Un domaine où vous pouvez déjà observer une mécanismes. Mais récemment, comme je m’intéresse grande croissance (et je pense qu’elle va être encore au cerveau, j’ai commencé à en apprendre un peu plus plus grande dans les 5 à 10 années à venir) est celui sur ce que les gens savent à propos de l’apprentissage des sciences naturelles comme la biologie ou l’astro- humain, et c’est vraiment différent. Par exemple, nomie - qui produisent maintenant énormément de lorsque nous, humains, apprenons, une grande partie données… comparé à une centaine d’années aupara- de ce qui détermine si nous réussissons ou pas est lié à vant, quand Mendeleev a réalisé son expérience sur les la motivation. Et il n’y a rien dans les algorithmes gènes de pois. Aujourd’hui, nous disposons d’im- d’apprentissage artificiel qui corresponde, même de menses ensembles de données, provenant des microar- loin, à la motivation. C’est donc un phénomène très rays, etc ; pour les expériences d’imagerie cérébrale différent. Peut-être que dans 10 ans, nous le compren- nous avons des téraoctets d’images. Il n’est donc pas drons mieux, mais pour l’instant, les deux sont vrai- possible que les gens s’assoient et regarder un téraoc- ment différents. tet de données à la main. Ainsi, de plus en plus, vous voyez des ordinateurs faire partie intégrante des Que préférez-vous à Carnegie Mellon? sciences empiriques uniquement parce qu’elles dispo- Je pense que c’est un endroit où vous êtes encoura- sent de gigantesques ensembles de données. En parti- gés à faire tout ce que vous aimez faire et vous n’avez culier, dans notre centre pour la découverte et l’ap- pas à vous soucier de la discipline dans laquelle vous prentissage automatiques, nous sommes spéci- travaillez. Ici, je suis dans l’informatique et j’ai décidé fiquement intéressés à trouver quel type d’algorithme d’étudier le cerveau, et c’est très bien. Il n’y a jamais la nous pouvons mettre au point pour trouver des ten- crainte de savoir si vous êtes autorisé à travailler sur un dances générales dans de grands ensembles de don- problème donné. Faites-le ! nées détaillées. Il y a une grande opportunité pour construire des programmes, comme ceux sur lesquels Avez-vous toujours voulu enseigner ? je travaille, qui apprennent les motifs d’activation du Non. C’était un pur accident. J’aime enseigner. J’ai cerveau indiquant que vous pensez à des noms plutôt écrit un livre il y a quelques années parce que j’ai com- qu’à des verbes, ou dans le cas de la biologie cellulai- mencé à enseigner l’apprentissage artificiel et que re, nous apprenons les motifs d’aspects de protéines j’avais remarqué que c’était plus agréable d’avoir des ou d’expression de gènes indiquant certains processus supports bien organisés. Mais ce qui m’a réellement en cours dans la cellule. Il est vraiment difficile de motivé à devenir professeur est que j’étais intéressé par trouver ces motifs à la main, et des algorithmes d’ap- la recherche. Au départ, quand je suis devenu profes- prentissage pour trouver ces motifs Ð algorithmes de seur, j’ai considéré l’enseignement comme une activité data mining - deviennent de plus en plus importants intéressante, mais quelque chose que je faisais simple- dans les sciences empiriques. ment à côté du reste. Après avoir écrit le livre, j’ai déci- dé qu’enseigner était réellement une partie majeure de Apprendre les algorithmes du cerveau pour faire ce que je faisais mais je n’ai pas commencé par là ! quelque chose est très difficile et n’est pas encore très bien compris. N’avez-vous jamais trouvé cela Quel est le cours que vous préférez enseigner ? frustrant que de faire apprendre à un ordinateur des J’aime beaucoup enseigner le cours d’apprentissage choses dont nous-mêmes ne connaissons pas les fonc- artificiel, parce que c’est le domaine dans lequel je tra- tionnements internes ? vaille. Mais j’apprécie également choisir un thème que C’est une observation très intéressante, je ne suis je ne maîtrise pas beaucoup et alors diriger un séminai- pas pour l’instant frustré par cela. Pourquoi ? [Rires] Je re dessus : j’apprends autant que les étudiants. Ce genre ne sais pas ! de cours est amusant. Peut-être que c’est curieux, mais il est vrai que la plupart des travaux en apprentissage artificiel (ou Avez-vous été le seul qui ait réellement fini par comment faire apprendre à un ordinateur), n’ont pas créer un cours d’apprentissage artificiel ici ? été guidés par notre connaissance de l’apprentissage Oui…C’est vrai ! [Rires] humain. Ces travaux ont simplement évolué par eux- mêmes : Ç ok, comment pouvons-nous concevoir ce Changeons un peu de sujet…pour un côté plus B ULLETIN DE L’AFIA numéro 60 - juillet 2005 29 INTERVIEWS

personnel…De toutes les expériences que vous avez d’elles est en thèse, elle fait croître des artères artifi- eues à Carnegie Mellon, quel a été votre souvenir le cielles pour sa thèse à Duke. L’autre est professeur de plus cher ? mathématiques dans une école à Washington. Oh ! Il y en a tellement, c’est difficile à dire ! Bien, l’un de mes favoris est lorsque je suis venu ici pour la Quel est votre lieu de villégiature préféré ? première fois et que j’ai enseigné ce cours avec Allan Ma maison ! [Rires] Newell et Geoff Hinton. Chacun d’entre nous a ensei- Notre maison est dans le Maryland – j’ai un appar- gné le cours, c’était sur les architectures pour les agents tement à Pittsburgh, mais notre maison se situe dans un intelligents, un domaine sur lequel chacun de nous tra- endroit appelé Deep Creek Lake, à environ deux heures vaillait sous des angles différents. Nous avons eu le de route d’ici. Nous avions l’habitude d’aller en meilleur groupe d’étudiants, et le cours ne fut pas du vacances dans une cabane là-bas et d’avoir une maison tout magistral : nous avions un ou deux papiers chaque ici, mais après que nos enfants aient quitté le college, semaine que nous devions tous lire - les enseignants et nous avons décidé que nous serions bien mieux près du les étudiants - et ensuite nous en discutions. Ceci a été lac et nous en avons fait notre résidence principale. un de mes meilleurs souvenirs de l’université de Donc, je suis ici à Pittsburgh la semaine et les week- Carnegie Mellon parce que ça a été ma première expé- ends, je suis dans ma maison ! rience de la façon dont les choses fonctionnent ici et de cette opportunité de liberté. Quelle est votre cuisine favorite ? Mon restaurant favori à Pittsburgh en ce moment est Quels loisirs ou passions avez-vous en dehors du le Eleven. Il est au centre-ville. En général, j’aime la travail ? bonne cuisine – la cuisine française est ma préférée. J’aime faire de la planche à voile. Je joue un peu de musique, de la guitare. J’aime skier. Quel est votre endroit préféré à Pittsburgh ? J’aime bien aller au Café Zinho qui est à Shadyside. Si vous n’aviez pas été dans le milieu académique C’est seulement un très petit mais très agréable endroit ou dans l’administration, qu’auriez-vous fait dans où aller. Eleven est un joli endroit, cher et raffiné, mais une autre vie ? le Café Zinho est mon préféré, un restaurant accessible. C’est amusant - parfois je pense que j’aurai voulu [Rires] être un docteur… Quelle est votre couleur préférée ? Quel jour est votre anniversaire ? Bleu. Le 9 août. Complétez cette phrase : Quand les choses Etes-vous marié et avez-vous des enfants ? deviennent difficiles, je… Je suis marié à une personne merveilleuse qui est Cours plus vite! [Rires] responsable du système décimal Dewey - son poste officiel est : Ç Editeur du système décimal de Dewey È Quel est votre leitmotiv ou votre philosophie ? - elle élabore tous les numéros sur les livres… Et j’ai Etre honnête…avec soi-même et autrui. deux filles merveilleuses, toutes les deux mariées. L’une

B ULLETIN DE L’AFIA 30 numéro 60 - juillet 2005 PRÉSENTATION DE LABORATOIRES

Présentations de laboratoires dans le bulletin de l'AFIA LIFIA, Grenoble ...... Bulletin n¡1 INRETS...... Bulletin n¡23 LRI, Orsay ...... Bulletin n¡1 IRIN Nantes ...... Bulletin n¡24 Service Systèmes Experts, Renault...... Bulletin n¡1 CRIN - INRIA Lorraine...... Bulletin n¡25 CEDIAG, ...... Bulletin n¡2 DIRO - Université de Montréal ...... Bulletin n¡26 CERT, ONERA, Toulouse...... Bulletin n¡2 IRIT - Toulouse (1) ...... Bulletin n¡28 IRIT, Toulouse...... Bulletin n¡2 IRIT - Toulouse (2) ...... Bulletin n¡29 LAAS, Toulouse...... Bulletin n¡2 LAAS - Toulouse (1) ...... Bulletin n¡30 HEUDIASYC, UTC...... Bulletin n¡3 Sony CSL ...... Bulletin n¡31 IFP, Rueil Malmaison...... Bulletin n¡3 LAAS - Toulouse (2) ...... Bulletin n¡32 DIAM, INSERM U194 ...... Bulletin n¡3 LIMSI - Département CHM ...... Bulletin n¡33 Lab. Math. Info., Fac Médecine de Marseille.. Bulletin n¡4 LAMSADE ...... Bulletin n¡34 GMD, St. Augustin (RFA) ...... Bulletin n¡4 Institut autrichien de recherches en I.A...... Bulletin n¡36 ONERA, Chatillon ...... Bulletin n¡4 LIP6 Ð Université Pierre KSL, Université de Stanford (USA) ...... Bulletin n¡5 et Marie Curie...... Bulletins n¡37 & 38 Dépt Applications de l’IA au CNET, Lannion. Bulletin n¡5 GREYC Ð Université de Caen ...... Bulletin n¡40 LAFORIA, Univ. Pierre et Marie Curie...... Bulletin n¡6 LIFL Ð Université de Lille...... Bulletin n¡41 L’institut FAW, ULM (RFA) ...... Bulletin n¡6 LRI (équipes IA et IASI) ...... Bulletin n¡43 Institut IIIA, Compiègne ...... Bulletin n¡6 IMAG - Grenoble...... Bulletin n¡44 LAIR, OHIO State University (USA)...... Bulletin n¡7 PSI (Perception, Système, Information - ARAMIIHS, Labo mixte MATRA-CNRS,...... Bulletin n¡7 Rouen)...... Bulletin n¡45 CEA, Service SERMA, Saclay ...... Bulletin n¡8 INRIA Ð Sophia Antipolis ...... Bulletin n¡46/47 Société ILOG...... Bulletin n¡8 LIH – Laboratoire d’Informatique LAIAC, Université de Caen ...... Bulletin n¡9 du Havre ...... Bulletin n¡46/47 Institut Français du Pétrole ...... Bulletin n¡10 Tech-CICO Ð Université de Technologie de Troyes ...... Bulletin n¡51 DFKI (Centre allemand de recherches en IA) . Bulletin n¡11 LIFO Ð Université d’Orléans – Équipe Contraintes GRTC, Marseille ...... Bulletin n¡11 et Apprentissage...... Bulletin n¡52 Inst. d’Analyse des Systèmes, Ac. Russe ...... Bulletin n¡12 LIIA Ð Ecole Nationale des Arts et Industries Georges Mason Univ., Center for AI (USA).... Bulletin n¡13 de Strasbourg ...... Bulletin n¡52 IRISA, INRIA et Université de Rennes...... Bulletin n¡13 LRL Ð Laboratoire de recherche sur le langage Ð Société INGENIA ...... Bulletin n¡14 Université Blaise Pascal Clermont 2 ...... Bulletin n¡53 LIPN, Université de Paris Nord ...... Bulletin n¡14 MIG – Mathématique, Informatique et Institut EURISCO ...... Bulletin n¡15 Génome – INRA...... Bulletin n¡53 LRDC, Université de Pittsburgh (USA)...... Bulletin n¡15 ESIEA Recherche, Laval et Paris ...... Bulletin n¡54 Société ISOFT...... Bulletin n¡16 Équipe Intelligence Artificielle et Applications Dépt. d’Info de l’Université d’Ottawa ...... Bulletin n¡16 (IAA) du Crip5, Paris 5 ...... Bulletin n¡55 Equipe CHM, Université du Colorado (USA). Bulletin n¡17 LAMIH Ð Univ. de Valenciennes et du LIRMM, Montpellier ...... Bulletin n¡19 Hainaut-Cambrésis...... Bulletin n¡55 Institut autrichien de recherches en I.A...... Bulletin n¡20 Université de Lund...... Bulletin 58 ENST Bretagne ...... Bulletin n¡21 CRIL Ð Centre de Recherche en Informatique LIA - Université de Savoie ...... Bulletin n¡22 de Lens Ð Université d’Artois...... Bulletin 58 B ULLETIN DE L’AFIA numéro 60 - juillet 2005 31 LABORATOIRES

Laboratoire d’InfoRmatique en Image et Systèmes d’information

LIRIS UMR 5205 Université Claude Bernard Bâtiment Nautibus (710), 43, Boulevard du 11 Novembre 1918 69622 VILLEURBANNE CEDEX Tél : +33 4 72 43 26 10 Fax : +33 4 72 43 15 36 Web : http://liris.cnrs.fr - - Mél. : {prenom.nom}@liris.cnrs.fr

Présentation générale Equipe tèmes) peuvent exploiter les services Le LIRIS comprend environ 200 per- mis à disposition en les interprétant sonnes : comme connaissances ou comporte- Axes de recherche ¥ 75 enseignants-chercheurs (dont 21 ments intelligents dans le contexte de Le LIRIS (Laboratoire d'InfoR- professeurs et 54 maîtres de confé- leur tâche courante. Ce thème travaille à matique en Image et Systèmes d'infor- rences), l’élaboration de propositions théoriques mation) est né début 2003 à la suite du ¥1 chargé de recherche CNRS, et pratiques pour relever ce défi ; qui regroupement de plusieurs laboratoires ¥ 105 doctorants, pourrait se résumer par la question : de recherche lyonnais (LIGIM, LISI, ¥7 post-doctorants, Ç Comment faire émerger des connais- RFV) et d'individualités du domaine ¥8 ITA/IATOS. sances ou/et des comportements intelli- des Sciences et Techniques de gents des systèmes informatiques ? ». l'Information et de la Communication. Il Enseignements doctoraux Ce thème a pour cibles communes la est associé au CNRS avec le label UMR Le LIRIS est laboratoire d’accueil du découverte, la gestion, l’exploitation et 5205. Il a deux thèmes principaux de Master Recherche Informatique de le partage des connaissances telles recherche : l'image numérique et les sys- Lyon (responsables : Mohand-Saïd qu’elles s’expriment dans ce que nous tèmes d'information, qui sont déclinés Hacid et Robert Laurini - site web : proposons d’appeler des « traces docu- suivant quatre axes scientifiques : http://mastria.insa-lyon.fr/). Les sept mentaires È. Une trace documentaire est ¥Axe 1 - Données, Documents et spécialités du Master sont : un conteneur de connaissances qui peut Connaissances (Responsable : S. ¥ Connaissances et Raisonnement prendre des formes très variées : Calabretto) ; ¥ Aide à la Décision pour l'Entreprise ¥ les documents dans leur acception la ¥Axe 2 - Images et vidéos : segmenta- ¥ Extraction de Connaissances à partir plus habituelle du terme, en tant tion et extraction d'information des Données qu’artefacts construits, et en particu- (Responsable : H. Emptoz) ; ¥ Informatique graphique et images lier les documents numériques, ¥Axe 3 - Modélisation et réalité aug- ¥ Systèmes d'information ¥ les contenus des bases de données en mentée (Responsable : B. Shariat) ; ¥ Réseaux, Télécommunications et tant que conteneurs de connaissances, ¥Axe 4 - Systèmes d'information com- Services ¥ les traces d’interactions liées à l’usa- municants (Responsable : A. Flory). ¥ Informatique Fondamentale ge du système informatique par l’uti- et deux actions transverses : Le master est délivré par plusieurs lisateur, Action A - Plate-forme d'Intégration établissements lyonnais : Université ¥ les traces d’interactions entre agents d'outils logiciels pour le document Claude Bernard Lyon 1, Institut informatiques, numérique, en liaison avec l'Institut des National des Sciences Appliquées de ¥ les traces d’usages captées dans les Sciences du Document Numérique Lyon, Université Lumière Lyon 2, Ecole grandes bases de données (permettant (ISDN) ; Centrale de Lyon, Ecole Normale de découvrir des profils), Action B - Plate-forme d'Intégration Supérieure de Lyon. ¥ les codes complexes régissant des logicielle : dossier médical multimédia phénomènes d’évolution ou de com- réparti, en liaison avec le thème fédéra- Présentation générale de l’équipe portement (génomes, séquences teur « Ingénierie de la Santé ». D2C d’événements,…), Seul l’axe 1 induit des recherches en Le défi à relever par les systèmes ¥ etc. Intelligence Artificielle et fait donc l’ob- informatiques omniprésents en tant que Cinq axes thématiques structurent jet d’une présentation plus détaillée. supports pour les activités extrêmement d’une manière plus spécifique les diffé- Pour plus d’information sur les autres variées de la société est de « faire sens È rentes facettes du thème général : thèmes, vous pouvez consulter le site pour les utilisateurs et les uns pour les ¥ Modélisation sémantique de docu- web du LIRIS. autres. Les utilisateurs (ou agents sys- ments. B ULLETIN DE L’AFIA 32 numéro 60 - juillet 2005 LABORATOIRES

¥ Cognition et expérience et agents document audiovisuel est décomposé en recherche documentaire pour personna- situés. morceaux appelés unités audiovisuelles. liser l’assistance. Nous avons choisi le ¥Représentation de connaissances, rai- Ces morceaux de document sont anno- Raisonnement à partir de cas (RàPC ) sonnement et bases de données. tés par des termes issus d’une base de pour l’apprentissage du profil utilisa- ¥ Découverte de connaissances. connaissance hiérarchique. Les termes teur. Le système que nous proposons ¥ Modélisation collaborative. de la base de connaissance et l’ensemble effectue l’expansion de la requête de des annotations d’un flux forment alors l’utilisateur, fournit la requête étendue un graphe connexe orienté et étiqueté. au système de recherche documentaire Thème : Modélisation Le graphe ainsi défini forme une base Context de Oracle puis filtre les docu- sémantique de documents d’annotations. Pour accéder aux don- ments collectés avant de les présenter à nées contenues dans cette base d’anno- l’utilisateur final. Cette démarche a été Responsable tations, on utilise des requêtes qui sont validée par un prototype : COSYDOR Jean-Marie Pinon elles aussi traduites sous la forme de (COoperative System for DOcument graphes. Le projet SESAME se poursuit Retrieval) dans le cadre de la thèse de Chercheurs permanents par le projet RNRT RECIS dont l’objec- Lobna Jeribi. Sylvie Calabretto, Elöd Egyed- tif est d’étudier et de développer des ¥ pour l’assistance au déplacement pié- Zsigmond, Béatrice Rumpler outils permettant d’enrichir les services ton. de recherche et d’accès à l’information Dans le cadre du projet régional Thésards et post-docs multimédia. Dans le cadre du projet Ç OUVEJ È, nous nous intéressons à Rocio Abascal, Tiphaine Accary- RECIS, le modèle E-SIA a été proposé. l’aide au déplacement piéton en milieu Barbier (ATER), Noureddine Chatti, Ce modèle enlève la structure hiérar- urbain en particulier pour les personnes Vivien Guillet (ATER), Farah Harrathi, chique de la base de connaissances et déficientes visuelles. Une assistance Hassan Nadery , Cristiane Vilar Mayer rajoute les notions de Dimension automatisée est possible si l’on prend d’Analyse et de Schémas de Description soin d’intégrer les situations person- Problématique ainsi que des méthodes de traçage de nelles, les capacités et les besoins de Force est de constater que nous dis- l’annotation et de la recherche de docu- l’utilisateur dans le système. La notion posons et consommons quotidienne- ments par le modèle Trèfle?. Trèfle? de profil utilisateur devient de fait un ment de plus en plus d'information, permet de tracer les actions des utilisa- des éléments pivots de notre proposi- information diffusée selon de multiples teurs toujours sous la forme de graphes tion. Notre approche s’appuie d’une part formats et au contenu extrêmement et fournit des techniques pour réutiliser sur la définition du profil utilisateur et varié. De ce fait, les systèmes de diffu- l’expérience ainsi capté pour aider l’uti- d’autre part sur la formalisation du pro- sion, de stockage ou d'accès à cette lisateur dans sa tâche d’annotation et de fil en vue de son exploitation. Elle met information multimédia doivent en per- recherche de documents. Les techniques en œuvre une adaptation à l’utilisateur, manence être repensés et s'adapter à ce de réutilisation de l’expérience se basent en effet, les trajets proposés et le niveau volume disponible croissant tout en sur le paradigme du raisonnement à par- de détail dans les descriptions sont cal- satisfaisant au mieux les besoins de l'uti- tir de cas (RàPC). Ces résultats sont culés en fonction du profil. De plus elle lisateur. Le problème de la recherche et communs avec l’axe thématique « permet l’utilisation de modalités de res- de la sélection d'une information perti- cognition-expérience ». titution variées. L’instanciation du profil nente constitue l'objet essentiel de notre de l’utilisateur repose sur un « feed- action de recherche. Plusieurs ¥ Modélisation du profil utilisateur back È explicite de l’utilisateur (évalua- approches dans des domaines aussi pour la recherche et l’extraction d'in- tion directe) et un Ç feedback È implici- variés que l'audiovisuel, les documents formation dans les documents scienti- te (évaluation à travers l’exploitation de archéologiques, scientifiques, ou encore fiques pour des déficients visuels traces d’utilisation). Complémentaire- les hyper documents mono ou multi- A partir de bases de documents exis- ment, des stéréotypes sont formés. Ils lingues du WEB ont été explorées pour tantes, nous avons défini un système remédient au problème de l’instancia- effectuer la recherche d'information par intelligent d’aide à la recherche d'infor- tion du profil. le contenu, mais dans chaque cas, il mation adapté aux utilisateurs déficients Un prototype est réalisé en grandeur apparaît que l'indexation du document visuels. Ce système permet d'extraire les réelle sur le campus de la Doua, dans reste un élément clé pour garantir le informations les plus pertinentes pour lequel, les trajets sont définis dans un meilleur succès dans la recherche. l'utilisateur et de les restituer selon la dialecte de xml, les étapes d’adaptations modalité la mieux adaptée à ses préfé- étant réalisées par application de feuilles Résultats rences : son, Braille ou texte. Nous de transformation xslt.(Thèse de Vivien Modèle de représentation de docu- avons défini la notion de profil utilisa- Guillet) ments audiovisuels teur (connaissances du domaine, Le modèle Strates-IA, développé connaissances comportementales, Modèle d’indexation sémantique de dans le projet SESAME, permet de connaissances cognitives). Le système corpus multilingue structurer et de représenter des annota- exploite ces connaissances durant les Catherine Roussey a proposé dans sa tions de documents audiovisuels. Un différentes phases du processus de thèse un modèle de graphe sémantique B ULLETIN DE L’AFIA numéro 60 - juillet 2005 33 LABORATOIRES

permettant d'améliorer la description Description » (thèse d’Aurélien Bénel). nous affranchir des outils de description sémantique des documents dans un Ce modèle se présente sous la forme « technologiques » et de représenter une contexte multilingue. Ce modèle est une d’un graphe orienté acyclique. Les structure documentaire par un graphe, extension du modèle des graphes nœuds sont appelés des « descripteurs » ce qui offre de plus riches possibilités de conceptuels de Sowa tenant compte de et les arcs des « spécialisations ». Le description. l'existence de plusieurs vocabulaires. mécanisme que nous avons proposé Une structure documentaire est une L’indexation d’un document s’effectue pour comparer des points de vue entre description d’un document par un grâce à la définition préalable d’un the- eux est un filtre de graphe. Il permet par ensemble d’éléments en relations les saurus sémantique. Un thésaurus induction totalisante de trouver des rap- uns avec les autres, au cours ou en vue sémantique est un nouveau genre d’on- ports entre descripteurs, non-dits au d’un usage. Un document multistructuré tologie qui allie à une modélisation du niveau des modèles, mais apparaissant est un document structuré dans lequel domaine plusieurs terminologies. Nous dans leurs usages. Ce filtre de graphe est on considère plusieurs usages possibles avons montré la pertinence de notre pro- également utilisé pour arpenter l’espace et donc plusieurs décompositions struc- position en implémentant un prototype documentaire et donc rechercher des turelles. L’une de ces structures, nom- appelé Système Documentaire documents par navigation dans le réseau mée structure première, est constitutive Multilingue (SyDoM) pour la gestion et de descripteurs. Ces travaux ont donné du document en tant qu’unité. Toute l'interrogation d'une collection de docu- naissance au système en open sources autre structure s’appuie sur la structure ments XML Ainsi les termes sont disso- Porphyry (http://www.porphyry.org). première par le biais d’une correspon- ciés des notions qu’ils dénotent, ce qui Le système Porphyry comprend aujour- dance avec celle-ci, directement ou par permet de clarifier les relations entre les d’hui deux couches (au sens informa- l’intermédiaire d’une autre structure. termes et les notions et d’identifier les tique) : la première permet de gérer les Enfin, deux structures quelconques ne relations terminologiques des relations corpus documentaires, la seconde les peuvent pas être mutuellement en cor- sémantiques. L’objectif du travail de points de vue. Nous travaillons actuelle- respondance, ni directement ni indirec- thèse de Farah Harrathi est de proposer ment sur la création d’une troisième tement. Ces travaux se poursuivent dans une méthode d’indexation automatique couche pour l’intersubjectivité. Cet le cadre de l'ACI Masse de Données de documents multilingues pour per- espace intersubjectif permettra de détec- SemWeb. mettre le passage à l’échelle de SyDoM. ter des incohérences par propagation de Des travaux sur la structure séman- La méthode est fondée sur l’extraction contraintes, contraintes posées par l’ex- tique de thèses scientifiques sont menés des concepts et la détection de la pré- pert à l’intérieur d’un même point de dans la thèse de Rocio Abascal. sence de relations sémantiques entre vue et entre des points de vue différents. concepts à partir des documents. Elle Ces travaux sont menés dans le cadre de Elaboration d’un modèle de repré- s’inspire, d’une part de certaines pro- l’EPML Confrontation de points de vue sentation sémantique des textes régle- priétés générales des langues naturelles, du RTP Document. mentaires et d’autre part des méthodes linguis- Il s’agit de modéliser la sémantique tiques et statistiques. Multistructuralité des documents des textes réglementaires pour les Nos travaux sur la multistructuralité mettre en relation lorsqu’ils appartien- Nouveaux modèles à base de points des documents visent à proposer un nent à des niveaux de droit distincts. de vue pour les bibliothèques numé- modèle générique de l’approche à base L’ensemble de nos modèles permet de riques spécialisées de points de vue. En effet, dans le modè- rendre compte de la sémantique de cha- La consultation de ressources hétéro- le des réseaux de description, seules des cun des documents, mais aussi de leurs gènes (SGBD, banques d’images, bases relations de spécialisation sont autori- relations au sein de la pyramide régle- documentaires) pose un ensemble de sées. Dans une première phase, nous mentaire : un hyperdocument, depuis les problèmes dits de sémantique. Deux avons étendu ce modèle à des docu- textes les plus généraux, jusqu’aux approches sont possibles : une approche ments temporels en ajoutant des rela- textes les plus proches des spécifica- ontologique ou une approche à base de tions de Allen (Thèse de Tiphaine tions des systèmes d’information qui points de vue. Contrairement à l’ap- Accary, Projet STIC-SHS Société de mettent en œuvre cette réglementation. proche ontologique qui nécessite un l'Information). L’objectif du modèle de Notre contribution permet d’établir un consensus entre experts, cette nouvelle document à structures multiples est de support formel offrant en perspective approche permet de modéliser des proposer un modèle générique qui sup- une gestion de la cohérence (détection points de vue contradictoires (intersub- porte tout type de relation et tout type de des incohérences, des contradictions et jectivité). En effet, dans le cadre de document (Thèse de Noureddine Chatti, des tautologies) et de la conformité au bibliothèques numériques spécialisées projet régional ISDN). Le modèle pro- sein du corpus réglementaire (thèse de (destinées à des experts), limiter la des- posé a pour objectif de permettre la David Jouve, convention CIFRE avec le cription des documents à une indexation prise en compte de la multistructuralité CNEDI de Lyon). unique, fixe et effectuée par un tiers, des documents multimédias. Les struc- reviendrait à nier l’expertise des cher- tures documentaires sont habituellement cheurs ou experts. Nous avons donc modélisées sous la forme d’arbres. De développé le modèle des « Réseaux de façon plus générale, nous choisissons de B ULLETIN DE L’AFIA 34 numéro 60 - juillet 2005 LABORATOIRES

Thème : Cognition, interactions homme-homme médiati- de l’Université de Provence). Le projet Expérience et Agents Situés sées par les systèmes tout comme les AMBRE exploite le Raisonnement à interactions agents-agents forment le Partir de Cas pour faire acquérir des Responsable fond commun de l’axe thématique. Les méthodes issues de recherches en didac- Alain Mille (AM) systèmes informatiques eux-mêmes ne tique des disciplines. L’acquisition de peuvent en effet plus être considérés connaissances théoriques à partir de la Chercheurs permanents comme des entités fermées intégrant des résolution de problèmes par analogie Béatrice Fuchs (BF), Nathalie Guin- mécanismes automatiques pour des exige de modéliser les connaissances de tâches spécifiques, mais constituent des Duclosson (NG), Salima Hassas (SH), la méthode (fondées sur des connais- systèmes ouverts, s’appuyant explicite- sances de classification) pour expliciter Stéphanie Jean-Daubias (SJD), Simone ment sur la prise en compte des diverses ces connaissances, les explications asso- Pimont (SP), Yannick Prié (YP) interactions qu’ils entretiennent avec un ciées, les liens entre les connaissances environnement complexe et changeant : de classification et les connaissances du Thésards et post-docs il s’agira alors de voir à quel point il est RàPC (en particulier la relation entre Jesus Arana-Lozano, Frédéric Armetta, possible de voir ces systèmes comme connaissance de recherche de problèmes Magali Beldame, Rosanna Bova, des « écosystèmes artificiels È. Cette similaires et connaissance d’adaptation Amélie Cordier, Carole Bavay- facette de la problématique est en cours d’une solution d’un problème similaire). Eyssautier (Grenoble), Clément Faure, de construction dans l’axe thématique. L’expérimentation en situation écolo- Olivier Georgeon, Julien Laflaquière, La prise en compte des interactions gique (lycée et primaire) a démontré Leonardo Lana de Carvalho Sandra comme fondement de l’émergence du toute l’importance de l’appropriation de Nogry, Mick Philippon, Amjad Rattrout, sens implique la collaboration avec les l’EIAH (plusieurs versions de l’EIAH Arnaud Stuber spécialistes des sciences cognitives. Une ont été développées incrémentalement première application d'une telle collabo- avec les utilisateurs). Problématique ration concerne la prise en compte des L’appropriation d’un EIAH par l’ap- La pérennisation du savoir (et du aspirations des interlocuteurs d'un systè- prenant passe par la capacité de celui-ci savoir-faire 1) revêt une importance me (aussi bien ceux qui l'interrogent, à l’exploiter pour partager et réutiliser grandissante dans un nombre croissant ceux qu'il contribue à former, que ceux l’expérience des apprentissages médiés d'entreprises 2. Les outils dans ce domai- qui l'alimentent en connaissances). Une par l’environnement. Le projet PIXED ne peuvent se présenter comme des seconde approche consiste à étudier en s’est intéressé à l’exploitation des traces Aides à la Décision et aussi comme des parallèle (chez les humains et dans les d’apprentissages dans le cadre d’un Aides-mémoire 3. Dans le premier cas logiciels), les mécanismes d'évocation, EIAH pour l’apprentissage à distance (aides à la décision), on doit clairement tels que ceux qui permettent de recon- tout à la fois pour assister réflexivement se garder de l'utopie consistant à viser naître dans un problème nouveau des l’apprenant dans sa tâche d’apprentissa- des systèmes de « décision automa- éléments de similitude avec un problè- ge que pour mettre à disposition un tique » ; il s'agit bien de fournir à l'utili- me déjà résolu en vue d’adapter sa mécanisme de traçage permettant sateur des éléments lui permettant (ré)solution. d’échanger sur les processus d’appren- d'avoir une vue plus précise de son pro- tissage en les représentant sous formes blème et des conséquences prévisibles Résultats d’épisodes d’apprentissage contextuali- de ses choix. Le second cas inclut aussi EIAH (NG, SJD, AM) sés dans leur trace et en autorisant leur bien la mémoire collective que celle La conception des EIAH ne peut se manipulation par les apprenants (parta- d'un individu. Au-delà de l'utilisation résoudre à la mise en œuvre de bons ge de ces épisodes avec les enseignants, par l'ingénieur pour l’aide à la concep- outils, de bonnes méthodes, de bonnes les autres apprenants, etc). tion par exemple, il convient d'envisager pratiques. L’intégration des EIAH dans l'utilisation des informations à des fins les pratiques d’enseignement et d’ap- RàPC (BF, AM) pédagogiques, par exemple dans le prentissage passe par leur appropriation. Le Raisonnement à Partir de Cas est cadre d'EIAH (Environnements L’équipe explore les moyens de faciliter une source d’inspiration importante Informatiques pour l'Apprentissage cette intégration par l’évaluation pluri- dans l’équipe pour orienter les travaux Humain). Il s’agit donc de mobiliser les disciplinaire précoce des systèmes déve- cherchant à remobiliser l’expérience possibilités des systèmes informatiques loppés et par la conception d’outils pour remettre en contexte la tâche de pour développer des assistants Ç intelli- d’appropriation des EIAH par les ensei- l’utilisateur, facilitant la résolution de gents » des tâches médiatisées. Les gnants (Projets PERLEA et AMBRE) et problème, l’apprentissage humain, la par les apprenants (Projet Pixed). coopération, l’assistance, etc. 1. Jean-Marc Fouet (décédé en mai 2000), Peut- on exprimer les savoir-faire ?, in Actes du congrès L’appropriation des EIAH passe éga- Ce domaine bénéficie d’une compé- MLX, Namur, pp183-189, 1998 lement par l’exploitation des processus tence ancienne et reconnue dans le 2. Jean-Marc Fouet, Connaissances et savoir- d’apprentissage individuels en particu- domaine, en particulier dans la modéli- faire en entreprise, HERMES, 1997 lier lorsqu’il s’agit d’apprendre des sation et la formalisation du 3. Alain Mille, Associer expertise et expérience pour assister la tâche de l’utilisateur, Thèse HDR, méthodes (collaboration avec le Raisonnement, des ses différentes UCB Lyon1, 1998 Laboratoire de Psychologie Cognitive étapes et des connaissances qui les B ULLETIN DE L’AFIA numéro 60 - juillet 2005 35 LABORATOIRES

caractérisent. Un travail en collabora- lecture de Ç constellations de mots È Thème : Représentation de tion avec l’équipe Orpailleur de Nancy a (beaucoup de pages Web mettent ainsi connaissances, raisonnement permis la théorisation des connaissances Ç en constellation » les mots plutôt que et bases de données mobilisées dans le RàPC et l’expérience les organiser dans une syntaxe conve- nue. acquise permet d’envisager la réalisa- Responsable tion d’un atelier du RàPC intégrant des Mohand-Saïd Hacid capacités d’apprentissage des connais- Systèmes complexes (SH, SP, AM) sances mobilisées par le RàPC. Les systèmes informatiques ne sont Chercheurs permanents plus considérés comme des entités fer- Salima Benbernou, Fabien De Marchi, Les traces et leur interprétation (YP, mées, dotées de mécanismes automa- Etienne Pichat, Christine Solnon AM) tiques de réalisation de tâche mais Les interactions homme-homme comme des systèmes ouverts, évoluant Thésards et post-docs médiées par un environnement informa- dans environnements complexes : utili- Hassan Badir (ATER), Etienne Canaud, tique peuvent se matérialiser sous la sateurs, autres systèmes, réseau, etc. Samira Hammiche, Sébastien Sorlin, forme de traces laissées consciemment Sujets à d’incessantes perturbations Adrian Tanasescu par l’utilisateur 4. L’équipe propose une liées aux interactions mutuelles, ils doi- Ç théorie du traçage » (projet MUSET- vent constamment s’adapter. Les Problématique TE) mettant en évidence le rôle central recherches sont d’une part théoriques Approximation de requêtes dans les de ce qui est appelé « modèle d’utilisa- pour fonder une nouvelle façon de voir bases de données : L’utilisation de tion È permettant de faciliter l’interpré- l’acte de computation et d’autre part réponses approximatives à des requêtes tation et l’exploitation des traces par les pratiques en s’appliquant au domaine posées à une base de données compor- utilisateurs eux-mêmes ou par des cher- des réseaux, du web (sémantique !), des tant des informations partielles a été cheurs analystes des interactions chaînes logistiques et bien entendu dans explorée, au cours des années 80, par les humaines médiées par un environne- le domaine de la cognition abordé au communautés bases de données, intelli- ment informatique. Une architecture de travers de l’étude de l’émergence de gence artificielle et recherche d’infor- traçage et un mécanisme générique d’in- sens dans les interactions et des repré- mation. Depuis, les types de données terprétation contextuelle (Signatures de sentations associées (Projets OSCAR et manipulés dans les nouvelles applica- Tâches Expliquées) complètent la théo- ISOCELE). tions ont évolué pour inclure des don- rie. Plusieurs projets exploitent cette Ce thème de recherche trouve égale- nées plus complexes comme les don- approche pour la réalisation d’assistants ment sa genèse dans la résolution de nées multimédias. Les données fondés sur la réutilisation de l’expérien- problèmes sous contraintes fortement multimédias ont la caractéristique d’être ce (généralisation d’une forme de combinatoires, et les CSP (problèmes de subjectives dans leur interprétation RàPC) dans le domaine des EIAH satisfaction de contraintes) se révélant sémantique. Pour permettre une (PIXED et divers EIAH), de la concep- trop figés pour s’adapter au caractère recherche efficace dans les bases de tion (Dassault-Systèmes), de l’indexa- dynamique de l’environnement, les données multimédias, il est nécessaire tion et la recherche d’information solutions fondées sur une approche d’extraire et de représenter la séman- (RECIS), de l’assistance aux tâches col- décentralisée, flexible et adaptative à tique de ces données. Plusieurs travaux laboratives (Projets OSCAR et ISOCE- base d’agents réactifs (application aux se sont intéressés à des descriptions qua- LE) et des maquettes et prototypes ont problèmes d’ordonnancement fortement lifiées de « bas niveau È, générées par été réalisées avec succès. Plusieurs pro- dynamiques. des outils de traitement algorithmiques jets en cours sont orientés dans l’exploi- et celles de plus haut niveau, qualifiées tation de la théorie pour réaliser des Travaux en collaboration avec les de «sémantiques» afin d’obtenir des outils d’aide à l’interprétation d’usages Sciences Humaines et Sociales réponses précises aux requêtes sou- par les chercheurs analystes de l’activité Par nature, les projets du thème mises. Ces requêtes peuvent être sur les (collaborations INRETS, ICTT, cluster Cognition, Expérience et Agents Situés caractéristiques de bas niveau, la struc- de recherche Rhône-Alpes, etc.). nécessitent des collaborations fortes ture ou la sémantique des données. Les Un autre champ applicatif de l’inter- avec la recherche en SHS. requêtes portant sur la sémantique ne prétation basée sur les traces concerne Le thème s’insère dans plusieurs permettent pas d’avoir des réponses pré- l’interprétation de documents par anno- communautés interdisciplinaires (com- cises à cause de la nature subjective des tation/traces de relecture et réutilisation munauté EIAH, communauté IC, com- données. Pour remédier à ce problème, avec une application originale aux docu- munauté Systèmes Complexes, commu- nous proposons de concevoir et d’explo- ments audiovisuels et à la génération nauté ARCO…) et bien entendu a animé rer un cadre formel pour l’approxima- d’hypervidéos (Projet Advene). et participé à plusieurs groupes de tra- tion sémantique de requêtes dans les Une piste de recherche est ouverte sur vail nationaux (animation RTP38, bases de données multimédias. Il s’agit la considération de l’interprétation et la RTP39, RTP14 ?) ; Européens (ESOA, d’analyser les différentes situations pour AgentLink III, Cost 282) lesquelles une réponse précise ne peut 4. CRoss Industry Standard Process for Data être obtenue dans le cas des données Mining (www.crisp-dm.org) multimédias dans un contexte reparti. B ULLETIN DE L’AFIA 36 numéro 60 - juillet 2005 LABORATOIRES

Sur la base de cette analyse, nous avons modèles formels de qualité pour per- lui ressemble le plus, cela afin de pou- proposé un ensemble de constructeurs mettre une conception adaptative et voir en réutiliser la solution par adapta- qui peuvent être utilisées pour modéliser quantitative d'entrepôts multimédias; (2) tion. On s'intéresse plus particulière- les approximations et les algorithmes enrichir la sémantique des modèles d'in- ment à une application du raisonnement qui les implantent. formation des sources pour permettre la à partir de cas dans le domaine de la Entrepôts de Données Multimédias et résolution des conflits et une intégration conception mécanique assistée par ordi- Qualité de Service : Depuis son appari- simplifiée; (3) enrichir la sémantique nateur et de recherche dans les bases de tion, le rôle du multimédia dans la diffu- des modèles de schémas des entrepôts données images. sion de l'information n'a cessé de multimédias pour permettre aux croître, pour être aujourd'hui le principal concepteurs et optimiseurs de requêtes support. La problématique d'une diffu- de tenir compte de façon explicite de la Thème : Découverte sion massive et de qualité n'a toujours nature des données multimédias. de connaissances pas été résolue. Nous disposons d'un Découverte Dynamique de Services héritage volumineux de documents mul- Web : La notion de ÇWeb serviceÈ Responsable timédias (vidéo, audio, image), qui bien désigne essentiellement une application Jean-François Boulicaut sûr ne fait qu'augmenter. (un programme) mise à disposition sur Nous avons donc de grandes quanti- Internet par un fournisseur de service, et Chercheurs permanents tés d'informations multimédias en notre accessible par les clients à travers des Claire Leschi, Christophe Rigotti possession et se pose alors le problème protocoles Internet standards. Des d'organiser ces informations et de exemples de services actuellement dis- Thésards et post-docs retrouver une information particulière ponibles concernent les prévisions Hunor Albert-Lorincz , Jérémy Besson, dans tous ces documents. Face au météorologiques, la réservation de Sylvain Blachon, Clément Fauré, nombre de ceux-ci, une recherche voyage en ligne, les services bancaires Cyrille Masson (ATER), Nicolas Meger exhaustive consistant à explorer chaque ou des fonctions entières d’une entrepri- (ATER et docteur), Ruggero Pensa document est forcément impossible. Il se comme la mise en Ïuvre de la ges- est donc nécessaire de disposer d'outils tion de la chaîne logistique. Par essence, Problématique d'archivage et de modèles de structura- les services Web sont des composants Il est toujours plus facile de collecter tion permettant de rechercher efficace- logiciels autonomes et auto-descriptifs des données mais notre capacité à en ment une information donnée contenue et constituent par ce fait un nouveau extraire des informations à forte valeur dans de telles masses de documents paradigme pour la médiation d’applica- ajoutée reste limitée. Il est donc impor- multimédias. tions. Ceci a pour effet de permettre une tant de mettre au point de nouveaux Une exploitation sérieuse de cette intégration des applications plus rapide modes d'interactions avec de grands masse d'information est pratiquement et moins coûteuse et avec des perspec- volumes de données, qu’ils soient basés non réalisable sans un système logiciel tives d’évolution et de réutilisation sur des déductions ou sur des inductions intelligent. La future génération de sys- réelles pour les entreprises. L’objectif (ou généralisations). L'extraction de tèmes reposera sur la possibilité de stoc- ultime de l’approche services Web est connaissances dans les bases de données ker, d'accéder et de raisonner sur de gros de transformer le Web en un dispositif (ECBD ou Ç Knowledge Discovery in volumes d'objets multimédias (avec une distribué de calcul où les programmes Databases È) est le domaine de distribution spatiale naturelle). (services) peuvent interagir de manière recherche au sein duquel coopèrent sta- Construire un entrepôt de données mul- intelligente en étant capables de se tisticiens, spécialistes en bases de don- timédias global contribuera à résoudre découvrir automatiquement, de négocier nées et en intelligence artificielle pour des problèmes importants. entre eux et de se composer en des ser- Ç apprendre È ou expliciter des connais- Notre objectif est de développer un vices plus complexes. Ceci ouvre des sances enfouies dans les données. Nous cadre pour une Ç nouvelle génération » perspectives de recherche et de transfert considérons que l’ECBD est une évolu- d'entrepôts de données multimédias technologique à court et à moyen termes tion naturelle des bases de données au capables de supporter des traitements dans les domaines où l’interopérabilité sens où la découverte de connaissances sophistiqués sur des informations com- entre applications est fondamentale. est étudiée comme un processus d’inter- plexes. Nous cherchons à concevoir et à Mesure de la similarité de graphes rogation. Dans cette vision baptisée combiner des techniques spécifiques étiquetés : De nombreuses applications Ç Bases de données inductives È, prépa- développées dans les domaines des nécessitent d'évaluer la similarité de ration des données, fouille mais aussi bases de données et de l'intelligence deux objets, ou de trouver parmi un interprétation des motifs ou des modèles artificielle pour la manipulation d'objets ensemble donné d'objets, celui qui est le extraits sont confiés à des requêtes. A multimédias. « plus similaire » à un objet donné. Ce long terme, ce type de recherche doit Plusieurs domaines critiques où les travail a trouvé son origine dans le rai- conduire vers des langages de requêtes facteurs de qualité ont une importance sonnement à partir de cas, où pour généralistes pour l’extraction de centrale seront explorés, comme :(1) résoudre un nouveau problème, il s'agit connaissances (i.e., le Ç SQL È de l'enrichissement de la sémantique des de trouver parmi un ensemble de pro- l’ECBD est à inventer). A court terme, entrepôts d'information avec des blèmes précédemment résolus, celui qui les progrès dans cette direction sont B ULLETIN DE L’AFIA numéro 60 - juillet 2005 37 LABORATOIRES

utiles pour fournir de nouveaux outils de mels). Plus récemment, nous nous veurs de contraintes décrits dans le lan- Ç data mining È et mieux comprendre sommes intéressés à la notion de gage CHR. comment assister l’interactivité entre les concept formel tolérant aux exceptions, analystes et les données qu’ils traitent. une approche prometteuse dans le Applications. Depuis sa création en 1998, l’équipe contexte des données bruitées. La plu- Nous avons conduit plusieurs proces- s’est focalisée sur les techniques dites part des outils développés pour l’extrac- sus d’extraction de règles à partir de descriptives (non supervisées) et a privi- tion de motifs ensemblistes sont en données sur les chômeurs du Rhône légié le travail sur des données réelles, cours d’intégration dans une plate- (source ANPE), de données sur la navi- notamment dans le domaine bio-médi- forme logicielle appelée Bio++ car gation sur des sites WWW (source cal. Nous avons aujourd’hui une exper- dédiée à l’analyse de données d’expres- INSA), de la fouille de données bio- tise reconnue pour l’extraction de motifs sion de gènes. Ce prototype est suffi- médicales (participation à plusieurs séquentiels et ensemblistes sous samment fiable pour pouvoir être utilisé Ç discovery challenge È ECML/PKDD) contraintes (i.e., des motifs locaux à dans le cadre de l’enseignement et sa et de données sismiques (contrat partir desquels on peut calculer des mise à disposition pour la communauté Européen AEGIS). D’autre part, deux règles descriptives comme les règles scientifique est envisagée à court terme. conventions CIFRE ont été menées à d’association) mais aussi sur le calcul de terme, l’une sur la recherche de signa- partitions ou de bi-partitions (construc- Algorithmes et outils pour l’extrac- tures pour l’étude de renversements de tion de modèles dans le cadre de la clas- tion de motifs séquentiels. tendances dans le domaine boursier sification non supervisée conceptuelle). Nous avons également étudié l’ex- (Caisse des Dépôts) et la seconde sur la traction de motifs sous contraintes dans construction de résumés de grandes col- Résultats des données séquentielles, qu’il s’agis- lections de règles d’association Algorithmes et Outils pour l’extrac- se d’une unique mais longue séquence (Schlumberger SLB). Deux autres tion de motifs ensemblistes. d’événements (travaux sur la recherche conventions CIFRE sont en cours de Nous avons d’abord travaillé sur le de règles avec des fenêtres temporelles réalisation avec le groupe CIC pour la problème difficile mais bien posé de optimales dans le cadre du contrat recherche de motifs dans des flux finan- l’extraction de motifs fréquents dans de Européen AEGIS pour l’analyse de ciers et EADS pour des applications de très grandes matrices booléennes denses données sismiques) ou bien de bases de nos méthodes et outils au problème de la et/ou dont les données sont fortement séquences (e.g., des navigations sur un fiabilité opérationnelle d’avions. Depuis corrélées. Ceci nous a permis, entre site WWW) éventuellement très 2001, nous nous sommes beaucoup autres choses, d’étendre significative- grandes. Ainsi, nous avons conçu des investi dans le traitement de données ment les contextes d’applications poten- algorithmes pour l’extraction de motifs d’expression de gènes en coopération tielles des règles d'associations. Avec séquentiels satisfaisant une contrainte avec des biologistes du Centre de nos travaux sur les ensembles libres, de fréquence minimale (contrainte anti- Génétique Moléculaire et Cellulaire nous avons initié un courant de monotone) en conjonction avec (CGMC CNRS-UCBL UMR 5534, recherche concernant les représenta- d’autres contraintes qui ne sont pas contact : Dr. O. Gandrillon) et de l’unité tions condensées d’ensembles fréquents anti-monotones. Il s’agissait notam- INRA/INSERM 1235 (contact : Dr S. (ensembles libres et fermés, ensembles ment de prendre en compte des Rome). Les nouveaux problèmes posés v-libres, ensembles NDI, etc). Nous contraintes de similarité à un motif de mais aussi les promesses de résultats avons formalisé plusieurs de ces repré- référence ou de satisfaction d’une importants (étude de l’auto renouvelle- sentations condensées et nous avons expression régulière. ment de cellules souches, compréhen- étudié leurs usages multiples (i.e., pour Deux autres directions de travail ont sion des actions de l’insuline sur la dériver des règles d’association ou des été fructueuses sur le plan algorith- régulation des gènes chez l’homme règles de classification, pour servir de mique, Tout d’abord, nous avons propo- obèse ou souffrant d’un diabète de type base à des classifications conceptuelles, sé l’un des premiers algorithmes géné- 2) ont alors motivé non seulement des pour représenter des groupes de synex- riques d’extraction de motifs locaux applications mais aussi le développe- pression en biologie moléculaire). C’est (ensembles d’attributs) satisfaisant des ment de nouveaux algorithmiques (voir un domaine aujourd’hui bien identifié et conjonctions de contraintes anti-mono- ci-dessus) et la proposition d’une très actif, aussi bien sur un plan national tones et de contraintes monotones. Il méthode d’analyse originale (voir ci- que sur un plan international. Les appli- s’agissait d’un travail important pour dessous). Des résultats validés sur le cations à l’analyse de données d’expres- mieux comprendre les verrous scienti- plan de la pertinence biologique ont été sion de gènes (analyse du transcripto- fiques et technologiques posés par le obtenus (règles d’association décrivant me) nous ont conduit vers l’étude du cadre théorique des bases de données des interactions nouvelles entre des bi-partitionnement (calcul heuristique inductives (contrat Européen cInQ). gènes humains de tissus et organes optimisant localement l’association D’autre part, dans le cadre d’une colla- variés, concepts formels permettant entre une partition des lignes ou objets boration pluriannuelle avec l’Université d’identifier de nouvelles voies de régu- et une partition des colonnes ou attri- de Munich, nous avons développé des lation impliquant des gènes humains buts) et les applications des treillis de techniques originales pour la découverte réagissant à l’insuline). Galois (collections de concepts for- de règles utiles à la conception de sol- B ULLETIN DE L’AFIA 38 numéro 60 - juillet 2005 LABORATOIRES

Contributions méthodologiques et post-traitement de grandes collections Modélisation coopérative : de maniè- théoriques. de motifs sont développés (e.g., la re complémentaire, l’organisation et la Notre contribution théorique au visualisation de groupes de motifs simi- mise en place des processus collabora- Çdata mining » réside essentiellement laires ou l’interrogation de grandes col- tifs dans des organisations distribuées dans le rôle majeur que nous avons joué lections de motifs stockées dans des ont une influence sur les modes de pour faire émerger le cadre des bases de bases de données relationnelles). Ce tra- représentation et de structuration des données inductives, c’est-à-dire un vail se poursuit notamment dans le connaissances liées à l’objet de la cadre théorique permettant d’appréhen- cadre de l’ACI Masse de Données 46 conception. Nous étudions donc la der les processus de découverte de Bingo (2004-2007). modélisation et le lien de ces processus connaissances comme des processus en tant que partie dynamique de l’en- d’interrogation. Une grande partie du semble du système de conception colla- travail a été réalisé dans le cadre du Thème : borative, tant d’un point de vue structu- contrat Européen cInQ (FP5, IST FET Modélisation collaborative rel (nature de l’activité collaborative) 2000-26469, Mai 2001 Ð Mai 2004) qui que fonctionnel (modalités de l’échange a été coordonné par le LIRIS. Ce Responsable de données et de partage de connais- consortium a produit une soixantaine de Parisa Ghodous sances). publications scientifiques au meilleur Modélisation sémantique : la dimen- niveau international et une communauté Chercheurs permanents sion multidisciplinaire de cette activité dédiée aux bases de données inductives Lionel Médini, Denis Pallez (jusqu’au ne permet pas aux co-opérateurs de commence à émerger, notamment grâce 1/9/2005) s’entendre sur la totalité des modèles de aux ateliers internationaux que nous données et de connaissances qu’ils avons organisé. Une première ébauche Thésards et post-docs manipulent. La plupart d’entre eux sont de théorie des bases de données induc- Christel Dartigues (ATER), Kamel spécifiques à des sous-domaines parti- tives a été produite mais reste limitée à Slimani (ATER), Catarina Ferreira Da culiers. Ces modèles, qui font sens pour l’étude des motifs dits locaux. La princi- Silva (Doctorant), Patrick Hoffmann leurs auteurs et les co-opérateurs qui tra- pale contribution du LIRIS à ce cadre (Doctorant), Moisés Dutra Lima vaillent dans le même contexte, ne sont théorique a été la formalisation des (Doctorant), Samer Abdel-Ghafour pas nécessairement compréhensibles représentations exactes et approxima- (Doctorant) par les autres acteurs du processus col- tives pour les motifs ensemblistes Un laboratif. Pourtant, ils peuvent renfer- nouveau contrat Européen baptisé IQ Problématique mer des connaissances qui peuvent être (FP6, IST FET, négociation achevée) va Les connaissances mises en Ïuvre utiles à l’ensemble du processus, à s’attaquer à plusieurs des problèmes dans les processus de travail et plus par- condition d’être rendues intelligibles ouverts déjà identifiés (e.g., la construc- ticulièrement d’ingénierie collaboratifs pour chacun. Partant de ce principe, tion sous contraintes de motifs globaux requièrent une compréhension appro- nous nous intéressons à la manière de comme des partitions ou des classi- fondie des processus de construction de rendre intelligibles ces structures de fieurs). Notons aussi que dans IQ, nous structures de connaissances, de commu- connaissances à travers les différents avons décidé de privilégier les applica- nication et d’échange de données entre contextes applicatifs, en mettant notam- tions bioinformatiques pour motiver et les différents co-opérateurs travaillant ment l’accent sur l’établissement de valider nos contributions théoriques. dans des contextes applicatifs différents, liens sémantiques entre des concepts Toujours sur un plan conceptuel, nous et de résolution des problèmes de com- issus de ressources sémantiques (dic- avons mis au point, instrumenté et munication voire des conflits pouvant tionnaires, taxonomies, ontologies…) exploité une véritable méthodologie survenir dans le cadre du développe- différentes et hétérogènes et la contex- d’extraction de connaissances à partir de ment coopératif des objets. L’équipe tualisation de ces connaissances. Dans données d’expression de gènes. Il s’agit modélisation collaborative du LIRIS le même ordre d’idée, nous cherchons à d’abord de fournir des méthodes et des aborde ces thèmes sous les trois angles faire émerger de nouvelles connais- outils pour faciliter le processus de suivants. sances opérationnalisables, issues de la codage de propriétés booléennes, à par- Modélisation générique et normali- mise en relation de ces différentes struc- tir notamment des données numériques sée : l’une des approches permettant de tures de connaissances, et directement fournies (e.g., données Puces ADN). faciliter l’échange et le partage de utilisables par les applications collabo- Nous proposons ensuite d’exploiter nos connaissances est l’établissement de ratives. Nous visons donc l’interopéra- extracteurs pour calculer des collections normes et de standards partagés par bilité, au niveau sémantique, de ces de motifs a priori intéressants (associa- l’ensemble des équipes coopérantes. structures de connaissances. tions pertinentes d’ensembles de gènes Cette activité consiste à étudier, d’un et d’ensembles de situations biolo- point de vue structurel et sémantique, Résultats giques). Il s’agit enfin d’assister les dif- les modes de représentation des don- Modélisation Générique et ficiles phases d’interprétation de ces nées, informations et connaissances au Normalisée : nos premiers travaux ont motifs par les spécialistes en biologie centre du processus collaboratif et parta- concerné la résolution des problèmes moléculaire. A cette fin, des outils de gées par tous. d’échange et partage des connaissances B ULLETIN DE L’AFIA numéro 60 - juillet 2005 39 LABORATOIRES

techniques. Nous nous sommes orientés représentation des connaissances appli- ¥ Commerce électronique vers une approche de la modélisation quée aux environnements coopératifs, et ¥ Gouvernements numériques des caractéristiques technologiques des s’intéresse d’une part à l’élaboration de ¥ Handicap (Assistance à l’utilisateur) objets industriels. Dans ce cadre, nous structures de connaissances, et d’autre ¥Travail collaboratif (Ingénierie simul- avons participé au développement de la part à l’interopérabilité de celles-ci. Il a tanée) norme STEP et la norme PSL dans le débuté par l’élaboration d’une méthodo- cadre d’une collaboration soutenue logie de construction d’ontologies, Projets en cours depuis plusieurs années avec le NIST appliquée à l’intégration des deux et animation scientifique (National Institute of Standards and phases de la conception et de la concep- Technology, USA). Dans ce thème, tion des gammes. Ce travail a été réali- Projets Internationaux nous avons développé une méthodolo- sé dans le cadre d’une thèse en coopéra- Semantic Infrastructure for Content- gie originale pour la représentation inté- tion avec l’équipe de Pr. Ram Sriram du Based Access to Distributed Video grée des connaissances liées au produit NIST (Professeur au MIT) et actuelle- Material, Projet NSF (Partenaire) et aux processus associés. Cette métho- ment poursuivi dans le cadre d’une HyperLearning, GDREuropéen Plus dologie permet aux différents experts du thèse en convention CIFRE avec la (Partenaire) développement de produit de réutiliser société DataKit. Concernant l’interopé- Projet modélisation coopérative du les modèles de produit et de processus rabilité des ressources sémantiques, NIST (Partenaire) existants. Elle permet également de nous mettons en place un « référentiel transformer leurs modèles en modèles sémantique » permettant de représenter Projets Européens normalisés pour pouvoir les partager l’ensemble des ressources et des proces- AEGIS, Projet Européen IST FP5 avec les autres experts. L’équipe a cher- sus collaboratifs en présence, en tirant (Partenaire) ché à étendre cette méthodologie, en notamment partie des travaux effectués cInQ, Projet Européen IST FET FP5 introduisant le concept de projet (de dans les sous-thèmes précédents. Nous (Porteur) bien ou de service) avec établissement proposons une méthode d’« interopéra- IQ, Projet Européen IST FET FP6 des relations entre projet, produit et pro- bilisation contextualisée » des res- (Partenaire) cessus ainsi que des relations entre pro- sources sémantiques, en les positionnant COST 282, (Partenaire) jets. Ce travail a ensuite été poursuivi et les interreliant dans ce référentiel. Il PRODAEC, Projet Européen dans le cadre du projet européen PRO- s’agit également de tester et d’affiner (Partenaire) DAEC. Une thèse et un DEA ont été cette approche et de proposer une infra- e-COGNOS, Projet Européen soutenus dans ce sous-thème. structure comprenant ces différentes FUNSIEC, Projet Européen Modélisation Coopérative : les pro- étapes et permettant l’intégration de res- blèmes liés à un environnement de tra- sources sémantiques dans le référentiel Projets Nationaux vail coopératif sont identifiés pour et leur gestion dynamique. Ce travail est AMBRE, Projet STIC-SHS (Porteur) ensuite définir les différents modèles réalisé en coopération avec le CSTB Porphyre2, Projet STIC-SHS Société nécessaires au développement de dans le cadre des projets européens e- de l'Information (Partenaire) manière à être capable de gérer plu- COGNOS et FUNSIEC. Une thèse et CASES, ACI Cognitique (Partenaire) sieurs points de vue. Dans ce cadre, trois DEA ont été soutenus et trois RECIS, Projet RNTL (Partenaire) nous avons étudié plusieurs exemples du thèses sont actuellement en cours dans Bingo, ACI Masse de Données 46 développement coopératif dans le ce sous-thème. (Partenaire) domaine de la mécanique et mécatro- Projet inter-EPST Bioinformatique nique pour valider ces modèles. Un pro- Domaines d’applications (co-Porteur) totype d’infrastructure coopératif a été ¥ Mémoire d’entreprises PLEXIR, EPML du RTP 33 développé pour permettre aux experts ¥Environnements Informatiques (Partenaire) de définir leurs points de vue de maniè- d’Apprentissage Humain Confrontation de points de vue, re coopérative et de les intégrer. Pour ¥ Assistants à la décision EPML du RTP 33 (Partenaire) l’extension de ce développement nous ¥ Gestion de la connaissance (partage, Archéologie et document en architec- avons considéré le développement d’un réutilisation, collaboration) ture, ACI Cognitique (Partenaire) environnement intelligent en utilisant ¥Textes réglementaires APMD, ACI Masse de Données les techniques de l’intelligence artifi- ¥ Bibliothèques virtuelles distribuées et (Partenaire) cielle distribuée. Les projets 2IUF, multilingues SemWeb, ACI Masse de Données COSMOCE de la région Rhône-Alpes ¥Web sémantique (Partenaire) et le projet Modélisation Coopérative ¥ Documentations techniques, etc. Acteurs, ACI Education et Formation avec le NIST servent de support à cette ¥Agents réseaux (applications orien- (co-Porteur) étude. Une thèse et quatre DEA ont été tées réseaux dont aspects liés à la Abondement ANVAR (Porteur) soutenus, et deux thèses sont actuelle- sécurité) ment en cours dans ce sous-thème. ¥ Assistants web (Internet et intranet) Projets Régionaux Modélisation Sémantique : ce sous- ¥ Génome et transcriptome ISDN, Axe Ç Document vivant È thème se situe dans le domaine de la ¥ Entrepôts de données (Porteur) B ULLETIN DE L’AFIA 40 numéro 60 - juillet 2005 LABORATOIRES

ISOCELE, Projet régional Jean-Mathias Héraud, Projet d’inté- Habilitations à diriger des recherches (Partenaire) gration de l’expérience dans l’enseigne- Jean-François Boulicaut : Extraction GUIDANCE Projet régional ment à distance (2002) de connaissances dans les données - des (Partenaire) Pierre-Antoine Champin, ARDECO : méthodes ad-hoc au cadre des bases de OUVEJ Projet régional (Partenaire) Assistance à la réutilisation d’épisodes données inductives (2001). 2IUF, Projet régional (Partenaire) de conception en CAO (2002) Parisa Ghodous : Modèles et COSMOCE, Projet régional Artur Bykowski : Condensed repre- Architectures pour l’Ingénierie (Partenaire) sentations of frequent sets: application Coopérative (2002) to descriptive pattern discovery (2002) Salima Hassas : Systèmes complexes Participation à l’animation scienti- Baptiste Jeudy : Optimisation de à base de multi-agents situés (2003) fique : requêtes inductives: application à l'ex- Sylvie Calabretto : Modèles de repré- 3 Réseaux d’excellence européens : traction sous contraintes de règles d'as- sentation de la sémantique des docu- KDNet, ILP2Net, EvoNet, AgentLink II sociation (2002) ments. Applications aux Bibliothèques 11 GdR I3 (1.1, 1.2, 1.4, 2.1,2.2,2.3, Mihaela Scuturici : Contribution aux Numériques (2003) 3.1, 3.2, 3.3, 4.1, 6.1, 6.2, 6.3) techniques orientées objet de gestion Christophe Rigotti : Exploration d'es- RTP 5 AS (Porteur d’une AS, partici- des séquences vidéo pour les serveurs paces de motifs (2004) pant à 2 AS) Web (2002) RTP 9 (Bases de Données et Serge Fenet, Vers un paradigme de d’Informations hétérogènes programmation écologique basé sur une Bibliographie Distribuées) [AS Personnalisation de architecture mobile distribuée : applica- l’information - Participant] tion à la sécurité des réseaux (2001) Sélection de publications significa- RTP 12 AS (Participant aux AS Aurélien Bénel : Consultation assis- tives en MSD (parmi environ 70 depuis GaFoDonnées et ASAB, porteur de tée par ordinateur de la documentation 2001) l’AS Disco Challenge) en Sciences Humaines : Considérations RTP 33 (Documents et contenu : épistémologiques, solutions opératoires C. ROUSSEY, S. CALABRETTO, J.M. PINON. A new model of Conceptual Graph création, indexation, navigation) et applications à l'archéologie (2003) Adapted for Multilingual Information [Porteur d’une AS, EPML] Thomas Daurel : Représentations Retrieval Purposes. Proceedings of the 12th RTP 34 (Handicaps) Participant condensées d'ensembles de règles d'as- International Conference on Database and RTP 38 (Processus cognitifs & sociation (2003) Expert Systems Applications construction du sens)[Noyau] Abraham Alvarez : Serveur actif pour DEXA'2001,Technical University of Organisation de conférences interna- la gestion de la cohérence de documents Munich (Germany), September 3-7 2001 Lecture Notes in Computer Science LNCS tionales : ECML/PKDD 2004, ECAI (2003) N¡2113, pp. 92-101 2002, ISMIS 2002, ISPE/CE 2000, Elöd Egyed-Zsigmond : Gestion des C. ROUSSEY, S. CALABRETTO, J.M. DCMCE 2002, STAIRS 2002 et natio- connaissances dans une base de docu- PINON. SyDoM: A Multilingual nales (6) ments multimédias (2003) Information Retrieval System for Digital Luc Damas, Modélisation des proces- Libraries. Proceedings of International sus de mémorisation pour le développe- Conference EP'2001 (Electronic Publishing), 5-7 july 2001, University of ment d’un assistant générique à la remé- Kent at Canterbury, United Kingdom, pp. Thèses et HDR moration de l’apprentissage humain 150-164 (2003) A. BENEL, E. EGYED-ZSIGMOND, Y. Thèses de doctorat Denis Jouvin, Délégation de Rôle et PRIE, S. CALABRETTO, A. MILLE, A. Lobna Jeribi : Aide à la recherche Architectures Dynamiques de Systèmes IACOVELLA, J.M. PINON. Truth in the documentaire adaptée à l’utilisateur : Multi-Agents Conversationnels (2003) Digital Library: From Ontological to Hermeneutical Systems. Proceedings of the approche par réutilisation d’expé- David Jouve : Modélisation séman- Fifth European Conference on Research and riences. Cas d’application : accès au tique de la réglementation (2003) Advanced Technology for Digital Libraries, contenu de documents scientifiques par Marion Leleu : Extraction de motifs ECDL’2001, Darmstadt, September 4-9, les déficients visuels (2001) séquentiels sous contraintes dans des 2001. Lecture Notes in Computer Science, Cécile Nicolle : Système d'accès à des données avec répétitions consécutives Vol. 2163, Springer Verlag. pp.366-377. bases de données hétérogènes réparties (2004) D. JOUVE, B. CHABBAT, Y. AMGHAR, J- M. PINON, Modélisation sémantique de la en vue d'une aide à la décision Nicolas Meger : Recherche automa- réglementation, Ingénierie des Systèmes (SABaDH) (2001) tique des fenêtres temporelles optimales d’Information, Hermès Sciences, 6 : 95-119, Catherine Roussey : Une méthode de motifs séquentiels (2004) 2001. d’indexation sémantique adaptée aux Imad Elkhalkhali : Système intégré L. JERIBI, B. RUMPLER, J.M. PINON. corpus multilingues (2001) pour la modélisation, l’échange et le User Modelling and Instance Reuse for Vasile-Marian Scuturici : Utilisation partage des données de produit (2002) Information Retrieval Study Case : Visually Disabled Users Access to Scientific efficace des serveurs Web en tant que Christel Dartigues : Système de ges- Documents. International Conference serveurs vidéo pour des applications de tion de données techniques dans un FLAIRS 2002, Penscola, USA, May 16- vidéo à la demande (2001) environnement coopératif (2003) 18th, AAAI Press Proceedings of the B ULLETIN DE L’AFIA numéro 60 - juillet 2005 41 LABORATOIRES

Fifteenth International Florida Artificial Nancy, 28-29 avril 2005, Vandoeuvre les Portinale, editors, European Conference on Intelligence research Symposium Nancy. Case-Based Reasoning, Lecture Notes in Conference, pp 51-56 S. NOGRY, S. JEAN-DAUBIAS, N. Artificial Intelligence, number 1898, pages A. BENEL, S. CALABRETTO, A. IACO- DUCLOSSON. ITS evaluation in class- 86--98. Springer, Berlin, 2000 VELLA, J.M. PINON. Porphyry 2001: room: the case of the Ambre ITS. ITS 2004, Semantics for scholarly publications retrie- Springer ed., Maceio, Brasil, p.511-520 Sélection de publications significa- val. Proceedings of the thirteenth O. AUBERT, Y. PRIÉ. From video informa- tives du thème RCRBD International Symposium on Methodologies tion retrieval to hypervideo management. In for Intelligent Systems [ISMIS], Lyon, June International Workshop on Multidisciplinary S. HAMMICHE , S. BENBERNOU, M-S 26-29, 2002. Lecture Notes in Artificial Image, Video, and Audio Retrieval and HACID AND A. VAKALI. Semantic Intelligence, Vol. 2366, Springer Verlag. Mining. Sherbrooke-Canada, October 25-26 Retrieval of Multimedia Data. The Second pp.351-361. 2004 ACM International Workshop on V. GUILLET, B. RUMPLER, J.M. PINON. S NOGRY, S JEAN-DAUBIAS, M OLLA- Multimedia Databases. November 13, 2004. Providing Help for Visually Impaired GNIER-BELDAME. Évaluation des EIAH : Washington DC. USA. People's Navigation in an Urban une nécessaire diversité des méthodes, TICE E. BERTINO, MS HACID AND F TOUMA- Environment using GPS. 8th International 2004, Compiègne, Novembre 2004, pp. 265- NI. Towards Structures Discovery in Video Conference on Computers Helping People 271. Data. Journal of Experimental and with Special Needs– ICCHP’02 conference, DUCLOSSON N. Représentation des Theoretical Artificial Intelligence, special Linz -Austria, published in Springer's connaissances dans l’EIAH AMBRE-add. issue Knowledge Discovery. Volume 17, Lecture notes in Computer Science, July 15 Technologies de l'Information et de la Number 1-2, January Ð June 2005. pages 5- - 20th, LNCS 2398, pp. 429-436, 2002 Connaissance dans l’Enseignement supé- 18. 2005. D. JOUVE, Y. AMGHAR, B. CHABBAT, J- rieur et l'industrie, TICE’2004, Compiègne, E. BERTINO, J. FAN, ELENA FERRARI, M. PINON. Conceptual Framework for 20-22 octobre 2004, p. 164-171. MS. HACID, AK. ELMAGARMID AND Document Semantic Modelling: An ARMETTA F., HASSAS S., PIMONT S., X. ZHU. A Hierarchical Access Control Application to Document and Knowledge GONON E. Managing dynamic flow in pro- Model for Video Database Systems. In ACM Management in the Legal Domain, Data & duction chains through self-organization. Transactions on Information Systems Knowledge Engineering, Elsevier Science, 2nd International Workshop on Engineering (TOIS). Volume 21. Issue 2. Pages 155-181. 46(3) : 345-375, 2003. Self-Organising Applications (ESOA'04), April 2003. T. ACCARY,A. BENEL, S. CALABRETTO, AAMAS'04, Juillet 2004, New York E. BERTINO, T. CATARCI, A.K. ELMA- A. IACOVELLA. Confrontation de points N. FOUKIA, S. HASSAS. Organising GARMID AND M.S. HACID. Quality of de vue sur des corpus documentaires : Le Systems Nature-inspired approaches to soft- Service Specification in Video Databases. cas de la modélisation du temps archéolo- ware engineering. Chapter “Managing IEEE Multimedia, Vol. 10, Number 4, pages gique. Actes du 14ème Congrès francopho- Computer Networks Security through Self- 71-81, October-December 2003. ne de Reconnaissance des formes et Organization: a Complex System E. BERTINO, A.K. ELMAGARMID AND d'Intelligence artificielle, RFIA 2004, Perspective, in G. DI MARZO SERUGEN- M.S. HACID. Path and Ordering Toulouse, 28 au 30 Janvier 2004, pp. 197- DO, A. KARAGEORGOS, O. F. RANA, F. Constraints over Semistructured Data. 205 ZAMBONELLI, (Eds), LNAI volume # Journal of Intelligent Information Systems V. GUILLET, B. RUMPLER, J.M. PINON. 2977, Springer Verlag, 2004 (JIIS). Kluwer Academic Publishers. Modélisation de l'utilisateur et exploitation PA. CHAMPIN, Y. PRIÉ, A. MILLE, Volume 20, Issue 3, pages 181-206. March dans un système "adapté" d'aide au déplace- MUSETTE. Modelling USEs and Tasks for 2003. ment piéton. Revue RSTI Série ISI (ED. Tracing Experience. Proc. From structured E. BERTINO, A.K. ELMAGARMID AND Hermes Ð Lavoisier), Volume 9, N¡ 2/2004 cases to unstructured problem solving epi- M.S. HACID. A Database Approach to pp 107 à 128 sodes - WS 5 of ICCBR'03, Trondheim Quality of Service Specification in Video R. ABASCAL, B. RUMPLER, J.M. PINON. (NO) , NTNU, Trondheim (NO) , pp279- Databases. Sigmod Record. Volume 32, Information Retrieval in Digital Theses 286, June 2003 Number 1. March 2003.7 Based on Natural Language Processing A. STUBER, S. HASSAS, A. MILLE. MS HACID, F. TOUMANI AND A.K. Tools. J.L. Vicedo et al. (Eds): España for Combining MAS and Experience Reuse for ELMAGARMID. Constraint-Based Natural Language Processing (EsTAL’04), assisting collective task achievement. Approach to Semistructured Data. LNAI 3230, pp. 172-182, Springer-Verlag ICCBR’03-WS5 – June 2003 - Trondheim, Fundamenta Informaticae Journal, Vol. 47 Berlin Heidelberg, October 2004, Alicante, Norway N¡ 1-2, pages, 53-73, 2002. Spain. JM HÉRAUD, A. MILLE. Pixed: towards B. BENATALLAH, MS HACID, A. LEGER, A. BENEL, S. CALABRETTO. Ontologies the sharing and the re-use of experience to C. REY, F. TOUMANI. On automating Web … déontologie : réflexion sur le statut des assist training. In EDMEDIA 2002, AACE, services discovery. VLDB J. 14(1): 84-96 modèles informatiques. Rivista Ç Linguistica Denver, pp 777-782 (2005). Computazionale È. Volume XX-XXI. 2004, L. DAMAS, R. VERSACE ET A. MILLE. Le E. CANAUD, S. BENBERNOU, MS pp.31-47 rôle de l'amorçage dans la remémoration : HACID. Managing Trust in Active XML. Expérimentations pour une application au IEEE SCC 2004: 41-48. Sélection de publications significa- assistants informatiques. in Actes de CJC4, S. BENBERNOU, E. CANAUD, MS tives du thème CEXAS (parmi environ Estigma, Lyon, mai 2001 HACID, F. TOUMANI. A Hybrid Approach 80 depuis 2001) B. FUCHS, J. LIEBER, A. MILLE, AND A. to Semantic Web Services Discovery. NAPOLI. An algorithm for adaptation in Intelligent Information Systems 2004: 505- J. LAFLAQUIERE, P.A. CHAMPIN, Y. case-based reasoning. In Werner Horn, edi- 512. PRIE, A. MILLE. Approche de modélisation tor, Proceedings of ECAI'2000, pages 45-- S. SORLIN, C. SOLNON. Une contrainte de l’expérienece d’utilisation de systèmes 49. IOS Press, Amsterdam, 2000 globale pour le problème de l'isomorphisme complexes pour l’assistance aux tâches de B. FUCHS AND A. MILLE. Representing de graphes. Dans dans « 13èmes Journées veille informatiquement médiées. Confé- knowledge for case-based reasoning: the Francophones de Programmation en rence ISKO-France, 2005, INIST/CNRS rocade system. In Enrico Blanzieri and Luigi Logique et de programmation par B ULLETIN DE L’AFIA 42 numéro 60 - juillet 2005 LABORATOIRES

Contraintes (JFPLC 2004) È, à paraître, Juin European Conference on Principles and P. GHODOUS, M. SOBOLOWSKI, Editors 2004. Practice of Knowledge Discovery in of “CE3: Smart and Concurrent Integration S. SORLIN ET C. SOLNON. A global Databases PKDD 2003, Cavtat-Dubrovnik of Product Data, Services, and Control constraint for graph isomorphism problems. (Croatia), September 2003 Springer-Verlag Strategies”, Juin 2005, Omnipress publi- In Ç the 6th International Conference on LNAI 2838. pp. 303-314. shers, USA. Integration of AI and OR Techniques in S. ABDENNADHER, C. RIGOTTI. C. FERREIRA DA SILVA, L. MEDINI, S. Constraint Programming for Combinatorial Automatic generation of rule-based ABDELGHAFOUR, P. HOFFMANN, P. Optimisation Problems (CP-AI-OR 2004) È constraint solvers. ACM Transactions on GHODOUS. Interoperability of heteroge- Springer Verlag Avril 2004. Computational Logic. ACM Transactions on neous semantic resources. InterDB’2005, Computational Logic 5(2):177-205, 2004. International Workshop on Database J-F. BOULICAUT , O. GANDRILLON Interoperability, April 2005, Namur Sélection de publications significa- (Coordinateurs) Informatique pour l’analyse Belgium. Numéro spécial de la revue du transcriptome, Hermes Science ELSEVIER's ENTCS, Electronic Notes in tives en ECBD (parmi environ 60 Publishing, Traité IC2, Juillet 2004. 310 Theoretical Computer Science”. depuis 2001) pages. K. SLIMANI, P. GHODOUS, J.F. BOUJUT. R. PENSA, J. BESSON, J-F. BOULICAUT. Knowledge management for Cognitive A. BYKOWSKI, C. RIGOTTI. A condensed A methodology for biologically relevant pat- Synchronization in collaborative design. representation to find frequent patterns. tern discovery from gene expression data. ICE2005, Munich, June 2005. Proceedings ACM Symposium on Principles Proceedings International Conference on C. DARTIGUES, P. GHODOUS. Product of Database Systems PODS 2001, May 21- Discovery Science DS 2004, Padova, Italy, Data Exchange using Ontologies. Artificial 24, 2001, Santa Barbara (USA). pp. 267- October 2004. Springer-Verlag LNAI 3245, Intelligence in Design ’02, Cambridge 273. pp. 230-241. University, UK, 13-15 July 2002. S. ABDENNADHER, C. RIGOTTI. Toward C. MASSON, C. ROBARDET, J-F. BOULI- C. DARTIGUES, C. LIMA, L. MEDINI, P. Inductive Constraint Solving. Proceedings CAUT. Optimizing subset queries: a step GHODOUS. Ontology Based Tool for International Conference on Principles and towards SQL-based inductive databases for Knowledge Management and Practice of Constraint Programming CP'01, itemsets. Proceedings 2004 ACM Interoperability between Enterprises. 10th Paphos (Cyprus), November 2001. Springer- Symposium of Applied Computing International Conference on Concurrent Verlag LNCS Volume 2239. pp. 31-45. (SAC'2004), Special Track on Data Mining, Engineering, Research and Application’03, B. JEUDY, J-F. BOULICAUT. Optimization March 2004, Nicosia, Cyprus. pp. 535-539. Madeira Island, Portugal, July 2003. of association rule mining queries. N. MEGER, C. RIGOTTI. Constraint-based C. FERREIRA DA SILVA, L. MEDINI, P. Intelligent Data Analysis journal, 6(4):341- mining of episode rules and optimal window GHODOUS. Conflict Mitigation for 357, 2002. sizes. Proceedings European Conference on Collaborative Design. CE2004, Beijing, J-F. BOULICAUT, A. BYKOWSKI, C. Principles and Practice of Knowledge China, 22-26 July 2004. RIGOTTI. Free-sets: a condensed represen- Discovery in Databases PKDD 2004, Pisa, P. GHODOUS, M. MARTINEZ. Product and tation of boolean data for frequency query Italy, September 2004. Springer-Verlag Process Modeling in a Cooperative approximation. Data Mining and LNAI volume 3202, pp. 313-324. Environment. In International Journal of Knowledge Discovery 7(1):5-22, 2003. J. BESSON, C. ROBARDET, J-F. BOULI- Internet and Enterprise Management”, Vol. A. BYKOWSKI, C. RIGOTTI. DBC: a CAUT, S. ROME. Constraint-based concept 1, No.3, April 2003, pages 336-349. condensed representation of frequent pat- mining and its application to microarray L. DESHAYES, C. DARTIGUES, P. GHO- terns for efficient mining. Information data analysis. Intelligent Data Analysis jour- DOUS, J.F. RIGAL. Collaborative System Systems 28(8):949-977, 2003. nal 9(1):59-82, 2005. for Cutting Data Management. International H. ALBERT-LORINCZ, J-F. BOULICAUT. Journal of Concurrent Engineering : Mining frequent sequential patterns under Sélection de publications significa- Research and Applications (CERA), Volume regular expressions: a highly adaptive stra- tives du thème MC (parmi environ 40 11, Number 1, March 2003, pages 27-36. tegy for pushing constraints. Proceedings C. FERREIRA DA SILVA, L. MEDINI, P. SIAM International Conference on Data depuis 2001) GHODOUS. Atténuation de conflits en Mining SDM'03, San Francisco (USA), May conception coopérative. 15ème journée 1-3, 2003. pp. 316-320. P. GHODOUS, Series Editor, R. GON- francophones d’Ingénierie des M. LELEU, C. RIGOTTI, J-F. BOULI- CALVES, J. CHA, A. STEIGER, Editors of Connaissances (IC2004), 5-7 mai 2004, CAUT, G. EUVRARD. Constraint-based “Enhanced Interoperable Systems”, A.A. Lyon, France. sequential pattern mining over datasets with Balkema Publishers, 2003, ISBN 90 5809 consecutive repetitions. Proceedings 623 8

B ULLETIN DE L’AFIA numéro 60 - juillet 2005 43 LABORATOIRES

Knowledge Innovation Research Center d’ARCELOR

Aceralia, Centro de Desarrollo Tecnológico. Apartado 90. E-34 000 Avilés Espagne

Directeur : François-Marie Lesaffre Directeur Adjoint: Nicolas de Abajo Ingénieurs : Jose Arancon, Diego Diaz, Francisco Lago, Jan Van Hoecke

Introduction Knowledge Discovery et Knowledge réduire la dispersion du modèle chargé Management. du calcul des enfournements permettant Le Centre KiN (Knowledge Dans cette optique, nous sommes de produire l’acier à la nuance désirée. Innovation) a été créé en début 2004 ouverts à la collaboration avec des par- L’objectif industriel est de réduire les avec la finalité de valoriser les connais- tenaires qui peuvent nous apporter l’ex- coûts de production et d’améliorer la sances de l’entreprise. Valorisation par pertise des développements les plus qualité de l’acier. L’objectif technique et pour l’innovation du Groupe. récents de la Recherche. est de réduire l’imprécision constatée Il s’inscrit dans la poursuite des déve- dans les prédictions du modèle. Elle a loppements et réalisations menées dans deux sources, d’une part l’imprécision Arcelor depuis 2 décennies. 1. Knowledge Engineering (et parfois les erreurs) des mesures et Arcelor est le résultat d’une fusion d’autre part l’incomplétude du modèle. réalisée en 2002 entre 3 groupes indus- Nous englobons dans ces activités ce L’application mettra en Ïuvre des tech- triels : Aceralia, Arbed et Usinor qui qui a trait à la réalisation de systèmes à niques de réconciliation de données chacun avait développé des compé- bases de connaissances / systèmes pour réduire la première et des tech- tences en IA et des développements experts. niques d’adaptation pour la seconde. La significatifs. Réconciliation de Données consiste à Ces développements avaient princi- Applications trouver le vecteur de données d’entrée palement lieu dans le domaine de la pro- Développement d’un système d’aide d’un modèle le plus proche possible des duction industrielle : process, approvi- à la décision dans le domaine du process mesures dans leur domaine d’impréci- sionnement, qualité, produit. Ces de fabrication de l’acier pour boîte bois- sion et qui satisfasse ledit modèle. La actions continuent au sein d’Arcelor qui son. L’acier nécessaire pour ce produit sortie du modèle (de prédiction par a souhaité se doter de moyens de R&D est extrêmement fin et donc susceptible exemple) ´peut être améliorée en utilisa- pour adresser les questions de l’entrepri- d’être plié en cas de forte traction tion le vecteur réconcilié en lieu et place se au sens plus général : comment rédui- (comme une feuille de papier). Le projet du vecteur mesuré. Quant aux tech- re la durée du processus complet depuis vise à recueillir les connaissances opéra- niques d’adaptation, le problème essen- la commande jusqu’à l’encaissement ? toires, à les modéliser dans une ontolo- tiel que nous devons résoudre est la défi- Le Groupe a ainsi mis en oeuvre les gie, et à les mettre en œuvre pour les nition d’une distance entre cas de techniques et les méthodes de l’IA dans opérationnels. L’objectif est de réduire production afin d’utiliser des techniques les années 90 - 2000 dans le domaine la formation de ces défauts en les antici- largement inspirées du CBR. industriel, il souhaite maintenant l’ap- pant et en y remédiant. D’autres systèmes sont à l’étude dans pliquer au domaine business. Cela étant, Réalisation d’un système d’aide à la le domaine de la conception des pro- l’équipe KiN récente, se développe au décision pour un opérateur dans le duits et de leur mise en Ïuvre. début sur les thèmes industriels, mieux domaine de la logistique. Il s’agit d’op- connus. timiser des convois de transport sur rail Ontologies Les activités de KiN sont fondamen- de produits liquides entre 2 ateliers dis- Pour chacun de ces projets, nous met- talement de la Recherche Appliquée : tants de plus de 20 km. L’objectif est de tons en œuvre une méthodologie basée nous visons à mettre en œuvre les tech- diminuer la perte de température par une sur KADS. Le Modèle Conceptuel sera nologies de l’IA pour le Groupe, dans le meilleure affectation des transports et écrit sous forme d’Ontologies. Nous respect de sa stratégie de développe- une meilleure utilisation des lignes de envisageons, si les résultats des pre- ment. Ces activités s’organisent autour chemin de fer. miers tests sont encourageants de systé- de 3 axes: Knowledge Engineering, Une troisième application vise à matiser leur usage afin de construire B ULLETIN DE L’AFIA 44 numéro 60 - juillet 2005 LABORATOIRES

petit à petit une Ontologie du Domaine 2. Knowledge Discovery avec un niveau de service adéquat de sidérurgique. l’IHM. Le souci majeur exprimé dans Le défi auquel nous pensons nous Nous entendons ici les techniques ces activités concerne la productivité de attaquer est double, considérant au préa- permettant d’extraire de l’information l’expert (ou plutôt des experts) afin que lable que nous trouverons sur le marché symbolique à partir de données numé- leur expertise puisse se concentrer sur la ou dans le milieu académique les outils riques. compréhension des phénomènes et leur ayant la puissance de représentation traitements et non dans l’analyse des nécessaire. Le premier consiste en la Applications informations brutes. méta-ontologie du domaine permettant Nous menons actuellement une étude Dans ce domaine, nous appliquons la 1 le développement et l’intégration har- concernant l’état de l’art en matière de méthode CRISP-DM . monieux des ontologies, qui seront reconnaissance automatique d’anoma- développées sur le moyen terme, avec lies dans un corpus de larges données. probablement des équipes distinctes. Le L’objectif est de pouvoir identifier des 3. Knowledge Management second, qui lui est lié, est la probléma- événements significatifs pouvant tique de la maintenance, traditionnelle- conduire d’une part à déclassifier des Dans cette activité, nous considérons ment peu abordée dans les recherches produits qui n’auraient pas la qualité la connaissance comme un objet à mani- universitaires mais essentielle dans les requise et d’autre part d’améliorer les puler et pour lequel le sujet majeur applications industrielles, considérant process existants par la compréhension concerne le flux de gestion et la mise à qu’une bonne part des budgets de déve- de telles anomalies. disposition des connaissances pour les loppements de Systèmes d’Information Les process industriels sont à ce jour activités des acteurs de l’entreprise. (SI) est accaparée par les coûts récur- d’un très bon niveau de qualité, on peut rents des applications à maintenir. donc en identifier un modèle de bon Applications fonctionnement et en déduire les La première application concerne la Contraintes et méthodes situations d’anomalies. mise en œuvre d’un moteur de La mise en œuvre de Systèmes Notre propos est de tester à la fois les recherche du commerce adapté à la d’Information suit, dans le Groupe, une algorithmes disponibles dans les centres population des chercheurs d’Arcelor règle d’économie de bon sens : il faut de recherche ou les universités ainsi que afin de les aider dans leurs travaux être capable de faire du copy-enginee- les produits du marché. Les SPC d’établissements d’état de l’art (veille ring. Les systèmes à bases de connais- (Statistical Process Control) étant déjà ponctuelle). sances, en tant que SI doivent faire de fortement diffusés dans Arcelor, nous Nous nous sommes efforcés d’identi- même. Les modèles de connaissances nous intéressons aux algorithmes de fier les caractéristiques du travail du doivent donc être génériques et les traitement multi-variables. On mention- chercheur afin de proposer une ergono- développements faits, réutilisables. La nera la Maîtrise Globale des Processus, mie adéquate aux besoins – et conforme généricité est la propriété qu’ont les l’utilisation des Self Organized Maps, aux standards actuels. connaissances modélisées de s’appli- des Support Vector Machines ou des La difficulté majeure à laquelle nous quer indépendamment de la ligne, ou Moindres géneralisés, parmi d’autres. sommes confrontés est le traitement des plus exactement pour n’importe quelle D’autres applications ponctuelles ressources linguistiques permettant ligne de production. Cette propriété per- sont en cours pour lesquelles l’applica- d’une part de catégoriser correctement met le déploiement maîtrisé des applica- tion au premier niveau des techniques les documents et d’autre part de propo- tions, elle a également l’avantage de statistiques s’avère insuffisant et requiè- ser des moyens de gérer le multilinguis- garantir la pertinence d’une application rent l’utilisation des statistiques avan- me de façon économique et pérenne. dans le temps. La réutilisabilité est la cées (ANN par exemple) ou d’autres Nos travaux en ce domaine suivent 2 propriété qu’ont les composants des SI techniques d’apprentissage. axes : l’utilisation des ontologies (cf. ci- d’être utilisés pour d’autres applica- dessus) et la gestion de dictionnaires. tions. Framework Notre idée est de disposer d’outils adé- Ce qui nous guide à long terme est de quats pour la gestion, permettant l’im- disposer pour l’expert d’une boîte à outils qui lui permet de choisir celui qui 1. CRoss Industry Standard Process for Data est le plus adapté à la tâche à mener, Mining (www.crisp-dm.org) B ULLETIN DE L’AFIA numéro 60 - juillet 2005 45 LABORATOIRES

portation dans les moteurs de recherche d’acier afin de prendre en compte dès la des relations étroites avec les Centres que nous utilisons. conception les contraintes de produc- Universitaires, en Europe, à même d’ap- La seconde application concerne le tion. porter les concepts et les technologies problème du départ en retraite et la perte Une autre aide à la conception de de demain dans ces domaines. de connaissances conséquente pour tôles grâce à une combinaison de l’entreprise. Ce projet visera d’une part réseaux de neurones et d’algorithmes Références. à recueillir les connaissances précieuses génétiques. qui doivent rester dans le Groupe et D’autres applications ont été dévelop- [1] Introduccio_n a la inteligencia artificial : d’autre part à mettre en place méthodes pées dans le domaine de l’optimisation. sistemas expertos, redes neuronales artifi- ciales y computacio_n evolutiva Rau_l et outils pour permettre la capitalisation Pino Diez, Alberto Go_mez Go_mez, future. Nicola_s de Abajo Marti_nez. Conclusions. Editor/impresor Universidad de Oviedo, KiN RC est un jeune centre de 2001. (B. Informa_tica) 4. Arcelor et l’IA recherche en IA appliquée pour un [2] KDD 2004:Nicolás de Abajo, Alberto B. Diez, Vanesa Lobato, Sergio R. Cuesta: Groupe industriel. Son objectif est ANN quality diagnostic models for packa- Le Centre KiN bénéficie de l’investis- d’identifier, recueillir, modéliser, mettre ging manufacturing: an industrial data sement important fait par Arcelor dans en Ïuvre et valoriser les connaissances mining case study. 799-80 le domaine de l’IA. du Groupe dans une optique de rupture. [3] Systèmes d'aide à la conduite des procé- Citons le projet Sachem, l’un des dés industriels. François-Marie Lesaffre, investissements les plus importants dans Son ambition est d’attaquer des Claude Thirion and Laurent Baudouin. Mécanique & Industries , Volume 1, Issue 5, le domaine de l’IA au siècle précédent domaines jusqu’alors peu investis par October 2000, Pages 447-455 qui a produit un système d’aide à la ces techniques, comme le service [4] Dolenc N., Gobrecht A., Libralesso J.M., conduite équipant 6 hauts-fourneaux (vendre du savoir et pas seulement des Helleisen M. , Lallier M. , Steiler J.M., d’Arcelor. La plateforme a été réutilisée bobines d’acier) ou les fonctions sup- Lemuet D., Lesaffre F.M. et Thirion C. , Ç pour d’autres applications, notamment port de l’entreprise (achats, commerce, The Sachem Project : a Computer Assisted Control System - Prospects and pour la conduite du bain de galvanisa- finances etc.), et d’initier / supporter des Opportunities, Development and Initial tion. développements dans les domaines plus Results È, Proceedings of the 6th Une modélisation approfondie des traditionnels que sont la production International Conference on Man-Machine défauts possibles de fabrication (qui a industrielle. Interaction and Intelligent Systems in valu a son auteur l’intranet d’or en En tant que centre de recherche appli- Business - Montpellier, France, May 28-30, 1999) est disponible aux concepteurs quée, KiN RC a pour vocation a nouer 1997, pp 255-259

Vos cours sur le PortAI Les enseignants et chercheurs sont invités à mettre leur cours à disposition des utilisateurs du PortAI : http : //www.afia-france.org Si vous êtes membre de l’AFIA, cela consiste à mettre un fichier (par exemple, ppt) dans votre espace « valise » et à mettre un lien hypertexte dessus à partir de votre page personnelle. Signalez nous par email votre contribution !

B ULLETIN DE L’AFIA 46 numéro 60 - juillet 2005 REVUE BIBLIOGRAPHIQUE

Introduction à la logique - Théorie de la démonstration (cours et exercices corrigés)

René David, Karim Nour et Christophe Raffalli (Université de Savoie à Chambéry), Dunod, Paris, 2001.

Recension par Amédéo Napoli (LORIA).

Voici un livre dont la chronique aurait du être faite depuis considérations peut-être plus pragmatiques, et traite du calcul longtemps, mais les contraintes du marché aidant, la voilà qui des séquents et les rapports avec la déduction naturelle intro- arrive seulement. Ce livre d'introduction à la logique est avant duite au chapitre un. Le chapitre six passe aux logique d'ordre tout destiné aux étudiants mathématiciens, qu'ils suivent un supérieur, qui ont toute leur importance même si elles ne sont master de mathématiques ou d'informatique. Il est censé - pas si simples à appréhender. Dans le chapitre, des exemples selon les auteurs - être utile aux étudiants voulant mieux sont proposés comme les logiques et arithmétique du second connaître la « grammaire » du raisonnement, et partant il ne ordre, et les nombres réels. Le chapitre sept enfin porte sur la peut qu'intéresser les gens d'intelligence artificielle, ainsi démonstration automatique, et il est peut-être le chapitre le qu'être une introduction à la théorie de la démonstration, enco- plus en rapport avec l'intelligence artificielle (sachant que sa re une raison de son intérêt en intelligence artificielle. lecture est tout de même préparée par les chapitres précé-

Le livre s'articule autour de sept chapitres qui vont des dents). Y sont abordées l'unification, la méthode des tableaux notions de formule et de démonstration à la démonstration sémantiques et la méthode de résolution. Une annexe décrit le automatique, en passant par la logique intuitionniste, le calcul logiciel Phox, compagnon du livre (site www.lama.univ- des séquents et les logiques d'ordre supérieur. Le premier cha- savoie.fr/~RAFFALLI/ PhoX.html toujours actif). pitre détaille minutieusement les notions de formules et de démonstration au premier ordre, suivi d'une bonne trentaine L'utilisation de ce logiciel permet d'obtenir des preuves et d'exercices, ce qui est le cas d'ailleurs pour tous les chapitres, d'illustrer les méthodes présentées dans le livre. exercices dont le corrigé figure en fin d'ouvrage. Si ce premier chapitre porte plutôt sur la syntaxe, le deuxième chapitre est Au final, ce livre présente quelques similarités avec l'ou- en rapport avec la sémantique et aborde le problème de la vrage plus ancien de René Cori et Daniel Lascar (Logique complétude de la logique du premier ordre : peut-on prouver mathématique, 2 tomes, Masson, 1993) avec un caractère ici tout ce qui est vrai et réciproquement. Le chapitre trois pro- volontairement plus didactique peut-être, et avec l'ouvrage pose des exemples de théories, comme celles de l'arithmétique plus récent de Pierre Marchand (Mathématiques discrètes, de Peano (liée à la démonstration du théorème de Gödel) et la Dunod, Paris, 2003), dont ils sera question dans une prochai- théorie des ensembles de Zermolo Fraenkel. Le chapitre se ne chronique) ; il pourrait compléter pour certaines parties le termine par une discussion sur les phénomènes d'incomplétu- de (toujours le théorème de Gödel), les paradoxes et la déci- livre de Daniel Kayser sur la représentation des connaissances dabilité. Le chapitre quatre aborde la logique intuitionniste et par exemple (La représentation des connaissances, Hermès, les modèles de Kripke (les preuves constructives). 1997). C'est donc là un bon livre de mathématiques, qui doit servir aux informaticiens théoriciens et que le spécialiste d'in- Le chapitre passe en revue les cas du calcul des proposi- telligence artificielle pourra consulter avec profit pour obtenir tions, du calcul des prédicats et donne l'exemple classique de des premiers détails sur des thèmes précis en logique. l'arithmétique de Heyting. Le chapitre cinq revient à des

B ULLETIN DE L’AFIA numéro 60 - juillet 2005 47 REVUE BIBLIOGRAPHIQUE

Aléatoire et presqu’aléatoire en IA

Recension par Olivier Teytaud (LRI), avec remerciements à Sylvain Gelly et aux éditeurs du bulletin.

Ce groupe thématique de recensions présente une sélection arbitraire de quelques livres qui me plaisent particulière- ment quant à l’aléatoire et les voisins de l’aléatoire pour l’IA. La théorie de l’apprentissage, incluant le processus empirique, est particulièrement à l’honneur ; le quasi-aléatoire et la théorie des sondages sont aussi présents. Nous espérons ces éléments utiles dans différents cadres, la fouille de données et la théorie de l'apprentissage notamment (significativement affectées par chacun des livres cités), mais aussi l'optimisation (e.g. l'apprentissage par renforce- ment lié au processus empirique tel qu'étudié dans le livre de A.W. Van Der Vaart et J.A. Wellner, les algorithmes génétiques concernés par les suites à faible dispersion définies dans le livre de H. Niederreiter).

Random Number Generation and Quasi- 2. Table des matières commentée Monte-Carlo method, Harald Niederreiter, La table des matières est comme suit : ¥ Monte-Carlo methods and Quasi-Monte-Carlo methods SIAM, CBMS 63, 1992, 241p, ISBN (introduction claire et nette au calcul d’intégrales par 0898712955. Quasi-Monte-Carlo). ¥ Quasi-Monte-Carlo methods for numerical integration : 1. Brève présentation présentation formelle des résultats principaux en calcul Considérons le calcul de l’intégrale de f sur l’hypercube d’intégrale par Quasi-Monte-Carlo. La notion de discrépan- [0,1]d. La méthode de Monte-Carlo est l’approximation de cette ce est introduite pour quantifier le fait qu’une suite de intégrale I par la moyenne Mn des f(xi), pour i variant de 1 à n points est bien répartie pour faire de l’intégration avec. Les d et où les xi sont tirés au sort sur [0,1] de manière indépendan- bornes sont formellement énoncées, sur la base de quantités te identiquement distribuée. Sous des hypothèses très légères, très moyennement intuitives comme la variation totale au on a convergence presque sûre de Mn vers I (par la loi forte des sens de Hardy et Krause. grands nombres). Le théorème central limite nous fournit des ¥ Low-discrepancy point sets and sequences. L’auteur intervalles de confiance, d’ordre de grandeur 1/racine(n). Cet explique comment construire des suites à faible discrépan- intervalle de confiance est seulement asymptotiquement consis- ce et présente des inégalités quant aux discrépances mini- tant, mais en appliquant diverses inégalités selon ses préfé- males possibles. Des outils logiciels peuvent être trouvés rences, on obtient des choses proches en non-asymptotiques, sur le web quant à l’évaluation de la discrépance d’un jeu c’est-à-dire des intervalles de confiance, des vrais, des solides. de points donnés ([Thiémard, 2001]). Quasi-Monte-Carlo est le passage au déterministe, basé ¥ Nets and (t,s) sequences. L’auteur présente une méthode sur le principe selon lequel le tirage de points est une affaire spécifique de son crû pour optimiser la discrépance. Des trop sérieuse pour être confiée au hasard. Quasi-aléatoire et outils logiciels efficaces peuvent être trouvés sur le web pseudo-aléatoire sont ainsi tous deux des suites déterministes, ([Burkardt, 2003]). mais alors que l’esprit « pseudo-aléatoire » consiste à cher- ¥ Lattice rules for Numerical Integration. L’auteur présente cher des suites aussi proches du hasard que possible, le des règles d’intégration qui permettent de tirer partir de la Ç quasi-aléatoire » cherche à faire mieux. En fait, la méthode régularité de la fonction au delà de la variation totale au revient à chercher des points qui minimisent la discrépance, sens de Hardy et Krause. Malheureusement, l’approche est c’est-à-dire le sup des écarts |Mn-I|, pour l’ensemble des fonc- encore peu opérationnelle, et par là même intéressera peut- tions caractéristiques de rectangles (à bords parallèles aux être peu les praticiens. axes en général). ¥ Quasi-Monte-Carlo methods for Optimization. L’auteur Niederreiter nous rappelle donc diverses inégalités, présente grosso-modo des epsilon-nets pour faire du ran- majorant en particulier l’écart |Mn-I|, pour une suite xi adé- dom-search amelioré. Partie intéressante pour les fans d’al- quatement choisie, par O(V(f)log(n)d/n), où d est la dimension gorithmes génétiques. de l’hypercube et où V(f) est la variation totale au sens de ¥ Quatre chapitres sont alors dédiés aux nombres qui ne sont Hardy et Krause de f (notion affreuse à définir mais modéré- pas aléatoires ni optimisés du point de vue de la discrépan- ment restrictive). Des inégalités similaires sont montrées pour ce, mais qui sont destinés à reproduire au mieux les carac- des fonctions restreintes à des domaines inclus dans l’hyper- tèristiques du hasard. cube, en se restreignant aux points inclus dans le domaine. Les constantes sont explicites. Notons la dépendance en d, à 3. Bilan comparer à Monte-Carlo qui donne du O (sup |F| /racine(n)) Livre clair et net, rigoureux. Dans un grand nombre de en probabilité. cas de calcul d’intégrales, les méthodes proposées sont infini- B ULLETIN DE L’AFIA 48 numéro 60 - juillet 2005 REVUE BIBLIOGRAPHIQUE

ment meilleures que Monte-Carlo « brut ». Presque limité au passage à d=infini est ce que l’on appelle un théorème central calcul d’intégrale, discutant peu le problème de la grande limite fonctionnel. dimension qui pose un réel problème et le fait que les hypo- Plein de notions arrivent alors : une classe de thèses (Hardy-Krause) nécessaires pour valider les intervalles Glivenko-Cantelli est une classe de fonctions pour laquelle de confiance ne sont pas totalement anodines. D tend vers (0,0,...,0) et une classe de Donsker est une clas- se de fonctions pour laquelle G tend vers un processus gaus- 4. Inspiration pour l’IA sien presque sûrement borné. On peut en fait dans le cas Selon nous, la lecture de livre est une bonne inspiration d’une classe de Donsker calculer les covariances du proces- pour : sus gaussien limite. ¥ apprentissage actif pour des relations déterministes (typi- En particulier, la finitude des nombres de couverture 1 quement, la minimisation de l’espérance de coût L1 lors de pour tout epsilon et pour une norme adéquate éventuellement l’approximation d’une cible t par une fonction f_ dans F est dépendant de la distribution (cas particulier : finitude de la la recherche d’une fonction d’intégrale minimale parmi les VC-dimension) entraine le fait qu’une classe de fonctions est f-t, où f_ dans F), Glivenko-Cantelli (voir détails dans le résumé ci-dessous). Le ¥ apprentissage tout court, la loi du logarithme itéré permet- fait que les nombres de couverture croissent polynomialement tant de déduire des bornes sur la discrépance de points aléa- (en particulier, VC-dimension finie) entraine le fait que la toires, et donc d’en déduire des inégalités sur les espaces de classe de fonctions est Donsker ; mais les nombres de couver- fonctions de variation totale bornée au sens de Hardy et ture peuvent même être exponentiels (du moment que ça Krause. n’augmente pas trop vite quand même). En particulier, cette ¥ optimisation stochastique (eg, apprentissage par renforce- notion couvre beaucoup plus de familles de fonctions que la ment) : pourquoi ne pas utiliser une représentation « quasi- VC-dimension, et entraine pourtant des convergences en aléatoire » des aléas ? 1/racine(n) (ce qui est bien, car le 1/racine(n) est fréquent dans ¥ application de la faible dispersion aux algorithmes géné- la vraie vie). tiques (pourquoi ne pas répartir les mutations mieux qu’au Des parties censées être des applications présentent hasard ?), ensuite diverses méthodes : le bootstrap, les M-estimateurs, la ¥ applications des algorithmes génétiques à la faible discré- delta-méthode, etc. Croire que les personnes moins matheuses pance (pourquoi ne pas générer des points à faible discré- et plus liées aux applications vont comprendre aisément cette pance au lieu de chercher des méthodes analytiques qui partie conduit à une lourde déception ; mais le jeu (déchiffrer fournissent des points « à peu près » optimaux ?). péniblement) en vaut la chandelle (à la fin on maîtrise des outils utiles). En particulier : ¥ Le bootstrap, c’est le fait de dire que G peut être approché Weak Convergence and Empirical par G', où Processes. Aad W. Van Der Vaart & Jon A. G'=racine (n) (D'1, ..., D'd), Wellner, Springer Series in Statistics. New avec D'i=M'i-E'i, où E'i=Mi et M'i est une moyenne calcu- lée sur un rééchantillonnage aléatoire simple (avec remise) York, 508p, 1996. de n éléments parmi x1, ..., xn. Ce n’est pas complètement intuitif, mais finalement en le notant bien ça parait pas déli- Le review présenté ci-dessous est complété par celui rant : le bootstrap stipule que M -E est proche de M' -E' ,ce d’Evarist Giné, l’un des spécialistes du sujet, diffusé dans i i i i qui est cohérent vu que Mi est une moyenne sur n tirages de Zentralblatt et reproduit/traduit avec l’aimable autorisation de points parmi la loi correspondant à E , et M' est une moyen- son auteur. D’autres reviews sont disponibles à i i ne sur n tirages de points parmi la loi correspondant à E' . http://www.stat.washington.edu/jaw/RESEARCH/BOOKS/bo i ¥ Les Z-estimateurs, c’est se demander à quelle vitesse ok4.rev.html. {xn;fn(xn)=0} tend vers x tel que f(x)=0, quand fn est une estimation statistique de f (e.g. et f(x)=Eg(x,w) où w est une 1. Brève presentation variable aléatoire dont w1, _, wn est un échantillon aléatoi- Pour parler de ce livre il va falloir commencer par défi- re simple). nir ce qu’est un théorème central limite fonctionnel. On consi- ¥ Les M-estimateurs, c’est se demander à quelle vitesse arg- dère un échantillon grosso-modo aléatoire simple x1,...,xn. On min fn tend vers argmin f, quand f est une estimation sta- considère les moyennes de (f , f , f , ..., f ) sur cet échan- n 1 2 3 d tistique de f. tillon : ces moyennes sont (M , M , ..., M ), où 1 2 d ¥ La delta-méthode, c’est se demander jusqu’où on peut M =(f (x )+fi(x2)+...+f (x ))/ . On considère Ei la limite de Mi, i i 1 i n n généraliser les résultats précédents (en particulier, les et enfin le vecteur (D , ..., D ) où l’écart D est défini par 1 d i classes de Donsker et le bootstrap) pour appliquer nos inter- Di=Mi-Ei. La loi forte des grands nombres nous dit que D=(D , ..., D ) tend presque sûrement vers (0, 0, ... ,0), sous 1 d 1. Le nombre de couverture N(epsilon) d’une famille de fonctions des hypothèses très légères. Le théorème central limite multi- est le nombre de boules de rayon epsilon nécessaires pour recouvrir varié nous fournit la limite de G=racine(n) (D1, ..., Dd). Le cette famille de fonctions. B ULLETIN DE L’AFIA numéro 60 - juillet 2005 49 REVUE BIBLIOGRAPHIQUE

valles de confiance à autre chose que des calculs de moyen- couverture polynomiaux, ici on peut traiter des nombres de ne ; en particulier, aux estimateurs différentiables au sens de couverture exponentiels (en particulier, tant que le log est Hadamard en G. polynomial de degré inférieur à 2). ¥ Uniform entropy numbers. Cette section présente les inéga- 2. Table des matières commentée & guide de lecture lités classiques en théorie de l’apprentissage, inégalités rapide montrant notamment comment borner les nombres de cou- Une bonne première approche consiste en lire l’intro- verture indépendamment de la distribution avec les coeffi- duction de la partie II et de la partie III (plus secondairement, cients de pulvérisation, et comment borner, via le lemme de l’introduction de la partie I), puis les parties concernant les Sauer, les coefficients de pulvérisation avec la VC-dimen- nombres de couverture, les théorèmes façon Donsker, le sion. bootstrap et la delta-méthode. Partie I : stochastic convergen- ¥Bracketing numbers. Cette partie présente des nombres de ce (la partie qui n’intéressera pas beaucoup la communauté couverture différents des nombres usuels, forts commodes IA) dans certains cas, et permettant notamment des espaces de ¥ Introduction fonctions « réguliers » au sens de Hölder par exemple - ce ¥ Outer integrals and measurable majorants qui est particulièrement intéressant pour de l’imagerie ou de ¥Weak convergence l’évaluation de risque de première ou seconde espèce. En ¥Product spaces particulier, on peut montrer que les « patatoïdes » réguliers ¥ Spaces of bounded functions au sens de Hölder sont une classe de Glivenko-Cantelli, et ¥ Spaces of locally bounded functions sont une classe de Donsker si la norme _-Hölderienne est ¥The ball sigma-field and measurability of suprema bornée pour un degré _ suffisamment grand, point riche ¥ Hilbert spaces d’enseignements pour la validation d’extraction de motifs ¥ Convergence: almost surely and in probability spatio-temporels. ¥ Convergence: weak, almost uniform, and in probability ¥ Uniformity in the underlying distribution. Cette partie ¥ Refinments montre comment des classes de Glivenko-Cantelli, pour ¥ Uniformity and metrization une distribution donnée, ou des classes de Donsker, pour Partie II : empirical process (la partie directement pas- une distribution donnée, peuvent être en fait uniformément sionnante pour les fans de théorie de l’apprentissage) Glivenko-Cantelli ou Donsker si les nombres de couverture ¥ Introduction sont bornés uniformément en la distribution. Cette partie ¥ Maximal inequalities and covering numbers malheureusement n’évoque qu’à peine le fait que la VC- ¥ Symmetrization and measurability dimension fait plus que garantir le caractère polynomial des ¥ Glivenko-Cantelli theorems (partie pas indispensable, car nombres d’entropie et permet des inégalités non-asympto- déjà connue, pour ceux qui connaissent la théorie de l’ap- tiques, comme d’ailleurs les nombres de couverture eux- prentissage « usuelle » comme présentée dans le livre de mêmes - le livre est définitivement orienté vers les résultats Devroye, Gyorfi & Lugosi) ; on y lira en particulier que si asymptotiques. Pour creuser plus ce point il faudra donc lire les Ç bracketing nombre de couverture È N[](epsilon) sont le livre de Vapnik, ou celui de Devroye, Gyorfi et Lugosi, en nombre fini pour tout epsilon alors la classe de fonctions ou celui de Vidyasagar, ou celui d’Antony et Bartlett. est Glivenko-Cantelli pour la convergence presque sûre. On ¥Multiplier central limit theorems. Cette partie fournit les y lira aussi que si les nombres de couverture N(epsilon) outils techniques pour des méthodes de rééchantillonnage, pour L1(Pn) (ie, nombre de couverture pour la loi empi- comme notamment le bootstrap évoqué en partie III. rique) ont leur logarithme en o(n) pour tout epsilon alors la ¥Permanence of the Donsker property. Cette partie précise classe est Glivenko-Cantelli pour la convergence presque comment combiner des classes de Donsker pour obtenir de sûre (résultat permettant en particulier de traiter le cas de la nouvelles classes de Donsker. VC-dimension finie, qui conduit à des coefficients de pul- ¥The central limit theorem for Processes. Cette partie géné- vérisation polynomiaux, et donc à des nombres de couver- ralise les résultats précédents à des cas non-identiquement ture polynomiaux). Il est à noter que les conclusions obte- distribués. nues vont très au-delà du cas de la VC-dimension finie, ce ¥Partial-sum processes. qui est instructif pour les personnes habituées à travailler en ¥ Other Donsker classes. VC-théorie. ¥Tail bounds. ¥ Donsker theorems (partie fondamentale du livre - si vous ne devez en lire qu’une lisez celle-ci). On apprend notamment Partie III : statistical applications que si les logarithmes des nombres de couverture sont en ¥ Introduction O(1/epsilona) où a<2 alors on a bien un théorème central ¥ M-estimators (partie très importante et peu exploitée pour limite fonctionnel intéressant - en particulier, on a conver- l’apprentissage par renforcement ou l’optimisation de fonc- gence faible en 1/racine (n), donc du même ordre de vites- tions stochastiques) se que le cas de la VC-dimension finie. Mais contrairement ¥ Z-estimators à la VC-dimension qui ne peut traiter que des nombres de ¥Rates of convergence B ULLETIN DE L’AFIA 50 numéro 60 - juillet 2005 REVUE BIBLIOGRAPHIQUE

¥ Random sample size, poissonization and Kac processes Gyorfi, Lugosi est ainsi beaucoup plus fort à bien des égarts ¥The Bootstrap (partie très importante pour la théorie de que celui du Van Der Vaart & Wellner. Finalement, de temps l’apprentissage et l’estimation de risque de première espè- à autre on peut dire que les résultats présentés ici, avec toute ce) leur élégance, sont une réponse parfaite à une question ¥The two sample problem modérément adéquate. Reste néanmoins des justifications ¥ Independence empirical processes qui touchent au coeur de pourquoi le bootstrap ça marche, ¥The Delta-Method (partie très importante pour l’estimation et ça n’est vraiment pas rien, car les résultats non-asympto- de risque de première espèce) tiques n’en rendent pas compte. Par ailleurs, la lecture est ¥ Contiguity peut-être plus ardue que nécessaire, notamment par manque ¥ Convolution and minimax theorems de discussion. Notons enfin que la loi du logarithme itéré Appendix (contient divers éléments très intéressants, est absente, ce qui fait un manque certain. comme la perturbante inégalité de Sudakov et la non-moins ¥ Synthèse : il est à mon avis d’utilité publique que quelqu’un perturbante inégalité de Borell - tristement, cette partie est un écrive une version de ce livre accessible à tous, en faisant peu légère en discussions) éventuellement des hypothèses plus fortes de mesurabilité (qui se préoccupe de cela dans la communauté IA ? ) pour 3. Bilan simplifier l’exposé, et en mettant l’accent sur la compré- ¥Avantages : trop peu connu en IA et en apprentissage (alors hensibilité par tous (certes, il n’est pas valorisant pour un que tout un chacun connaît un minimum de VC-théorie), chercheur de se dire qu’il a simplement fait une version très complet, très propre. En outre, le livre est beaucoup Ç pour les nuls È du Van Der Vaart & Wellner, mais qui dans plus lisible, tant pour des raisons pédagogiques que de pure la communauté IA trouve un intérêt à s’acharner des heures forme (LaTeX!) que d’autres livres thématiquement sur la partie I qui est dans cet ouvrage totalement indispen- proches, même des livres écrits par des spécialistes incon- sable ? ). Les classes de Donsker ne « tuent » pas l’intérêt tournables du sujet. Notons comme atout de ce livre les par- des résultats non-asymptotiques, elles ont de multiples ties d’introduction de chaque section, qui présentent assez défauts tout comme d’ailleurs les classes de type VC ; elles informellement l’ensemble des résultats. Quadrupler le sont plus complémentaires que concurrentes de la théorie volume de ces sections aurait ajouté une plus-value consi- de l’apprentissage disons « classique », basée sur les inéga- dérable à l’ouvrage ; en particulier, les appendices man- lités non-asymptotiques comme celles de Hoeffding ou quent de discussions. Chernoff ; les rendre plus accessibles serait un acte d’utili- ¥ Inconvénients : les résultats sont certes vrais mais asympto- té publique. tiques, et vraiment très asymptotiques. En particulier, l’in- égalité de Borell, appliquée à un processus gaussien limite 4. Inspiration pour l’IA (exclusivement pour ceux qui d’un processus empirique, est relativement peu crédible aiment les maths) : bien que mathématiquement vraie ; elle est certes vraie, ¥ Apprentissage actif (car les processus gaussiens se combi- mais pour parler avec un brin de provocation il faut Ç aller nent mieux que les inégalités vapnikiennes, d’où la possibi- vraiment chercher loin l’asymptotique ». Malheureusement, lité de considérer des stratifications du domaine d’appren- on a beau démontrer des trucs asymptotiquement vrais, les tissage), intervalles de confiance qu’on va en déduire ne seront pas ¥Erreur de première voire seconde espèce dans l’extraction forcément fiables pour un nombre fini d’exemples. Les gens de connaissance dans les bases de données (via le bootstrap peuvent râler que la VC-dimension et les inégalités de en particulier). concentration comme faisaient Kolmogorov et Tikhomirov ¥ Les M-estimateurs sont décisifs pour l’apprentissage par [Kolmogorov et al., 1961], ce n’est pas bien car trop conser- renforcement ou l’optimisation stochastique. vatif, n’empêche que les inégalités non-asymptotiques ont ¥ Notons aussi que les conditions conduisant au caractère le mérite de ne pas mentir en général. Certes, encore faut-il Donsker d’une famille de fonctions permettent de traiter les que les points soient environ indépendants et identiquement convergences uniformes sur des « blobs » réguliers dans distribués, et il faut beaucoup d’exemples, pourra-t-on une image ou un film, et donc permettent de traiter des objecter ; mais ce sont pourtant ces mathématiques là, bien risques de première espèce en modèles déformables ou en que bien moins complexes, qui ont conduit à des dévelop- fouille de données « images ». pements très féconds comme les résultats de consistance Vaart, Aad van der ; Wellner, Jon A. Weak convergence universelle par des techniques de minimisation du risque and empirical processes. With applications to statistics. structurel. Pourquoi éluder en quelques mots tous ces déve- (English) [B] Springer Series in Statistics. New York, NY: loppements non-asymptotiques et leurs conséquences ? Les Springer, xvi, 508 p. DM 74.00; oeS 540.20; sFr 65.50 (1996). résultats de type Donsker, outre le fait qu’elles ne fournis- [ISBN 0-387-94640-3] sent pas de résultats non-asymptotiques, et malgré leur plus grande complexité, ne rendent pas compte de l’efficacité de techniques de régularisation et c’est bien triste. L’impact philosophique d’un livre comme le bouquin de Devroye, B ULLETIN DE L’AFIA numéro 60 - juillet 2005 51 REVUE BIBLIOGRAPHIQUE

Review de Zentralblatt 862.60002 et il contient aussi une annexe avec des choses diverses et par Evarist Giné (traduction O.Teytaud) importantes comme des inégalités et des processus gaussiens. La première partie, Ç Stochastic convergence È (environ 80 pages) constitue un survol complet de la théorie des convergences en loi, presque sûre et en probabilité d’éléments Review 5 : Zentralblatt 862.60002. Evarist Giné, reviewer. aléatoires non nécessairement mesurable avec des valeurs Soit (S,P) un espace de probabilité, et soit X :-->S les i dans des espaces métriques non nécessairement séparables. Il fonctions coordonnées et soit contient le nécessaire calcul intégral de fonctions non-mesu- P =sum _X /n, pour n_ dans N, n (i=1..n) i rables, les propriétés de la définition de convergence en loi de les mesures empiriques pour les « données » Xi. Le fonctions non-mesurables par Hoffman-Joergensen, la conver- papier révolutionnaire de V. N. Vapnik et A. Ya. Chervonenkis gence presqu’uniforme de Dudley, etc. Quelques uns des ÇTheory Probab. Appl. 16, 264-280 (1971); translation from points forts de cette introduction sont une nouvelle version du Teor. Veroyatn. Primen. 16, 264-279 (1971; Zbl 247.60005) È théorème de Prokhorov, avec la notion ajoutée de ‘mesurabi- sur la convergence presque sûre de (P -P)(C) uniformément n lité asymptotique’, et le théorème de Skorokhod-Dudley- en C sur des classes générales C de sous-ensembles mesu- Wichura. rables de S, donna naissance à une nouvelle branche de la La deuxième partie, ‘Empirical processes’ (environ 200 théorie du processus empirique dont l’objet est l’étude de la pages), développe la théorie du processus empirique. Les mesure empirique comme un processus indexé par une famil- outils de symétrisation et de randomisation, les inégalités le d’ensembles ou de fonctions, la nouveauté étant la généra- exponentielles pour les sommes de variables indépendantes, et lité du cadre: l’espace S n’a pas besoin d’être R ou Rd, la clas- les inégalités maximales et les bornes d’entropie sont premiè- se C n’est pas nécessairement la classe des demi-lignes, etc. rement développées et alors appliquées pour prouver des lois On cherche des théorèmes limites, des bornes exponentielles, uniformes des grands nombres (théorèmes de Glivenko- des vitesses pour le processus empirique, uniformément sur la Cantelli), des théorèmes centraux limites (théorèmes de classe C d’ensembles ou la classe F de fonctions. Le dévelop- Donsker), des TCLs (NDT: théorèmes centraux limites) mul- pement de cette théorie requiert une généralisation de la tiplicatifs et des vitesses de convergence. Les deux plus théorie des convergences des variables aléatoires vers des grands types d’hypothèses, du type Vapnik-Chervonenkis ou éléments aléatoires prenant leurs valeurs dans des espaces de du type entropie-bracketing, sont présentés en détail, avec métrique non-nécessairement séparable (e.g., l’espace beaucoup d’exemples utiles. L’uniformité non seulement en infini métrique L (F) de toutes les fonctionnelles bornées f_dans F, mais aussi en P, tant pour la LGN et pour le TCL, F-->R). De manière peut-être plus importante, cela nécessite est aussi traité. Cette partie du livre a aussi un chapitre dédié aussi un enrichissement d’autres éléments de probabilité, dont aux bornes exponentielles tendues [principalement de M. une grande partie a été développée précédemment pour l’étu- Talagrand, Ann. Probab. 22, No. 1, 28-76 (1994; Zbl de des propriétés des trajectoires des processus gaussiens et 798.60051)]. L’inclusion d’autant d’exemples, d’inégalités pour la théorie des probabilités dans les espaces de Banach exponentielles tendues et de formes affinées du théorème de séparables. Et il apparait que la théorie du processus empi- Dudley sur les nombres de couverture des classes VC [D. rique ainsi développée a trouvé de nombreuses utilisations en Haussler, J. Comb. Theory, Ser. A 69, No. 2, 217-232 (1995; statistiques asymptotiques. Bien que de nombreux problèmes Zbl 818.60005)] sont parmi les caractéristiques les plus demeurent, cette branche de la théorie du processus empirique saillantes de cet exposé. Ni les conditions nécessaires pour la est désormais arrivée à maturité après 25 ans d’intenses déve- LGN et le TCL ou la loi du logarithme itéré ne sont traitées ; loppements. Le livre de van der Vaart et Wellner constitue une bien qu’elles soient des parts très importants de la théorie, excellente somme de la théorie générale du processus empi- elles sont moins applicables que la plupart des sujets choisis rique et de ses applications, et vient précisément au bon par les auteurs. moment. Les surveys précédents de la théorie : Gaenssler’s La troisième partie, Ç Statistical applications È (environ 1993 IMS Lecture Notes, le livre de D. Pollard Ç Convergence 150 pages), inclut les M et Z estimateurs, les vitesses de of stochastic processes È (1984; Zbl 544.60045), les notes de convergences des M-estimateurs avec des applications e.g. à la lectures de R. M. Dudley [in: Ecole d’Ete de probabilites de régression, au bootstrap, à la méthode delta, les processus Saint Flour XII-1982, Lect. Notes Math. 1097, 1-142 (1984; empiriques d’indépendance, les théorèmes de contiguité, de Zbl 554.60029)], le reviewer et J. Zinn [in: Probability and convolution et de minimax. Peut-être la première application Banach spaces, Lect. Notes Math. 1221, 50-113 (1986; Zbl de la théorie moderne du processus empirique en statistiques 605.60026)] et D. Pollard [“Empirical processes: Theory and a été le papier de D. Pollard [Econ. Theory 1, 295-314 (1985)] applications” (1990; Zbl 741.60001)] et, de manière tangen- appliqué à la M-estimation. Les auteurs développent cela, tielle, un chapitre dans le livre de M. Ledoux et M. Talagrand incluant le travail suivant de J. Kim et D. Pollard [Ann. Stat. ÇProbability in Banach spaces: Isoperimetry and processes È 18, No. 1, 191-219 (1990; Zbl 703.62063)], et présentent de (1991; Zbl 748.60004). très beaux et intéressants exemples, tels que l’estimateur de Le livre reviewé est divisé en trois parties: Stochastic Grenander pour les densités monotones, l’estimateur court, convergence, Empirical processes et Statistical applications, etc. Ils présentent aussi des travaux récents, principalement de B ULLETIN DE L’AFIA 52 numéro 60 - juillet 2005 REVUE BIBLIOGRAPHIQUE

van de Geer [Report 93-06, Univ. of Leiden] et L. Birge et P. Zbl.792.62038; Zbl.816.62039 Keywords: stochastic pro- Massart [Probab. Theory Relat. Fields 97, No. 1/2, 113-150 cesses; empirical processes; convergence in law; central limit (1993; Zbl 805.62037)], sur la méthode des « sieves È et les theorems; invariance principles; Glivenko-Cantelli theorems; estimateurs de contrasts minimaux. Le bootstrap du processus sampling Classification: *60-02 Research monographs (pro- empirique [principalement, le reviewer et J. Zinn, Ann. bability theory) 62-02 Research monographs (statistics). Probab. 18, No. 2, 851-869 (1990; Zbl 706.62017)], et J. Praestgaard et le second auteur, Ann. Probab. 21, No. 4, 2053-2086 (1993; Zbl 792.62038)] est présenté très en détails. Théorie des Sondages. Cette présentation repose plus sur la randomisation que le tra- Yves Tillé. Dunod, Collection “Sciences vail original, et elle l’améliore significativement au niveau de la mesurabilité. Le chapitre sur la méthode delta est très com- Sup”, plet et contient de nombreux exemples significatifs comme la 296 pages. ISBN 2100054848, 2001. statistique de Wilcoxon, l’estimateur de Nelson-Aalen de la Ç cumulative hazard function for censored data È, les quan- 1. Brève présentation tiles, la fonction de copula, Kaplan-Meyer et le produit inté- La théorie des sondages est l’élaboration : gral, etc. L’utilité de la différentiabilité au sens de Hadamard ¥ d’intervalles de confiance quant à des informations extra- est soulignée [voir R. M. Dudley,e.g. Ann. Stat. 22, No. 1, 1- polées à partir d’échantillons finis (typiquement, on mesure 20 (1994; Zbl 816.62039)], ainsi que la différentiabilité au 1000 français tirés au sort proprement, quelle est la taille sens de Frechet vis à vis de la norme de la p-variation, avec moyenne des français au vu de ces résultats ?) ; des vitesses). La version du théorème de Prokhorov présentée ¥ la recherche de façons adéquates d’échantillonner, typique- en partie 1 trouve une bonne application dans les preuves de ment via la stratification (e.g., on mesure des enfants et des formes générales des théorèmes de convolution et de mini- adultes, et on détermine de manière optimale (du point de max. vue de la variance) combien d’enfants et combien d’adultes Il y a six annexes, la première et la sixième étant des col- doivent être mesurés). lections d’inégalités utiles, la seconde avec une liste complète La théorie des sondages est « un ensemble d’outils sta- de faits sur les processus gaussiens utilisés dans l’ensemble du tistiques permettant l’étude d’une population au moyen de livre, la troisième sur les processus de Rademacher, la qua- l’examen d’une partie de celle-ci ». On appelle « strates » une trième avec une preuve d’une des inégalités isopérimétriques sous-population, supposée avoir une certaine forme d’homo- de Talagrand pour les espaces produits, et la cinquième avec généité (e.g., pour des salariés les strates peuvent être les caté- des théorèmes centraux limites dans R. Chaque chapitre gories socio-professionnelles), et Ç grappes È un ensemble contient une liste d’exercices, et chaque partie s’achève sur d’individus dont la connaissance coûte beaucoup moins cher des notes bibliographiques. que la somme des coûts associés au fait de faire la connais- La préface du livre explique ce qu’il essaie de faire : sance de chacun des individus séparément (pour un sondage ÇThe first goal is to give an exposition of certain modes of chez une population d’humains, une grappe peut être un foyer stochastic convergence_ È Ç A second goal is to use the weak ou un immeuble). Des stratifications tant mobiles que fixes convergence theory background developed in Part 1 to present sont considérées. L’analyse est centrée sur le cas où aucun an account of major components of the modern theory of modèle de la population n’est supposé. empirical processes indexed by classes of sets and functions. È Quoique le livre soit centré sur le cas d’une population Ç Our third goal is to illustrate the usefulness of modern weak discrète, le lecteur extrapolera sans mal les résultats à des cas convergence theory and modern empirical process theory for plus généraux ; en fait le livre peut être totalement adapté au statistics by a wide variety of applications. È Les auteurs ont Monte-Carlo biaisé. amplement réussi : le livre fait exactement ce qu’il veut faire. Le livre est d’intérêt immédiat aux statisticiens mathé- 2. Table des matières maticiens, particulièrement à ceux qui travaillent sur les théo- ¥ Introduction ries asymptotiques utilisant des propriétés (non nécessaire- ¥ Une histoire des idées en théorie des sondages ment asymptotiques) du processus empirique. Il est aussi ¥ Les fondements de la théorie des sondages d’intérêt pour les probabilistes et pour les statisticiens moins ¥ Plans simples mathématiciens. Ce livre est approprié à la fois comme réfé- ¥ Plans à probabilités inégales rence et comme livre d’étude (pour différents cours). Ce n’est ¥Echantillonnage par scission et estimation de variance pas le lieu pour faire des recommandations ; aussi, je vais seu- ¥ Stratification lement dire que je garde ce livre dans mon bureau, sur l’éta- ¥ Plans équilibrés gère la plus proche de mon bureau. ¥ Plans par grappes, à plusieurs degrés et à deux phases Citations: Zbl.247.60005; Zbl.544.60045; ¥ Estimation avec informations auxiliaires et plans simples Zbl.554.60029; Zbl.605.60026; Zbl.741.60001; ¥ Estimation avec informations auxiliaires et plans complexes Zbl.748.60004; Zbl.798.60051; Zbl.818.60005; ¥ Estimation de variance par linéarisation Zbl.703.62063; Zbl.805.62037; Zbl.706.62017; ¥Traitements des non-réponses B ULLETIN DE L’AFIA numéro 60 - juillet 2005 53 REVUE BIBLIOGRAPHIQUE

3. Bilan dérées par yi=1 ou =-1 selon la classe des exemples, et à effec- ¥rigoureux ; tuer un vote pondérée par yi exp(-d(x,xi)2/_2). La consistance ¥facile à lire ; est prouvée. ¥ de thème bien ciblé ; Le chapitre 11 prouve la consistance de la méthode des ¥ couvrant tant les aspects de planification du sondage, que plus proches voisins. d’estimation et de construction d’intervalles de confiance ; Le chapitre 12 présente de manière très convaincante ¥ le cas des non-réponses est aussi présenté. synthétique et rigoureuse la théorie de l’apprentissage à la façon de Vapnik et Chervonenkis. Le chapitre 13 quant aux aspects combinatoires est particulièrement précieux ; les A Probabilistic Theory of Pattern inégalités basées sur les coefficients de pulvérisation sont sou- vent meilleures que les inégalités basées sur la VC-dimension. Recognition. L’impact de l’erreur bayésienne nulle est présenté, ainsi que le Luc Devroye, Laszlo Gyorfi, Gabor cas moins souvent cité mais intéressant d’une erreur bayé- Lugosi, Springer-Verlag, New sienne faible. York,1996. Le chapitre 14 présente des bornes inférieures en théorie de l’apprentissage ; ces bornes inférieures sont très utiles 1. Brève présentation notamment grâce à des lemmes très réutilisables. En particu- Ce livre traite de la classification binaire supervisée. Le lier, la différence entre « VC-dimension infinie sans ensemble traitement est orienté théorie statistique, la clarté et la rigueur infini pulvérisé » et « VC-dimension infinie avec ensemble sont parfaites, de nombreuses références même hors théorie infini pulvérisé » est présentée ; cette différence est riche sont fournies. L’aspect algorithmique est peu traité. Les sup- d’enseignements et est rarement soulignée. Des convergences port vector machines ne sont pas évoquées. Les propriétés de arbitrairement lentes, même à erreur minimale nulle, sont pré- consistance et de consistance universelle sont définies et trai- sentées. Le chapitre 15 discute le maximum de vraisemblance. tées. Les vitesses de convergence, dans un cadre non-asymp- On y rappelle notamment que le maximum de vraisemblance, totique, sont présentées de la manière la plus convaincante ça n’est pas vraiment ça lorsqu’on n’est pas très sûr d’inclure possible. Les discussions sont toutes pertinentes. la décision de Bayes dans notre famille de classifieurs, point simple mais important et peut être insuffisamment utilisé 2. Table des matières commentées comme facteur explicatif de certains résultats expérimentaux. Le chapitre 2 Ç The Bayes Error »présente le problème Le chapitre 16 discute la classification paramétrique. Le cha- et les définitions fondamentales. pitre 17 discute la discrimination linéaire généralisée. Le chapitre 3 Ç Inequalities and alternate distance mea- Le chapitre 18 complète très utilement les chapitres 12, sures » présente différentes distances stochastiques intéres- 13 et 14 (VC-théorie) par la minimisation du risque structurel. santes. Les résultats exposés sont les plus clairs et convaincants que Le chapitre 4 « Linear discrimination » présente des je connaisse. La vitesse de convergence en 1/racine(n), obte- méthodes linéaires. nue lorsque la décision de Bayes appartient à une famille de Le chapitre 5 « Nearest Neighbour rules » présente de fonctions union dénombrable incrémentale de familles de VC- manière très détaillée les méthodes de plus proches voisins et dimension finie, est en particulier prouvée. La constante dans les résultats théoriques qui les concernent. cette convergence dépend de l'index de la famille de fonctions Le chapitre 6 définit et démontre des résultats de consis- de VC-dimension finie à laquelle appartient la décision de tance et de consistance universelle, dont le très important Bayes, et non de la distribution elle-même. théorème de Stone qui démontre d’un coup la consistance uni- Le chapitre 19 présente des compléments quant aux plus verselle d’un grand nombre de méthodes. proches voisins (en particulier, utilisation de prototypes et Le chapitre 7 démontre que des vitesses de convergence plus proches voisins condensés). arbitrairement lentes peuvent avoir lieu. Le chapitre 14 appro- Le chapitre 20 traite des arbres de décision, le chapitre fondira ce point de manière très intéressante. 21 du partitionnement et des inégalités qu’on peut lui associer. Le chapitre 8 « Error estimation » présente des applica- Il est à mon sens particulièrement utile pour traiter de l’ap- tions classiques d’inégalité comme Hoeffding ou Chernoff à prentissage non-supervisé et des prétraitements éventuels de l’estimation d’erreur en généralisation ou à la sélection de données. classifieur. La section 22 traite de l’estimation « hold out » et de ses Le chapitre 9 présente des résultats quant à la méthode applications. par histogrammes (cette méthode consiste à quadriller le La section 23 traite de l’erreur empirique et de ses appli- domaine et à faire un vote à majorité dans la zone d’un point cations ; on y applique la VC-théorie des chapitres 12 à 14 à à classer). diverses méthodes, et on y développe aussi des méthodes spé- Le chapitre 10 présente des méthodes à noyau (consis- cifiques pour différents algorithmes d’apprentissage. tant e.g. à placer des gaussiennes « sur » les exemples xi, pon- La section 24 traite des méthodes de type validation croi- B ULLETIN DE L’AFIA 54 numéro 60 - juillet 2005 REVUE BIBLIOGRAPHIQUE

sée ; les résultats inférieurs et supérieurs soulignent l’habi- résultats de densité toujours utiles, quelques bases de probabi- tuelle efficacité du livre qui à chaque section prend la peine de lité, l’inégalité de Cauchy-Schwartz, l’inégalité de Hölder, souligner la question que l’on a envie de se poser en voyant les l’inégalité de Markov, l’inégalité de Tchébytchev, l’inégalité résultats ; les résultats montrant que ça marche sont pondérés de Tchébytchev-Cantelli , l’inégalité de Jensen, l’inégalité, par ceux qui montrent que ça ne marche pas. Outre des résul- des notions sur les convergences des variables aléatoires tats généraux, des applications sont présentées aux k-plus (convergence en probabilité, convergence presque sûre, proches voisins et aux règles à noyaux ou à histogrammes. convergence dans Lp, lemme de Borel-Cantelli pour construi- La section 25 complète le chapitre 10 par des « automa- re des convergences presque sûres à partir de convergences en tic kernel rules È, comme le chapitre 26 complète le chapitre probabilité, quelques infos sur les espérances conditionnelles, 11 avec des Ç automatic nearest rules È ; ces deux chapitres une très jolie section sur les binomiales (ça me sert au quoti- étudient le choix des hyperparamètres à partir de données dien), l’inégalité de Hoeffding pour une distribution hyper- (dans le cas des Ç kernel rules È, la largeur des gaussiennes par géométrique, et quelques définitions sur les distributions mul- exemple ; pour les plus proches voisins, le nombre de voisins). tinomiale, exponentielle, gamma et gaussienne . Le chapitre 27 traite de domaines discrets. Le chapitre 28 traite de l’utilisation d’epsilon-entropie ; 3. Bilan cette section basée sur l’approche utilisée autrefois par La table des matières est éloquente quant à l’ampleur du Kolmogorov et Tikhomirov est la seule à traiter de la régres- livre ; tous les chapitres sont traités avec la même rigueur sion. Les résultats de Kolmogorov et Tikhomirov quant aux mathématique et la même clarté lumineuse. Les annexes sont nombres de couverture des espaces de Hölder, qui sont les précieuses au quotidien, et dans toutes les démonstrations les plus naturels des espaces (dérivées alpha-ièmes bornées en lemmes décisifs sont proprement extraits et présentés séparé- gros), que l’on trouvera dans le livre de A.W. Van Der Vaart & ment. Les questions fondamentales sont traitées. Quel défaut J.W. Wellner, ne sont ici présentés que dans des sous-cas. peut-on trouver à ce livre ? On peut simplement regretter que Le chapitre 29 traite de l’optimisation au sens des la régression ne soit qu’évoquée et que les propriétés venues moindres carrés pour l’estimation de P(Y=1|X) et montre des de la communauté du processus empirique ne soient pas utili- résultats de consistance. Il s’agit d’appliquer en fait des résul- sées : le livre est centré sur la théorie de l’apprentissage « clas- tats comme ceux du chapitre 28 avec un accent particulier sur sique È (non-asymptotique) et la classification binaire (non la le calcul des nombres de couverture. régression ou la classification multi-classes). J’insiste en par- Le chapitre 30 traite de réseaux neuronaux. Des calculs ticulier sur le souci de clarté qui fait que ce livre se lit comme de VC-dimension et de coefficients de pulvérisation sont au un roman, et le bonheur des discussions. Ayez-en deux pour programme. Le livre d’Antony et Bartlett présentera l’avanta- pouvoir en prêter un à vos amis sans être pris au dépourvu. ge à ce niveau là de comprendre aussi la fat-shattering dimen- sion. Une propriété de consistance universelle est aussi pré- sentée (appliquant sans grande surprise les résultats de type Références minimisation structurelle du risque). Le chapitre 31 traite de bootstrap et de quelques autres [Thiemard, 2001] E. Thiemard, An algorithm to compute méthodes d’évaluation de l’erreur en généralisation. Le théo- bounds for the star discrepancy, Journal of Complexity 17, 4, rème montrant la remplaçabilité d’un algorithme stochastique 850-880, 2001. par un algorithme déterministe est en particulier présenté. [Burkardt, 2003] J. Burkardt, niederreiter2.cc, niederrei- Le chapitre 32 traite de sélection de variables et est ins- ter2.h, http://www.csit.fsu.edu/ burkardt/cppsrc/niederrei- tructif. ter2/niederreiter2.html 2003. Les appendices sont un très bon ramassis de résultats [Kolmogorov et al, 1961] A.-N. Kolmogorov, V.-M. utiles dans la vie quotidienne du data-mining (comme Tikhomirov, epsilon-entropy and epsilon-capacity of sets in d’ailleurs l’ensemble des lemmes du livre) : quelques élé- functional spaces, Amer. Math. Soc. Transl. 17, pp 277-364, ments de théorie de la mesure et d’intégrale de Lebesgue, des 1961.

B ULLETIN DE L’AFIA numéro 60 - juillet 2005 55 CONFÉRENCES

Connaissance et Documents Temporels

Journée scientifique organisée dans le cadre de la plate-forme AFIA

31 mai 2005 Ð Nice

Objectifs de la manifestation nautés (traitement du signal et vision, document, repré- sentation des connaissances) qui n'ont pas comme habi- Cet atelier fait suite à une journée consacrée au tude d'interagir régulièrement bien que travaillant sur Ç Modèles documentaires de l'audiovisuel È (http://liris. les mêmes objets ! cnrs.fr/~yprie/Projets/SDN04/) organisée lors de la Pourtant, de l'avis général, la "modélisation de Semaine du Document Numérique à La Rochelle du 21 connaissance" est sans doute UN moyen de combler le au 25 juin 2004. fossé sémantique généralement constaté lorsque l'on a à Cette année, l'atelier avait pour objectif de faire le traiter des documents temporels. point sur l'utilisation des connaissances (au sens large) dans les différents processus permettant de manipuler Liste AVIS les documents temporels (i.e., documents multimédias dont au moins une des composante est temporelle, par Une liste de diffusion, public et archivée, sous exemple la vidéo). Nous avions ainsi identifié au moins abonnement, dénommée AVIS - Audio-Visual trois grands champs d'applications qui ont recours à Information Systems (ou Systèmes d'Information l'utilisation de connaissances pour exploiter, analyser, Audiovisuelle) a été depuis mise en place. Elle est décrire ou publier des documents temporels : l'extrac- consacrée aux échanges d'informations concernant les tion automatique de descripteurs, la description séman- systèmes d'information audiovisuels : aspects documen- tique et l'indexation du contenu des documents, et la taires, aspects juridiques, normes, systèmes, produits, génération et la publication de nouveaux documents retours d'expériences, conférences, etc. temporels. La page d'accueil de AVIS est : Participants et déroulement de l'atelier https://www.irisa.fr/wws/info/avis Une quinzaine de personnes (chercheurs et docto- Cette liste a donc pour objectif de favoriser l'émer- rants) ont participé à cette demi-journée. Le programme gence d'une communauté autour de la problématique de celle-ci était composé d'un exposé invité et de 4 pré- sentations orales correspondant aux articles acceptés des SIAV, sans restriction, en mettant en relation aussi par le comité de programme de l'atelier. Les articles, bien des documentalistes que des informaticiens, des présentations et acte de l'atelier sont disponibles à sémiologues que des industriels, des praticiens que des http://liris.cnrs.fr/yannick.prie/Projets/AFIA05/. théoriciens, etc.

Synthèse des problématiques scientifiques débattues Toute personne intéressée par cette liste, peut s'ins- crire soit directement sur https://listes.irisa.fr/wws/ L'hypothèse formulée en préambule de cet atelier info/avis, ou bien en nous demandant de l'inscrire à (à savoir, les connaissances sont de plus en plus utilisées Yannick Prié ([email protected]) ou à Raphaël pour manipuler les documents temporels) peut être Troncy ([email protected]). considérée comme validée au regard des différentes pré- sentations. En revanche, cette notion de connaissance Futur plans recouvre des choses larges, tant du point de vue de son objet (du paramétrage d'algorithme de traitement auto- Une autre journée organisée sur les mêmes théma- matique à des modèles de connaissance d'un domaine) tiques nous paraît également d'actualité, mais sa forme que de celui de sa représentation (plus ou moins for- reste à définir. Cette journée pourrait être organisée melle). dans le cade de la Semaine de la Connaissance 2006 ou L'atelier a permis de toucher différentes commu- de la Semaine du Document Numérique 2006. B ULLETIN DE L’AFIA 56 numéro 60 - juillet 2005 CONFÉRENCES

Quinzième Conférence Internationale sur la Planification et l’Ordonnancement Automatisés (ICAPS’05) 6-10 juin 2005, Monterey, CA http://icaps05.icaps-conference.org/

Compte-rendu rédigé par Philippe Morignot (AXLOG), Sylvie Thiébaux (ANU & NICTA), Daniel Godard (ILOG), Olivier Bonnet-Torrès (ONERA-Toulouse) et Florent Teichteil (ONERA-Toulouse).

ICAPS’05 fait partie d’une suite de conférences Signalons un nouveau genre d’événement, baptisé qui regroupent depuis 2003 la suite de conférences amé- Ç Festivus È (http://rakaposhi.eas.asu.edu/festivus/) et ricaines AIPS (A.I. Planning Systems), dont la premiè- organisé par Subbarao Kambhampati, voulu comme re édition a eu lieu en 1992 à College Park dans l’état une sorte d’exutoire libre expression où tout orateur du Maryland, et la série de workshops puis conférences pouvait proposer de s’exprimer (6 ont été sélectionnés) EWSP (European Workshop on Planning), dont la pre- pendant 5 minutes et débattre avec la salle pendant 5 mière édition a eu lieu en 1991 à Sankt Augustin en autres minutes, sur des thèmes commençant par Ç Vous Allemagne, transformée en ECP (European Conference faites tous de la mauvaise recherche parce que … », on Planning) depuis 1997. Cette suite de conférences ÇVous devriez travailler sur … », Ç Si je vois encore un ICAPS a maintenant lieu chaque année en alternance de seul papier sur X, je vais hurler parce que …», Ç Le vrai part et d’autre de l’Atlantique. problème de la planification est …», Ç Nous sommes ICAPS’05 était organisé par Susanne Biundo, coincés dans une impasse et la façon d’en sortir est de Karen Myers et Kanna Rajan, à Monterey, en … », Ç La meilleure chose qui s’est produite en planifi- Californie, non pas à Asilomar (et ses bungalows) mais cation est … » et des idées de démarrage de ce style. au Hyatt Regency Conference Center, en bordure d’un Quelques photos de cette semaine sont disponibles parcours de golf. sur le site de la conférence (ou à http://homepage.mac. ICAPS’06 sera organisé par Daniel Borrajo, Steve com/peterajarvis/Menu64.html). Smith et Lee McCluskey à Cumbria en Angleterre Nous résumons ici quelques 1 présentations (invi- (Lake District). Durant ICAPS’05, le comité de pilota- tées ou reviewées) qui nous ont intéressés, soit en ses- ge a décidé de choisir Mark Boddy, Maria Fox et Sylvie sion plénière, soit dans les workshops, soit dans les pos- Thiébaux pour organiser ICAPS’07 à Providence, dans ters. Les actes (papier et CD-ROM) de la conférence et l’état de Rhode Islands aux USA. des workshops sont disponibles au AAAI Press à Menlo 233 participants étaient inscrits (dont une quinzai- Park en Californie (http://www.aaai.org/Press/press. ne de français). 93 articles ont été soumis (dont 44 html) - les actes des Workshops sont disponibles indivi- d’américains et 6 de français), 33 articles ont été accep- duellement sur le site de la conférence. tés pour présentation/publication (taux d’acceptation de 35%). Session plénière Le lundi et le mardi ont été réservés aux Workshops, Tutorials et à la compétition d’ingénierie Exposé invité 2 :Drew McDermott (Université de des connaissances (KE Competition),organisés en ses- Yale) propose la notion d‘expressivité comme étant au sions parallèles. Une visite du Monterey Bay Aquarium cÏur de la planification. Après l’époque pionnière Research Laboratory a été organisée le lundi après midi depuis STRIPS (introduisant les pré- et post-conditions (une vingtaine de participants). Ce laboratoire a été par rapport à GPS), vinrent ABSTRIPS, puis NOAH fondé par David Packard et comporte environ 2000 per- puis NONLIN, ayant tous besoin d’un surplus d’ex- sonnes explorant la faille au large de Monterey, traitant pressivité (donc augmentant le contrôle ?). Après des les données recueillies et les analysant pour étudier la ages sombres vint la Renaissance avec TWEAK et faune, flore et géologie sous-marines. Les moyens d’ex- ploration sont divers robots sous-marins filoguidés (pilotés depuis un bateau) ou autonomes (style torpille). 1. Les auteurs de ce compte-rendu ayant aussi présenté un expo- Le reste de la semaine a été consacré en une ses- sé, il a été décidé de présenter tous les articles français dans la session plénière, pour ne (dé)favoriser personne. sion unique à la séance plénière (avec posters, démons- 2. Les transparents des trois exposés invités sont disponibles sur trations de systèmes et Doctoral Consortium le soir). le site de la conférence. B ULLETIN DE L’AFIA numéro 60 - juillet 2005 57 CONFÉRENCES

PRODIGY, puis UCPOP et le langage ADL, puis des Russel Bent et Pascal Van Hentenryck (Brown Ç bons È algorithmes comme GRAPHPLAN, SAT- University) proposent d'utiliser les données historiques PLAN et la planification par relaxation de Geffner et au lieu d'utiliser une distribution pour faire de la plani- Bonet. Puis vint la Compétition Internationale de fication stochastique en prenant pour hypothèse que le Planification et le langage PDDL, maintenant dans sa futur ressemblera au passé. Ils ont expérimentés leur version 4. Les leçons de PDDL sont de ne pas prendre approche à deux types de problème : un problème d'or- en compte les limitations actuelles de planificateurs, donnancement et un problème de « vehicle routing È. mais de pousser la communauté, en rendant les planifi- Matthew Streeter et Stephen Smith (Carnegie cateurs comparables entre eux et en y introduisant les Mellon University) ont étudié la distribution des solu- réseaux de tâches hiérarchiques (HTN, e. g., SHOP2). tions de makespan minimal dans les problèmes de type Par exemple, introduire dans PDDL la notion de flot de Job Shop. Ils montrent que quand le ratio nombre de données (une valeur attachée à une action) des HTNs, jobs sur le nombre de ressources et égal à 1, les solu- ou des variables instantiables à l’exécution uniquement. tions de makespan minimal sont contenues dans une L’idée est d’effectuer le maximum de planification Ç big valley È. Au contraire, quand ce ratio augmente, avant l’exécution et de pouvoir y inclure d’autres les solutions de makespan minimal sont plus dispersées. modules (e.g., ordonnancement) si besoin. Ces résultats permettent d'expliquer pourquoi les pro- Exposé invité : Henry Kautz (Université de blèmes carrés sont en général plus difficiles à résoudre. Washington) s’intéresse au suivi d’activités de per- Pascal Van Hentenryck et Yannis Vergados s'inté- sonnes à partir de données marquées (des capteurs dis- ressent à la minimisation du nombre de breaks dans la posés sur des portions du corps, sur des objets, etc), à la planification des tournois de sport. Leur approche est reconnaissance des formes/patrons de déplacement pra- basée sur la recherche locale et le recuit simulé avec tiqués par ces personnes dans leur vie quotidienne, et à auto adaptation des paramètres du recuit. Les résultats l’apprentissage du marquage de ces activités et de ces obtenus sont impressionnants tant sur le plan de la qua- endroits où se déplacent ces personnes. En effet, un lité que sur celui des temps de réponses. A noter cepen- changement dans la routine étant souvent précurseur dant qu'il existe un algorithme polynomial pour trouver d’accident ou de maladie, il propose d’utiliser son sys- une solution optimale à ce type de problème (Schreuder tème pour suivre les activités des personnes handica- 1992). pées, malades ou vieilles. Le cœur du modèle est Laurence Kramer et Stephen Smith décrivent de d’abord basé sur des modèles de Markov cachés, mais nouvelles heuristiques de réparation pour résoudre des cela conduit à trop d’erreur. Il utilise ensuite des problèmes d'ordonnancement sur-contraints et amélio- réseaux bayesiens dynamiques, ce qui réduit l’erreur rent ainsi les résultats qu'ils ont publié à ICAPS’04. mais ne traite toujours pas les objets nouveaux rencon- Daniel Godard, Philippe Laborie et Wim Nuijten trés. La notion d’abstraction permet ensuite de réduire (ILOG) décrivent une approche de type Ç Large l’erreur à un niveau acceptable. Il propose d’appliquer Neiborhood Search » pour résoudre des problèmes d'or- cette approche pour ces personnes handicapées ou donnancement cumulatif et rapportent les résultats malades, au moyen de compas électroniques, qui indi- obtenus sur les instances de Lawrence, Fisher et queraient toute déviation importante par rapport à leurs Thompson: sur 36 instances ouvertes, 33 nouvelles activités quotidiennes. bornes ont été obtenues. Exposé invité : Kim Larsen (Université d’Aalborg Jörg Hoffman (Max-Planck Institut) et Ronen au Danemark) a présenté son projet européen AME- Brafman (NASA Ames) poursuivent leur idée de l’an TIST d’ordonnancement optimal et temps-réel. dernier, sur la planification avec état initial partielle- L’ordonnancement d’un graphe de tâches est basé sur ment connu et effets des actions partiellement connus, des automates temporisés. Comme il doit représenter parce que dépendants d’observations effectuées à l’exé- plusieurs tels automates, des variables sont partagées cution (planification contingente, avec planification entre eux. Ce formalisme permet de représenter des conformante comme cas particulier). Un plan devient contraintes temporelles (e.g., t1 Ð t2 < durée). Pour ainsi un arbre ET/OU (représenter toutes les valeurs représenter les ressources à associer aux tâches, il a possibles des observations) et un plan solution possède recours à des automates temporisés avec prix (le coût les buts dans ses feuilles. Dans cette représentation, la d’affecter telle ou telle ressource à telle tâche). La combinatoire se manifeste par la co-NP-complétude du recherche proprement dite des valeurs des variables problème de la détermination de la valeur de vérité dans ces automates est effectuée au moyen d’un algo- d’une proposition dans un état intermédiaire (elle rithme A* symbolique. Il compare ses résultats avec la dépend de toute l’historique de cette proposition). Pour programmation linéaire en nombres entiers. trouver un plan solution (propositions-buts atteints dans B ULLETIN DE L’AFIA 58 numéro 60 - juillet 2005 CONFÉRENCES

les états feuilles), les auteurs effectuent alors une heuristique en largeur d'abord, qui élague, à chaque recherche heuristique, par relaxation dans un plan de niveau de l'arbre de recherche, tous les noeuds sauf les graphe, au moyen de l’algorithme AO*. Les résultats k meilleurs. La clef de la méthode de Zhou et Hansen expérimentaux montrent que cette approche est souvent est une structure de données, appelée pile de faisceau meilleure que l’état de l’art. (beam stack), grâce à laquelle on peut intégrer de façon Un planificateur prend généralement entrée non efficace le retour en arrière systématique à la recherche seulement un état initial et des buts, mais une liste d’ac- en faisceau. L'algorithme résultant trouve de bonnes tions génériques (e.g., écrites en PDDL) instantiables solutions qu'il améliore au fur et à mesure du temps de dans le futur plan solution par le planificateur. Qiang calcul, jusqu'à convergence vers l'optimal. Yang, Kangheng Wu et Yunfei Jiang (Université de Contrairement à la méthode de Weixiong Zhang (1998), Hong Kong) proposent le système ARMS, capable celle-ci induit une complexité mémoire linéaire en la d’apprendre la formulation de ces actions à partir tou- profondeur de l'arbre et le paramètre k. La complexité jours d’un état initial, mais de plans corrects (dont peut-être améliorée et rendue indépendante de la pro- ARMS ne connaît que le nom des actions), ainsi que fondeur en considérant les versions Ç diviser pour d’une liste de prédicats seulement. En particulier, ne régner » ou « iterative deepening È de la recherche en sont pas fournis à ARMS les états intermédiaires (ce qui faisceau. est le cas par exemple dans le suivi d’objets ou le suivi La planification temporelle probabiliste est un axe de plan). Le cœur du modèle est constitué, en séquence, de recherche relativement nouveau qui cherche à unifier par (1) des analyses statistiques sur la fréquence d’ap- les résultats en planification temporelle, d'une part, et en parition de certains noms d’actions dans les plans cor- planification probabiliste, d'autre part. L'objectif est de rects (qui sont fournis aléatoirement par le planificateur pouvoir traiter des domaines plus réalistes comprenant MIPS), et (2) par la déduction des pré- et post-condi- actions concurrentes, ressources et contraintes de tions des actions au moyen de clauses résolues par un temps, avec une incertitude sur la durée des actions, résolveur SAT. Qiang Yang et ses collègues mesurent le ainsi que leurs effets et le temps auquel ceux-ci se pro- degré de correction des actions, ainsi que la redondance duisent. Mausam et Dan Weld de l'Université de des prédicats trouvés par ARMS ; ils constatent une Washington ont présenté une approche du problème rapide convergence vers un minimum de ces 2 erreurs. basée sur une extension des processus de décision Mark Boddy, qui a toujours avancé que la planifi- Markoviens concurrents (CoMPDs, i.e., des MDPs dont cation classique n'avait pas d'application, vient de nuan- les transitions sont étiquetées par des ensembles d'ac- cer ses propos antérieurs. Avec ses collègues de tions concurrentes). Cette extension tient compte du Adventium Labs, il s'est interessé au problème de l'ana- temps et de l'état d'avancement des actions en cours lyse des vulnérabilités d'un système informatique aux d'exécution, grâce à un espace d'états plus complexe. potentielles attaques de pirates. Il a construit un logiciel Ces processus peuvent être résolus de façon optimale d'aide aux administrateurs systéme qui génère des par des algorithmes de type programmation dynamique séquences d'actions qu'un pirate pourrait suivre afin temps-réel (RTDP), moyennant des heuristiques perfor- d'atteindre des objectifs de nature malicieuse spécifiés mantes pour estimer le coût des états rencontrés. par les administrateurs. Le problème est modélisé Mausam et Weld proposent plusieurs heuristiques qui comme un problème de planification classique avec res- sous-estiment le temps d'exécution de la politique sources numériques dans le langage PDDL, et est réso- (makespan) à partir d'un état donné et qui s'appuient sur lu à l'aide du planificateur metric-FF de Joerg la résolution exacte d'un processus plus simple (e.g. Hoffmann. Le modèle actuel comporte 25 types d'ob- MDP ou CoMDP). jets différents, 124 prédicats, et 56 opérateurs. Une ins- L'exploitation de connaissances de contrôle de la tance typique implique environ 200-300 faits et des recherche spécifiques au domaine considéré a donné séquences de 20 à 50 actions que metric-FF met moins lieu à des planificateurs extrêmement performants tels d'une seconde à générer. Nous espérons que ce problè- que SHOP2, TLPlan, et TALPlanner. Une limite impor- me fera partie de ceux sur lesquels les planificateurs tante de ces approches est qu'elles ne s'appliquent qu'à classiques plancheront pendant la prochaine compéti- des objectifs classiques d'atteignabilité d'un état but. En tion internationale de planification en 2006. particulier, les mécanismes d'exploitation de ces Rong Zhou et Eric Hansen (prix du meilleur papier connaissances reposent sur le fait que ces dernières se étudiant) ont présenté une méthode pour transformer la réfèrent à un état but fixé. Froduald Kabanza recherche en faisceau (beam search) en un algorithme (Université de Sherbrooke) et Sylvie Thiébaux complet garantissant une solution optimale. La (ANU/NICTA) ont présenté une extension des méch- recherche en faisceau est une variante de la recherche nismes d'utilisation de connaissance de contrôle à des B ULLETIN DE L’AFIA numéro 60 - juillet 2005 59 CONFÉRENCES

comportements plus riches exprimables en logique tem- définition même du domaine reste à faire. Il apparaît porelle linéaire (communément appelés buts temporel- donc deux grandes acceptations du terme. lement étendus) tels que la maintenance de propriétés, D’une part, il peut s’agir de réaliser une planifica- les gardes, les séquences de buts, etc. Cette première tion pour des utilisateurs humains et automatiques. approche du problème conserve le langage classique Berry, Yorke-Smith et al. proposent une application du d'expression des connaissances de contrôle, mais analy- type assistant agenda personnalisé. Les préférences se le but étendu pour générer une séquence de buts clas- peuvent être données par l’utilisateur ou apprises. Finzi siques à atteindre à partir desquels les connaissances et Orlandini utilisent la planification pour faciliter l’in- seront successivement interprêtées. Cette analyse se teraction entre des robots et un opérateur. Miller propo- base sur la construction d'un automate de Büchi équiva- se un cadre pour la délégation du pouvoir de décision lent au but étendu et est mise en œuvre dans le planifi- vers des véhicules autonomes. cateur TLPlan de Bacchus et Kabanza. D’autre part, l’initiative mixte peut s’appliquer au Une nouvelle technique pour la planification a été processus de planification lui-même. Bresina, Jonsson, présentée par Menkes van den Briel (Université Morris et Rajan utilisent le planificateur MAPGEN d’Arizona), Thomas Vossen (Université de Colorado à pour l’aide à la génération de plans pour des rovers Boulder) et Subbarao Kambhampati (Université d’exploration martiens. Hayes, Larsen et Ravinder utili- d’Arizona), au moyen de la programmation linéaire en sent un planificateur pour générer des plans d’action nombres entiers (l’idée originale étant due à Thomas d’un ennemi afin d’aider à la prise de décision pour l’ar- Vossen et d’autres étudiants de Dana Nau à mée américaine. Myers propose que l’opérateur entre l’Université de Maryland en 1999). Le modèle se base des méta-informations pour guider la visualisation du sur les changements d’états de variables entières (e.g., processus de planification. Kirkpatrick, Dilkina et la valeur de vérité de la proposition « sur(A,B) ») et, Havens améliorent la performance de calcul de l’ordi- de plus, utilise des variables entières à plusieurs nateur par l’intervention humaine dans des calculs d’op- valeurs (et non binaires) pour encoder différentes pro- timisation. positions (par exemple, la variable entière v à 1, 2 ou 3 représente les propositions « sur (A, B) È, Ç sur (A,C) È et Ç sur (A, Table) »). La fonction objectif à Workshop Ç Planification et ordonnancement mul- minimiser est le nombre d’actions du plan. Les auteurs tiagent È, organisé par Bradley Clement utilisent un algorithme de séparation / évaluation (branch-and-cut) pour améliorer les performances. Ils L’atelier propose à la fois des applications et des montrent trouver des plans corrects plus rapidement avancées théoriques. que SatPlan04. Sur le plan des applications, on relève le projet Une autre nouvelle technique pour la planification COORDINATOR de Honeywell. Ce projet débutant a été proposée par Alexandru Horia Brie (Ecole (Musliner & Phelps) propose un système d’aide à la Polytechnique) et Philippe Morignot (AXLOG), au localisation et à la décision en ligne pour des équipes de moyen des algorithmes génétiques. Le cœur du modèle pompiers. D’autre part, Wilkins et al. proposent un sys- est une représentation d’un plan sous forme de chromo- tème de planification pour les missions de support de some de longueur variable, ainsi rechercher un plan cor- l’armée américaine. Du fait du nombre considérable de rect revient à rechercher le meilleur individu dans une missions de par le monde, un plan initial est fourni a population. Différents imports de la communauté évo- priori. L’approche met en Ïuvre une replanification en ligne pour répondre à l’afflux important de missions lutionniste (multi-population, mimétisme faible, sélec- impromptues. tion par tournois, mutation/croisement des élites, ré-ini- Les avancées théoriques quant à elles se partagent tialisation d’une population) permettent d’optimiser ce en trois catégories. processus stochastique. Une analyse de l’influence des Tout d’abord, les problèmes de décision de Markov nombreux paramètres est effectuée, mais l’approche passe encore difficilement à l’échelle. 3. Plusieurs autres Workshops existaient : Ç Le rôle des ontolo- gies dans la planification et l’ordonnancement », organisé par Juan Workshop 3 Ç Planification et ordonnancement en Fernandez Olivares et Eva Onaindia ; Ç Programmation par initiative mixte È, organisé par George Ferguson, contraintes pour la planification et l’ordonnancement », organisé par Caroline Hayes et Greg Sullivan. Chris Beck, Andrew Davenport et Toby Walsh ; Ç Vérification et vali- dation de systèmes de planification et d’ordonnancement basés sur les modèles », organisé par Maria Fox, Allen Goldberg, Klaus Havelund L’initiative mixte est une grande nouveauté dans la et Derek Long ; « Exécution de plan : une vérification de la réalité », communauté de la planification. Dans ces conditions, la organisé par Sailesh Ramakrishnan. B ULLETIN DE L’AFIA 60 numéro 60 - juillet 2005 CONFÉRENCES

s’orientent, dans le monde multiagent vers une modéli- et faibles du papier présenté. La formule semble avoir sation partiellement observable. Bernstein, Hansen & plu dans l'ensemble car elle permet d'ouvrir la discus- Zilberstein suggèrent de résoudre les DEC-POMDP par sion et d'améliorer le travail en cours. itération de la politique : l’idée est de proposer une amé- La journée a commencé par une présentation de lioration locale puis de rechercher l’impact sur le grou- Roy Tuner, conférencier invité du workshop. Il a discu- pe par calcul de la variation de corrélation. Dans une té des problèmes de planification de mission pour des toute autre direction, Nair, Tambe et al. s’intéressent véhicules sous-marins autonomes. Il a également pré- plutôt à la factorisation du problème en fonction de la senté les différents types de sous-marins autonomes structure du groupe d’agents, de façon à résoudre des existants à ce jour. Plus particulièrement, il a expliqué sous-problèmes plus petits et faiblement corrélés entre où se trouve l'incertitude dans ce genre de mission, et eux. dans quelles conditions elle doit être prise en compte : D’un autre côté, les sociétés d’agents prennent en véhicule invisible et isolé aux grandes profondeurs, compte les difficultés de communication sous diffé- environnement sous-marin très dynamique, imprécision rentes formes. Rauenbusch, Grosz et al. explorent les des capteurs (sonar, indicateur de charge de batterie), règles de l’enchère pour l’allocation de tâches de façon imprécision des actionneurs (bras du robot sous-marin). à trouver les meilleures stratégies en fonction de la taille On distingue deux types de planification sous du problème. Han & Barber s’intéressent à des agents incertitudes : la planification Ç proactive È, qui s'appuie autonomes choisissant leurs buts dans une liste fournie sur un modèle stochastique connu de l'environnement, a priori. Le choix, motivé par une récompense/punition et la planification « réactive È, qui suppose que la dyna- prend en compte l’agent seul et son utilité mais aussi les mique stochastique de l'environnement n'est pas effets sur les autres tâches et les autres agents et sert de connue. Dans le premier cas, le plan obtenu est une base à une allocation par négociation. Van der Krogt & politique qui indique l'action optimale à réaliser dans de Weerdt proposent une planification par enchères puis n'importe quel état (stochastique) où l'agent peut se délégation et appliquent une replanification par raffine- trouver. Dans le deuxième cas, un plan partiel est recal- ment et « déraffinement È pour prendre en compte les culé régulièrement, basé sur un modèle supposé locale- changements de dernière minute. ment déterministe dans l'espace et le temps. Un tel com- Enfin, les représentations par contraintes et/ou portement est Ç anytime È : les plans partiels successifs temporelles se partagent en deux catégories. sont calculés en tâche de fond au cours de la mission Premièrement, Jensen & Veloso proposent l’ordon- durant le temps disponible, sur un horizon de raisonne- nancement d’atelier tolérant aux fautes par analyse de ment dont le modèle d'environnement est supposé être diagrammes de décision binaire pour des tâches tempo- localement déterministe. Dans ce contexte, les décisions rellement incertaines. Léauté & Williams permettent sont prises au plus tard, elles engagent le système sur la aux plans une flexibilité temporelle de façon à générer durée la plus courte possible, et le temps entre deux un grand nombre de plans possibles. Ces plans relaxés décisions est utilisé au maximum pour raisonner afin de sont ensuite contraints à nouveau tout en éliminant les prendre la meilleure décision possible. Les re-planifica- candidats incohérents. Deuxièmement, Wehowsky, tions sont nécessaires chaque fois qu'un événement Block & Williams isolent des structures types (séquen- imprévu apparaît. ce, choix, parallélisme…) dans un plan partiel pour Dans le cadre de la planification proactive, les répartir le travail de planification temporelle entre les papiers présentés se basaient sur des Processus agents. La vérification est centralisée. De façon ana- Décisionnels de Markov (PDM). Ce modèle intègre l'in- logue, Bonnet-Torrès & Tessier proposent de structurer certitude de l'environnement dans les transitions sto- un groupe d’agents par les structures remarquables du chastiques, supposées markoviennes, entre les états de plan. Cette approche fondée sur les réseaux de Petri l'agent. Deux papiers s'intéressent à la résolution de facilite une replanification en ligne localisée. PDM de grande taille, qui modélisent des problèmes de réalisation séquentielle de sous-buts. Ces travaux s'ap- Workshop Ç Planification sous incertitude pour les puient sur un modèle hiérarchique de PDM visant à systèmes autonomes », organisé par Christophe réduire l'exploration de l'espace d'états, qui est en géné- Guettier et Neil Yorke-Smith ral très grand. Han & Barber proposent de construire un « espace de désir » qui représente les buts qu'on désire A la demande de Gérard Verfaillie, ce workshop a réaliser, lorsque ceux-ci bougent au cours de la mission. été l'occasion de tester une nouvelle forme de présenta- Ils définissent alors des macro-actions qui agrègent les tion. A chaque orateur était assigné un « critique » char- actions à réaliser pour transiter entre les buts de l'espa- gé de commenter, après chaque exposé, les points forts ce de désir. Au fur et à mesure de la modification dyna- B ULLETIN DE L’AFIA numéro 60 - juillet 2005 61 CONFÉRENCES

mique des buts, les meilleurs macro-actions à réaliser contraintes (CSP) adaptée à la planification anytime sont recalculées. Teichteil & Fabiani s'intéressent aux sous incertitudes. Leur étude s'appuie sur une décompo- espaces d'état représentés sous forme de produit carté- sition du domaine des variables en Ç environnements È, sien de variables qui décrivent l'ensemble de la mission, qui sont des produits cartésiens de sous-ensembles des dont les objectifs à atteindre. Ils proposent de réduire domaines de chaque variable. Ils proposent deux amé- les variables qui ont un grand nombre de valeurs pos- liorations à cette approche : des heuristiques pour sélec- sibles en énumérant localement le PDM factorisé, et en tionner l'environnement suivant à décomposer, et une utilisant ensuite des techniques de décomposition de méthode pour résoudre des sous-problèmes dont la PDM énumérés qui visent à réduire le nombre d'états taille augmente de manière incrémentale. Enfin, énumérés. Le PDM abstrait factorisé obtenu, qui Chanthery, Barbier et Farges proposent un modèle de contient des variables réduites, nécessite de définir des problème de planification en-ligne de mission pour des macro-actions qui ont la même sémantique que celles véhicules aériens autonomes. Leur modèle se base sur de Han & Barber. Les auteurs proposent également une un espace d'états hiérarchique : le niveau supérieur classe d'algorithmes qui permettent de résoudre rapide- représente les points de passage de l'aéronef et les ment le PDM connaissant des états de départ et d'arri- objectifs à atteindre ; le niveau inférieur décrit les tra- vée, mais au détriment d'une perte d'optimalité qui doit jectoires et les itinéraires entre les différents points de être contrôlée. passage. Ils proposent un algorithme de résolution D'autre part, toujours dans le cadre des PDM, adapté à leur formalisme, dérivé de A*. Benazera, Mausam, Hansen, Brafman et Meuleau s'in- Enfin, le workshop s'est terminé par la présentation téressent à la résolution de PDM hybrides, dont l'espa- deux papiers courts (Ç position papers È). Fabiani, ce d'états, factorisé, est constitué de variables discrètes Bensana, Farges, Morignot, Poncet, Baltié et Patin ont et continues. Des travaux ont été récemment proposés présenté le projet ARTEMIS de re-planification distri- sur ce sujet mais, contrairement à ce papier, ils ne per- buée sous contraintes de ressources. L'approche choisie mettent pas de résoudre des PDM hybrides de grande est basée sur un modèle de planification sous- taille. Les auteurs proposent ici d'utiliser une variante contraintes adapté à un contexte de re-planification dis- de l'algorithme AO*, appelée « Hybrid AO* È, qui tribuée. Axmann et Wickler ont présenté l'architecture prend en compte des variables discrètes et continues. d'un module de décision embarqué à bord du satellite Les noeuds du graphe développé durant la recherche BayernSat. L'approche de planification choisie est réac- d'une solution correspondent à chaque valeur distincte tive, mais le modèle et les techniques de résolution ne de la composante discrète de l'espace d'états du PDM sont pas encore spécifiées. factorisé. Les autres articles s'intéressaient à des approches Compétition d’ingéniérie des connaissances réactives, où le modèle choisi pour décrire le problème n'a pas de connaissance sur l'incertitude de l'environne- ICAPS-05 marquait la première édition de la com- ment. Ferguson, Likhachev & Stentz ont d'abord pré- pétition d'ingénierie des connaissances (KE), organisée senté une revue de différents algorithmes de planifica- par Roman Bartàk et Lee McCluskey. L'ingénierie des tion d'itinéraires dont A*, D*, D* Lite et Delayed D*, connaissances y est définie comme le processus qui ces trois derniers algorithmes étant une extension de A* mène à l'acquisition, la validation, et la maintenance des qui permet de gérer les changements dans le graphe de modèles de planification, ainsi que la sélection et l'opti- planification durant la mission. Ils présentent également misation d'outils de planification s'y appliquant. L'enjeu deux algorithmes adaptés à une comportement est important : l'impact des recherches en planification, anytime : Anytime Repairing A* et Anytime Dynamic qui passe par son utilisation hors de la communauté, A*. Ensuite, Damiani, Verfaillie et Charmeau s'intéres- repose directement sur des solutions satisfaisantes aux sent à la gestion en temps réel d'une constellation de problèmes lies à l'ingénierie des connaissances. Les satellites de surveillance de la Terre. Une coordination buts de la compétition sont de promouvoir et d'accélérer minimale des satellites est assurée par le centre de les recherches dans ce domaine et d'encourager et le contrôle qui centralise les requêtes des utilisateurs. La développement et la diffusion de logiciels dédiés à ces décision des observations à bord utilise un algorithme problèmes. anytime capable de construire itérativement des plans Parmi les sept finalistes figuraient des systèmes optimaux sur un nombre croissant de requêtes d'obser- intégrant une solution complète aux problèmes d'ingé- vation futures. Par ailleurs, Guettier et Yorke-Smith ont nierie des connaissances (élaboration, apprentissage, et présenté une étude expérimentale des « mixed-CSP È, validation de modèles, sélection d'outils de planification qui sont une version des problèmes de satisfaction de appropriés), en l'occurrence ModPlan (Stefan Edelkamp B ULLETIN DE L’AFIA 62 numéro 60 - juillet 2005 CONFÉRENCES

et collègues), GIPO (Ron Simpson), et ItSimple (Tiago Pour y remédier, il propose de considérer la planifica- Vaquero et collègues). On comptait aussi des systèmes tion dans un sens plus large, de définir un prix pour la d'apprentissage automatique de modèles (ARMS, Wu et meilleure application et d’accepter plus d’articles issus collègues) ou de connaissances de contrôle de la des workshops. recherche (Hamlet, Borrajo et collègues), ainsi que des Martha Pollack constate qu’il y a très peu de systèmes plus spécialisés pour browser et débugger des femmes dans la communauté scientifique de la planifi- plans temporels générés par les planificateurs à base de cation, par rapport au nombre d’hommes. Elle relie cet contraintes (PlanWorks, Daley et collègues), ou encore état de fait à la position de la femme dans la société, pour l'aide à la modification de procédures du type de souvent inférieure à celle des hommes à compétence celles utilisées par PRS (Tailor, Jim Blythe et col- égale. lègues). Dan Weld met la communauté de la planification Le jury (Amedeo Cesta, Sylvie Thiébaux et David en jugement devant un tribunal. La défense plaide que Wilkins), avait la tâche difficile de primer un ou deux de 10% des articles à AAAI et IJCAI traitent de la planifi- ces systèmes, en se basant sur les articles les décrivant, cation, que les articles à ICAPS sont bons et qu’il exis- les reviews de ces articles, ainsi que les présentations te une compétition entre planificateurs. Le jury doute orales et démonstration des systèmes par les auteurs. que cela crée des emplois. Le procureur demande « où Les prix furent décernés à GIPO (Ron Simpson, sont les applications ? ». La défense répond qu’elles University of Huddersfield) dans la catégorie systèmes existent en manufacturing, en robotique et en observa- complets, et ARMS (Kanghen Wu, Hong Kong tion depuis l’espace. Mais « est-ce que les planificateurs University of Science & Technology) dans la catégorie clé en main s’appliquent à cela ? » La plupart du temps, outils. ARMS faisait par ailleurs l'objet d'une présen- non. Ç Alors pourquoi les construisez vous ? È. Le jury tation ayant suscité beaucoup d'intérêt en session plé- ne sait pas décider si la communauté est coupable ou nière. non : il faut que la communauté s’oriente vers les bons Rendez-vous pour la prochaine édition de la com- problèmes menant à des applications (problème que pétition qui devrait avoir lieu à ICAPS 2007. d’autres communautés ont aussi). Adele Howe estime que la recherche appliquée Festivus n’est pas respectée, parce que ce qui importe à Mr. Tout- le-monde est ce qui change sa vie. Selon elle, l’exemple David Smith effectue le constat suivant sur le à suivre est la RoboCup en robotique. Elle suggère aux mécanisme du reviewing à AAAI: (1) un article avec un reviewers et auteurs de changer leurs critères : pour les Ç nouvel algorithme sympa È (cool new algorithm) est reviewers, de ne pas s’attendre à avoir une vérification rejeté par les reviewers ; (2) un article avec une nouvel expérimentale d’un algorithme, de changer leurs cri- algorithme sympa et des preuves est rejeté par les revie- tères de review et de suivre les buts à long terme de la wers ; (3) un article avec seulement des expériences est communauté ; pour les auteurs, de faire un travail didac- rejeté par les reviewers ; (4) un article avec un nouvel tique d’explication et rendre accessible leurs données et algorithme sympa, des preuves et des expériences est code source. Enfin, elle dit qu’elle sera heureuse le jour accepté par les reviewers. Il conclut que l’ennemi de la où un planificateur dans le monde des cubes saura communauté est la communauté elle-même, à savoir le construire des châteaux de cubes aussi créatifs que ceux reviewer. faits par n’importe quel enfant de 5 ans. Craig Knoblock estime que la communauté de la Amedeo Cesta a disserté sur une citation d’Henry planification est au moyen-age : il y a 5 fois plus d’ar- David Thoreau : Ç Les forêts seraient très silencieuses si ticles sur les algorithmes, techniques et heuristiques de aucun oiseau ne chantait sauf ceux qui chantent le planification que sur des applications ; et il constate que mieux È. quasiment personne ne fait le lien entre ces deux bords.

B ULLETIN DE L’AFIA numéro 60 - juillet 2005 63 RÉSUMÉ DE THéSES ET D’HDR

Méthodologie d'évaluation de la cohérence bases et l'évaluation finale. Chacune de ces étapes exploite des inter-représentations pour l'intégration de connaissances déduites des spécifications ou induites des bases de données spatiales - Une approche données par apprentissage automatique, en appliquant MACO combinant l'utilisation de méta-données et (Méthode d'Acquisition de connaissances pour l'évaluation de l'apprentissage automatique la Cohérence). L'intérêt d'utiliser l'apprentissage est double. Outre le fait qu'il permet d'acquérir des règles pour l'évalua- tion, il met en évidence l'écart toléré sur les données par rap- David Sheeren port aux spécifications papiers. Notre approche a été mise en œuvre sur des bases de données de l'IGN présentant différents Thèse de Doctorat niveaux de détail. Soutenue le 20 mai 2005 à l’ Institut Géographique National à Saint-Mandé

Jury : J.-D. Zucker : Directeur de thèse - Université Paris 13. S. Mustiere : Encadrant - COGIT / Institut Recherche ciblée Géographique National. S. Spaccapietra : Rapporteur - Ecole de documents sur le web Polytechnique Fédérale de Lausanne. C. Weber : Rapporteur - Université Louis Pasteur, Strasbourg. A. Doucet : Amar-Djalil Mezaour Examinateur - Université Paris 6. C. Puech : Examinateur - UMR TETIS, CEMAGREF-ENGREF. J.-P. Donnay : Invité - Thèse de Doctorat Université de Liège Soutenue le 8 juin 2005 au LRI à Orsay.

Résumé : A l'heure actuelle, la plupart des bases de don- Jury : Examinateur : Dr. Alain Léger, Directeur scienti- nées spatiales sont gérées de manière indépendante. Cette fique du pôle Knowledge Processing, France Télecom R&D, indépendance pose différents problèmes : elle multiplie les Rennes. Examinateur : Dr. Yves Kodratoff, Directeur de efforts de maintenance et de mise à jour, elle rend difficile la recherche CNRS, Université Paris-Sud, Orsay. Directrice de mise en oeuvre d'analyses multi-niveaux et ne garantit pas une thèse : Pr. Marie-Christine Rousset, Professeur, Université cohérence entre les sources. Paris-Sud, Orsay. Rapporteur : Pr. Bernd Amann, Professeur, Université Paris 6, Paris. Rapporteur : Pr. Mohand-Saïd Une gestion conjointe de ces sources nécessite leur inté- Hacid, Professeur, Université Claude Bernard, Lyon. gration qui permet de définir des liens explicites entre les bases et d'en fournir une vision unifiée. Notre thèse s'inscrit Résumé : Depuis sa création, le web a vu sa taille croître dans ce cadre. Le sujet que nous traitons porte en particulier de manière phénoménale rendant la recherche d'informations sur la mise en correspondance des données et l'évaluation de difficile et fastidieuse. Cette difficulté est perceptible lorsqu'il la cohérence inter-représentations. Nous cherchons à analyser s'agit de rechercher des documents complexes tels que des automatiquement chaque différence de représentation entre documents thématiques. Ceci se traduit par des réponses les données appariées afin d'en déduire si celle-ci résulte des nombreuses et souvent imprécises. Il est, dans ce cas, néces- critères de saisie différents des bases ou d'erreurs de saisie. saire de recourir à un expert humain pour filtrer les réponses Cette évaluation vise à garantir une intégration cohérente des impertinentes. Cette imprécision s'explique par le principe données. même du fonctionnement des outils de recherche actuels de documents sur le web. En effet, les requêtes mots clés utilisés Pour étudier la conformité des représentations nous pro- par la plupart des moteurs de recherche sont peu expressives posons d'exploiter les spécifications des bases. Ces documents pour caractériser les documents souhaités. Par ailleurs, les décrivent les règles de sélection et de modélisation des objets. techniques utilisées par ces moteurs pour constituer leur index Ils constituent des méta-données de référence pour juger si les de documents, sur lequel les requêtes sont évaluées, parcou- représentations sont équivalentes ou incohérentes. rent le web dans le but de rapatrier tout type de documents. Je L'utilisation de ces documents est toutefois insuffisante. Les montre dans cette thèse que l'hétérogénéité des index des spécifications décrites en langue naturelle peuvent être impré- moteurs de recherche et leur technique non ciblée pour ali- cises ou incomplètes. Dans ce contexte, les données des bases menter ces index peut être source d'imprécision lors de l'éva- constituent une seconde source de connaissances intéressante. luation des requêtes. Pour améliorer la précision de la L'analyse des correspondances à l'aide de techniques d'ap- recherche sur le web, je propose WeQueL, un langage de prentissage automatique permet d'induire des règles rendant requêtes déclaratif et multicritères. Par ce langage, je montre possible la justification de la conformité des représentations. qu'une façon d'augmenter la précision des requêtes mots clés consiste à les combiner sur différentes parties de la structure La méthodologie que nous proposons repose sur ces élé- d'un document. Je propose également une approche sélective ments. Elle se compose de deux méthodes : MECO et MACO. d'exploration du web guidée par une requête WeQueL. Cette La première est la Méthode d'Evaluation de la COhérence. approche repose sur une technique d'anticipation du score Elle comprend plusieurs étapes : l'enrichissement des don- d'un document sans avoir encore rapatrié son contenu. Pour nées, le contrôle intra-base, l'appariement, le contrôle inter- cela, un système d'apprentissage bayesien est mis en place. B ULLETIN DE L’AFIA 64 numéro 60 - juillet 2005 SOMMAIRES DES REVUES

N'hésitez pas à envoyer un message à Brigitte Grau Le rôle des connaissances dans l'identification automatique ([email protected]) pour lui indiquer toute suggestion permet- d'icones. Une comparaison avec des humains, P. DESSUS, tant d’améliorer cette rubrique. Les revues figurant réguliè- D. PERAYA rement au sommaire mais n’ayant pas de nouveau numéro Ergonomie, culture, scénario. Trois facteurs pour la concep- apparaissent seulement avec leur nom et leur adresse WEB. tion d'une plate-forme de coopération, N. GRÉGORI, J. HAUTECOUVERTURE, C. GODART, F. CHAROY Le dialogue en contexte. Pour une approche dialogique des REVUE D'INTELLIGENCE ARTIFICIELLE environnements d'apprentissage collectif, P. COTTIER, C. http://ria.e-revues.com/ SCHMIDT Cognition située chez le singe capucin, M. DUBOIS, P. CAR- RIA V18 N¡5-6 2004 LIER Conception, modélisation géométrique et contraintes en L'origine du sens : l'Affect Inconditionnel, S. TOUSSEUL CAO : une synthèse, R. MACULET, M. DANIEL Similarité en intension versus similarité en extension. A la Un modèle de mémoire dans un système multi-agent de géo- croisée de l'informatique et du théâtre, A. BONARDI, F. simulation, J. PERRON, B. MOULIN ROUSSEAUX Traitement des erreurs d'accord. Une analyse syntagmatique Les statuts de l'action dans la perception d'une Ïuvre, N. SZI- pour la détection et une analyse multicritère pour la cor- LAS rection, L. HADRICH BELGUITH, A. BEN HAMADOU L'émergence d'une perspective écologique en psychologie LOGUS : compréhension de l'oral spontané. Présentation et ergonomique. Distinction entre différents niveaux de évaluation des bases formelles de LOGUS, J. VILLA- contrôle cognitif dans l activité, T. MORINEAU NEAU, O. RIDOUX, J. ANTOINE Évaluer un site web. Les concepteurs et utilisateurs parvien- Un modèle de résolution de problèmes utilisant des agents nent-ils à identifier les problèmes d’utilisabilité ?, A. réactifs pour la localisation et le suivi, F. GECHTER, V. CHEVALIER CHEVRIER, F. CHARPILLET Analyse de l'exploration tactile sur support traditionnel chez la personne aveugle et conception de l'interface de lecture RIA V19 N¡1-2 2005 Tactos, A. AMMAR, O. GAPENNE, E. BLOMME, K. Alternatives en sciences cognitives: enjeux et débats. Colloque ARCo'04 sous la direction de O. GAPENNE, M. ROVIRA C. MANES GALLO, C. BRASSAC, L. MONDADA Quel paradigme pour la conception ? Combiner approche Désir et connaissance : le mort saisi par le vif. Eléments pour fonctionnelle et située, J. HAUE une organologie de la libido, B. STIEGLER Simulation d'un amorçage intermodal sur un réseau de neu- Les enjeux de la cartographie du cerveau pour les sciences rones impulsionnels, D. MEUNIER, H. PAUGAM-MOISY cognitives. Réduction, traduction ou transformation ?, A. Une contribution de la dynamique non linéaire à l'étude du BEAULIEU développement cognitif. L'exécution d'une série de des- Formes symboliques et émergence de valeurs. Pour une cogni- sins géométriques, C. BISCARA, R. BALDY tion culturalisée, J. LASSéGUE Amorçage masqué cognate inter-alphabet. Rôle des facteurs Prendre en compte la phénoménalité. Propositions pour une morphologique et phonologique, M. VOGA-REDLINGER psychophénoménologie, P. VERMERSCH L'esprit du corps en psychologie, P. KELLER Expériences corporelles et reconnaissance de soi. L'exemple RIA V19 N¡3 2005 des mammifères marins, F. DELFOUR, P. CARLIER Applying context management, directed by P. BRÉZILLON, T. Qu'est-ce qui détermine le choix de la main utilisée par l'en- ROTH-BERGHOFER R., S. SCHULZ fant ? Influence combinée de la demande de la tâche, de la Context-aware Web Engineering: Modeling and Applications, posture et de la consistance manuelle, P. LECONTE, J. J. WOLFGANG KALTZ, J. ZIEGLER, S. LOHMANN FAGARD Context-Aware Information Delivery. An Application in the Kinesthèse, corps propre et espace objectif. Sur les limites de Health Care Domain, J. JAHNKE, Y. BYCHKOV, D. DAH- la constitution kinesthésique du corps propre, A. KHAT- LEM, L. KAWASME CHATOUROV Context: Representation and Reasoning. Representing and Recherche d'informations sur le web. Etude de l'influence de Reasoning about Context in a Mobile Environment, A. facteurs liés à l'interface, à l'utilisateur et à la tâche, A. KOFOD-PETERSEN, M. MIKALSEN CIACCIA, D. MARTINS A Quality Framework for the Storage and Retrieval of Mobilisation et construction de ressources dans l'utilisation Context, J. SILJEE, I. BOSLOPER, J. NIJHUIS d'artefacts électroniques de lecture, V. FOLCHER, A. Context-based Retrieval for Explainable Reasoning, S. LÉAL SCHULZ, T. ROTH-BERGHOFER B ULLETIN DE L’AFIA numéro 60 - juillet 2005 65 SOMMAIRES DES REVUES

Reinforcing Shared Context to Improve Collaboration, P. AI V165 N¡2 JULY 2005 BRÉZILLON, R. MENDES DE ARAUJO Decision making on the sole basis of statistical likelihood, P. A Context-Based Representation of Knowledge Flows in H. GIANG, P. P. SHENOY Dynamic Organizations, A. GACHET, P. BRÉZILLON An optimal coarse-grained arc consistency algorithm, C. Contextualizations in a Social Network. Context in Social BESSIéRE, J.-C. RÉGIN, R. H.C. YAP, Y. ZHANG networks and virtual communities, P. BRÉZILLON Self-stabilizing defeat status computation: dealing with conflict management in multi-agent systems, P. BARONI, M. GIACOMIN, G. GUIDA Book review ARTIFICIAL INTELLIGENCE M. Dorigo and T. Stützle, Ant Colony Optimization, MIT http://www.elsevier.nl/inca/publications/store/5/0/5/6/0/1/ Press, 2004, by C. BLUM

AI V163 N¡2 APRIL 2005 Neural network ensembles: evaluation of aggregation algo- rithms, P.M. GRANITTO, P.F. VERDES, H.A. CECCATTO AI MAGAZINE A logic-based model of intention formation and action for http://www.aaai.org/Magazine/magazine.html multi-agent subcontracting, J. GRANT, S. KRAUS, D. PERLIS AI MAGAZINE V25 N¡1 SPRING 2005 Redundancy in logic I: CNF propositional formulae, P. LIBE- Semantic Integration, N. F. NOY, A. DOAN, A. Y. HALEVY RATORE Semantic Integration through Invariants, M. GRÜNINGER, J. Bayesian network modelling through qualitative patterns, B. KOPENA P. J.F. LUCAS Automatic Ontology Matching Using Application Semantics, A. GAL, G. MODICA, H. JAMIL, A. EYAL AI V164 N¡1-2 MAY 2005 Automatically Utilizing Secondary Sources to Align A formal analysis of why heuristic functions work, B.J. Information Across Sources, M. MICHALOWSKI, S. OOMMEN, L.G. RUEDA THAKKAR, C. A. KNOBLOCK The complexity of contract negotiation, P. E. DUNNE, M. Semantic Integration in Text: From Ambiguous Names to WOOLDRIDGE, M. LAURENCE Identifiable Entities, X. LI, P. MORIE, D. ROTH MaxSolver: An efficient exact algorithm for (weighted) maxi- Data Integration: A Logic-Based Perspective, D. CALVANE- mum satisfiability, Z. XING, W. ZHANG SE, G. DE GIACOMO On the logic of cooperation and propositional control, W. VAN Ontology Translation for Interoperability Among Semantic DER HOEK, M. WOOLDRIDGE Web Services, M. H. BURSTEIN, D. V. MCDERMOTT A formal framework for the decentralised diagnosis of large Semantic Integration Research in the Database Community: A scale discrete event systems and its application to tele- Brief Survey, A. DOAN, A. Y. HALEVY communication networks, Y. PENCOLE, M.O. CORDIER Understanding planning with incomplete information and sen- sing, M. OGLIETTI Knowledge updates: Semantics and complexity issues, C. COGNITIVE SCIENCE BARAL, Y. ZHANG http://www.elsevier.com/inca/publications/store/6/2/0/1/9/4/ Qualitative decision under uncertainty: back to expected utili- ty, H. FARGIER, R. SABBADIN

AI V165 N¡1 JUNE 2005 APPLIED ARTIFICIAL INTELLIGENCE E-generalization using grammars, J. BURGHARDT http://www.tandf.co.uk/journals/tf/08839514.html Automatic identification of music performers with learning ensembles, E. STAMATATOS, G. WIDMER APPLIED AI V19 N¡1 FEBRUARY 2005 Automatic cinematography and multilingual NLG for genera- Resource Management In Wideband Cdma Systems Using ting video documentaries, C. CALLAWAY, E. NOT, A. Genetic Algorithms, T. M. CHANS, S. KWONGK, K. F. NOVELLO, C. ROCCHI, O. STOCK, M. ZANCANARO MAN Unsupervised named-entity extraction from the Web: An Electrocardiogram Diagnosis Using Hybrid Case-Based experimental study, O. ETZIONI, M. CAFARELLA, D. Reasoning, C.-S. HO, Y.-F. YEH DOWNEY, A.-M. POPESCU, T. SHAKED, S. SODER- Fuzzy Methods For Medical Diagnosis, P. R. INNOCENT, R. LAND, D. S. WELD, A. YATES I. JOHN, J. M. GARIBALDI B ULLETIN DE L’AFIA 66 numéro 60 - juillet 2005 SOMMAIRES DES REVUES

APPLIED AI V19 N¡2 FEBRUARY 2005 A Distributed Neural Approach For Causal Reasoning Using Planning To Optimize The Umts Call Setup For The Cooperative And Competitive Neural Computations, L. B. Execution Of Mobile Applications, R. ENGLERT ROMDHANE, B. AYEB Topic Detection Of Unrestricted Texts: Approaches And Evaluations, Y. CHALI The Act Of Creating Humorous Acronyms, O. STOCK, C. STRAPPARAVA COMPUTATIONAL INTELLIGENCE A Genetic Algorithm Approach To Minimize Transmission http://www.blackwellpublishing.com/journal.asp?ref=0824- Error Of Automotive Spur Gear Sets, D. J. FONSECA, S. 7935&site=1 SHISHOO, T. C. LIM, D. S. CHEN Selection Of Variables By Genetic Algorithms To Classify COMPUTATIONAL INTELLIGENCE V21 N¡1 Apple Beverages By Artificial Neural Networks, M. GES- FEBRUARY 2005 TAL, M. PAZ GÓMEZ-CARRACEDO, J. M. ANDRADE, Strategic Interactions In A Supply Chain Game, M. P. WELL- J. DORADO, E. FERNÁNDEZ, D. PRADA, A. PAZOS MAN, J. ESTELLE, S. SINGH, Y. VOROBEYCHIK, C. KIEKINTVELD, V. SONI APPLIED AI V19 N¡3-4 MARCH 2005 Compact Diagnoses Representation In Diagnostic Problem Not Quite An Editorial: Educational Agents And (E-) Solving, P. TORASSO, G. TORTA Learning, S. PAYR Feature-Based Korean Grammar Utilizing Learned Constraint Lessons From Emotion Psychology For The Design Of Rules, S.-Y. PARK, Y.-J. KWAK, H.-C. RIM, H.-S. LIM Lifelike Characters, J. GRATCH, S. MARSELLA Fast And Robust Incremental Action Prediction For Learning By Feeling: Evoking Empathy With Synthetic Interactive Agents, J. DINERSTEIN, D. VENTURA, P. K. Characters, A. PAIVA, J. DIAS, D. SOBRAL, R. AYLETT, EGBERT S. WOODS, L. HALL, C. ZOLL The Empathic Companion: A Character-Based Interface That COMPUTATIONAL INTELLIGENCE V21 N¡2 MAY Addresses Users' Affective States, H. PRENDINGER, M. 2005 ISHIZUKA On Knowledge Grid And Grid Intelligence: A Survey, W. K. Affect In Tutoring Dialogues, D. HEYLEN, A. NIJHOLT, R. CHEUNG, J. LIU OP DEN AKKER XML Declarative Description With First-Order Logical Toward Reusable Roleplayers Using An Appraisal-Based Constraints, C. ANUTARIYA, V. WUWONGSE, K. AKAMA Architecture, S. RANK Semantics-Assisted Problem Solving On The Semantic Grid, Sensitizing Social Agents For Virtual Training, H. NAKANI- L. CHEN, N. RICHARD SHADBOLT, F. TAO, C. GOBLE, SHI, S. SHIMIZU, K. ISBISTER C. PULESTON, S. J. COX Learning By Teaching: A New Agent Paradigm For Building A Data-Mining Grid For Multiple Human Brain Educational Software, GAUTAM BISWAS, KRITTAYA Data Analysis, N. ZHONG, J. HU, S. MOTOMURA, J.-L. LEELAWONG, DANIEL SCHWARTZ, NANCY VYE WU, C. LIU Close Encounters Of The Virtual Kind: Agents Simulating Query Routing In A Peer-To-Peer Semantic Link Network, H. Copresence, M. GERHARD, D. MOORE, D. HOBBS ZHUGE, J. LIU, L. FENG, X. SUN, C. HE Using Theatrical Concepts For Role-Plays With Educational Agents, M. KLESEN

APPLIED AI V19 N¡5 MAY-JUNE 2005 Intelligent Sensor Fusion And Learning For Autonomous APPLIED INTELLIGENCE Robot Navigation, K. C. TAN, Y. J. CHEN, L. F. WANG, D. http://www.kluweronline.com/issn/0924-669X/ K. LIU On The Performance Of Estimation Of Distribution APPLIED INTELLIGENCE V22 N¡2 MARCH 2005 Algorithms Applied To Software Testing, R. SAGARNA, J. Personalized Course Navigation Based on Grey Relational A. LOZANO Analysis, H.-M. LEE, C.-C. HUANG, T.-T. KAO Constraint Satisfaction In “Conscious” Software Agents—A Building Bayesian Network Models in Medicine: The MEN- Practical Application, A. KELEMEN, S. FRANKLIN, Y. TOR Experience, S. MANI, M. VALTORTA, S. MCDER- LIANG MOTT Motion Planning Of An Intelligent Robot Using Ga Motivated Searching the Solution Space in Constructive Geometric Temporal Associative Memory, S. PATNAIK, K. KARIBA- Constraint Solving with Genetic Algorithms, M. V. SAPPA LUZON, A. SOTO, J. F. GALVEZ, R. JOAN-ARINYO B ULLETIN DE L’AFIA numéro 60 - juillet 2005 67 SOMMAIRES DES REVUES

3-D Container Packing Heuristics, A. LIM, B. RODRIGUES, ARTIFICIAL INTELLIGENCE REVIEW Y. YANG http://www.kluweronline.com/issn/0269-2821/contents Multi-Instance Learning Based Web Mining, Z.-H. ZHOU, K. JIANG, M. LI AI REVIEW V23 N¡1 2005 Optimal Control of Fed-Batch Processes Based on Multiple Statistical, Evolutionary, and Neurocomputing Clustering Neural Networks, Z. XIONG, J. ZHANG Techniques: Cluster-Based vs Object-Based Approaches, P. LINGRAS, X. HUANG APPLIED INTELLIGENCE V22 N¡3 MAY 2005 A Study on Distribution Preservation Mechanism in Evolutionary Radial Basis Functions for Credit Assessment, Evolutionary Multi-Objective Optimization, E. F. KHOR, E. LACERDA, A. C. P. L. F. CARVALHO, A. PADUA K. C. TAN, T. H. LEE, et al. BRAGA, T. B. LUDERMIR Some Reflections on Intelligent Control, H. TIANFIELD Methods for Operations Planning in Airport Decision Support Systems, J. GARCIA HERRERO, A. BERLANGA, J. M. AI REVIEW V23 N¡2 2005 MOLINA, J. R. CASAR Spatial Models for Wide-Area Visual Surveillance: A Hybrid Neural-Genetic Algorithm for the Frequency Computational Approaches and Spatial Building-Blocks, Assignment Problem in Satellite Communications, S. R. J. HOWARTH SALCEDO-SANZ, C. BOUSONO-CALZON Graded Relative Evidence, D. BELL A Prioritized Information Fusion Method for Handling Fuzzy A Comparative Study of Game Theoretic and Evolutionary Decision-Making Problems, S.-J. CHEN, S.-M. CHEN Models of Bargaining for Software Agents, S. S. FATIMA, Multileveled Symbiotic Evolutionary Algorithm: Application M. WOOLDRIDGE, N. R. JENNINGS to FMS Loading Problems, J. YUN KIM, Y. KEUN KIM Similarity Analysis of Video Sequences Using an Artificial AI REVIEW V23 N¡3 2005 Neural Network, S. M. BHANDARKAR, F. CHEN Feature Recognition in Solar Images, V. ZHARKOVA, S. IPSON, A. BENKHALIL, S. ZHARKOV Evolving Dynamic Multi-Objective Optimization Problems with Objective Replacement, S.-U. GUAN, Q. CHEN, W. MINDS AND MACHINES MO JOURNAL FOR ARTIFICIAL INTELLIGENCE PHI- Intelligent Fixture Design through a Hybrid System of LOSOPHY AND COGNITIVE SCIENCE Artificial Neural Network and Genetic Algorithm, M. http://www.springeronline.com/sgw/cda/frontpage/0,0,5-0- HAMEDI 70-35534114-0,0.html AI REVIEW V23 N¡4 2005 MINDS AND MACHINES V15 N¡1 FEBRUARY 2005 Relation Algebras and their Application in Temporal and Problem for Massive Modularity, J. COLLINS Spatial Reasoning, I. DUENTSCH Attractor Spaces as Modules: A Semi-Eliminative Reduction Characterisation of a Novel Indexing Technique for Case- of Symbolic AI to Dynamic Systems Theory, T. ROCK- Based Reasoning, D. W. PATTERSON, M. GALUSHKA, WELL N. ROONEY Cognition and the Power of Continuous Dynamical Systems, On Paradox of Fuzzy Modeling: Supervised Learning for W. SCHONBEIN Rectifying Fuzzy Membership Function, S. LIN Computing Machinery and Emergence: The Aesthetics and Metaphysics of Video Games, J. COGBURN, M. SILCOX AI REVIEW V24 N¡1 2005 Book Reviews: Airport Gate Scheduling with Time Windows, A. LIM, B. David Papineau,Thinking About Consciousness, Clarendon RODRIGUES, Y. ZHU Press (Oxford University Press), 2002, by R. WYATT Review on Computational Trust and Reputation Models, J. George Lakoff and Rafael E. Nunez, Where Mathematics SABATER, C. SIERRA Comes From, New York: Basic Books, 2000, by G. M. Evaluating Six Candidate Solutions for the Small-Disjunct SHUTE Problem and Choosing the Best Solution via Meta- Franz Baader et al. (eds.), The Description Logic Handbook, Learning, D. R. CARVALHO, A. A. FREITAS Cambridge: Cambridge University Press, 2003, by M. BREMER Patrick Blackburn, Maarten de Rijke and Yde Venema, Modal Logic, Cambridge: Cambridge University Press, by M. BREMER B ULLETIN DE L’AFIA 68 numéro 60 - juillet 2005 SOMMAIRES DES REVUES

MINDS AND MACHINES Differences in effect of robot and screen agent recommenda- JOURNAL FOR ARTIFICIAL INTELLIGENCE PHI- tions on human decision-making, K. SHINOZAWA, F. LOSOPHY AND COGNITIVE SCIENCE NAYA,J. YAMATO, K. KOGURE http://www.springeronline.com/sgw/cda/frontpage/0,0,5-0- Manipulation of non-verbal interaction style and demographic 70-35534114-0,0.html embodiment to increase anthropomorphic computer cha- racter credibility, A. J. COWELL, K. M. STANNEY MINDS AND MACHINES V15 N¡1 FEBRUARY 2005 Problem for Massive Modularity, J. COLLINS IJHCS V62 N¡3 MARCH 2005 Attractor Spaces as Modules: A Semi-Eliminative Reduction Presence, memory and interaction in virtual environments, A. of Symbolic AI to Dynamic Systems Theory, T. ROCK- SUTCLIFFE, B. GAULT, J.-E. SHIN WELL The emergence of the contextual role of the e-book in cogni- Cognition and the Power of Continuous Dynamical Systems, tive processes through an ecological and functional analy- W. SCHONBEIN sis, T. MORINEAU, C. BLANCHE, L. TOBIN, N. GUE- Computing Machinery and Emergence: The Aesthetics and GUEN Metaphysics of Video Games, J. COGBURN, M. SILCOX The effects of task complexity and time availability limita- Book Reviews: tions on human performance in database query tasks, H. David Papineau,Thinking About Consciousness, Clarendon TOPI, J.S. VALACICH, J.A. HOFFER Press (Oxford University Press), 2002, by R. WYATT The mechanics of trust: A framework for research and design, George Lakoff and Rafael E. Nunez, Where Mathematics J. RIEGELSBERGER, M.A. SASSE, J.D. MCCARTHY Comes From, New York: Basic Books, 2000, by G. M. Erratum to: ''The production and recognition of emotions in SHUTE speech: features and algorithms'', P.-Y. OUDEYER Franz Baader et al. (eds.), The Description Logic Handbook, Cambridge: Cambridge University Press, 2003, by M. http://mitpress.mit.edu/catalog/item/default.asp?sid=8563C0 BREMER 99-9701-4DD2-85C8-8F3502E9C8AE&ttype=4&tid=10 Patrick Blackburn, Maarten de Rijke and Yde Venema, Modal Logic, Cambridge: Cambridge University Press, by M. COMPUTATIONAL LINGUISTICS V31 N¡1 MARCH BREMER 2005 Some Points in a Time, K. SPÄRCK-JONES Squibs and Discussions INTERNATIONAL JOURNAL Real versus Template-Based Natural Language Generation: A OF HUMAN-COMPUTER STUDIES False Opposition?, K. VAN DEEMTER, E. KRAHMER, M. http://www.academicpress.com/ijhcs THèUNE Articles IJHCS V62 N¡2 FEBRUARY 2005 Discrimative Reranking for Natural Language Parsing, M. Special issue COLLINS, T. KOO Subtle expressivity for characters and robots, edited by N. The Proposition Bank: An Annotated Corpus of Semantic SUZUKI, C. BARTNECK Roles, M. PALMER, D. GILDEA, P. KINGSBURY Computers that care: investigating the effects of orientation of Clustering Syntactic Positions with Similar Semantic emotion exhibited by an embodied computer agent, S. Requirements, P. GAMALLO, A. AGUSTINI, G. P. LOPES BRAVE, C. NASS, K. HUTCHINSON Book reviews Subtle emotional expressions of synthetic characters, C. Ontological Semantics by S. Nirenburg and V. Raskin, by J. F. BARTNECK, J. REICHENBACH SOWA TelMeA-Expressive avatars in asynchronous communica- Argumentation Machines: New Frontiers in Argumentation tions, T. TAKAHASHI, C. BARTNECK, Y. KATAGIRI, N. and Computation edited by C. Reed and T. J. Norman, by H. ARAI I. ZUKERMAN Variations in gesturing and speech by GESTYLE, H. NOOT, Z. RUTTKAY Using human physiology to evaluate subtle expressivity of a virtual quizmaster in a mathematical game, H. PRENDIN- GER, J. MORI, M. ISHIZUKA NATURAL LANGUAGE ENGINEERING Cooperative embodied communication emerged by interactive http://titles.cambridge.org/journals/journal_catalogue.asp?mn humanoid robots, D. SAKAMOTO, T. KANDA, T. ONO, emonic=nle M. KAMASHIMA, M. IMAI, H. ISHIGURO B ULLETIN DE L’AFIA numéro 60 - juillet 2005 69 SOMMAIRES DES REVUES

NLE V11 N¡1 MARCH 2005 Genericity and portability for task-independent speech reco- Robust parsing with weighted constraints, K. FOTH, W. MEN- gnition, F. LEFEVRE, J.-L. GAUVAIN, L. LAMEL ZEL, I. SCHRÖDER A comparison of parsing technologies for the biomedical domain, C. GROVER, A. LASCARIDES, M. LAPATA Visualization-enabled multi-document summarization by MACHINE LEARNING Iterative Residual Rescaling, R. ANDO, B. BOGURAEV, http://www.wkap.nl/jrnltoc.htm/0885-6125 R. BYRD, M. NEFF Correcting real-word spelling errors by restoring lexical cohe- MACHINE LEARNING V58 N¡2-3 2005 sion, G. HIRST, A. BUDANITSKY Evolutionary Rule Mining in Time Series Databases, M. LIE Industry Watch, R. DALE HETLAND, P. SAETROM Book reviews Automatic Feature Extraction for Classifying Audio Data, I. Charles D. Yang. Knowledge and Learning in Natural MIERSWA, K. MORIK Language. Oxford University Press., 2002, by P. BUTTE- Clustering Time Series with Clipped Data, A. BAGNALL, G. RY JANACEK Ali Farghlay, editor. Handbook for Language Engineers Classification of Multivariate Time Series and Structured Data (CSLI Lecture Notes, No. 164). CSLI Publications, Using Constructive Induction, M. WALEED KADOUS, C. Stanford, by M. STEVENSON SAMMUT Principle Components and Importance Ranking of Distributed Anomalies, K. BEGNUM, M. BURGESS Fast and Exact Warping of Time Series Using Adaptive USER MODELING Segmental Approximations, Y. SHOU, N. MAMOULIS, D. AND USER-ADAPTED INTERACTION W. CHEUNG http://www.wkap.nl/jrnltoc.htm/0924-1868 Discovery of Time-Series Motif from Multi-Dimensional Data Based on MDL Principle, Y. TANAKA, K. IWAMO- UMUAI V14 N¡5 JANUARY 2005 TO, K. UEHARA Exploiting Query Repetition and Regularity in an Adaptive Elastic Translation Invariant Matching of Trajectories, M. Community-Based Web Search Engine, B. SMYTH, E. VLACHOS, G. KOLLIOS, D. GUNOPULOS BALFE, J. FREYNE, et al. Knowledge Discovery with Genetic Programming for Providing Feedback to Courseware Authors, C. ROME- RO, S. VENTURA, P. de BRA NEURAL NETWORKS http://www.elsevier.com/inca/publications/store/8/4/1/

NEURAL NETWORKS V18 N¡2 MARCH 2005 COMPUTER SPEECH AND LANGUAGE Cogent confabulation, R. HECHT-NIELSEN http://www.sciencedirect.com/science?_ob=JournalURL&_is Intelligent initialization of resource allocating RBF networks, sn=08852308&_auth=y&_acct=C000050221&_ver- M. WALLACE, N. TSAPATSOULIS, S. KOLLIAS sion=1&_urlVersion=0&_userid=10&md5=be00614a6a8826 Mathematical and Computational Analysis 664cf3538182118628 Chaotic dynamics of a behavior-based miniature mobile robot: effects of environment and control structure, MD. COMPUTER SPEECH & LANGUAGE V19 N¡3 JULY MONIRUL ISLAM, K. MURASE 2005 Adaptive algorithms for first principal eigenvector computa- Estimation of stochastic context-free grammars and their use tion, C. CHATTERJEE as language models, J.M. BENEDê, J.A. SÁNCHEZ Analysis of global exponential stability and periodic solutions A computational approach to the variations in Arabic verbal of neural networks with time-varying delays, H. HUANG, orthography, S. ALNAJEM D. W.C. HO, J. CAO Efficient computation of the frame-based extended union On the global output convergence of a class of recurrent neu- model and its application in speech recognition against ral networks with time-varying inputs, S. HU, D. LIU partial temporal corruptions, A. CHAN, M. SIU Engineering and Design Using semantic analysis to improve speech recognition per- NEUROM: a ROM based RNS digital neuron, G. ALIA, E. formance, H. ERDOGAN, R. SARIKAYA, S. F. CHEN, Y. MARTINELLI GAO, M. PICHENY Technology and Applications B ULLETIN DE L’AFIA 70 numéro 60 - juillet 2005 SOMMAIRES DES REVUES

TAO-robust backpropagation learning algorithm, A. V. Customization in a unified framework for summarizing medi- PERNêA-ESPINOZA, J. B. ORDIERES-MERÉ, F. J. cal literature, N. ELHADAD, M.-Y. KAN, J.L. KLAVANS, MARTÍNEZ-DE-PISÓN, A. GONZÁLEZ-MARCOS K.R. MCKEOWN Experimentally optimal _ in support vector regression for dif- ferent noise models and parameter settings, A. CHALI- AI IN MEDICINE V33 N¡3 MARCH 2005 MOURDA, B. SCHÖLKOPF, A. J. SMOLA A reliable probabilistic sleep stager based on a single EEG signal, A. FLEXER, G. GRUBER, G. DORFFNER NEURAL NETWORKS V18 N¡3 APRIL 2005 A method for detection of Alzheimer's disease using ICA- A model of smooth pursuit in primates based on learning the enhanced EEG measurements, C. MELISSANT, A. YPMA, target dynamics, T. SHIBATA, H. TABATA, S. SCHAAL, E.E.E. FRIETMAN, C.J. STAM M. KAWATO Applying instance-based techniques to prediction of final out- Information theory, novelty and hippocampal responses: come in acute stroke, C. GOTTRUP, K. THOMSEN, P. unpredicted or unpredictable?, B.A. STRANGE, A. DUG- LOCHT, O. WU, A.G. SORENSEN, W.J. KOROSHETZ, L. GINS, W. PENNY, R.J. DOLAN, K.J. FRISTON OSTERGAARD Dynamical behaviors of Cohen-Grossberg neural networks An arrhythmia classification system based on the RR-interval with discontinuous activation functions, W. LU, T. CHEN signal, M.G. TSIPOURAS, D.I. FOTIADIS, D. SIDERIS Global exponential stability of delayed competitive neural A classifier based on the artificial neural network approach for networks with different time scales, H. LU, Z. HE cardiologic auscultation in pediatrics, S.R. BHATIKAR, C. An asymptotic statistical analysis of support vector machines DEGROFF, R.L. MAHAJAN with soft margins, K. IKEDA, T. AOISHI Applying spatial distribution analysis techniques to classifica- Improved local learning rule for information maximization tion of 3D medical images, D. POKRAJAC, V. MEGA- and related applications, R. LINSKER LOOIKONOMOU, A. LAZAREVIC, D. KONTOS, Z. The dynamic wave expansion neural network model for robot OBRADOVIC motion planning in time-varying environments, D.V. LEBEDEV, J.J. STEIL, H.J. RITTER AI IN MEDICINE V34 N¡1 MAY 2005 Self-organizing information fusion and hierarchical knowled- Artificial Intelligence in Medicine in Europe AIME'03, M. ge discovery: a new framework using ARTMAP neural DOJAT, E. KERAVNOU networks, G.A. CARPENTER, S. MARTENS, O.J. OGAS A framework for distributed mediation of temporal-abstrac- Predictive neural networks for gene expression data analysis, tion queries to clinical databases, D. BOAZ, Y. SHAHAR A.H. TAN, H. PAN Temporal data mining for the quality assessment of hemodia- Book review: Exploratory analysis and data modeling in func- lysis services, R. BELLAZZI, C. LARIZZA, P. MAGNI, R. tional neuroimaging, A. NIETO-CASTANON BELLAZZI Generalised reliability characteristics for probabilistic net- works, D. SENT, L.C. VAN DER GAAG Decision support of inspired oxygen selection based on ARTIFICIAL INTELLIGENCE IN MEDICINE Bayesian learning of pulmonary gas exchange parameters, http://www.elsevier.com/inca/publications/store/5/0/5/6/2/7/ D. MURLEY, S. REES, B. RASMUSSEN, S. ANDREAS- SEN AI IN MEDICINE V33 N¡2 FEBRUARY 2005 A new method for sleep apnea classification using wavelets Information extraction and summarization from medical and feedforward neural networks, O. FONTENLA- documents. C.D. SPYROPOULOS, V. KARKALETSIS ROMERO, B. GUIJARRO-BERDINAS, A. ALONSO- Automatic processing of multilingual medical terminology: BETANZOS, V. MORET-BONILLO applications to thesaurus enrichment and cross-language Constraint reasoning in deep biomedical models, J. CRUZ, P. information retrieval, H. DEJEAN, E. GAUSSIER, J.-M. BARAHONA RENDERS, F. SADAT Bio-medical entity extraction using support vector machines, AI IN MEDICINE V34 N¡2 JUNE 2005 K. TAKEUCHI, N. COLLIER Merging multimedia presentations and semistructured tempo- Comparative experiments on learning information extractors ral data: a graph-based model and its application to clini- for proteins and their interactions, R. BUNESCU, R. GE, cal information, C. COMBI, B. OLIBONI, R. ROSSATO R.J. KATE, E.M. MARCOTTE, R.J. MOONEY, A.K. Predicting breast cancer survivability: a comparison of three RAMANI, Y.W. WONG data mining methods, D. DELEN, G. WALKER, A. Summarization from medical documents: a survey, S. AFAN- KADAM TENOS, V. KARKALETSIS, P. STAMATOPOULOS Evaluation of radiological features for breast tumour classifi- B ULLETIN DE L’AFIA numéro 60 - juillet 2005 71 SOMMAIRES DES REVUES

cation in clinical screening with machine learning Graphical models for imprecise probabilities, F.G. COZMAN methods. The UK MARIBS Breast Screening Study, T.W. Utilizing belief functions for the estimation of future climate NATTKEMPER, B. ARNRICH, O. LICHTE, W. TIMM, A. change, E. KRIEGLER, H. HELD DEGENHARD, L. POINTON, C. HAYES, M.O. LEACH Benefits of embedding structural constraints in coherent dia- Characterization of clustered microcalcifications in digitized gnostic processes, A. CAPOTORTI mammograms using neural networks and support vector Upper entropy of credal sets. Applications to credal classifi- machines, A. PAPADOPOULOS, D.I. FOTIADIS, A. cation, J. ABELLAN, S. MORAL LIKAS Dynamic programming for deterministic discrete-time sys- Neural network predictions of significant coronary artery ste- tems with uncertain gain, G. de COOMAN, M.C.M. nosis in men, B.A. MOBLEY, E. SCHECHTER, W.E. TROFFAES MOORE, P.A. MCKEE, J.E. EICHNER Inference in credal networks: branch-and-bound methods and A spatio-temporal Bayesian network classifier for understan- the A/R+ algorithm, J.C. FERREIRA DA ROCHA, F.G. ding visual field deterioration, A. TUCKER, V. VINCIOT- COZMAN TI, X. LIU, D. GARWAY-HEATH Uncertainty modelling and conditioning with convex impreci- se previsions, R. PELESSONI, P. VICIG

IJAR V40 N¡1-2 JULY 2005 INTERNATIONAL JOURNAL Introduction to special issues on data mining and granular OF APPROXIMATE REASONING computing, T.Y. LIN http://www.elsevier.com/inca/publications/store/5/0/5/7/8/7/ Design of nearest neighbor classifiers: multi-objective approa- ch, J.H. CHEN, H.M. CHEN, S.Y. HO IJAR V39 N¡1 APRIL 2005 Rough representation of a region of interest in medical Behavioral design to model a reactive decision of an expert in images, S. HIRANO, S. TSUMOTO geothermal wells, A.L. LAUREANO-CRUCES, G. ESPI- Rough set theory for topological spaces, E.F. LASHIN, A.M. NOSA-PAREDES KOZAE, A.A. ABO KHADRA, T. MEDHAT The development of a robust fuzzy inference mechanism, Mining association rules with multiple minimum supports W.W. MELEK, A.A. GOLDENBERG using maximum constraints, Y.C. LEE, T.P. HONG, W.Y. Foundations of probabilistic inference with uncertain eviden- LIN ce, F. J. GROEN, A. MOSLEH A simplicial complex, a hypergraph, structure in the latent Representing human uncertainty by subjective likelihood esti- semantic space of document clustering, T.Y. LIN, I.J. mates, F. A . DAHL CHIANG An adaptive fuzzy observer-based approach for chaotic syn- The investigation of the Bayesian rough set model, D. SLE- chronization, C.S. TING ZAK, W. ZIARKO The structure analysis of fuzzy sets, L. ZHANG, B. ZHANG IJAR V39 N¡2-3 JUNE 2005 A new fuzzy clustering algorithm for optimally finding gra- Credibility via imprecise probability, M. ZAFFALON nular prototypes, Y. XIE, V.V. RAGHAVAN, P. DHATRIC, An introduction to the imprecise Dirichlet model for multino- X. ZHAO mial data, J.M. BERNARD Partial identification with missing data: concepts and findings, C.F. MANSKI

B ULLETIN DE L’AFIA 72 numéro 60 - juillet 2005 LES DOSSIERS DU BULLETIN DE L’AFIA

Raisonnement à partir de cas...... Bulletin n¡59 Multimédia et I.A...... Bulletin n¡58 Planification et heuristiques...... Bulletin n¡56/57 Systèmes d’Information ...... Bulletin n¡55 Web sémantique ...... Bulletin n¡54 L’IA dans le RNTL ...... Bulletin n¡53 IA et diagnostic ...... Bulletin n¡52 Temps, espace et évolutif ...... Bulletin n¡51 Equipes d’IA en France ...... Bulletin n¡49/50 IA et Médecine...... Bulletin n¡48 Fouille de données ...... Bulletin n¡46/47 IA et document ...... Bulletin n¡44 IA et connexionnisme...... Bulletin n¡43 IA et Vie Artificielle ...... Bulletin n¡42 IA et CHM ...... Bulletin n¡41 IA et EIAH...... Bulletin n¡40 Plates-formes multi-agents...... Bulletin n¡39 IA et WEB...... Bulletin n¡38 Mémoires d’entreprises...... Bulletin n¡36 IA et logique ...... Bulletin n¡35 Ingénierie des connaissances...... Bulletin n¡34 IA et Télécommunications ...... Bulletin n¡33 IA et Terminologie...... Bulletin n¡32 Décision et IA ...... Bulletin n¡31 Raisonnement IA et Image...... Bulletin n¡30 Raisonnement temporel et spatial ...... Bulletin n¡29 Systèmes Multi-agents...... Bulletin n¡28 IA et robotique...... Bulletin n¡27 I.A . et biologie moléculaire ...... Bulletin n¡26 A. et droit ...... Bulletin n¡25 I.A. et fusion de données ...... Bulletin n¡24 I.A. et musique ...... Bulletin n¡23 Apprentissage ...... Bulletin n¡22 Les explications dans les SBC...... Bulletin n¡20 Pétrole-Chimie...... Bulletin n¡19 Le raisonnement à partir de cas ...... Bulletin n¡18 I.A. et temps-réel...... Bulletin n¡17 Planification et action...... Bulletin n¡16 Traitement automatique des langues ...... Bulletin n¡15 I.A. et médecine ...... Bulletin n¡14 Diagnostic à base de modèles ...... Bulletin n¡13 Validation des SBC ...... Bulletin n¡12 Le connexionnisme ...... Bulletin n¡11 I.A. et jeux...... Bulletin n¡10 E.I.A.O...... Bulletin n¡9 I.A. et gestion ...... Bulletin n¡8 Conception et I.A...... Bulletin n¡7 Intelligence artificielle distribuée ...... Bulletin n¡6 Acquisition des Connaissances...... Bulletin n¡5 IA et ordonnancement ...... Bulletin n¡4

B ULLETIN DE L’AFIA numéro 60 - juillet 2005 73 APPELS Ë DOSSIERS

Dossier Ç IA et Bioinformatique È

Coordonnateurs : François Coste (IRISA, Rennes, [email protected]), Christine Froidevaux (LRI, Orsay, [email protected])

Objectifs Qui peut soumettre ?

La bioinformatique a connu ces dernières années un essor Toute équipe de recherche de la communauté francopho- considérable suite à l’explosion des technologies permettant ne appartenant à un établissement public ou industriel, impli- d’obtenir à haut débit un grand nombre de données en géno- quée dans des actions de recherche et de développement cor- mique nécessitant des méthodes automatiques de traitement. respondant aux objectifs du dossier. L’outil informatique est alors devenu indispensable pour le Les industriels sont fortement sollicités. stockage et la manipulation de ces données. Après cette phase d’acquisition des données, le nouveau Comment soumettre ? défi de la post-génomique consiste à extraire de la connais- sance à partir de cette masse de données. Face au changement Les contributions devront présenter succinctement l’équi- d’échelle du nombre de données disponibles, l’informatique a pe et les principaux travaux concernant le thème « IA et bio- un rôle à jouer pour assister le biologiste dans sa quête de la informatiqueÈ : concepts, outils, expériences, applications compréhension du vivant, l’élaboration de nouveaux concepts mises en Ïuvre. Elles seront organisées selon le schéma sui- et la formulation de nouvelles hypothèses. En particulier, vant : l’intelligence artificielle peut aider le biologiste à modéliser ¥ Identification de l’équipe : nom, adresse, site Web, person- des systèmes complexes composés d’objets de types diffé- ne à contacter (téléphone, mél) ; rents en fortes interactions. ¥ Membres de l’équipe concernés par le sujet; L’intelligence artificielle peut être utilisée avantageuse- ¥Thème général de l’équipe ; ment dans différents domaines clés de la bioinformatique, ¥ Description des travaux ou projets en lien avec le thème du par exemple : la structuration et l’évolution des génomes, la dossier ; prédiction de la topologie de protéines et de leurs sites actifs, ¥ Courte bibliographie ciblée (5 références maximum) et la compréhension du contrôle du niveau d’expression, la adresse d’un site Web où l’on peut trouver l’ensemble des modélisation des réseaux d’interactions et de leur niveau d’or- références et articles. ganisation, la découverte de voies thérapeutiques, etc. Toutes les composantes de l’intelligence artificielle sont Présentation concernées. Le choix judicieux d’une bonne représentation de connaissances est crucial pour une modélisation pertinente. Les contributions feront 1400 mots au maximum et Le recours à des méthodes d’apprentissage permet de décou- devront être envoyées par courrier électronique au format vrir des régularités dans ces masses de données et de propo- Word ou RTF. Aucune mise en forme particulière ne doit être ser des modèles à partir d’exemples pouvant conduire à faite sur les textes autre que gras, italique et la taille des carac- l’identification de nouveaux éléments satisfaisant le modèle. tères. Si vous êtes concernés par cet appel, merci d’envoyer L’interprétation des phénomènes biologiques passe par l’inté- votre contribution gration de données très hétérogènes pouvant bénéficier de l’utilisation d’ontologies pour leur mise en correspondance. *** avant le 15 octobre 2005 ***

Ce dossier a pour objectif de recenser et présenter les aux coordonnateurs. équipes dont les travaux se situent à l’intersection de l’intelli- Pour tout renseignement, s’adresser par courrier électro- gence artificielle et de la bioinformatique. nique, à l’un des coordonnateurs.

B ULLETIN DE L’AFIA 74 numéro 60 - juillet 2005 AFIA Tarifs 2005 l’AFIA est membre de l’ECCAI

Adhésion individuelle et abonnement ❏ Demande ❏ Renouvellement

Nom : Prénom : Affiliation : Adresse postale : N¡ de téléphone : N¡ de télécopie : Adresse électronique : Activités (à titre professionnel / à titre privér (rayer la mention inutile) ) :

Consultation du bulletin sur Envoi du bulletin papier + un accès pour WEB (pour une personne) consultation du bulletin sur WEB ❏ Adhésion simple : 30 Euros 60 Euros ❏ Adhésion étudiant (sur justificatif) : 15 Euros 30 Euros ❏ Adhésion de soutien Sans objet 90 Euros ❏ Abonnement au bulletin sans adhésion Sans objet 55 Euros

❏ Adhésion au collège IAD-SMA : ajouter 7,5 Euros pour les étudiants, 15 Euros pour les autres. ❏ Adhésion au collège Cafe (Apprentissage) : gratuit.

Adhésion Personne morale ❏ Demande ❏ Renouvellement

Organisme : Adresse postale commune aux bénéficiaires couverts par cette adhésion : Nom et prénom du représentant : Fonction : Mél : Tél : Fax : Adresse postale :

Le tarif d’hadésion comprend une partie fixe et une partie par bénéficiaire Coordonnées des bénéficiaires (10 maximum) : NOM, prénom Mél. Tél. Fax

Tarif de base fixe : Tarif par bénéficiaire : ❏ Laboratoires universitaires 100 Euros 30 Euros ❏ Personnes morales non universitaires 300 Euros 30 Euros ❏ Adhésion de soutien 600 Euros Sans objet ❏ j’accepte que les renseignements ci-dessus apparaissent dans l’annuaire de l’AFIA. ❏ j’accepte que les renseignements ci-dessus soient transmis à l'ECCAI pour constituer un fichier européen.

Veuillez trouver un règlement (à l'ordre de l'AFIA ) de ...... Euros

Trésorier AFIA : Jérémie MARY, LRI, Bâtiment 490, Université Paris-Sud, 91405 ORSAY. Mode d’adhésion : De préférence, en ligne via le site Internet de l’AFIA : http : //www.afia-france.org A défaut, cette page doit être envoyée au trésorier. Modes de paiement : 1) par chèque, à l’ordre de l’AFIA, envoyé au trésorier. 2) par bon de commande administratif, à l’ordre de l’AFIA, envoyé au trésorier. 3) Par virement bancaire sur le compte de l’AFIA : Société Générale, Résidence du Val de Seine, 78430 LOUVECIENNES. Code banque 30003, code guichet 01902, numéro de compte 00037283856 clef RIB 3. TVA non applicable, article 293B du CGI

B ULLETIN DE L’AFIA numéro 60 - juillet 2005 75 S OMMAIRE DU B ULLETIN N¡60

Editorial...... 3

Prix AFIA ...... 4

Débat ...... 6

l’I.A. au Québec ...... 7

Dossier : Intelligence Artificielle et Image ...... 9

Interviews ...... 28

Présentation de Laboratoires ...... 31

Laboratoires ...... 32

Revue bibliographique ...... 47

Conférences ...... 56

Resuméde thèses et d’HRD ...... 64

Sommaires des Revues ...... 64

Appels à dossiers ...... 74

CALENDRIER DE PARUTION DU BULLETIN DE L’AFIA Hiver Eté Réception des contributions: Réception des contributions: 15 décembre 15 juin Sortie le 31 janvier Sortie 31 juillet

Printemps Automne Réception des contributions: Réception des contributions: 15 mars 15 septembre Sortie le 30 avril Sortie le 31 octobre B ULLETIN DE L’AFIA 76 numéro 60 - juillet 2005