Artificielle
Total Page:16
File Type:pdf, Size:1020Kb
#69 NOVEMBRE 2019 L’INTELLIGENCE ARTIFICIELLE CONTEXTE − TECHNOLOGIES − DOMAINES D’APPLICATION − PERSPECTIVES POINT DE VUE L’IA, nouveau « graal » de l’informaticien ? Par Rodolphe Gelin, expert IA (Renault Paris) © DR « Si le Cro-Magnon informatique des années 90 pouvait se dire que la loi de Moore allait régler ses problèmes de performance, le geek contemporain ne peut plus trop y compter, la physique des micro-processeurs ayant déjà pratiquement atteint ses limites. » e retour en grâce de l’intelligence artificielle et surtout des nouvelles valeurs des paramètres qui, en une dizaine d’itérations, lui techniques basées sur l’apprentissage a été rendu possible permettent de bien reconnaître les 80 000 exemples. Les perfor- par l’explosion du nombre de données disponibles et l’ac- mances de ce réseau fraîchement formé sont ensuite testées sur les 20 croissement exponentiel des puissances de calcul. Ces 000 images restantes. Comme la « vérité terrain » est connue pour ces Lnouveaux ordres de grandeur permettent de mettre en œuvre des images, la qualité de l’apprentissage est automatiquement évaluée. Si algorithmes et des méthodes inenvisageables il y a une trentaine d’an- le réseau en reconnaît correctement 99 %, on peut commencer à le nées. À la fin des années 80, ce qu’on appelait une explosion combi- faire travailler réellement. Mais généralement, ce type de perfor- natoire ne semble plus aujourd’hui qu’un pétard combinatoire mouillé ! mances n’est pas obtenu du premier coup. L’apprentissage est donc recommencé selon les mêmes modalités et peut être répété une di- Un des domaines où l’évolution a été la plus spectaculaire est le trai- zaine de fois, le tout en moins de 10 minutes, grâce aux ressources de tement d’images. Comparons ainsi le même exercice réalisé par un calcul actuelles. L’étudiant de 2019 a effectué en quelques minutes étudiant à 30 ans d’intervalle : reconnaître la présence d’une voiture plus de calculs que celui de 1990 en aurait fait dans toute sa vie (si la sur une photo. A la fin du XXe siècle, son programme recherchait explicitement, parmi les pixels formant l’image, des éléments carac- technologie s’était arrêtée là). térisant une voiture : des bords (zones de couleurs différentes), des Le travail de l’informaticien du XXIe siècle serait-il donc beaucoup bords vaguement circulaires (roues) puis plus rectilignes (toit, portes, plus facile que celui de son collègue du XXe ? Peut-être... Mais les vitres…) en envisageant toutes les orientations et positions possibles nouvelles contraintes industrielles sur la protection des données ou dans l’image dont il fallait ensuite vérifier la cohérence géométrique. « l’embarquabilité » du logiciel qui doit, par exemple, tourner sur une Après plusieurs dizaines de minutes de calcul, l’ordinateur rendait son voiture n’ayant pas toujours un accès rapide à des moyens de calcul verdict sur la présence ou non d’une voiture dans l’image. Aujourd’hui, distants ou les ressources pour faire tourner ces calculs en local, in- un système de reconnaissance d’images basé sur de l’apprentissage utilise une base de données déjà labellisée de 100 000 photos, cha- duisent de nouveaux problèmes. Si le Cro-Magnon informatique des cune y étant décrite. Grâce à celles-ci, il apprend lui-même ce qui années 90 pouvait se dire que la loi de Moore allait régler ses pro- caractérise la présence d’une voiture dans une image en essayant tous blèmes de performance, le geek contemporain ne peut plus trop y les motifs possibles dans un paquet de pixels. Lors de la phase d’ap- compter, la physique des micro-processeurs ayant déjà pratiquement prentissage, le système utilise 80 000 de ces images pour entrainer atteint ses limites. D’où l’émergence de nouvelles expertises en atten- un réseau composé de centaines de milliers de neurones : ce dernier, dant la prochaine rupture technologique. A la façon de ceux qui, au- dont les paramètres (les « poids » des neurones) sont initialisés à des trefois, étaient capables de coder des routines en assembleur pour valeurs quelconques, traite les images et indique, pour chacune, ce « gagner du temps de cycle », les experts en conception d’architectures qu’il y a reconnu. Les paramètres ayant été choisis au hasard, ses ré- de réseaux de neurones et en adéquation « hardware-software » sont ponses sont généralement fausses. Une moyenne des erreurs faites mis à rude épreuve pour que l’IA devienne réalité dans notre quoti- sur ces 80 000 exemples est alors calculée puis utilisée pour corriger dien. Hier comme aujourd’hui, être informaticien reste un beau mais la valeur des poids des neurones. Le processus est relancé avec les dur métier ! 2 - L’intelligence artificielle Les voix de la recherche - #69 - Clefs SOMMAIRE DANS CE NUMÉRO LE POINT DE VUE DE RODOLPHE GELIN 2 L’INTELLIGENCE SOMMAIRE 3 DÉFINITION 4 ARTIFICIELLE CONTEXTE 6 LES TECHNOLOGIES 12 LES INFRASTRUCTURES 13 L’IA EMBARQUÉE 14 L’IA DE CONFIANCE 22 L’ALGORITHMIQUE 26 LES DOMAINES D’APPLICATION INTRODUCTION 31 30 ÉNERGIE 28 RECHERCHE FONDAMENTALE 34 Biologie / santé 35 Climat et environnement 37 Astrophysique 38 Physique nucléaire 40 CALCUL 42 PERSPECTIVES 4 questions à Yann LeCun 45 par Étienne Klein Clefs - #69 - Les voix de la recherche L’intelligence artificielle - 3 L’INTELLIGENCE ARTIFICIELLE • PAR ALEXEI GRINBAUM (Direction de la recherche fondamentale) DÉFINITION Alexei Grinbaum est physicien et philosophe. Il travaille au Laboratoire Vous avez (bien) dit de recherche sur les sciences de la matière (Institut de recherche sur les lois fondamentales de l’Univers du CEA). intelligence artificielle ? Selon les fondateurs de la cybernétique, dont John McCarthy and Marvin Minsky, le terme « intelligence artificielle » désigne un comportement produit par une machine dont on peut raisonnablement estimer que, s’il avait été le fruit d’une action humaine, il aurait exigé de l’intelligence de la part de l’agent concerné. Trait saillant à retenir, cette définition s’appuie sur la comparaison entre la machine et l’homme. En effet, bien avant les ordinateurs jouant aux échecs ou les traducteurs automatiques, Alan Turing soulignait déjà que le concept même de « machine intelligente » ne pouvait être défini qu’à travers sa confrontation « Trois types d’algorithmes avec un comportement humain. fondent les systèmes d’IA : apprentissage dit supervisé, ette définition recouvre un spectre très toute description mathématique rigoureuse de ce qui large : par exemple, elle inclut la capacité à se passe pendant l’apprentissage profond. apprentissage non supervisé, trouver des erreurs d’orthographe dans un La technique d’apprentissage supervisé présuppose apprentissage par texte, ce qui nous paraît aujourd’hui tout à Cfait automatisable. Comme d’habitude, le développe- que les systèmes informatiques élaborent leur renforcement. ment du numérique exige en permanence qu’on révise fonctionnement en suivant des lois ou des indications les définitions historiques, y compris celle de l’IA. Dans dictées ou « étiquetées », par les hommes. À l’inverse, Chacune de ces méthodes un premier sens, « intelligence artificielle » désigne un la technique non supervisée permet à la machine peut être réalisée seule, domaine de recherche autour des machines dotées d’explorer ses données sans qu’aucune « grille de d’une capacité d’apprentissage et dont le comporte- lecture » ne lui soit imposée. Souvent, elle y trouve des mais des algorithmes dits ment complexe ne peut être entièrement décrit ni com- régularités qui ne ressemblent guère à des notions pris par le concepteur humain. Le fonctionnement familières à l’homme : c’est la marque d’un élément d’apprentissage profond d’un tel système ne se réduit pas au choix d’action dans non-humain dans le comportement de ces machines (deep learning) les emploient un catalogue écrit au préalable, aussi long soit-il. que, par ailleurs, on mesure toujours à l’homme. C’est Du point de vue de l’histoire de l’informatique, aussi l’élément qui procure aux systèmes d’IA leur à des niveaux différents l’apprentissage machine n’est qu’un outil d’IA parmi incroyable efficacité. Dans le cas de l’apprentissage au sein d’un seul système. » d’autres mais, en pratique, ces deux termes sont de non supervisé, celle-ci peut aller jusqu’à mettre l’utili- plus en plus fréquemment synonymes. sateur dans la situation d’indistinction : en 2019, la Trois types d’algorithmes fondent les systèmes d’IA : génération non supervisée de textes a été capable apprentissage dit supervisé, apprentissage non d’écrire plusieurs paragraphes tout à fait identiques à supervisé, apprentissage par renforcement. Chacune la production humaine ; dans le domaine visuel, le de ces méthodes peut être réalisée seule, mais des recours au non-humain et au non-explicable est encore algorithmes dits d’apprentissage profond (deep lear- plus fondamental : la reconnaissance des images est ning) les emploient à des niveaux différents au sein beaucoup plus efficace si les règles de fonctionnement d’un seul système. Cette imbrication contribue ne sont pas dictées d’emblée par l’homme mais davantage à rendre inconcevable, au moins à ce jour, « découvertes » par le système. 4 - L’intelligence artificielle Les voix de la recherche - #69 - Clefs L’INTELLIGENCE ARTIFICIELLE La troisième méthode d’apprentissage, dite « par renforcement », consiste à identifier, en une suite 3 d’étapes d’évaluation successives, puis à établir avec une force croissante, des corrélations pertinentes entre Instabilité de l’apprentissage les données. Les dernières recherches montrent que le succès de cette méthode, très répandue dans le Les techniques actuelles ne résistent pas bien à domaine des jeux, dépend souvent de la « curiosité » plusieurs types d’attaques adversariales. Pour une de la machine : sa capacité à attribuer un poids bonne protection des systèmes d’IA, de nouvelles Alan Mathison Turing (1912-1954), conséquent à l’exploration des scénarii inconnus ou recherches et solutions techniques restent nécessaires.