LE SON NUMÉRIQUE : UNE ACOUSTIQUE AFFRANCHIE DE LA MÉCANIQUE ? J. Risset

To cite this version:

J. Risset. LE SON NUMÉRIQUE : UNE ACOUSTIQUE AFFRANCHIE DE LA MÉ- CANIQUE ?. Journal de Physique IV Proceedings, EDP Sciences, 1992, 02 (C1), pp.C1-3-C1-11. ￿10.1051/jp4:1992101￿. ￿jpa-00251043￿

HAL Id: jpa-00251043 https://hal.archives-ouvertes.fr/jpa-00251043 Submitted on 1 Jan 1992

HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. JOURNAL DE PHYSIQUE IV Colloque Cl, supplément au Journal de Physique III, Volume 2, avril 1992

LE SON NUM~QUE:UNE ACOUSTIQUE AFFRANCHIE DE LA MÉCANIQUE ?

J.C.RISSET Laboratoire de Mécanique et d>Acoustique,31 Chemin Joseph Aiguier; F-13000 Marseille, France

Abstract. Since 1875, there have been radical innovations in Our ways to deal with sound. Sounds could be recorded and converted into electrical vibrations and vice-versa. Electronics made radio and sound recording practical. A new era came about with the advent of digital recording, synthesis and processing of sound, pioneered in 1957 by Mathews. Sounds can now be coded arbitrarily and elaborated with unprecedented precision and flexibility, which seems to free acoustics from the constraints of mechanics. This has opened new applications in speech, music, noise absorption, room acoustics; as dernonstrated by acoustic illusions, it has also greatly improved Our understanding of auditory perception, specially in the field of timbre. The limitations of digital acoustics depend upon the differential capacities of perception rather than upon the constraints of mechanics. Yet Our auditory perception is geared to a world of mechanically-produced sounds, and mechanics should not be given a cavalier dismissal, as the work of Gibson and Cadoz has suggested: the specifics of mechanical vibrations shed light on the the perceptual organization in the hearing process. In particular, digitally-implemented mechanical models may - at least in certain cases -turn out to be more valuable for the creation of musical sounds than signal- processing models. However the ultimate criterion for endeavours related to hearing remains perceptual.

Introduction

Depuis 1875, I'acoustique a connu des innovations radicales. L'apparition de l'enregistrement, de I'électroacoustique, de l'électronique, puis du traitement numérique des sons, ont remis en cause la sujétion de la production sonore aux vibrations mécaniques. II semble à première vue que I'acoustique numérique puisse s'affranchir de la mécanique. Cependant notre ouïe a évolué dans un environnements d'objets vibrants: aussi la prise en considération des contraintes et des particularités des vibrations mécanique s est-elle importante pour comprendre les idiosyncrasies de la perception auditive et pour en tirer parti. Je souhaite le demontrer dans cet article, avec l'aide pour l'exposé au Congrès d'illustrations sonores et visuelles.

Révolutions sonores

Au xlxBrnesiècle, on a pu transcrire des ondes sonores sous forme graphique. Edison parvient en 1877 à reproduire des sons à partir de gravures graphiques. D'un phénom8ne atmosphérique fugitif, l'enregistrement fait un objet susceptible d'examen, d'analyse, un évènement archivable, qu'on peut reproduire en l'absence de sa cause initiale.

En 1875, Bell invente le téléphone: l'électricité y vbhicule des vibrations d'origine acoustique. L'électroacoustique verra ses possibilités accrues par i'électronique, qui permet le développement de la radio, du cinéma parlant et de l'enregistrement sur disques.

Article published online by EDP Sciences and available at http://dx.doi.org/10.1051/jp4:1992101 Cl4 JOURNAL DE PHYSIQUE IV

Le codage numérique des sons, réalisé en 1957 par Mathews, ouvre une nouvelle ère : il permet d'appliquer au domaine acoustique les ressources de I'ordinateur, immense réservoir d'opérations possibles, de "machines virtuelles" définies par la programmation. Le codage numérique (ou "digital") est discontinu, "discret"; il introduit une granularité, une quantification qui correspond initialement à une perte d'information: cependant cette perte peut être minimisée de façon à être inappréciable par nos sens. Un codage avec une précision de 16 bits, couramment réalisé aujourd'hui, correspond à un rapport signal sur bruit bien meilleur que ce que donne n'importe quel enregistrement analogique. Et le format du disque compact prgvoit pour chaque canal 44100 échantillons numériques pour une seconde de son, ce qui est suffisant pour reconstituer fidèlement n'importe quelle onde sonore audible, puisque l'homme n'entend que les fréquences inférieures à 20000 Hz. (La possibilité de représenter par des échantillons discrets une onde limitée en fréquence et de restaurer à partir des échantillons la fonction continue originelle par lissage était connue bien avant Shannon - peut-être par Cauchy: en tout cas, Whittaker l'avait démontrée dès 1917).

Le codage numérique donne accès à une véritable maîtrise du signal. La discontinuité et I'arbitrarité du codage permettent de protéger la représentation du signal, qu'il soit fort ou faible, contre les déformations, et en particulier contre la contamination par le bruit, plaie des enregistrements "analogiques". A la différence des circuits électroniques, aux étranges idiosyncrasies, I'ordinateur permet l'élaboration du signal sonore avec une précision, une reproductibilité et une flexibilité sans précédent - ce qui peut d'ailleurs donner lieu à des effets inattendus.

Ces possibilités d'élaboration paraissent libérer la production sonore numérique de la sujétion de aux vibrations mécaniques. Certes, les haut-parieurs émettent le son par des membranes vibrantes, qui introduisent certaines limitations. Cependant une bonne enceinte acoustique est une source sonore assez générale, qui se prête à l'émission de sons très variés, issus de diverses sources acoustiques - sons de parole ou d'instruments de musique, ou sons produits par synthèse informatique et imitant les sons instrumentaux ou vocaux ou s'en écartant radicalement. Dans le cas des sons de synthèse, aucune vibration mécanique n'intervient dans la genèse du son. L'acoustique "numérique" ne peut-elle dès lors s'affranchir de la mécanique?

Avant de donner des éléments de réponse, je voudrais évoquer des applications propres au son numérique dans quelques domaines de l'acoustique.

Applications du son numérique à la parole

La synthèse et la reconnaissance automatique de la parole par ordinateur font depuis une trentaine d'années l'objet de nombreuses recherches. L'enjeu est important: la parole est le véhicule principal de la communication humaine, et le r6seau téléphonique en permet une diffusion planétaire. La reconnaissance automatique habiliterait un ordinateur à réagir à des commandes parlées, et la synthèse permettrait de transmettre sous forme vocale les informations demandées à une banque de données. Mais la synthèse et surtout la reconnaissance posent des problèmes très difficiles, qui n'ont pu être résolus de façon satisfaisante que dans des conditions limitatives: on commence à les appliquer dans des cas pratiques bien précis, par exemple pour assister les handicapés.

En tout cas, les recherches sur la parole numérique ont fait considérablement progresser la phonétique. Le codage de la parole permet de réaliser cryptophonie ou compression d'information. Le son numérique commence à être utilisé pour la messagerie vocale informatique: on peut stocker sur le disque optique effaçable de I'ordinateur NeXT environ dix heures de parole de qualité téléphonique.

Application du son numérique au contrôle de l'environnement sonore

La précision propre au son numérique permet d'envisager l'absorption acoustique active, c'est-à-dire l'atténuation d'un son en lui ajoutant le son "opposé". Particulièrement étudiée au Laboratoire de Mécanique et d'Acoustique de Marseille (L.M.A.), cette technique a donné lieu notamment à un casque protecteur dont l'isolation est accrue par absorption acoustique active. On en trouvera un panorama dans les Actes du Colloque "Contrôle actif vibro-acoustique et dynamique des vibrations" , qui s'est tenu en 1991 pour marquer le cinquantenaire du L.M.A. Réverbération numérique, acoustique architecturale, environnements virtuels

Schroeder et Logan ont proposé en 1963 un paradigme pour réaliser une réverbération artificielle sans coloration, et Chowning l'a mis en oeuvre sur ordinateur pour simuler des "environnements virtuels", des "espaces illuso~res". Pour suggérer l'éloignement du son dans l'espace, Chowning fait décroître le son direct en laissant subsister un niveau de réverbération constant. II donne l'impression que les sources sonores sont animées d'un mouvement rapide en contrôlant finement l'évolution de l'intensité dans différents haut- parleurs, et surtout en introduisant des variations de fréquence simulant l'effet Doppler. Chowning a ainsi réalisé en quadriphonie de saisissantes illusions de mouvement de sources, qui démontrent la capacité du son numérique à échapper aux contraintes matérielles.

II existe de plus en plus de salles dans lesquelles l'acoustique est assistée par l'addition de réverbération et d'échos réalisés numériquement - il ne s'agit pas de sonorisation, et les auditeurs n'en sont pas conscients. En introduisant dans une petite salle suffisamment assourdie des réverbérations appropriées, suffisamment retardées par rapport au son direct, on peut créer l'illusion acoustique que cette salle est grande - ce qui n'est pas possible si la réverbération est crée par des parois matérielles réverbérantes, comme dans l'Espace de Projection de l'IRCAM. II est probable que des dispositifs commerciaux seront prochainement disponibles pour modifier les environnnements acoustiques domestiques, ce qui peut rendre plus satisfaisants l'écoute et le jeu musical: i'étde pilote effectuée par Simon Bolzinger et présentée dans le cadre de ce colloque montre que le jeu du pianiste est influencé par les caractéristiques acoustiques de la salle dans laquelle il joue. (Les données ont été obtenues à I'aide de capteurs disposés dans un piano Disklavier de Yamaha, piano acoustique disposant de capteurs, qui repèrent les caractéristiques du jeu dans le format numérique MIDI - Musical Instrument Digital Interface - et aussi de moteurs, susceptibles d'enfoncer les touches du piano à partir de commandes MIDI). Blauert étudie des processus d'enregistrement et de traitement des sons qui permettent à l'auditeur de les "externaliser" dans l'écoute au walkman.

Les premières simulations de salles sur ordinateur datent d' il y a une quinzaine d'années (Atai & al., 1966). La simulation a permis d'établir les principaux impératifs pour une salle de concert, spécialement celui d'induire l'impression que les sources sonores sont étendues dans l'espace. Ce sentiment de "spatialité" tient à la disparité des signaux reçus par les deux oreilles. Cela explique a posteriori pourquoi nombre de salles de concerts réputées sont hautes et étroites: les échos venant des murs latéraux sont plus différenciés que ceux venant du plafond, et les premiers échos sont les plus importants. Même lorsqu'on réalise des maquettes physiques à échelle réduite, on les excite à I'aide de sons numériques transposés à des fréquences élevées (il est nécessaire de diviser les longueurs d'onde dans le rapport des dimensions spatiales). Et la simulation numérique des salles joue un rôle de plus en plus important: elle permet de réaliser des maquettes virtuelles sans qu'il soit nécessaire de les construire physiquement.

Exploration des applications musicales du son numérique

Un programme général de synthése comme MUSIC V , précurseur du style de programmation "objet", permet à l'utilisateur d'articuler des modules dont chacun réalise une certaine opération sur le signal: consultation de tables de fonctions, création d'un signal oscillant ou aléatoire, addition ou multiplication de deux signaux, filtrage ou réverbération numérique ... De tels modules visent à obtenir un résultat acoustique plutôt qu'à simuler un processus vibratoire. Au L.M.A., Arfib a incorporé dans MUSIC V des modules réalisant les transformées de Gabor ou en ondelettes, processus d'analyse-synthèse appliqués au signal sonore notamment par Kronland-Martinet. Cela permet de mettre en oeuvre numériquement des modèles plus ou moins complexes de synthèse et même de traitement du son: on parle de modèles de traitement de signal ("signal-processing models").

On peut ainsi réaliser des sons de caractéristiques physiques arbitraires, sans contrainte mécanique ni limitation instrumentale. Le musicien numérique est placé devant une page blanche de sons: il n'est plus obligé de composer avec des sons, il peut composer le son lui- mgme. Liberté un peu vertigineuse ... Et il faut conquérir ces nouveaux territoires, d'abord JOURNAL DE PHYSIQUE IV plus difficiles qu'on ne le prévoyait. Comme le précise le prochain paragraphe à propos des illusions auditives, il y a souvent entre les paramètres physiques des sons, tels qu'on les spécifie au programme de synthèse, et leur effet sensible à l'oreille, une relation "psychoacoustique" qui ne correspond pas à l'intuition ou au sens commun. Les manuels d'acoustique "classiques" sont peu diserts à ce sujet. Ainsi les descriptions traditionnelles des sons musicaux instrumentaux, carac\érisés par un spectre donné et des temps d'attaque et de décroissance, sont souvent totalement insuffisantes pour permettre de donner par synthèse imitative une idée même appauvrie de I'instrument. Le d6veloppement des ressources musicales de la synthèse et du traitement numérique des sons est donc inséparable d'une recherche sur les caractéristiques de I'audition, sur ses processus d'identification des hauteurs, des rythmes et des timbres, sur ses régions sensibles, ses "zones érogènes", ses exigences spécifiques pour que le son paraisse doté d'une identité, d'une vie, d'une présence ou d'une richesse proprement musicale.

Avant l'avènement du son numérique, les sons dont on pouvait repérer avec précision les paramètres physiques étaient extrêmement simples - sinusoïdes , bandes de bruit - et la plupart des études scientifiques de I'audition avaient recours à de tels sons: or, dans l'étude de la musique - et plus généralement dans la vie quotidienne, qui ne se confine pas dans l'isolement de la cabine d'écoute d'un laboratoire - l'auditeur est confronté à des sons naturels complexes, multiples, insérés dans un contexte. Et les différences aperçues dans les analyses étaient souvent interprétées comme responsables des différences perçues, sans qu'on ait la possibilité de vérifier par synthèse la pertinence auditive de ces différences. Aussi les données de la psychoacoustique classique, certes indispensables, étaient neanmoins insuffisantes pour insuffler musicalité et même identit6 au son numérique.

Ce n'est qu'avec "l'analyse par synthèse" qu'on a pu obtenir des informations sur les caractéristiques pertinentes des instruments traditionnels, informations permettant d'en réaliser des synthèses imitatives satisfaisantes. Les sons naturels sont complexes, et leurs paramètres varient d'un son à un autre; si on retient des analyses une description décantée, cette simplification doit être validée par synthèse: elle n'a d'intérêt que si elle permet une resynthèse crédible. Ainsi mon étude des sons de trompette a montré que la caractéristique principale était la variation du spectre en fonction de l'intensité, au cours de l'attaque aussi bien que de la partie stationnaire du son: le spectre s'enrichit en harmoniques haute fréquence lorsque l'intensité croît. On ne peut donc imiter les sons cuivrés par des ondes au spectre fixe, même dotées de transitoires d'attaque et de décroissance. C'est ici une relation entre plusieurs paramètres - intensit6 et spectre - qui caractérise le timbre de façon dominante. Cette relation trouve son origine dans le fonctionnement non linéaire de I'oscillateur mécanique mis en jeu dans la trompette - les lèvres de l'instrumentiste, fonctionnant comme des anches en oscillateur de relaxation. Dans le cas du violon, Mathews a mis en évidence une relation caractéristique, cette fois entre fréquence et spectre, qu'on peut attribuer aux caractéristiques du filtrage complexe réalisée par la caisse de l'instrument.

II a fallu d'autres recherches pour 6laborer et exploiter au mieux des méthodes de synthèse et de traitement répondant aux exigences musicales. Ces recherches se poursuivent. II est facile de communiquer les recettes de production de sons, sous forme des prescriptions qu'on fournit à un programme de synthèse donné comme MUSIC V: ces recettes fournissent en même temps des descriptions exhaustives de la structure physique des sons. J'ai ainsi publié en 1969 un catalogue de sons synthétiques, réunissant l'enregistrement de sons,leurs recettes informatiques de production par MUSIC V et des explications sur le propos et les techniques ces données restent utiles aujourd'hui. La facilité d'archivage et de reproduction propre à l'ordinateur aide donc à une cumulation des progrès accomplis dans le savoir-faire de la musique numérique. On étudie actuellement des processus d'analyse-synthèse qui permettent non seulement de reconstituer des sons, mais surtout de les transformer intimement en modifiant avant la resynthèse les paramètres détectés par l'analyse. Ainsi, dans notre Equipe d'informatique Musicale du L.M.A., Arfib, Boyer et Kronland-Martinet ont-ils pu réaliser sur des sons vocaux ou instrumentaux des transformations qui n'auraient pu être réalisées directement, comme la contraction ou la dilatation de l'échelle de temps sans modification des fréquence. Sanchez, Delprat et Guillemain ont contribué à extraire à partir de certains sons les valeurs des paramètres pouvant permettre d'imiter ces sons en recourant à un mode de synthèse donné - synthèse additive, soustractive, ou non-linéaire (distorsion ou modulation de frequence de Chowning). Une telle identification de paramètres est difficile: l'enjeu est d'étendre à la manipulation des sons réels la ductilité propre à la synthèse. (Cf. De Poli & al., 1991).

Je ne puis donner dans le cadre de cet expose une perspective sur la musique "numerique" (Cf. Barrière, 1991, Dufourt, 1991). Elle intéresse au premier chef les musiciens qui sont, soucieux de vocabulaire et pas seulement de grammaire, à l'instar du précurseur Edgard Varèse, qui souhaitait dès 1917 étendre leur activité compositionnelle jusqu'au niveau de la structure sonore, et composer le son lui-même au lieu de se borner à composer avec des sons existants. Malgré la difficulté du domaine de l'informatique musicale, l'activité de centres de recherche et de création comme l'IRCAM, le CCRMA de Stanford ou le ZKM de Karlsruhe démontre l'importance du domaine numérique dans la création musicale d'aujourd'hui. Mais le numérique ne concerne pas que la "musique savante", qui fut la première à s'y intéresser (Varése introduisit dès 1959 une pièce de musique numérique dans un concert new-yorkais). Depuis une dizaine d'années, grilce au développement de la microélectronique numérique, les recherches faites sur le son numerique ont pu être exploitées par l'industrie pour la réalisation d'instruments numériques peu coûteux. Les instruments numériques sont trop souvent des ersatz inférieurs à leurs modèles acoustiques. Mais ils peuvent s'améliorer - et ils ouvrent aussi de nouvelles possibilités. Leur coût est souvent moins élevés. Les claviers électroniques se multiplient, alors que le nombre de pianos vendus diminue: les pianos numériques sont bien plus faciles à insonoriser que les pianos acoustiques. Cependant il faut noter que l'on est loin d'approcher numériquement la richesse sonore d'un piano, extraordinaire dispositif mécanique (qui comporte des milliers de pièces) qui produit des sons extrêmement complexes et dont la réaction sous les doigts est précieuse et difficile à simuler.

Illusions auditives et organisation perceptive

Ce n'est qu'avec la synthèse numérique des sons qu'il est devenu possible de produire des sons ayant de façon précise des caractéristiques voulues. II devient alors facile de faire l'expérience "psychoacoustique" de la relation entre la structure physique du son, telle qu'on la prescrit au programme de synthèse, et de son effet sensible, qu'on peut éprouver à l'écoute.

Les illusions visuelles sont plus anciennes que les illusions auditives: il n'est pas besoin d'un dispositif sophistiqué pour dessiner une figure imaginée. La synthèse sonore a permis de produire des combinaisons de paramètres sonores donnant lieu à des illusions auditives. J'ai parlé plus haut des illusions de mouvements sonores demontrées par Chowning. Shepard, Knowlton et moi-même avons réalisé des sons aux propriétés de hauteur ou de rythme paradoxales. J'ai ainsi produit en 1968 un son dont la hauteur paraît baisser lorsqu'on double les fréquences de toutes ses composantes: dans ce cas, les variations de la hauteur sonore perçue ne correspondent pas du tout à celles de la fréquence de la vibration. Plus récemment, j'ai synthétisé un son scandé de battements rythmiques, lesquels paraissent ralentir si l'on double la vitesse du magnétophone sur lequel on joue le son. Ces exemples montrent qu'à l'évidence la perception auditive ne se réduit pas à une évaluation des paramètres physiques des sons: la relation psychoacoustique est complexe, on s'en aperçoit en effectuant des essais de synthèse, en particulier dès qu'on s'écarte de structures sonores simples et habituelles.

Dans le domaine du traitement numérique des sons, ce ne sont plus les contraintes mécaniques qui interviennent, mais l'état de l'art, du savoir-faire dans le domaine de la synthèse et du traitement numérique du signal, et surtout les caractéristiques de la perception, qui imposent comme limitations celles des capacités auditives de discrimination. Les illusions de hauteur et de rythme qui viennent d'&tre décrites montrent que les spécificités perceptives peuvent oblitérer les relations physiques. La sensibilité de l'audition aux variations acoustiques est extraordinaire, mais cette sensibilité est inégale et spécifique: l'oreille, extremement sensible à nombre d'aspects fréquentiels, est pour ainsi dire aveugle aux relations de phase entre les composantes harmoniques d'un son périodique. Comment comprendre les nombreuses et surprenantes particularités du fonctionnement auditif que révHe la pratique du son numérique? Cl-8 JOURNAL DE PHYSIQUE IV

Le point de vue "écologique" ou "fonctionnaliste" sur la perception considère que l'évolution a développé chez les êtres vivants des capacités perceptives qui leur permettent d'optimiser le traitement des données sensorielles pour en extraire des informations sur l'environnement utiles à la survie. Ce point de vue a été défendu par Gibson, qui a fait remarquer que les cinq sens ne visent pas a mesurer les paramètres physiques du stimulus - ce qui serait le point de vue de la psychophysique classique: Selon Gibson, nos sens sont des systèmes perceptifs dont le fonctionnement vise à exploiter les données qui leur parviennent - de façon différente suivant la modalité sensorielle (visuelle, sonore, ...) afin d'obtenir des renseignements utiles sur le monde extérieur. L'audition est ainsi le sens le mieux adapté à assurer une fonction d'alerte, puisque la longueur d'onde des sons audibles est telle qu'ils contournent les obstacles à notre échelle, à la différence des ondes lumineuses. Gibson l'a fait remarquer, la rotation de la tête est importante: I'audition ayant détecté la direction de la source de son, la tête peut alors se tourner dans cette direction et scruter la scéne pour y reconnaître des détails avec une finesse que permet la vision, la longueur d'onde de la lumière étant inférieure à 1 micron.

L'organisation auditive est agencée pour démêler efficacement l'écheveau d'une multitude de sons simultanés et successifs, et assigner à ces sons une ou plusieurs sources distinctes. L'audition permet aussi de repérer la direction de ces sources et d'évaluer leur distance et leur énergie "à la source", alors qu'un appareil de mesure physique ne peut qu'indiquer le niveau physique qu'il reçoit. Et I'audition tente d'identifier la nature de la source, la manière dont le son a été produit. Toutes ces capacités sont très spécifiques, et elles aident l'organisme à obtenir par i'écoute des informations sur les objets physiques extérieurs dont les vibrations ont produit les sons entendus. A tel point qu'on désigne le plus souvent le timbre d'un son acoustique par sa source - violon, trompette, voix. La réponse en fréquence d'une salle est extrêmement irrégulière, et elle varie d'un point à un autre, aussi ne faut-il pas s'étonner que I'audition ait recours à des caractéristiques plus élaborées et moins fragiles que la structure d'un seul spectre pour identifier la source de son. On l'a vu à propos du violon ou de la trompette, I'audition caractérise souvent une source par une propriété, une relation, plus robuste, moins sujette aux distorsions introduites lors de la propagation. De mgme, l'oreille est particulièrement sensible aux aspects fréquentiels, bien conservés lors de la propagation - sauf dans le cas de sources en mouvement: mais l'oreille tire alors parti de I'effet Doppler pour obtenir des informations sur ces mouvements (Chowning, 1971, 1991). Au contraire, I'insensibilité de I'audition aux relations de phase des composantes harmoniques d'un son périodique se comprend bien, puisque ces relations de phases sont modifiées de façon indémêlable dans tout environnement réverbérant: une sensibilité aux relations de phase pourrait brouiller la reconnaissance de la source (Risset, 1973).

Le point de vue "écologique" s'est vu confirmé par l'exploration de la synthèse par ordinateur: il est comme un "fil d'Ariane" qui permet de se guider dans le labyrinthe des particularités apparemment saugrenues de la relation psychoacoustique. Ces particularités ne sont que la trace de processus perceptifs élaborés, qui fonctionnent utilement pour aider l'auditeur à analyser le magma sonore global reçu en composantes assignables a des sources distinctes de sons d'origine mécanique (Cf. Bregman, 1989). Comme l'a écrit Purkinje, les illusions, "erreurs des sens, sont des vérités de la perception." Les mécanismes perceptifs, interposant tyranniquement leurs particularités entre les sons et la conscience qu'on en a, reflètent à leur façon les particularités de la genèse mécanique du monde sonore dans le cadre duquel l'évolution les a façonnés. Même l'acoustique numérique ne peut qu'en apparence s'affranchir du monde mécanique!

Le fait que des instruments de musique fonctionnent mécaniquement n'empêche d'ailleurs pas de les associer avec un odinateur, soit par l'intermédiaire d'une analyse du signal sonore émis, soit par l'entremise de capteurs. C'est ce qu'on fait Barry Vercoe, Larry Beauregard, . Le piano acoustique Disklavier de Yamaha, utilisé par Boizinger pour son étude sur l'influence de l'acoustique de la salle sur le jeu du pianiste, comporte des capteurs mais aussi des moteurs: il peut être utilisé comme un piano mécanique, mais le format MIDI permet de le coupler à un ordinateur. J'ai ainsi réalisé en 1989 au M.I.T., avec l'aide de Scott Van Duyne, un Duo pour un pianiste , dans lequel le pianiste est "accompagné" par un programme d'ordinateur qui commande l'exécution, sur le même piano acoustique, d'une partie musicale qui n'est pas préétablie, mais qui dépend de ce que joue le pianiste et de la façon dont il joue. Le monde numérique virtuel peut donc être le partenaire sensible d'un jeu sur un instrument mécanique. Les études de Sundberg sur la manière dont les interprètes arrivent à l'expressivité musicale lui suggèrent l'importance de certains rythmes d'origine mécanique et biologique, qui fonctionnent pour l'homme comme des ancrages absolus, des références, notamment les rythme du coeur, de la marche, de la course.

Causalit6 sonore et simulation numérique de modèles physiques

L'audition est donc en quête des causalités mécaniques originaires des sons. A i'écoute d'un son produit par un haut-parleur, il ne suffit plus de désigner la source sonore - le haut- parleur - pour décrire le timbre. L'exploration de la synthèse numérique des sons permet de supprimer complètement la causalité mécanique, instrumentale, et de créer un monde sonore illusoire, sans contrepartie physique visuelle, tactile ou autre. Certains sons synthétiques peuvent être interprétés comme des percussions: mais, dans l'ordinateur, rien ne tape sur rien. Cependant, en présence de sons synthétiques, l'oreille continue de faire une enquête sur l'origine du son, et c'est lorsqu'elle peut assigner plausiblement à tel ou tel son une origine, un mécanisme physique, un objet qui l'a produit (son percuté, frotté, soufflé, liquide, métallique ... ) que ce son est perçu comme ayant une présence notable et une identité robuste. L'audition est à l'affût de.tous les accidents caractéristiques, tous les indices suceptibles de l'aider à remonter du son à sa source: lorqu'on tente une synthèse sonore imitative, l'impression de réalisme est accrue si l'on y incorpore des accidents suggérant la source du son, par exemple le grincement de l'archet pour le violon.

Cela donne tout son sens à la démarche de Cadoz et de son groupe de l'Association pour la Création et la Recherche sur les Outils d'Expression (ACROE). Selon I'ACROE, le développement des stratégies auditives se façonne au contact des corps vibrants, et il implique aussi d'autres modalités sensorielles: vision et toucher. Aussi importe-t-il d'utiliser l'informatique pour simuler les systèmes vibratoires. Cette simulation utilise des programmes organisés en modules, comme le programme de synthèse sonore MUSIC V. Dans le prgramme CORDIS de simulation physique, les modules ne correspondent plus à des éléments acoustiques qui s'ajoutent pour produire une onde sonore résultante, mais à des éléments mécaniques: masse, ressort, liaison avec frottement ... que I'utiliseur peut agencer à sa guise pour composer un objet mécanique virtuel: le programme donnera alors la solution des équations différentielles régissant le comportement mécanique de cet objet. Cene solution spécifie le mouvement des points de l'objet: on peut en déduire l'onde sonore, mais aussi la visualisation du mouvement. Et les simulations mettent en oeuvre des capteurs de geste s pouvant saisir certaines informations gestuelles comme le font une touche de piano ou un archet de violon, et qui sont pourvus de "retours d'effort" - de réaction mécanique - programmable. On le voit, il s'agit d'une démarche complémentaire de l'intelligence artificielle, qui cherche à simuler les opérations - intellectuelles ou perceptives - effectuées par un sujet humain: il s'agit ici de simuler i'environnement physique de ce sujet ou de lui subsituter un environnement "virtuel" réunissant plusieurs modalités sensorielles.

L'auditeur humain est très habitué à la parole humaine, et il est très sensible aux défauts d'une voix synthétique, dans la mesure où cette voix comporte certains détails aberrants, qui ne pourraient émaner d'un conduit vocal humain. Si l'on essaie d'effectuer une synthèse de parole "par règles", en ne conservant en mémoire que les données acoustiques correspondant à des phonèmes isolés, il est difficile de dégager des règles faisant passer de la description de phonèmes comme "a" ou "i" à celle de "aïe". Si l'on décrit "a" et "i" par la position de leurs formants, une transition de "a" à "i" effectuée par une interpolation entre les valeurs correspondantes des formants donnera des spectres intermédiaires ne pouvant émaner d'un conduit vocal configuré d'une façon vraisemblable, et l'oreille détecte le caractère artificiel d'une telle "voix". Aussi est-il souvent avantageux d'utiliser une méthode de synthèse de la parole effectuant une simulation du conduit vocal: les éléments phonétiques y sont décrits soit par la donnée des configurations du conduit vocal qui lui correspondent, soit par la donnée de la position des principaux "articulateurs" ( lèvres, langue, angle de la mâchoire inférieure): les interpolations sur de telles données donneront lieu à des transitions moins artificielles, et l'on peut prendre en compte la coarticulation de façon plus réaliste, les articulateurs suivant un principe de moindre effort pour aller d'une position à une autre. Ainsi la position de la langue n'est pas cruciale dans le b, non plus que celle des lèvres dans JOURNAL DE PHYSIQUE IV le d, et cela peut être pris en compte pour le calcul des positions successives de la langue et des lèvres dans la mod6lisation articulatoire d'une phrase donnée: le naturel des transitions y gagne. C'est par simulation du conduit vocal que Kelly, Lochbaum et Mathews ont réalise en 1963 Daisy , premier exemple de voix chantee par ordinateur, évoque dans le film de Kubrick "2001, Odyssée de l'Espace." C'est encore la sensibilité de I'oreille humaine aux détails de la genèse vibratoire de la parole qui est en jeu ici.

La simulation par modèles physiques s'attache à simuler des processus de nature mécanique pour obtenir un résultat sonore: comme il a At6 dit, elle permet d'exercer sur la production sonore des contrôles pertinents pour I'oreille, orientee vers la détection des mécanismes de genèse sonore mécanique. Les modèles m6caniques peuvent donc dans bien des cas donner lieu à des resultats de synthèse plus satisfaisants ou plus maîtrisables que les modeles de traitement du signal. Si cette methode pose dedélicats problèmes numeriques et exige une grande puissance de calcul dès lors qu'on veut traiter des cas complexes, le progrès informatique la rendra plus accessible: il n'est gubre douteux qu'elle permettra I'accès à un monde virtuel adapte à nos capaciteç perceptives et pouvant paraître "naturelu, en tout cas riche de possibilités sensibles et potentiellement harmonieuses. Cet aspect esthétique est important, au delà-même du domaine artistique. pour I'agrement de nos relations futures avec ce partenaire maintenant indispensable et omniprésent, l'ordinateur. Le colloque sur les modèles physiques tenu A I'ACROE en septembre 1990 fournit un tableau de l'état actuel et des perspectives des modèles physiques: on y verra que l'acoustique musicale n'est nullement affranchie de la mécanique, mais qu'elle s'en inspire et qu'elle participe A son d6veloppement. Cependant, lorsqu'on cherche à simuler des instruments - cordes pincees, cuivres, percussion - ou la voix humaine, on peut aussi obtenir des résultats extrgmement convaincants en simulant par ordinateur le résultat acoustique, sans s'attacher à copier dans tous ses details le processus reel. II suffit souvent de restituer dans la simulation les caractéristiques les plus pertinentes pour I'oreille. II ne faut pas oublier qu'en dernière analyse, le critère réside dans la perception du sujet. Et il est interessant d'exploiter les possibilit6s du son numerique qui échappent au domaine des sons mécaniques. On ne peut pas dans le monde physique faire croître indéfiniment la fréquence d'un son tout en le gardant dans le domaine audible, comme Shepard et moi-même Pavons fait par synthèse numerique. Les psychoacousticiens et les musiciens continueront la quête fascinante de sons "immatériels", qui n'ont pas d'existence dans le monde physique, mais qui fondent leur identité - parfois très présente - sur la mise en jeu de processus perceptifs. "La beauté est dans l'oeil de celui qui regarde" - ou dans l'oreille de celui qui Bcoute. Aussi peut-on considérer les modèles physiques et les modèles de traitement du signal comme deux demarches importantes et compl6mentaires qui doivent aider, chacune à leur façon, à enrichir les modèles perceptifs. Car, évidence souvent oubliée, ce qui fait l'importance des vibrations acoustiques, en depit de leur faible énergie, c'est d'abord le fait qu'on les entend.

Actes du Colloque "Contrble actif vibro-acoustique et dynamique des vibrations." Rencontres scientifiques du cinquantenaire, Publication L.M.A. no 127, Marseille, 9-1 1 octobre 1991. Actes du Colloque "Genbse et perception des sons". Rencontres scientifiques du cinquantenaire, Publication L.M.A. no 128, Marseille, 16-18 octobre 1991. Actes du Colloque ACROE "ModBles physiques dans la cr6ation sonore" (ACROE, Grenoble, 19-21 septembre 1990). Collection "Recherches musique et danse no 5, Maison des Sciences de l'homme, . B. S. Atal, M.R. Schroeder, G.M. Sessler, & J.E. West (1966). Evaluation of acoustic properties of enclosures by means of digital computers. J. Acoust. Soc. Am. 40, 438-433. B. Auriol (1991). La cl6 des sons - 6l6ments de psychosonique. ErBs, 1991. J . B. Barribre, coordinateur (1991). Le timbre. C. BourgoisllRCAM, Paris. J. Blauert (1983). Spatial hearing. M.I.T. Press. J. Blauert & W. Lindemann (1986). Auditory spaciousness: some further psychoacoustic analyses. J. Acoust. Soc. Am. 80, 533-542. S. Bolzinger & J.C. Risset (1992). Etude prbliminaire de l'influence de l'acoustique de la salle sur le jeu du pianiste. Communication prbsentbe dans le cadre du Deuxibme Congrds Français d'Acoustique. A. Bregman (1989). Auditory scene analysis: the perceptual organization of sound. M.I.T. Press. C. Cadoz, A. C. Cadoz, A. Luciani & J.L. Florens (1981). Synthbse musicale par simulation de mBcanismes instrumentaux et transducteurs gestuels rbtroactifs pour I'btude du jeu instrumental. Revue d'Acoustique 59. 279-292. J.M. Chowning (1971). The simulation of moving sound sources. J. Audio Eng. Soc. 19, 2-6. J.M. Chowning (1973). The synthesis of complex audio spectra by means of frequency modulation. J. Audio Eng. Soc. 21/7, 526-534 (rbbditb dans Roads & Strawn, 1985). J.M. Chowning (1989). Music from machines: perceptual fusion and auditory perspective. Ligeti- Kongresses, Hamburg. Laaber-Verlag, 1991. G. De Poli, A. Piccialli, & C. Roads. Representation of musical signals. M.I.T. Press, 1991. C. Dodge & T.A. Jerse (1985). Computer music: synthesis, composition and performance. Schirmer Books, New York. H. Dufourt (1991). Musique, pouvoir, Bcriture. C. Bourgois, Paris. J.J. Gibson (1966). The senses considered as perceptual systems. ~oubhtonMifflin Company, Boston. S. Handel (1989). Listening: an introduction to the perception of auditory events. M.I.T. Press. R. Kronland-Martinet, A. Grossman, & J. Morlet (1987). Analysis of sound patterns through wavelet transforms. Intern. Journal of Pattern Recognition and Artific. Intelligence, 1 no 2 , 273- 302. M.V. Mathews (1969). The technology of computer music, M.I.T. Press. M.V. Mathews & J.R. Pierce (1989). Current directions in computer music research. M.I.T. Press. J.A. Moorer (1977). Signal processing aspects of computer music. Proc. of the IEEE 65,1108-1137 (rbbditb dans Roads & Strawn, 1985). J.R. Pierce (1984). Le son musical (avec exemples sonores). Pour la SciencelBelin, Paris. J.C. Risset (1969). An introductory catalog of computer synthesized sounds (avec exemples sonores). Bell Laboratories, Murray Hill, N.J. (Publication prbvue en 1992sur disque compact Wergo: "The history of computer music") J.C. Risset (1971). Paradoxes de hauteur. Actes du 7e Congres International d'Acoustique, Budapest (et Rapport IRCAM no 10, avec exemples sonores, 1978). J.C. Risset (1973). Sons. Encyclopedia Universalis, Paris, 13, 168-171. J.C. Risset (1985) Digital techniques and sound structure in music, in Roads, 113-138. J.C. Risset (1986). Musical sound models for sound synthesis. Proceedings of the Tokyo International Conference on Acoustics, Speech, and Signal Processing, I.E.E.E., New York. J.C. Risset (1986). Pitch and rhythm paradoxes. J. Acoust. Soc. Am. 80, 961-962. J.C. Risset (1988). Perception, environnement, musiques. Inharmoniques, IRCAMIC. Bourgois, Paris, 10-42). J.C. Risset (1990). Acoustique et musique: mutation vers le son numBrique. Encyclopedia Universalis, Supplbment, 114-126 (et nouvelle Bdition). J.C. Risset & M.V. Mathews (1969) Analysis of instrument tones, Physics Today, 22 no 2, 23- 40. J.C. Risset & D.L. Wessel (1982) Exploration of timbre by analysis and synthesis, in The psychology of music (D.Deutsch, editor), Academic Press, 25-58. C. Roads, editor (1985) Composers and the computer, W. Kaufman, Los Altos, Calif. C. Roads & J. Strawn, editors (1985) Foundations of computer music, M.I.T. Press. M.R. Schroeder (1973). Computer models for concert hall acoustics. Amer. J. Physics 4114, 461- 471. J. Sundberg, editor (1983). Studies of musical performance. Public. of the Royal Swedish Academy of Music, Stockholm, no 39. D.L. Wessel & J.C. Risset (1979). Les illusions auditives, Universalia (Encyclopedia Universalis), 167-1 71.