OUTILS

La gestion informatisée de corpus bibliographiques Adaptation des normes et formats documentaires

'interrogation de plusieurs banques de données (BDD) documentaires est une nécessité L dans la constitution d'une bibliographie exhaustive sur un sujet pluridisciplinaire (14). Or, si la consultation de sources d'information variées, tant sur le plan géographique que thématique, garantit une meilleure couverture du sujet, elle pose néanmoins trois problèmes majeurs : l'hétérogénéité des formats de présentation ; la variabilité du vocabulaire d’indexation utilisé ; et la redondance de l'information due à la présence de références identiques.

L'utilisation d'un corpus documen- huit BDD sur cédérom.Trois provien- taire par des chercheurs à des fins nent du domaine biomédical :Medline d'édition de références bibliogra- et Biosis (États-Unis), EMBase (Pays- phiques et d'analyse bibliométrique Bas).Trois autres sont spécialisées en de leur domaine de recherche doit sécurité et hygiène au travail : Samuel Jolibois donc être précédée d'une phase de IOSHTIC (États-Unis), Cisilo (Suisse), INRS* normalisation de la structure des INRS-B (France). Une BDD est spécia- [email protected] notices ;d'une phase de normalisation lisée en psychologie, PsycLIT (États- du contenu des champs ; d'une phase Unis), et une autre est pluridiscipli- Emmanuel Nauer de dédoublonnage des notices. naire, Pascal (France). Les équations LORIA** À chaque étape du traitement de recherche ont été adaptées à cha- s'opèrent des choix qui peuvent être cune des bases interrogées, en raison Dominique Chouanière fondés sur des normes documen- de la diversité de leurs langages d'in- Marc Mouzé-Amad taires. Nous nous proposons ici de dexation respectifs. Au total, 27 000 Françoise Grandjean passer en revue les diverses normes notices bibliographiques ont ainsi été INRS existantes et d'en étudier leur adapta- rassemblées. tion à la gestion informatisée d'un cor- Nous avons développé une appli- Jacques Ducloy pus, alimenté et consulté par les cher- cation spécifique, dénommée LORIA cheurs eux-mêmes. Seront exposées WebStress, qui permet le reformatage les solutions retenues dans le cadre de des données et le dédoublonnage des l'élaboration d'une base documen- notices, d’une part ; l’exploration * INRS : Institut national de recherche et de sécurité, Vandœuvre-lès-Nancy. taire sur le stress professionnel à hypertextuelle de la base documen- ** LORIA : Laboratoire lorrain de recherche en l'INRS (Institut national de recherche taire dans une interface Web, d’autre informatique et ses applications, Vandœuvre-lès- Nancy. et de sécurité). Nous avons interrogé part (30).

BBF 2000 98 Paris, t. 45, n° 1 Adaptation des normes et formats documentaires

Normalisation – la création de nouveaux champs, Associations and Institutions), est une de la structure des notices absents de certaines bases (le champ norme internationale (18), dont déri- Type de publication est absent de vent toutes les règles de catalogage Chaque base dispose d'une struc- NIOSHTIC par exemple) ; existantes de portée nationale :normes ture spécifique, constituée d'un – la normalisation des intitulés des américaines (ANSI), françaises nombre variable de champs. Ainsi, champs retenus (Auteurs, Titre, (AFNOR), etc. Cette norme de descrip- sur les huit BDD interrogées, nous Descripteurs, etc.) ; tion bibliographique prescrit égale- avons recensé un total de 197 ment la présentation des notices, y champs, ce qui fait une moyenne de Normes de description compris la ponctuation. 24 champs par base. Si certains sont bibliographique L'ISBD se décline en autant de communs à toutes les bases (Auteurs, normes spécifiques que de types de Titre, Date de publication, etc.), Il existe deux types de normes de documents à décrire : monographies d'autres sont spécifiques à une ou description bibliographique : les (ISBD-M), périodiques (ISBD-S), docu- deux bases seulement (les Tags1 par normes de catalogage et les normes ments électroniques (ISBD-ER),etc.Elle exemple, sont uniquement proposés éditoriales. Les premières sont très comprend toutefois une structure par Medline, EMBase et PsycLIT). utilisées dans les grands centres générale en sept zones3, qui vaut pour D'autres enfin apparaissent sous des tous les documents, dont les trois formes différentes selon qu'ils sont premières seulement sont obligatoires : fusionnés ou non. À titre d'exemple, – Zone 1. Titre et mention de res- le Titre du périodique, le Volume, le Pour uniformiser ponsabilité (titre original, titre tra- Fascicule et la Pagination apparais- les données duit, auteur, affiliation de l'auteur) ; sent dans Medline PubMed dans un – Zone 2. Édition (1re édition, 2e édi- unique champ Source. provenant tion...) ; Pour uniformiser les données pro- de différentes bases, – Zone 4. Adresse bibliographique venant de différentes bases, il est (lieu de publication,éditeur,année de donc nécessaire de définir une struc- il est nécessaire publication) pour les monographies ; ture respectant les normes documen- Numérotation (volume, fascicule, taires en vigueur, ce qui suppose : de définir numéro) pour les publications en – la suppression des champs jugés une structure série ; non pertinents par rapport aux – Zone 5. Collation (format du docu- besoins des utilisateurs (Numéros de respectant ment, pagination, bibliographie, illus- contrôle, Date d'entrée et de mise à les normes tration...) ; jour dans la base originale, CODEN2, – Zone 6. Collection (titre et numéro Cote, Langue du résumé, Public documentaires dans la collection) ; cible, etc.) ; – Zone 7. Notes (notes sur les – l'éclatement de certains champs en vigueur diverses parutions du document (Source en : Titre de périodique, [reprint], les langues utilisées, etc.) ; Volume, Fascicule, Pagination, Lieu – Zone 8. ISBN, reliure et prix de publication, Éditeur, Date de documentaires (bibliothèques uni- (monographies) ; ISSN, titre clé et publication, etc. ; Titre en : Titre versitaires, par exemple) et nécessi- prix (publications en série). original et Titre traduit) ; tent de fortes compétences en cata- Les AACR2 (Anglo-American – la fusion de certains champs logage. Les secondes sont moins Cataloguing Rules 2nd ed.),parues en (Descripteurs principaux et complètes, mais plus simples à utili- 1978 et révisées en 1988 (3), incor- Descripteurs secondaires, etc.) ; ser ; elles sont donc adaptées à la porent les règles de l'ISBD, tout en documentation des chercheurs ou conservant leurs spécificités et en des petits centres d'information. intégrant les besoins nouveaux, nés 1. Les tags sont des descripteurs génériques qui de l'informatisation des biblio- renseignent sur le type de population (mâle, Normes de catalogage thèques.Elles ont une portée interna- femelle, animal...) ou la tranche d'âge (enfant, adulte...) concernée, le type de publication (étude de cas, étude de suivi...), l'aire L'ISBD-G (General International géographique... Standard Bibliographic Description), 3. La zone 3 n'est pas attribuée pour les 2. Le CODEN est un code alphanumérique monographies, mais peut être utilisée pour les d'identification des périodiques, qui tend à développée en 1975 par l'IFLA autres types de documents (cartes et plans par disparaître au profit de l'ISSN. (International Federation of Library exemple).

99 BBF 2000 Paris, t. 45, n° 1 OUTILS

tionale et ont été traduites et adap- grandes lignes les recommandations données bibliographiques informati- tées en plusieurs langues,notamment de l'Index Medicus (42), qui est l'édi- sées. Le format MARC original a été le français et l'espagnol. tion papier de la base bibliogra- développé par la Library of Congress phique Medline, produite par la NLM en 1966 (33), tandis que la British Normalisation éditoriale (National Library of Medicine). Les Library travaillait parallèlement à autorités (auteurs, descripteurs, titres l'établissement de son propre format La norme internationale ISO 690 de périodiques) doivent notamment MARC. Ce sont donc deux versions (21) définit la présentation des réfé- être identiques à celles de l'Index qui ont vu le jour : USMARC et rences bibliographiques4. Elle ne Medicus. UKMARC. reprend que les éléments les plus Après trente années d'existence, importants de la notice bibliogra- Formats d'échange de données MARC est le format de codage des phique de l'ISBD puisqu'elle n'est pas données bibliographiques le plus destinée aux bibliothécaires, mais Une fois définie la structure de la utilisé en documentation. Il fait l'ob- aux chercheurs et rédacteurs de notice bibliographique se pose le jet d'une norme internationale bibliographies. problème de sa représentation infor- établie en 1973, révisée en 1996, L'ISO 690 décrit des champs obli- matique. Il existe plusieurs formats [ISO 2709] (24),mais a subi des adap- gatoires (Auteurs, Titre, Année de tations nationales, à tel point que publication, etc.) et facultatifs l'on compte aujourd'hui une cinquan- (Pagination, Collection, Notes, etc.), taine de formats MARC spécifiques7, mais laisse une certaine liberté au MARC utilisés dans plus de soixante pays niveau de la présentation des élé- est un format (9). ments bibliographiques retenus. Un format d'uniformisation, Il faut alors appliquer les normes normalisé, l'UNIMARC8, a vu le jour en 1972, éditoriales reconnues à l'intérieur de destiné fondé sur des normes internationale- sa discipline5 : Chicago Style (his- ment reconnues : l'ISO 2709 (24) toire), MLA Style (Modern Language à la gestion déjà citée, l'ISO 3166 (25) (codes de Association, arts et lettres),APA Style pays), l'ISO 639 (20) (codes de (American Psychological Association, et à l'échange langues), l'ISBN-ISO 2108 (23), psychologie), CBE Style (Council of de données l'ISSN-ISO 3297 (26) et l'ISBD (règles Biological Editors, biologie), AMA de catalogage). Actuellement, seules Style (American Medical Association, bibliographiques douze agences bibliographiques médecine), Vancouver Style (méde- informatisées nationales9 ont adopté UNIMARC, le cine). Ces trois derniers formats de format américain USMARC fait donc présentation sont très proches, mais toujours référence. c'est le dernier (plus connu en France MARC est basé sur une structure sous le nom de Convention de normalisés de codage de données de données comportant : Vancouver) que nous avons retenu6, pour l'échange électronique d'infor- – des champs de longueur fixes, uti- parce qu'il fait autorité dans le mation. Nous nous limiterons à la lisés pour stocker des données de domaine médical. En effet, ce format présentation des deux formats les est adopté par les 500 plus grandes plus utilisés en documentation : revues biomédicales. Le style de MARC et SGML. Nous aborderons Vancouver (16) reprend dans ses brièvement la TEI (Text Encoding Initiative) et le Dublin Core Metadata 7. Une trentaine de ces formats sont basés sur Element Set, deux normes qui ont USMARC, d'autres sur UKMARC, d'autres encore sont hybrides. tendance à se développer avec la 8. Une description détaillée d'UNIMARC est croissance des documents élec- disponible en ligne : IFLA (International 4. La norme ISO 690-2 :1997 s'intéresse plus troniques. Federation of Library Associations and spécifiquement à la description bibliographique Institutions), UNIMARC: an Introduction. [online]. des documents électroniques. 1996. [cited 1998 Nov 20]. Available from URL 5. Une présentation de ces formats est disponible MARC http://ifla.inist.fr/VI/3/p1996-1/unimarc.htm en ligne sur le site de Bedford Books 9. Le décret n° 34-174 du 5 février 1993 (JO (http://www.bedfordbooks.com/rd/) et sur celui du 07/02/1993) a confirmé le rôle d'UNIMARC de l'université de Washington MARC (Machine Readable comme format national d'échange (http://healthlinks.washington.edu/hsl/styleguides/). bibliographique en France. UNIMARC 6. La bibliographie placée à la fin de cet article Cataloguing) est un format normalisé est notamment utilisé par la Bibliothèque est formatée selon le style de Vancouver. destiné à la gestion et à l'échange de nationale de France.

BBF 2000 100 Paris, t. 45, n° 1 Adaptation des normes et formats documentaires

nature générale, numéros d'identifi- La norme SGML se développe rapi- cadre général de description biblio- cation (ISBN, ISSN, Numéro de la dement dans le monde de la docu- graphique posé par l'ISBD et offre bibliographie nationale) ou valeurs mentation et va peu à peu se substi- une totale compatibilité avec les codées (Pays, Langue) ; tuer au format MARC (15, 35). Nous champs retenus par les logiciels de – des champs de longueur variable, l'avons retenue ici pour les avantages gestion de références bibliogra- où sont enregistrées les données suivants : phiques très utilisés dans le monde bibliographiques spécifiques (Titre, – intégration de formats différents de la recherche comme BibTeX, Mention de responsabilité, etc.) ; (MARC10 ou non-MARC) par adapta- EndNote, Reference Manager et – des sous-champs (le champ tion des balises SGML à ces formats ; Procite. Il existe également une table Adresse bibliographique par – lisibilité et compréhensibilité ; de correspondance entre les champs exemple se décompose en : Lieu de – recherche structurée sur tous les du format MARC et les balises de la publication, Éditeur, Date de publi- éléments du document ; TEI P3. cation). – adaptabilité rapide au format HTML Tous les champs sont délimités pour la mise en place d'une naviga- Dublin Core Element Set par des identificateurs numériques, tion hypertextuelle ; qui ne facilitent pas la lisibilité du – adaptabilité aux données bibliogra- Le Dublin Core Metada Element format (par exemple, 010=ISBN, phiques qui comprennent du texte et Set,établi en 1995 par l'OCLC (37) et 101=langue du document, 410=col- sont structurées ; le NCSA (National Centre for lection, 700=nom de personne, – indépendance de la plate-forme et Supercomputer Applications), se etc.). Les sous-champs sont identifiés du logiciel d'édition ou de consulta- démarque des formats précédents en par des lettres (par exemple, tion, d'où une réutilisation facilitée ce qu'il propose un ensemble mini- 400$a=adresse bibliographique, des données. mal de description bibliographique 400$b=lieu de publication, des documents électroniques uni- 400$c=date de publication). TEI P3 quement. Cet ensemble se compose Le format MARC est complexe à de quinze champs seulement : titre, utiliser et manque de convivialité La norme TEI P3 (Text Encoding créateur, sujet, description, éditeur, (15). S'il est adapté aux grands Initiative Public Proposal Number 3), contributeurs, date, type de res- centres documentaires disposant parue en 1994 (13), constitue une source, format, identificateur de res- d'un personnel formé, nous ne application particulière de SGML. source, relation, localisation, droits. l'avons pas jugé pertinent pour L'objectif de la TEI est de définir un Ainsi, en raison de l'utilisation aisée représenter nos données. format standard de codage et du format Dublin Core, ces champs d'échange de textes électroniques.La peuvent être renseignés par les SGML norme TEI P3 définit un ensemble de auteurs de documents électroniques conventions de balisage et d'annota- eux-mêmes. La norme SGML (28) se caractérise tion des textes conforme à la norme par sa capacité à représenter, à l'aide SGML. Normalisation de balises ou identificateurs, la struc- La TEI couvre toute forme de du contenu des champs ture logique de n'importe quel docu- publication (dictionnaires, manus- ment, indépendamment de la plate- crits, corpus linguistiques, données Une fois les structures de notices forme de travail. Chaque élément terminologiques, etc.). Le chapitre 6 bibliographiques uniformisées, il est (titre, sous-titre, image, légende, note de la norme est consacré aux cita- nécessaire de normaliser le contenu de bas de page, paragraphe, etc.) est tions et références bibliographiques des champs les plus importants identifié par une balise de début et de et précise quelles sont les balises à pour la recherche documentaire et fin d'élément. retenir pour la description bibliogra- l'exploitation bibliométrique du cor- phique d'un document, quels intitu- pus : Date de publication, Langue lés leur donner et comment les pré- de publication, Type de publica- premier auteur senter. Le schéma proposé obéit au tion, Titre de périodique, Pays d'af- second auteur filiation de l'auteur principal, ... Auteurs, Affiliation de l'auteur principal et Descripteurs. Pour la titre 10. La Library of Congress propose une DTD normalisation de ces champs dans (Document Type Definition) pour effectuer date l'intégration du format MARC en SGML notre corpus, nous avons suivi les [LC 1998]. recommandations de Vancouver ou,

101 BBF 2000 Paris, t. 45, n° 1 OUTILS

à défaut, celles de l'Index Medicus. ces variations en retenant les déno- la norme internationale ISO 4 (19) Lorsqu'il existe une norme interna- minations de types de publication qui donne les règles d'abréviation tionale ISO, nous signalons sa figurant dans l'Index Medicus. pour les mots du titre ou du titre de présence. publication. Normalisation Nous avons conservé la version Normalisation des dates des titres de périodiques abrégée et complète des titres de périodiques, afin de favoriser les Nous n'avons retenu dans le Les titres de périodiques apparais- recherches documentaires et l'édi- champ Date de publication que sent selon les bases interrogées, tan- tion de listes bibliographiques per- l'année de publication. Lorsque plu- tôt dans leur forme complète, tantôt sonnalisées. sieurs années étaient présentes, dans leur forme abrégée. Des varia- nous avons retenu la plus récente. tions peuvent en outre exister dans Normalisation des pays La mention du mois ou du jour a été la transcription des titres étrangers supprimée.En revanche,la date d'un (traduction ou translittération). Les noms de pays subissent égale- congrès apparaît en entier sur le Pour normaliser les titres de ment de nombreuses variations. modèle anglo-saxon : année, mois, périodiques de notre corpus, nous Ainsi,les États-Unis peuvent être dési- jour (1998 Dec. 12). Ce schéma est avons retenu comme forme normale gnés par USA, États-Unis, United conforme à la norme internationale l'édition 1998 des publications en States, US. Les changements géopoli- ISO 8601 (27) sur l'écriture des série (8 866 titres) dépouillées par la tiques intervenus ces dernières dates et des chronologies, qui NLM pour ses BDD bibliogra- années compliquent les dénomina- annule et remplace les normes ISO phiques11, comme le préconise la tions : éclatement de l'URSS en plu- 2014, ISO 2015, ISO 2711, ISO 3307 Convention de Vancouver. Cette liste sieurs républiques indépendantes, et ISO 4031. recense les publications analysées éclatement de la Yougoslavie, de la dans l'Index Medicus, l'Index to Tchécoslovaquie, changement de Normalisation des langues Dental Literature,l'International noms de pays africains, etc. Il existe Nursing Index et l'Hospital and une norme internationale ISO 3166 La mention de la langue de publi- Health Administration Index. À (25) fixant la dénomination des pays cation apparaît sous différentes défaut, nous avons retenu dans cet et proposant un code à deux ou trois formes selon la base interrogée. ordre de priorité les 8 379 pério- chiffres (par exemple, France, FR, Nous avons retenu l'intitulé complet diques indexés par l'ISI12 (Current FRA). de la langue proposé dans la norme Contents),les 1 409 périodiques ana- Conformément à la Convention internationale (20). L'intitulé nous lysés par PsycLIT13, les 1 065 pério- de Vancouver, nous avons retenu semble plus lisible que le code ter- diques exclusivement dépouillés pour notre corpus les dénominations minologique en deux lettres ou le dans EMBase14 et les 151 titres cou- des pays telles qu'elles apparaissent code bibliographique en trois verts par NIOSHTIC15. Enfin, pour les dans le MeSH (Medical Subject lettres. périodiques n'apparaissant dans Headings), le thésaurus de Medline, aucune des listes précitées, nous qui présente l'avantage d'un classe- Normalisation avons respecté les règles fixées par ment géographiquement hiérarchisé des types de documents : continent, région, pays, état, ville. Nous avons laissé inchangées les enti- Les types de document ont des tés géographiques lorsqu'il était 11. National Library of Medicine, List of Serials dénominations distinctes d’une base Indexed for Online Users. [online]. [Cited 1998 impossible d'identifier une subdivi- à l’autre. Dans notre corpus par Nov 12]. Available from URL ftp://nlmpubs.nlm. sion. Par exemple, nous avons laissé exemple, les actes de congrès appa- nih.gov/online/journals/ l'entité Yugoslavia, sauf si un nom de 12. ISI Master Journal Coverage List. [online]. raissent sous quinze dénominations [Cited 1998 Nov 12]. Available from URL ville figurait nous permettant d'iden- différentes : « Meeting Report », http://www.isinet.com/listlinx.html tifier le pays (par exemple : Zagreb 13. PsycInfo and PsycLIT Journal Coverage List. « Conference Presentation », [online]. [Cited 1998 Nov 12]. Available from URL Croatia, Beograd Serbia). « Conference-paper », « MEETING http://www.apa.org/psycinfo/covlist.html PAPER », « MEETING POSTER », 14. List of Journals Only to Be Found in EMBase. Normalisation des auteurs [online]. [Cited 1998 Nov 12]. Available from URL « MEETING REPORT », « MEETING http://www.chest.ac.uk/datasets/embase/journals. SLIDE », « Meeting Summary », html La description des auteurs subit 15. NIOSHTIC Core Journal List. [online]. [Cited « Meeting-Document », etc. Dans 1998 Nov 12]. Available from URL de nombreuses variations (8).Le nom notre exemple, nous avons éliminé http://www.cdc.gov/niosh/nioshtic.html précède généralement le prénom,

BBF 2000 102 Paris, t. 45, n° 1 Adaptation des normes et formats documentaires

Institute of Science and Quelques variations dénominatives Technology) et d'abréviations (par de l'École de management de l'université de Manchester exemple, University se retrouve (qui comptabilise 34 dénominations différentes dans notre corpus) sous cette forme ou sous des formes abrégées « Univ. », « Univ », « U »), ou encore à la présence ou – Victoria U of Manchester, Inst of Science & Technology, England l'absence de mentions relatives à – Victoria U of Manchester Inst of Science & Technology, Manchester School of Management, un statut commercial (limited, ltd, England incorporated, inc, Gmbh, SA, etc.). –Manchester Sch. Management, Univ. On retrouve également les varia- –Manchester Inst. Sci. and Technol., Manchester, U.K. tions liées aux dénominations des –Manchester School of Management, UMIST noms de pays (cf. normalisation des –Manchester School of Management, University of Manchester, Institute of Science and pays). Technology L'ensemble de ces variations –School of Management, Institute of Science and Technology, University of Manchester, produit une explosion combina- PO Box 88, Manchester M60 1QD, United Kingdom toire dans la présentation des affi- –U Manchester Inst of Science & Technology, Manchester School of Management, Manchester, liations, comme nous pouvons le England constater dans l'encadré ci-dessus. Les règles de catalogage (3,2) pré- conisent de conserver l'écriture la mais parfois c'est l'inverse. Le pré- dernier élément lorsqu'il s'agit plus courante de l'organisme. Ainsi, nom est complet ou abrégé, ou bien d’Anglo-saxons (par exemple, Mill, le nom de la collectivité doit être seul le premier prénom apparaît en John Stuart) ou de Portugais (par saisi dans la langue utilisée couram- entier et le second est abrégé. Les exemple Antunes,António Lobo). ment par cette collectivité dans ses noms peuvent être composés et pré- Ces règles sont difficilement auto- publications, sous leur forme déve- senter des particules (de, von, van, matisables. Aussi avons-nous adopté loppée de préférence au sigle,sauf si etc.). À ces variations s'en ajoutent un format plus simple qui ne procède celui-ci est la forme la plus connue. d'autres, comme celles liées à des à aucun rejet.Le nom complet de l'au- En général,c'est la collectivité subor- séparateurs (tiret, apostrophe, vir- teur apparaît suivi des initiales de ses donnée qui doit apparaître en pre- gule) ou à la casse. Par exemple, l'au- prénoms,sans point,conformément à mier (par exemple, Institute of teur le plus référencé dans notre cor- l'usage de l'Index Medicus. Les noms Occupational Medicine and Health, pus documentaire sur le stress pro- composés sont classés au premier University of Rochester), mais, dans fessionnel, Cary L. Cooper apparaît élément et les éléments sont systé- la pratique, ce principe est sujet à de sous neuf formes différentes « C. L. matiquement séparés par un trait nombreuses variations. Cooper », « COOPER CL », d'union, lorsqu'ils n'en possèdent Au total, les normes documen- « COOPER-C-L », « Cooper C.L. », pas. taires officielles sont conçues « Cooper CL », « Cooper, C. L. », comme un ensemble de règles, « Cooper,-Cary-L. », « Cooper-C-L », Normalisation contredites par de nombreuses « Cooper-CL ». de l'affiliation des auteurs exceptions. Ces règles laissent une Les règles de catalogage (3) et (1) trop large part à l'interprétation préconisent le rejet des particules Le champ Affiliation de l'auteur pour être automatisées. Nous avons selon les pratiques du pays auquel désigne l'organisme dans lequel tra- donc conçu nos propres règles, plus appartient l'auteur. Ainsi, un auteur vaille le premier auteur de la publi- conformes à un traitement automa- français, espagnol ou portugais verra cation. Il est composé de différentes tique. La première consiste à déve- sa particule « de » rejetée (par parties (section, division, départe- lopper tous les sigles et abréviations exemple :Roux,Jean de) tandis qu'un ment, unité, adresse, ville, code pos- (Univ University, Dpt Department, auteur américain ou un italien la tal, pays, etc.) dont le nombre et Sch School, etc.) sauf s'ils sont conservera en tête (De Sicca, l'ordre subissent de fortes varia- d'usage universel (UNESCO, ONU, Giovanni). Les noms composés sans tions. OTAN, etc.). La seconde consiste à espace sont classés au premier élé- Pour chacune des parties, les identifier les différentes parties de ment lorsqu'il s'agit de Français, variations de présentation sont liées l'affiliation pour les ordonner, du d'Allemands, d'Espagnols (par à l'utilisation de sigles (par exemple, général vers le particulier. Ainsi, exemple, Garcia Lorca, Federico), au UMIST University of Manchester nous aurons par exemple : United

103 BBF 2000 Paris, t. 45, n° 1 OUTILS

Quelques statistiques sur le corpus bibliographique traité

26 251 notices initiales retrouvées, sur la période* 1967-1997 20 402 notices après dédoublonnage, soit 5 849 doublons éliminés

1.1 Ventilation du nombre de notices par base après dédoublonnage 1.2 Ventilation du nombre de doublons par base Base Notices Base Doublons Medline 8 004 Medline 53 EMBase 3 125 EMBase 991 Biosis 1 446 Biosis 1 167 PsycLIT 4 137 PsycLIT 1 411 Pascal 1 252 Pascal 822 NIOSHTIC 1 807 NIOSHTIC 1 062 Cisilo 498 Cisilo 233 INRS-B 132 INRS-B 110 Total 20 401 Total 5849

2. Problèmes rencontrés

Les règles préconisées par les normes et formats documentaires en vigueur ne sont pas toujours complètement automatisables. Les principaux problèmes qui demeurent concernent les champs Auteurs, Affiliation des Auteurs, Source, et Descripteurs. Notre algorithme de reformatage du champ Auteurs fonctionne bien dans l'ensemble. Il adopte, rappelons-le, le format Nom Initiales des prénoms. Certaines ambiguïtés n'ont toutefois pas pu être levées actuellement. C'est le cas notamment pour les auteurs qui possèdent le même nom, mais dont l'une des initiales varie. Par exemple, l'auteur Robert A. Karasek apparaît, après normalisation, sous les formes « Karasek RA » et « Karasek R ». Nous savons qu'il s'agit du même auteur, mais comment le faire reconnaître par le système. Une des solutions envisagées (non encore testée) consiste à vérifier qu'ils appartiennent au même organisme. Mais nous nous heurtons alors au problème de l'Affiliation. Nous n'avons actuellement pas encore trouvé d'algorithme satisfaisant pour traiter les variations du champ Affiliation des auteurs. Considérons les deux variations suivantes concernant le service Physiologie environnementale de l'INRS. Comment faire reconnaître par le système l'identité entre « INRS Nancy » et « INRS » ainsi que celle entre « Cent. res. » et « cent. rech. » ?

Cent. res. INRS Nancy, serv. physiologie environmentale, Nancy, FRA INRS, cent. rech., serv. physiologie environnementale, Nancy, FRA

Notre algorithme de reformatage du champ Source fonctionne actuellement uniquement pour les articles de périodiques, qui représentent 90 % de notre corpus. Nous n'avons pas encore trouvé de solution satisfaisante pour normaliser la source des non-périodiques, tant les cas de figure sont divers. Outre la diversité des types de documents (monographie, contribution à une monographie, chapitre d'une monographie, colloque, acte d'un colloque, rapport, etc.), nous nous heurtons à la variation dans le catalogage de ces documents par les différentes bases de données interrogées. La normalisation automatique des descripteurs passe par la mise en correspondance des termes de notre corpus avec ceux d'un métathésaurus. À cet effet, nous avons utilisé l'UMLS (Unified Medical Language System), riche de quelque 476 000 concepts, représentant plus d'un million de formes différentes prélevées parmi 71 sources différentes. Malgré cette richesse, inégalée dans le domaine biomédical, plus de 8 000 termes de notre corpus n'ont pas été reconnus, parmi les 17 000 termes obtenus après reformatage (sur un nombre initial de 45 000). Il reste donc à traiter ce reliquat manuellement.

3. Projets de développement de l'application WebStress

La méthode et l'application décrite ici peuvent être réutilisées pour traiter tout corpus bibliographique dans le domaine biomédical, puisque nous avons retenu une norme éditoriale adoptée par des éditeurs de revues médicales. Il est possible de traiter des corpus bibliographiques dans d'autres domaines (histoire, droit, informatique, etc.), moyennant la modification des filtres de reformatage afin qu'ils correspondent à la norme éditoriale du domaine considéré. WebStress n'est pas seulement une application de reformatage de données et de dédoublonnage de notices. C'est également une interface Web de consultation hypertextuelle du corpus bibliographique. L'interrogation peut se faire à partir d'une liste d'items (auteurs, descripteurs) classés par fréquence décroissante ou à partir de requêtes booléennes classiques. Une fonction de classification automatique par clusterisation permet de dégager des réseaux d'auteurs (les « collèges invisibles ») ainsi que des thèmes de recherche spécifiques au sein d'une problématique plus vaste (dans notre exemple, le stress professionnel). L'originalité de cette interface est qu'elle permet de croiser les informations issues de données locales (le corpus) et de données distantes (BDD ou thésaurus disponibles sur Internet). Nous pouvons par exemple exporter une requête appliquée en premier sur le corpus local vers une BDD comme Medline PubMed ou un moteur de recherche sur Internet. Nous envisageons dans le futur d'interfacer l'application WebStress avec des logiciels de bibliographie tels que Reference Manager, EndNote ou Procite, afin de profiter de leurs fonctionnalités très riches en matière de publication de bibliographies à destination de périodiques spécialisés. Ainsi disposerons-nous d'une chaîne complète de traitement de l'information bibliographique, depuis l'interrogation des BDD elles-mêmes jusqu'à la publication de bibliographies.

* La période couverte varie selon la disponibilité des BDD interrogées sur cédérom : Medline (1967-1997), EMBase (1984-1997), Biosis (1990-1997), PsycLIT (1983-1997), Pascal (1987- 1997), NIOSHTIC (1973-1997), Cisilo (1974-1997), INRS-B (1981-1997). Nous procéderons à la mise à jour du corpus avant la fin de l'année.

BBF 2000 104 Paris, t. 45, n° 1 Adaptation des normes et formats documentaires

Kingdom, University of Manchester, concurrentes. Les descripteurs ont dédoublonnage s'avère cruciale. Il Institute of Science and Technology, ensuite subi une analyse sémantique convient de sélectionner les champs School of Management. par un expert en vue de la construc- qui sont présents dans toutes les Cette normalisation permet un tion d'un thésaurus sur le stress profes- notices.Il est également essentiel que meilleur repérage des affiliations des sionnel : établissement de relations ces champs possèdent un format auteurs, en proposant un classement d'équivalences entre les descripteurs homogène, soient significatifs et à plusieurs niveaux hiérarchiques. (termes préférentiels) et les non-des- identifient de façon univoque les Ainsi pourrons-nous étudier les pays, cripteurs (formes concurrentes), éta- notices. C'est pourquoi la normalisa- villes et universités les plus produc- blissement des relations hiérarchiques tion est une étape critique dans la tives sur un sujet déterminé ; les ins- (génériques, spécifiques) et associa- construction de cette clé. Deux solu- tituts spécialisés dans un domaine, tives. tions sont envisageables : le recours à toutes universités confondues ; etc. des codes normalisés d'identification d'unités d'information et la création Normalisation des descripteurs Dédoublonnage des notices d'une clé de dédoublonnage spéci- fique. Les principales variations termino- Les doublons désignent toutes les logiques observées dans notre cor- notices,au sein d'une ou de plusieurs Systèmes d'identification univoque pus sont d'ordre morphologique BDD, qui font référence à la même d'unités d'information (« Work Load », « Work-Load », publication logique : auteurs, titres et « Workload ») et lexical support de publication16 identiques. Il existe plusieurs systèmes inter- (« Corticotropin », « ACTH », « Acth L'élimination des doublons est une nationaux d'identification univoque Hormone », « Adrenocorticotrophic opération préalable à toute analyse d'unités d'information (42, 36). Hormone », « Adrenocorticotropic bibliométrique d'un corpus. Dans Certains s'attachent à identifier un Hormone »). notre application, la présence de ensemble de documents (pério- Conformément aux recomman- 6 000 références en double au sein dique, ouvrage collectif, conférences, dations de Vancouver,nous avons utilisé de la base Stress faussait les résultats etc.) ; on retrouve ici le CODEN et le MeSH et le metathesaurus UMLS statistiques et ne permettait pas l'édi- l'ISSN pour les périodiques, l'ISBN (Unified Medical Language System, tion de listes bibliographiques rigou- pour les ouvrages.D'autres,comme le produit par la NLM) (40, 31) pour la reuses. SICI ou le BIBLID (cf. ci-après), por- normalisation des descripteurs. Sur le Quelle que soit la solution infor- tent sur l'identification du document plan informatique,la normalisation s'est matique retenue, le dédoublonnage lui-même (article de périodique, opérée de la manière suivante (39) : s'opère en trois étapes (11) : contribution à une monographie, – réduction des mots-clés du corpus à construction d'une ou de plusieurs contribution à une conférence...). une forme minimale, expurgée des clés de dédoublonnage ; identifica- D'autres enfin décrivent une partie caractères non alphanumériques ; les tion des doublons par comparaison de document (schéma, tableau, majuscules ont été converties en des clés de dédoublonnage (mise en bibliographie, etc.) ; on a alors minuscules ; correspondance) ; élimination des recours aux notices MARC, aux URL – comparaison avec les termes équiva- doublons du corpus. (Uniform Resource Locator) ou lents contenus dans l'UMLS et sélec- encore aux DOI (Digital Object tion du terme préférentiel en cas de Construction Identifier). concordance ; de la clé de dédoublonnage Dans le but d'identifier les dou- – lemmatisation simple des mots-clés blons – lors d'une interrogation mul- non reconnus dans l'UMLS, afin d'éli- La sélection des champs qui vont tibase – nous nous sommes intéres- miner les variations morphologiques servir à la construction de la clé de sés plus particulièrement aux sys- (marques du pluriel, américanismes) ; tèmes qui permettent de caractériser – en cas de non-concordance avec les les documents eux-mêmes, à savoir : termes de l'UMLS, la forme la plus BIBLID et SICI. 16. On observe parfois des variations (erreurs occurrente devient la forme préféren- orthographiques, omissions, etc.) concernant tielle. les auteurs ou le titre d'une même publication, d'une base à l'autre. Nous ne considérons pas Dans notre application, ce type de comme des doublons les documents écrits traitement informatique a permis d'éli- par le même auteur et portant le même titre, miner,parmi un corpus de 45 000 des- mais qui ont fait l'objet de publications différentes (par exemple, un rapport interne cripteurs, plus de 60 % de formes qui devient un article de périodique).

105 BBF 2000 Paris, t. 45, n° 1 OUTILS

– BIBLID (BIBLiographic IDenti- converties en majuscules ; fication) est une norme internatio- Construction d'une clé – dans le cas des non-périodiques, nale ISO 9115 (29) établie en 1987, de dédoublonnage spécifique nous avons retenu le nombre total de mais qui n'a plus cours depuis 1996 pages du document (à la place de la en raison de son inadéquation aux La clé de dédoublonnage néces- première page), qui est facilement caractéristiques des publications site l'extraction d'une nouvelle infor- identifiable grâce à la mention « p. » électroniques. Cet identifiant retient, mation,à partir du traitement et de la (par exemple, 230 p.) ; lorsqu'il s'agit pour les articles de périodiques, concaténation de plusieurs données, d'une contribution à une monogra- l'ISSN, l'année de publication, la sous une forme normalisée. Nous phie, c'est l'indication de la première tomaison (volume, numéro, partie) et nous sommes inspirés du code page de la contribution qui est sélec- la pagination ; pour les contributions Meyer-Uhlenried (32). Cette clé tionnée et non la pagination totale. à des ouvrages, l'ISBN, l'année de alphanumérique de treize caractères Exemple : publication, la pagination. Les zones comprend les quatre premières Tamburro GA.; Di-Sciascio G; sont précédées de la mention BIBLID lettres du nom de l'auteur,les initiales De-Giglio F. Les facteurs déonto- et séparées par des signes de ponc- des deux premiers prénoms de l'au- logiques du personnel psychiatrique en tuation. teur si disponibles,les deux dernières tant que symptôme d'un état de «Burn-out». [Infringements of the Exemple : lettres de l'année, la première lettre ethics of the psychiatric profession: A BIBLID 0272 17716(1983)3 : 3p.68-70 des cinq premiers mots du titre. Burn-out syndrome]. Psychologie- BIBLID3-8007-1317-9(1986)p.158-170 Nous avons apporté quelques Médicale1992; 24 (Spec Issue 4):372-376. aménagements à ce code : – Le SICI (Serial Item and – l'indication de la première page de Dub1: TAMB*GA*92*LFDDP*372 Contribution Identifier), défini en l'article a été ajoutée,ce qui évite tout Dub2: TAMB*GA*92*IOTEO*372 1991 par le SISAC (US Serials risque de confusion entre deux Industry Advisory articles de périodique (c'est par Élimination des doublons Committee), a fait l'objet d'une nor- exemple le cas des articles en malisation américaine (4). Le SICI plusieurs parties) ; La double clé de dédoublonnage identifie de façon unique chaque – les quatre lettres de l'année ont été (titre original et titre traduit) permet expression physique d'une même retenues pour éviter toute ambiguïté d'identifier de manière univoque une entité logique (plusieurs publications (passage à l'an 2000) ; publication. Ainsi deux ou plusieurs d'un même article auront des SICI dif- – lorsque le titre comporte moins notices présentant la même clé de férents). Une version révisée du SICI de cinq mots, nous avons retenu les dédoublonnage sont considérées est parue en 1996, qui offre de nou- initiales des mots présents que nous comme des doublons. velles spécificités, comme la désigna- avons complétées par ajout des En présence de doublons, il tion du support (électronique par lettres du dernier mot du titre convient de ne conserver qu'une exemple) ou les composantes d'un afin d'obtenir un code de cinq seule notice et d'éliminer les autres. document. Le SICI s'avère peu aisé à caractères ; La sélection des notices à conserver construire et à manipuler (il com- – nous avons constitué deux clés de obéit à un ordre de priorité dépen- porte quarante caractères, calculés à dédoublonnage, la première (Dub1) dant de la base d'origine. Nous rete- partir de l'ISSN, de la tomaison, de fonctionnant d'après le titre original, nons dans cet ordre la notice prove- l'année de la publication, etc.). la seconde (Dub2) d'après le titre tra- nant de Medline,puis celle d'Embase, Nous n'avons pas retenu ces deux duit, ceci pour multiplier les chances de Biosis, de PsycLIT, de Pascal, de identificateurs comme clés de dédou- de retrouver des doublons (certaines NIOSHTIC, de Cisilo, et enfin celle blonnage, bien qu'il s'agisse de bases telles Biosis ou NIOSHTIC ne d'INRS-B. normes, parce qu'ils ne nous sem- proposent pas de titre dans sa langue blent pas adaptés à notre corpus. En originale) ; effet, la mention de l'ISSN, notam- – pour le codage du titre, seules les Conclusion ment, ne figure pas dans les bases lettres ont été conservées. Pour l'en- INRS-B et NIOSHTIC. De plus, la semble de la clé, tous les caractères Les problèmes de format sont tomaison, malgré le reformatage, est non imprimables de même que les familiers aux professionnels de la sensible à certaines variations (sup- tirets, points, apostrophes, etc., ont documentation et des bibliothèques plément, numéro spécial, etc.). Nous été supprimés ; chaque élément du qui ont conçu et utilisent des sys- avons donc construit une clé de code est séparé du suivant par une tèmes de description bibliogra- dédoublonnage adéquate. étoile et toutes les lettres ont été phique élaborés. Il est difficile de

BBF 2000 106 Paris, t. 45, n° 1 Adaptation des normes et formats documentaires

[online]. 1997. [cited 1998 Nov 20]. Available from : faire un choix parmi les nombreuses la rédaction d'une liste bibliogra- URL : http://www.bedfordbooks.com/rd/ctcbe.html normes documentaires existantes, phique : « The references must be 7. Bedford Books. The Social Sciences: APA Style. qu'il s'agisse des normes de catalo- verified by the author against the [online]. 1997. [cited 1998 Nov 20]. Available from : gage comme des formats d'échange original documents ». Cet obstacle URL : http://www.bedfordbooks.com/rd/ctapa.html de données (10, 38). risque de devenir plus prégnant 8. Degez, Danièle. Compatibilité des langages d'in- Nous dressons trois constats de dans les années à venir, avec la géné- dexation. Mariage, cohabitation ou fusion ? Quelques notre revue des normes documen- ralisation des documents électro- exemples concrets. Documentaliste-Sciences de l'in- formation, 1998;35(1):3-14. taires et de son adaptation à notre niques et l'accroissement de la litté- 9. Delsey, T. L'Évolution des formats MARC. In : application : rature scientifique. L'Avenir des formats de communication. Banque – le caractère multiforme des L'inadéquation des normes docu- internationale d'information sur les États franco- normes, même les mieux établies ; le mentaires (ISBD,AACR2) à un traite- phones de l'ACCT; 1996 Oct 7-11; Bibliothèque natio- meilleur exemple en est la norme ment informatique est relevée par nale du Canada, Ottawa. MARC qui revêt autant de formes les spécialistes, qui dénoncent la « 10. Dempsey, Lorcan ; Mumford, Anne ; que de pays l'utilisant, soit une cin- dichotomie entre les règles de cata- Robiette, Alan, et al. eLib standards guidelines. quantaine recensée par l'IFLA (17) ; logage et les formats informatiques Version 2. [online] 1998 Oct 27. [cited 1999 Jul 05]. Available from : URL : http://www.ukoln.ac.uk/ – l'inadéquation des normes exis- utilisés pour présenter les informa- services/elib/papers/other/standards/ tantes pour les traitements informati- tions » (12). C'est pourquoi nous 11. Desrichard, Yves. Le Dédoublonnage des sés ; les règles de catalogage ont été avons souvent opté pour une solu- banques de données bibliographiques : un état de conçues initialement pour être utili- tion originale, adaptée à l'exploita- l'art ». Documentaliste-Sciences de l'information, sées par un opérateur humain qui tion bibliométrique du corpus, par- 1997;34(2):82-9. dispose du document original et non fois éloignée des normes documen- 12. Desrichard, Yves. Les Formats et normes de par un ordinateur, d'où une grande taires en vigueur, comme pour les catalogage : évolutions et perspectives ». Bull Bibl Fr liberté dans l'interprétation de ces noms d'auteurs ou de collectivités- 1998; 43(3):56-65. règles, inacceptable dans le cadre auteurs, en attendant la parution de 13. ETC (Electronic Text Center). TEI Guideline for Electronic Text Encoding. [online]. 1994. d'une solution informatique ; nouvelles normes, plus adaptées au [cited 1998 Nov 20]. Available from : URL : – l'inadéquation des identificateurs traitement automatique des données http://etext.virginia.edu/tei/ univoques d'unités d'information bibliographiques. 14. Gehanno, JF, Paris C, Thirion, Benoît, (BIBLID ou SICI) pour le dédoublon- et al. Assessment of bibliographic databases perfor- nage des notices ; les notices biblio- Septembre 1999 mance in information retrieval for occupational and graphiques issues d'une interroga- environmental toxicology ». Occup Environ Med, tion multibase ne possèdent pas tous 1998;55:562-6. les éléments requis par ces identifi- 15. Heery, Rachel. Review of Metadata Formats. Program 1996;30(4):345-73. [online].[cited 1998 cateurs, d'où la nécessité de Nov 20]. Available from : URL : http://www.ukoln. construire une clé de dédoublon- BIBLIOGRAPHIE ac.uk/metadata/review.html nage adéquate. 16. ICMJE (International Committee of Medical En réponse à la variété de normes Cette bibliographie est formatée selon le style de Journal Editors). Uniform Requirements for de catalogage, tend à s'imposer la Vancouver. Manuscripts Submitted to Biomedical Journals. JAMA, notion de core record (12), qui 1997;277:927-934. [online] 1997 Mar 18. [cited 1998 désigne l'élaboration d'une notice 1. AFNOR NF Z44-001 :1995. Technologies de l'in- Nov 20]. Available from : URL : http://www.ama- formation - Classement alphabétique des dénomina- assn.org/public/journals/jama/sc6336.htm minimale, ne retenant que les tions. Paris : AFNOR; 1995. 17. IFLA (International Federation of Library champs essentiels à l'identification 2. AFNOR NF Z44-060 :1983. Documentation - Associations). UNIMARC: an Introduction. bibliographique d'un document. Catalogue d'auteurs et d'anonymes - Forme et struc- [online]. 1996. [cited 1998 Nov 20]. Available from : C'est le parti que nous avons suivi,en ture des vedettes des collectivités-auteurs. Paris : URL : http://ifla.inist.fr/VI/3/p1996-1/unimarc.htm nous fondant sur les recommanda- AFNOR; 1983. 18. ISBD(G). General International Standard tions de la Convention de Vancouver. 3. Anglo-American Cataloguing Rules (AACR2). Bibliographic Description. Annotated Text. L'absence du document original 2nd ed., rev. Chicago : American Library Association; [rev. ed.]. München: K. G. Saur, 1992. est un réel obstacle à la description 1988. 19. ISO 4 : 1997 (revision of 1984). Information and bibliographique des documents, 4. ANSI/NISO Z39-56 : 1996 (revision of 1991). Documentation - Rules for the Abbreviation of Title Serial Issue and Contribution Identifier (SICI). Words and Titles of Publications. [Geneva] : notamment dans l'écriture du nom Bethesda : NISO Press; 1996. International Organization for Standardization; 1984. de l'auteur ou de son affiliation. Or, 5. Bedford Books. The Humanities: MLA Style. 20. ISO 639 : 1988. – Code for the Representation toutes les normes, y compris la [online]. 1997. [cited 1998 Nov 20]. Available from : of Names of Languages. [Geneva] : International Convention de Vancouver, stipulent URL : http://www.bedfordbooks.com/rd/ctmla.html Organization for Standardization; 1988. le recours au document original dans 6. Bedford Books. The Sciences: CBE Style. 21. ISO 690 : 1987. Information and

107 BBF 2000 Paris, t. 45, n° 1 OUTILS

Documentation : Bibliographic References - Content, Information und Dokumentation. München : Saur; Form and Structure. [Geneva] : International 1980. Organization for Standardization; 1987. 33. Library of Congress (LC). MARC Standards. 22. ISO 690-2 : 1997. – Information and [online]. Updated 1999 Jan 27. [cited 1999 Feb 23]. Documentation - Bibliographic References - Content, Available from : URL : http://lcweb.loc.gov/marc Form and Structure. Part 2 : Electronic Documents or /marc.html Parts Thereof. [Geneva] : International Organization 34. Library of Congress (LC). Marc Document Type for Standardization; 1997. Definitions. Background and development. [online]. 23. ISO 2108 : 1992. Information and Updated 1998 Mar 2 [cited 1999 Feb 23]. Available Documentation - International Standard Book from : URL : http://lcweb.loc.gov/marc/ Numbering (ISBN). [Geneva] : International marcdtd/marcdtdback.html Organization for Standardization; 1992. 35. Lupovici, Catherine. Cataloguer en SGML : de 24. ISO 2709 : 1996 (revision of 1973). Information l'étiquetage au balisage. In 63rd IFLA General and Documentation - Format for Bibliographic Conference; 1997 Aug 31-Sept 5. [online]. [cited 1998 Information Interchange on Magnetic Tape. Nov 20]. Available from : URL : http://www.ifla. [Geneva] : International Organization for org/ifla/IV/ifla63/63lupcf.htm Standardization; 1996. 36. Lupovici, Catherine. Le Digital Object Identifier : 25. ISO 3166 : 1997 (revision of 1988). Code for le système du DOI. Bull Bibl Fr 1998;43(3):49-54. the Representation of Names of Countries. [Geneva] 37. OCLC. The Dublin Core: A Simple Content : International Organization for Standardization; Description Model for Electronic Resources. [online]. 1997. Updated 1998 May 3. [cited 1999 Feb 23]. Available 26. ISO 3297 : 1986 (revision of ?). Information and from : URL : http://purl.oclc.org/dc/ Documentation-International Standard Serial 38. OII (Open Information Interchange). Library Numbering (ISSN). [Geneva] : International Information Interchange Standards. [online]. Updated Organization for Standardization; 1986. 1998 Aug. [cited 1998 Nov 20]. Available from : URL : 27. ISO 8601 : 1988. Data Elements and http://www2.echo.lu/oii/en/library.html Interchange Formats - Information Interchange - 39. Nauer, E. (1999). De l'importance de la norma- Representation of Dates and Times. [Geneva] : lisation en bibliométrie. In: 7e colloque sur les sys- International Organization for Standardization; 1988. tèmes d'information élaborée; 1999 Sep 27th-Oct 1st; 28. ISO 8879 : 1986 (E). Information Processing - Ile Rousse, France. Text and Office Systems - Standard Generalized 40. NLM (National Library of Medicine). UMLS Markup Language (SGML). [Geneva] : International Knowledge Sources Documentation. 10th Ed. Bethesda Organization for Standardization; 1986. (MD): NLM; 1999. [online]. [updated 1999 Jan 1]. [cited 29. ISO 9115 : 1987 (cancealed in 1996). 1999 Jan 29]. Available from : URL : Information and Documentation-Bibliographic http://www.nlm.nih.gov/research/umls/UMLSDOC.HTML Identification (BIBLID) of Contributions in Serials 41. Paskin, Norman. Information Identifiers. and Books. [Geneva] : International Organization for Learned Publishing 1997;10(2):135-56. [online] [cited Standardization; 1987. 1998 Nov 20]. Available : from : URL http://www.else- 30. Jolibois, S. ; Nauer, E. ; Mouzé-Amady, M. ; vier.com/inca/homepage/about/infoident/Menu.shtml Chouanière, D. ; Grandjean, F. (1999). 42. Patrias, K. National Library of Medicine WebStress Application: a short description of current Recommended Formats for Bibliographic Citation. features and some proposals for future develop- Bethesda (MD): NLM; 1991. ments. In: Consensus Workshop on Stress at Work, 25-26 Oct 1999, AMI, Copenhagen. 43. University of Washington. AMA Style Guide [fact sheet online]. 1996 [updated 1997 Jul 8]. [cited 31. Jolibois, S. ; Nauer, E. ; Chouanière, D. ; 1998 Nov 20]. Available from : URL : http://health- Mouzé-Amady, M. ; Ducloy, J. ; Grandjean, F. links.washington.edu/hsl/styleguides/ama.html (2000). L'Unified Medical Language System (UMLS): une base de connaissances multilingue dans le 44. University of Washington. Style Guide [fact domaine biomédical. Documentaliste-Sciences de sheet online]. 1996 [updated 1997 Jul 8]. [cited 1998 l'information, 2000;37(1). Nov 20]. Available from : URL : http://healthlinks.washington.edu/hsl/styleguides/nl 32. Laisiepen, K. ; Lutterbeck, E. ; Meyer- m.html Uhlenried, K. H. – Grundlagen der praktischen

BBF 2000 108 Paris, t. 45, n° 1