2 Korpus I Językoznawstwo Korpusowe 9

Total Page:16

File Type:pdf, Size:1020Kb

2 Korpus I Językoznawstwo Korpusowe 9 Piotr Paryzek Pozyskiwanie danych leksykalnych z tekstów elektronicznych (na materiale czasopisma naukowego) Promotor: dr hab. Piotr Wierzchoń, prof. Uniwersytet im. Adama Mickiewicza w Poznaniu Instytut Językoznawstwa Poznań 2011 Panu Profesorowi Piotrowi Wierzchoniowi bardzo dziękuję za cierpliwość, trafne uwagi i opiekę nad pracą Spis treści 1 WSTĘP 7 2 KORPUS I JĘZYKOZNAWSTWO KORPUSOWE 9 2.1 Historia badań korpusowych 12 2.1.1 Krytycyzm Chomsky’ego 12 2.1.2 Rozwój badań korpusowych 14 2.2 Charakterystyka korpusów językowych 18 2.2.1 Sinclaira koncepcja konstruowania korpusów (1996) 18 2.2.2 Reprezentatywność 21 2.2.3 Koncepcja McEnery’ego i Wilsona (1996) 24 2.3 Typologia korpusów 27 2.3.1 Korpusy referencyjne i monitorujące 27 2.3.2 Korpusy ogólne i specjalistyczne 28 2.3.3 Korpusy pełnotekstowe i próbkowane 29 2.3.4 Korpusy języka pisanego i mówionego 30 2.3.5 Korpusy jednojęzyczne i wielojęzyczne, równoległe i porównywalne 31 2.3.6 Korpusy nieanotowane i anotowane 33 2.3.7 Korpusy synchroniczne i diachroniczne 35 2.4 Korpusy historyczne i współczesne 36 2.4.1 Korpusy ery przedkomputerowej 36 2.4.2 Wybrane korpusy komputerowe 38 2.4.2.1 Brown Corpus 38 2.4.2.2 British National Corpus 39 2.4.2.3 American National Corpus 40 2.4.2.4 Cobuild, Bank of English 40 2.4.2.5 International Corpus of English (ICE) 41 2.4.2.6 The Helsinki Corpus of English Texts 43 2.4.3 Korpusy w Polsce 43 2.4.3.1 PELCRA 43 2.4.3.2 Narodowy Korpus Języka Polskiego 45 3 2.4.3.3 Korpus Języka Polskiego PWN 46 2.4.3.4 Korpus IPI PAN 47 2.4.4 Zbiory tekstów 47 2.5 Narzędzia komputerowe i procedury stosowane w badaniu korpusów 50 2.5.1 Wyszukiwanie i zastępowanie informacji 50 2.5.2 Frekwencja 51 2.5.3 Lematyzacja 51 2.5.4 Analiza części mowy 53 2.5.4.1 Przykładowe analizatory morfologiczne 56 2.5.5 Parsing 60 2.5.6 Konkordancja 62 3 WYRAśENIA REGULARNE W BADANIACH KORPUSOWYCH 68 3.1 WyraŜenia regularne 68 3.2 Metaznaki 70 3.3 Zastępowanie wyraŜeń 75 3.3.1 Metaznaki zastępowania 75 3.4 Przykłady wyraŜeń regularnych stosowanych w pracy 78 4 METODY KOMPUTEROWEJ EKSCERPCJI INFORMACJI JĘZYKOWEJ ZE ZBIORÓW TEKSTÓW 80 4.1 Podstawa materiałowa pracy 80 4.1.1 Opracowywanie danych wejściowych 81 4.1.2 Uzyskany korpus w świetle zaprezentowanej typologii korpusów 82 4.2 Porównanie wybranych metod ekscerpcji jednostek nowych 84 4.2.1 Wprowadzenie 85 4.2.2 ZałoŜenia 88 4.2.2.1 Korpus 88 4.2.2.2 Wyszukiwanie fraz 89 4.2.2.3 Zastosowanie analizy morfologicznej 91 4.2.2.4 Wyodrębnianie jednostek występujących w języku z niewielką częstością 91 4.2.2.5 Plik random 93 4 4.2.3 Metoda 93 4.2.3.1 Wyszukiwanie fraz 93 4.2.3.2 Analiza morfologiczna 98 4.2.3.3 Wyodrębnianie jednostek leksykalnych o niskiej frekwencji 105 4.2.3.4 Analiza manualna list słów 108 4.2.4 Wynik badań 109 4.2.5 Analiza wyników 120 4.2.6 MoŜliwości rozszerzenia metody 123 4.2.7 MoŜliwości udoskonalenia metody 125 4.2.8 Dyskusja wyników 126 4.2.9 Wykorzystanie wyników do dalszych badań – badanie potencjału słowotwórczego wybranych morfemów 128 4.2.10 Próba przekładu uzyskanych jednostek nowych 131 4.3 Metoda ekscerpcji kolokacji w oparciu o akronimy 135 4.3.1 Kolokacje, zwroty stałe i jednostki wielowyrazowe 135 4.3.2 Opis metody 143 4.3.2.1 Sformułowanie Ŝądania 143 4.2.2.2 ZałoŜenie 145 4.3.2.3 Dane wykorzystane w opisywanej metodzie 145 4.3.2.4 Procedura zastosowana w badaniach 145 4.3.3 Wyniki 148 4.3.3.1 Jednostki dwuwyrazowe 148 4.3.3.2 Jednostki trójwyrazowe 156 4.3.3.3 Jednostki czterowyrazowe 193 4.3.3.4 Jednostki pięciowyrazowe 207 4.3.3.5 Jednostki sześciowyrazowe 209 4.3.4 MoŜliwości rozbudowy metody i dalszych badań 209 4.3.5 Dyskusja wyników 211 4.4 Metoda ekscerpcji kolokacji rzeczownikowych na podstawie obserwacji parametru końcówki liczby mnogiej 214 4.4.1 Podstawowe załoŜenie 214 4.4.2 Dane 215 4.4.3 Przetwarzanie danych i ekscerpcja kolokacji 215 4.4.4 Wyniki 220 4.4.4.1 Lista kolokacji dwuwyrazowych 221 4.4.4.2 Lista kolokacji trójwyrazowych 246 5 4.4.5 Dyskusja wyników 253 4.4.6 MoŜliwości rozwoju metody i dalszych badań 255 4.4.7 Porównanie wyników uzyskanych za pomocą metody ekscerpcji kolokacji w oparciu o akronimy (metoda A) oraz metody ekscerpcji kolokacji rzeczownikowych na podstawie obserwacji parametru końcówki liczby mnogiej (metoda B) 257 4.5 Podsumowanie 262 5 ZAKOŃCZENIE 266 SUMMARY 268 6 BIBLIOGRAFIA 274 6 Wstęp 1 Wstęp Niniejsza praca dotyczy wybranych metod pozyskiwania, czyli ekscerpcji, informacji o charakterze leksykalnym z elektronicznych zbiorów tekstów. Jej celem jest, po pierwsze, sformułowanie nowych, oryginalnych metod, które mogą być uŜyteczne w pozyskiwaniu materiału do analiz leksykalnych, a następnie zbadanie ich na wybranym zbiorze tekstów. Planowano opracowanie metod niewymagających zaawansowanej znajomości programowania komputerowego, a jednocześnie umoŜliwiających uzyskanie wartościowych wyników, gdzie za wartościowość metody uznaje się daną wydajność ekscerpcyjną. Trzy sformułowane metody dopracowano i zoptymalizowano. W rozdziale 2 „Korpus i językoznawstwo korpusowe” przedstawiono zarys historii badań korpusowych oraz informacje dotyczące korpusów językowych (ich cechy, typologię, przykłady oraz narzędzia przydatne w badaniach nad korpusami). W rozdziale 3 znajdują się informacje ogólne dotyczące wyraŜeń regularnych, ich składni itp., w tym szczegółowy opis wyraŜeń zastosowanych w niniejszej pracy. W rozdziale 4, będącym częścią eksperymentalną pracy, opisano zbiór tekstów wykorzystany w badaniach oraz przedstawiono dokładnie – z podziałem na poszczególne kroki − kolejno trzy metody pozyskiwania informacji leksykalnych: 7 Wstęp 1. Metoda ekscerpcji neologizmów, czyli agnonimów słownikowych, które w tekście pracy określa się jako wyrazy nowe 1. 2. Metoda ekscerpcji kolokacji w oparciu o akronimy (metoda akronimowa). 3. Metoda ekscerpcji kolokacji rzeczownikowych. W przypadku kaŜdej metody dokonano omówienia uzyskanych wyników, w tym odniesiono się do nich krytycznie, a takŜe oceniono moŜliwości rozbudowy kaŜdej metody i ewentualnych dalszych badań. Istotnym elementem pracy jest punkt 5. czwartego rozdziału, w którym podsumowano przebieg prac w przypadku trzech zaproponowanych i zastosowanych metod. W rozdziale 5 odniesiono się do spełnienia celu pracy oraz zawarto wnioski ogólne dotyczące moŜliwości wykorzystania wyodrębnionych metod pozyskiwania danych leksykalnych w badaniach korpusowych. Pracę zamyka streszczenie w języku angielskim oraz bibliografia. Praca wpisuje się w nurt badań prowadzonych w obrębie językoznawstwa stosowanego. Oznacza to, Ŝe celem dociekań naukowych jest stworzenie takiej teorii, której głównym komponentem będzie komponent ekscerpcyjny, prowadzący do uzyskania wstępnie przewidywanego wyniku ekscerpcyjnego (w postaci np. kolokacji występujących w tekstach naukowych). 1 Pojawiły się tu dwa terminy: neologizm i agnonim słownikowy. Neologizm to wyraz nowo powstały, zaś agnonim słownikowy to wyraz nieobecny w danym słowniku. Uściślenie to jest o tyle istotne, Ŝe pojęcie neologizmu jest relewantne lingwochronologizacyjnie, a pojęcie angnonimu słownikowego jest pojęciem lingwochronologizacyjnie neutralnym. W pracy, dla uproszczenia wywodu, stosuje się określenie jednostka nowa, mając w pamięci to, Ŝe faktycznie poszukujemy po prostu agnonimów słownikowych. Dopiero specjalnie dedykowana ku temu teoria lingwochronologizacyjna byłaby w stanie orzec o neologiczności względem danej granicy datacji agnonimów słownikowych. 8 Korpus i językoznawstwo korpusowe 2 Korpus i językoznawstwo korpusowe Według Barbary Lewandowskiej-Tomaszczyk językoznawstwo korpusowe : jest jedną z części językoznawstwa komputerowego 2 i zajmuje się analizą języka zgromadzonego w korpusach językowych, czyli komputerowych zbiorach autentycznych tekstów językowych, mówionych i pisanych (Lewandowska-Tomaszczyk 2005: 11). Zbioru tekstów nie moŜna zatem uznać za korpus 3, jeśli nie moŜna go zapisać w sposób elektroniczny i w ten sam sposób odczytywać. Inaczej mówiąc – w tym ujęciu zbiorów tekstów zgromadzonych przed wprowadzeniem do językoznawstwa komputerów nie naleŜy określać mianem korpusów. Jednym z pierwszych podręczników językoznawstwa korpusowego był Aarts i Meijs (1984), chociaŜ pojęcie to zostało uŜyte juŜ wcześniej, na przykład w Aarts i van den Heuvel (1982). Ponadto w literaturze angielskojęzycznej stosuje się takŜe (por. Taylor 2008, szczegółowa analiza występowania nazw dyscypliny w publikacjach naukowych) pojęcia corpus/corpus-based/corpus-driven/corpus assisted + analysis/approach/study , a takŜe wyodrębnia corpus-driven linguistics (Tognini-Bonelli 2001). Znacznie szersze ujęcie definicji korpusu przedstawił wcześniej Kennedy (1998: 1), według którego „korpus jest zbiorem tekstów pisanych lub 2 Na temat językoznawstwa komputerowego por. takŜe Grishman 1986, Boguraev 1995, Clark et al. 2010. 3 Źródłosłów słowa „korpus” jest łaciński i oznacza ciało (pierwsze znaczenie w internetowym Słowniku języka polskiego Wydawnictwa Naukowego PWN opracowanego na bazie Uniwersalnego słownika języka polskiego pod red. S. Dubisza). Znaczenie językoznawcze umieszczono na ostatniej, dziewiątej pozycji. 9 Korpus i językoznawstwo korpusowe transkrypcji wypowiedzi mówionych; na jego podstawie prowadzi się analizy językoznawcze i dokonuje opisu języka”. I kontynuuje: „wprowadzenie komputerów do badań korpusowych nie zmieniło istoty tych badań, mimo Ŝe wielu badaczy tak sądzi, a w Ŝadnym razie komputery nie wyznaczają początku badań korpusowych, mimo Ŝe znacznie je przyspieszyły i ułatwiły”. NaleŜy ponadto pamiętać, Ŝe mimo ogromnego postępu technologicznego w wielu aspektach
Recommended publications
  • 2004 DOE/BES Analysis Program Contractors' Meeting
    2004 DOE/BES Analysis Program Contractors’ Meeting Annapolis, Maryland February 12 – 14, 2004 Sponsored by The U.S. Department of Energy Office of Basic Energy Sciences Workshop Chair: John Miller 2004 DOE/BES Analysis Program Contractors’ Meeting Program and Abstracts Department of Energy Office of Science Office of Basic Energy Sciences Chemical Sciences, Geosciences and Biosciences Division FOREWORD This abstract booklet provides a record of the 2004 U.S. Department of Energy, Office of Basic Energy Sciences, Analysis Program Contractors’ Meeting. This group of scientists last met as part of the larger Separations and Analysis Program Contractors’ Meeting held in San Diego April 5-7, 2001. The agenda and abstracts of that meeting may be found on the web at http://www.sc.doe.gov/bes/chm/Publications/publications.html. There is wide agreement that a gathering of researchers with common interests and sponsorship provides a fruitful environment for exchange of research results, research techniques, and research opportunities. The primary means of communicating research achievements and perspectives at this meeting is oral presentations, formal discussion periods and informal breaks and meals. The agenda has been organized so that papers in related disciplines – such as mass spectrometry or optical spectroscopy – are loosely clustered together. I am pleased to have the privilege of organizing this meeting and of serving as the program manager of this world-class research program. In carrying out these tasks, I learn from the achievements, and share the excitement, of the research of the many sponsored scientists and students whose names appear on the papers in the following pages.
    [Show full text]
  • Synthetic Applications of Dienes and Polyenes, Excluding Cycloadditions
    The Chemistry of Dienes and Polyenes. Volume 2 Edited by Zvi Rappoport Copyright 2000 John Wiley & Sons, Ltd. ISBN: 0-471-72054-2 CHAPTER 9 Synthetic applications of dienes and polyenes, excluding cycloadditions NANETTE WACHTER-JURCSAK Department of Chemistry, Biochemistry and Natural Science, Hofstra University, Hempstead, New York 11549-1090, USA Fax: (516) 463-6394; e-mail: [email protected] and KIMBERLY A. CONLON Department of Pharmacological Sciences, School of Medicine, State University of New York at Stony Brook, Stony Brook, New York 11794-8651, USA Fax: (516) 444-3218; e-mail: [email protected] I. INTRODUCTION ..................................... 693 II. ADDITION REACTIONS ............................... 694 III. OXIDATION REACTIONS ............................... 700 IV. COUPLING REACTIONS ............................... 710 A. Wittig Reactions of Dienes and Polyenes .................... 711 B. Coupling Promoted by Organometallic Reagents ............... 712 V. DIMERIZATION REACTIONS ............................ 718 VI. PREPARATION OF METAL–POLYENE COMPLEXES ........... 720 VII. REARRANGEMENTS .................................. 722 A. Cope Rearrangement ................................. 722 B. Claisen Rearrangement ............................... 728 VIII. REFERENCES ....................................... 736 I. INTRODUCTION The reactivity of polyenes is influenced by their substituents, and whether or not the multiple double bonds of the unsaturated hydrocarbon are conjugated or isolated from 693 694 Nanette Wachter-Jurcsak and Kimberly A. Conlon one another. The -system of a polyene may be fully conjugated, or there may be one or more pairs of conjugated double bonds isolated from the other -bonds in the molecule, or, alternatively, each of the carbon–carbon double bonds in the polyene may be isolated from one another. Conjugated -systems react differently with electrophiles than isolated double bonds. Addition of hydrogen to isolated double bonds has been previously discussed in this series and will not be addressed here1.
    [Show full text]
  • Altriciality and the Evolution of Toe Orientation in Birds
    Evol Biol DOI 10.1007/s11692-015-9334-7 SYNTHESIS PAPER Altriciality and the Evolution of Toe Orientation in Birds 1 1 1 Joa˜o Francisco Botelho • Daniel Smith-Paredes • Alexander O. Vargas Received: 3 November 2014 / Accepted: 18 June 2015 Ó Springer Science+Business Media New York 2015 Abstract Specialized morphologies of bird feet have trees, to swim under and above the water surface, to hunt and evolved several times independently as different groups have fish, and to walk in the mud and over aquatic vegetation, become zygodactyl, semi-zygodactyl, heterodactyl, pam- among other abilities. Toe orientations in the foot can be prodactyl or syndactyl. Birds have also convergently described in six main types: Anisodactyl feet have digit II evolved similar modes of development, in a spectrum that (dII), digit III (dIII) and digit IV (dIV) pointing forward and goes from precocial to altricial. Using the new context pro- digit I (dI) pointing backward. From the basal anisodactyl vided by recent molecular phylogenies, we compared the condition four feet types have arisen by modifications in the evolution of foot morphology and modes of development orientation of digits. Zygodactyl feet have dI and dIV ori- among extant avian families. Variations in the arrangement ented backward and dII and dIII oriented forward, a condi- of toes with respect to the anisodactyl ancestral condition tion similar to heterodactyl feet, which have dI and dII have occurred only in altricial groups. Those groups repre- oriented backward and dIII and dIV oriented forward. Semi- sent four independent events of super-altriciality and many zygodactyl birds can assume a facultative zygodactyl or independent transformations of toe arrangements (at least almost zygodactyl orientation.
    [Show full text]
  • Big Historical Foundations for Deep Future Speculations: Cosmic Evolution, Atechnogenesis, and Technocultural Civilization
    Found Sci DOI 10.1007/s10699-015-9434-y Big Historical Foundations for Deep Future Speculations: Cosmic Evolution, Atechnogenesis, and Technocultural Civilization Cadell Last1 Ó Springer Science+Business Media Dordrecht 2015 Abstract Big historians are attempting to construct a general holistic narrative of human origins enabling an approach to studying the emergence of complexity, the relation between evolutionary processes, and the modern context of human experience and actions. In this paper I attempt to explore the past and future of cosmic evolution within a big historical foundation characterized by physical, biological, and cultural eras of change. From this analysis I offer a model of the human future that includes an addition and/or reinterpretation of technological singularity theory with a new theory of biocultural evo- lution focused on the potential birth of technological life: the theory of atechnogenesis. Furthermore, I explore the potential deep futures of technological life and extrapolate towards two hypothetical versions of an ‘Omega Civilization’: expansion and compression. Keywords Big history Á Anthropology Á Futures Á Evolution Á Singularity Á Philosophy 1 Introduction My focus is to explore the ‘deep future’ of ‘big history’ in-as-far as it can be explored given a lack of empirical data, inability to test future predictions, and an incomplete knowledge of local and global physical, biological, and cultural processes currently in operation. We can gain a new understanding of possible future trends and processes by analyzing the emerging science of cosmic evolution within the narrative architecture of big history. Although modern phenomena like technological complexification and sociopo- litical convergence receive considerable attention, few researchers approach these issues from the vantage point of 13.8 billion years of interconnected evolution.
    [Show full text]
  • Predictors of Juvenile Survival in Birds
    Ornithological Monographs Volume (2013), No. 78, 1–55 © The American Ornithologists’ Union, 2013. Printed in USA. PREDICTORS OF JUVENILE SURVIVAL IN BIRDS TERRI J. MANESS1,2,3 AND DAVID J. ANDERSON2 1School of Biological Sciences, Louisiana Tech University, Ruston, Louisiana 71272, USA; and 2Department of Biology, Wake Forest University, Winston-Salem, North Carolina 27106, USA ABSTRACT.—The survival probability of birds during the juvenile period, between the end of parental care and adulthood, is highly variable and has a major effect on population dynamics and parental fitness. As such, a large number of studies have attempted to evaluate potential predictors of juvenile survival in birds, especially predictors related to parental care. Lack’s hypothesis linking body reserves accumulated from parental care to the survival of naive juveniles has organized much of this research, but various other predictors have also been investigated and received some support. We reviewed the literature in this area and identified a variety of methodological problems that obscure interpretation of the body of results. Most studies adopted statistical techniques that missed the opportunities to (1) evaluate the relative importance of several predictors, (2) control the confounding effect of correlation among predictor variables, and (3) exploit the information content of collinearity by evaluating indirect (via correlation) as well as direct effects of potential predictors on juvenile survival. Ultimately, we concluded that too few reliable studies exist to allow robust evaluations of any hypothesis regarding juvenile survival in birds. We used path analysis to test potential predictors of juvenile survival of 2,631 offspring from seven annual cohorts of a seabird, the Nazca Booby (Sula granti).
    [Show full text]
  • Nanosystems, Edge Computing, and the Next Generation Computing Systems
    sensors Review Nanosystems, Edge Computing, and the Next Generation Computing Systems Ali Passian * and Neena Imam Computing & Computational Sciences Directorate, Oak Ridge National Laboratory, Oak Ridge, TN 37830, USA; [email protected] * Correspondence: [email protected] Received: 30 July 2019; Accepted: 16 September 2019; Published: 19 September 2019 Abstract: It is widely recognized that nanoscience and nanotechnology and their subfields, such as nanophotonics, nanoelectronics, and nanomechanics, have had a tremendous impact on recent advances in sensing, imaging, and communication, with notable developments, including novel transistors and processor architectures. For example, in addition to being supremely fast, optical and photonic components and devices are capable of operating across multiple orders of magnitude length, power, and spectral scales, encompassing the range from macroscopic device sizes and kW energies to atomic domains and single-photon energies. The extreme versatility of the associated electromagnetic phenomena and applications, both classical and quantum, are therefore highly appealing to the rapidly evolving computing and communication realms, where innovations in both hardware and software are necessary to meet the growing speed and memory requirements. Development of all-optical components, photonic chips, interconnects, and processors will bring the speed of light, photon coherence properties, field confinement and enhancement, information-carrying capacity, and the broad spectrum of light into the high-performance computing, the internet of things, and industries related to cloud, fog, and recently edge computing. Conversely, owing to their extraordinary properties, 0D, 1D, and 2D materials are being explored as a physical basis for the next generation of logic components and processors. Carbon nanotubes, for example, have been recently used to create a new processor beyond proof of principle.
    [Show full text]
  • Curriculum Vitae
    1 CURRICULUM VITAE Robert Bau Born: February 10, 1944, Shanghai, China (naturalized U.S. citizen, 1974) Education: B.Sc., University of Hong Kong, June, 1964 Ph.D., University of California at Los Angeles, March, 1968 ` Postdoctoral Research Fellow, Harvard University, 1968-69 Positions Held Since Ph.D. Degree: 1977-present Professor of Chemistry, University of Southern California 1974-77 Associate Professor of Chemistry, University of Southern California 1969-74 Assistant Professor of Chemistry, University of Southern California Awards and Honors: Fellow of the Alfred P. Sloan Foundation, 1974-76 NIH Research Career Development Awardee, 1975-80 Recipient of USC Associates Award for Excellence in Teaching, 1974 Recipient of USC Associates Award for Excellence in Research, 1979 Fellow of the American Association for the Advancement of Science, 1982 Recipient of the Alexander van Humboldt Foundation, U.S. Senior Scientist Award, 1985 Visiting Professor of Chemistry, University of Grenoble, France, March-June, 1989 President, American Crystallographic Association, 2006 Research Interests: X-ray and Neutron Diffraction Studies of Covalent Metal Hydride Compounds Neutron Diffraction Studies on Molecules Having Chiral Methylene Groups (Molecules of the type CHDRR') Neutron Diffraction Studies of Small Proteins 2 PUBLICATION LIST Professor Robert Bau Department of Chemistry University of Southern California Los Angeles, California 90089-0744 1. "The Crystal Structure of HRe2Mn(CO)14. A Neutral, 'Electron Deficient', Polynuclear Carbonyl Hydride", H.D. Kaesz, R. Bau, and M.R. Churchill, J. Am. Chem. Soc., 89, 2775 (1967). 2. "Spectroscopic Studies of Isotopically Substituted Metal Carbonyls. I. Vibrational Analysis of Metal Pentacarbonyl Halides", H.D. Kaesz, R. Bau, D. Hendrickson and J.M.
    [Show full text]
  • The Nanobank Database Is Available at for Free Use for Research Purposes
    Forthcoming: Annals of Economics and Statistics (Annales d’Economie et Statistique), Issue 115/116, in press 2014 NBER WORKING PAPER SERIES COMMUNITYWIDE DATABASE DESIGNS FOR TRACKING INNOVATION IMPACT: COMETS, STARS AND NANOBANK Lynne G. Zucker Michael R. Darby Jason Fong Working Paper No. 17404 http://www.nber.org/papers/w17404 NATIONAL BUREAU OF ECONOMIC RESEARCH 1050 Massachusetts Avenue Cambridge, MA 02138 September 2011 Revised March 2014 The construction of Nanobank was supported under major grants from the National Science Foundation (SES- 0304727 and SES-0531146) and the University of California’s Industry-University Cooperative Research Program (PP9902, P00-04, P01-02, and P03-01). Additional support was received from the California NanoSystems Institute, Sun Microsystems, Inc., UCLA’s International Institute, and from the UCLA Anderson School’s Center for International Business Education and Research (CIBER) and the Harold Price Center for Entrepreneurial Studies. The COMETS database (also known as the Science and Technology Agents of Revolution or STARS database) is being constructed for public research use under major grants from the Ewing Marion Kauffman Foundation (2008- 0028 and 2008-0031) and the Science of Science and Innovation Policy (SciSIP) Program at the National Science Foundation (grants SES-0830983 and SES-1158907) with support from other agencies. Our colleague Jonathan Furner of the UCLA Department of Information Studies played a leading role in developing the methodology for selecting records for Nanobank. We are indebted to our scientific and policy advisors Roy Doumani, James R. Heath, Evelyn Hu, Carlo Montemagno, Roger Noll, and Fraser Stoddart, and to our research team, especially Amarita Natt, Hsing-Hau Chen, Robert Liu, Hongyan Ma, Emre Uyar, and Stephanie Hwang Der.
    [Show full text]
  • Ultrafastlight-2020 Book of Abstracts
    Book of Abstracts IV International Conference on Ultrafast Optical Science UltrafastLight-2020 September 28 – October 2, 2020 Lebedev Physical Institute, Moscow IV International Conference on Ultrafast Optical Science (UltrafastLight-2020), is the broad-scope, annual international symposium dedicated to the most im- portant aspects of ultrafast phenomena in different fields of natural sciences and engineering. The Conference topics: 1. Extreme light 2. Ultrafast phenomena in condensed matter and ionized gases 3. Ultrafast laser nanofabrication and nanophotonics 4. Femtosecond non-linear optics. Filamentation. High field THz generation. 5. Femtosecond radiation in spectroscopy and optical frequency metrology. 6. Physics and technology of ultrafast lasers and ultrashort laser pulses. Website: www.ultrafastlight.ru E-mail: [email protected] [email protected] Chair - Nikolay Kolachevsky (Lebedev Physical Institute), Vice-chair - Andrey Ionin (Lebedev Physical Institute), Vice-chair - Sergey Kudryashov (ITMO University / LPI) 1 2 Contents 3 4 Section 1: Extreme light Section Chair: Andrei Savel’ev , e-mail: [email protected] (Lomonosov Moscow State University, Russia) Program committee: Valery Bychenkov (LPI RAS, Moscow, Russia) Igor Kostuykov (IAP RAS, Nizhny Novgorod, Russi) Scope Laser plasma sources of ionizing radiation Nuclear photonics Extreme fields physics Ultra high intensity facilities 5 Oral Investigation of pre-pulse influence on high-Z plasma formation in experiments with high intense up to 1022 W/cm2 femtosecond laser pulses by means of X-ray spectroscopy M. A. Alkhimova1, A. Ya. Faenov1,2, T. A. Pikuz1,2, I. Yu. Skobelev1,3, 4 4 4 S. A. Pikuz1,3, A. S. Pirozhkov , M. Nishiuchi , N. P. Dover , H. Sakaki4, A. Sagisaka4, Ko.
    [Show full text]
  • The Platypus Is Not a Rodent: DNA Hybridization, Amniote Phylogeny and the Palimpsest Theory
    The platypus is not a rodent: DNA hybridization, amniote phylogeny and the palimpsest theory John A. W. Kirsch1* and Gregory C. Mayer1,2 1The University of Wisconsin Zoological Museum, 250 North Mills Street, Madison,WI 53706, USA 2Department of Biological Sciences, University of Wisconsin-Parkside, Kenosha,WI 53141, USA We present DNA-hybridization data on 21 amniotes and two anurans showing that discrimination is obtained among most of these at the class and lower levels. Trees generated from these data largely agree with conventional views, for example in not associating birds and mammals. However, the sister relation- ships found here of the monotremes to marsupials, and of turtles to the alligator, are surprising results which are nonetheless consistent with the results of some other studies. The Marsupionta hypothesis of Gregory is reviewed, as are opinions about the placement of chelonians. Anatomical and reproductive data considered by Gregory do not unequivocally preclude a marsupial^monotreme special relationship, and there is other recent evidence for placing turtles within the Diapsida. We conclude that the evidential meaning of the molecular data is as shown in the trees, but that the topologies may be in£uenced by a base- compositional bias producing a seemingly slow evolutionary rate in monotremes, or by algorithmic artefacts (in the case of turtles as well). Keywords: Chelonia; Crocodilia; Eutheria; Marsupialia; Marsupionta; molecular evolution `Unyielding factualists have so set the style in taxonomy relationships continue to be debated, `everyone knows' and morphology that, if their assertions were accepted, that the latter result cannot be correct. hardly any known type of animal could possibly have The orthodox view of the phylogeny of mammals been derived even from any known past group.' regards monotremes (the living `Prototheria') as the Gregory (1947, p.
    [Show full text]
  • Enhanced Oil Recovery for Emergent Energy Demand: Challenges and Prospects for a Nanotechnology Paradigm Shift
    International Nano Letters https://doi.org/10.1007/s40089-018-0248-0 REVIEW Enhanced oil recovery for emergent energy demand: challenges and prospects for a nanotechnology paradigm shift Richard O. Afolabi1 Received: 3 May 2018 / Accepted: 6 September 2018 © The Author(s) 2018 Abstract Renewable and non-renewable energy sources remain the two fronts for meeting global emergent energy demand. Renew- able energy sources such as crude oil, in meeting energy needs, is a function of new hydrocarbon discoveries and improv- ing the recovery of existing oil felds. However, new crude oil discoveries are made at a decreasing rate; likewise, existing felds are at a declining phase with conventional recovery techniques not being able to produce as much as two-thirds of the oil in place. In complementing existing oil recovery techniques, research into the use of nanotechnology has emerged as a potential alternative for tertiary oil recovery scheme. Despite the promising results, there has not been any reported large- scale feld application of nanotechnology in the oil and gas industry except for some small-scale feld trials. In this paper, a detailed review of developments on nano-enhanced oil recovery (Nano-EOR) and its attendant challenges are presented. Furthermore, key recommendations were given for future research on Nano-EOR. While the adoption of new technologies has its associated risks, the future prospects of Nano-EOR remains very high. Keywords Nanotechnology · Enhanced oil recovery · Energy demand · Paradigm shift Introduction production, reserves growth, and feld reactivation or aban- donment [1, 2, 15, 16]. Recent research trend has shifted in Demand for energy has increased over the years with global various disciplines from the “Macro-domain” to the “Micro- industrialization and population growth [47].
    [Show full text]
  • Stability and Possible Production of the Super-Strong AB-Matter
    1 Stability and Possible Production of the Super-Strong AB-matter Alexander Bolonkin City University of New York, 1310 Avenue R, #6-F, Brooklyn,11229, USA [email protected] Abstract - In works [1-3] author offered and considered possible super strong nuclear matter. In given work he continues to study the problem of a stability and production this matter. He shows the special artificial forms of nuclear AB-matter which make its stability and give the fantastic properties. For example, by the offered AB-needle you can pierce any body without any damage, support motionless satellite, reach the other planet, and research Earth‘s interior. These forms of nuclear matter are not in nature now, and nanotubes are also not in nature. The AB-matter is also not natural now, but researching and investigating their possibility, properties, stability and production are necessary for creating them. Keywords- Femtotechnology; FemtoTech; AB-matter; AB-needle; Stability AB-matter; Production of AB-matter; 1. INTRODUCTION A. Brief History Physicist Richard Feynman offered his idea to design artificial matter from atoms and molecules at an American Physical Society meeting at Caltech on December 29, 1959. If he was not well-known physicist, the audience laughed at him and drove away from the podium. All scientists accepted his proposal as joke. Typical question are: How can you see the molecule? How can you catch the molecule? How can you connect one molecule to other? How many hundreds of years you will create one milligram of matter? And hundreds of same questions having no answers may be asked.
    [Show full text]