Lexical Innovation on the Internet - Neologisms in Blogs
Total Page:16
File Type:pdf, Size:1020Kb
Zurich Open Repository and Archive University of Zurich Main Library Strickhofstrasse 39 CH-8057 Zurich www.zora.uzh.ch Year: 2009 Lexical innovation on the internet - neologisms in blogs Smyk-Bhattacharjee, Dorota Abstract: Studien im Bereich des Sprachwandels beschreiben traditionellerweise diachronische Verän- derungen in den Kernsubsystemen der Sprache und versuchen, diese zu erklären. Obwohl ein Grossteil der Sprachwissenschaftler sich darüber einig ist, dass die aktuellen Entwicklungen in einer Sprache am klarsten im Wortschatz reflektiert werden, lassen die lexikographischen und morphologischen Zugänge zur Beobachtung des lexikalischen Wandels wichtige Fragen offen. So beschäftigen sich letztere typischer- weise mit Veränderungen, die schon stattgefunden haben, statt sich dem sich zum aktuellen Zeitpunkt vollziehenden Wandel zu widmen. Die vorliegende Dissertation bietet eine innovative Lösung zur Un- tersuchung des sich vollziehenden lexikalischen Wandels sowohl in Bezug auf die Datenquelle als auch bzgl. der verwendeten Methodologie. In den vergangenen 20 Jahren hat das Internet unsere Art zu leben, zu arbeiten und zu kommunizieren drastisch beeinflusst. Das Internet bietet aber auch eine Masse an frei zugänglichen Sprachdaten und damit neue Möglichkeiten für die Sprachforschung. Die in dieser Arbeit verwendeten Daten stammen aus einem Korpus englischsprachiger Blogs, eine Art Computer gestützte Kommunikation (computer-mediated communication, CMC). Blogs bieten eine neue, beispiel- lose Möglichkeit, Wörtern nachzuspüren zum Zeitpunkt, in der sie Eingang in die Sprache finden. Um die Untersuchung des Korpus zu vereinfachen, wurde eine Software mit dem Namen Indiana entwickelt. Dieses Instrument verbindet den Korpus basierten Zugang mit einer lexikographischen Analyse. Indiana verwendet eine Kombination von HTML-to-text converter, eine kumulative Datenbank und verschiede Filter, um potentielle Neologismen im Korpus identifizieren zu können. Die vorliegende Dissertation bi- etet neben dem innovativen methodologischen Beitrag einen unfassende Beschreibung und Analyse von Blogs als Quelle für die linguistische Forschung. Zum einen werden morphologische Muster analysiert, die bis dato marginalisiert wurden und bei den traditionellen Klassifizierungsmustern untergingen, und zum anderen werden detaillierte Fallstudien präsentiert, die das Aufkommen, die Verbreitung und die Institu- tionalisierung von spezifischen neuen lexikalischen Einheiten dokumentieren. Die Resultate bestätigen, dass das Internet die Sprachregelungsmechanismen beeinflusst und Innovationen im Internet ein Hinweis auf den Sprachwandel im Allgemeinen sind. Discussions about language change traditionally describe and attempt to explain diachronic alterations to the core subsystems of language. Though most scholars agree that vocabulary reflects ongoing changes in a language most clearly, the lexicographic and morphological approaches to observing lexical change have left serious gaps. They typically study the change that has already occurred, rather than change in progress. This thesis offers an innovative solution to studying lexical change in progress, both in terms of the data source and methodology. In the past two decades, the Internet has dramatically influenced the way we live, work, socialize, and communicate. It hasalso offered new opportunities for language research, providing abundant, freely available, linguistic data.The data used in this work comes from English language blogs, a genre of computer-mediated communication (CMC) native to the Web. Blogs offer unprecedented opportunities for tracing words as they come into the language. For the purpose of this research, a corpus of blogs has been compiled. To facilitate this research a software tool, named Indiana, has been developed. It fuses the corpus-based approach with lexicographic analysis. Indiana combines a HTML-to-text converter, a cumulative database, and a series of filters, to identify potential neologisms in my corpus. Apart from the methodological contribution, this thesis offers a comprehensive description and analysis of blogs as sources for linguistic inquiry. It analyses the previously marginalized morphological patters that often escape traditional classification patterns. It also presents detailed case studies of institutionalization, spread and emergence of specific new lexical items. The findings confirm that the Internet does affect language regulation mechanisms and innovation on the Internet is an indication of language change in general. Posted at the Zurich Open Repository and Archive, University of Zurich ZORA URL: https://doi.org/10.5167/uzh-163845 Dissertation Published Version Originally published at: Smyk-Bhattacharjee, Dorota. Lexical innovation on the internet - neologisms in blogs. 2009, University of Zurich, Faculty of Arts. 2 Lexical Innovation on the Internet - Neologisms in Blogs Thesis presented to the Faculty of Arts of the University of Zurich for the degree of Doctor of Philosophy by Dorota SmykBhattacharjee of Poland Accepted in the spring semester 2008 on the recommendation of Professor Dr. Andreas H. Jucker and Professor Dr. Udo Fries Zürich, 2009 for my parents Table of contents TABLE OF FIGURES TABLE OF TABLES ACKNOWLEDGEMENTS CHAPTER 1 Introduction ........................................................................................................................ 1 1.1 Language change research ...................................................................................... 2 1.2 The objective of this research.................................................................................. 5 1.3 Data source and methodology ................................................................................. 6 1.4 Structure of the thesis.............................................................................................. 7 CHAPTER 2 Expanding the lexicon - Basic concepts ............................................................................ 9 2.1 Introduction ............................................................................................................. 9 2.2 Lexical growth....................................................................................................... 10 2.3 Word coinage – root creation ................................................................................ 10 2.4 Borrowing.............................................................................................................. 12 2.5 Semantic change.................................................................................................... 15 2.6 Word-building ....................................................................................................... 17 2.6.1 Derivation....................................................................................................... 18 2.6.2 Compounds .................................................................................................... 21 2.6.3 Blends............................................................................................................. 23 2.6.4 Clipping.......................................................................................................... 25 2.6.5 Back-formation .............................................................................................. 26 2.6.6 Abbreviations: Acronyms & Alphabetisms ................................................... 28 2.6.7 Conversion ..................................................................................................... 31 2.6.8 Eponyms and Toponyms................................................................................ 32 2.7 Summary ............................................................................................................... 33 CHAPTER 3 The study of lexical innovation........................................................................................ 35 3.1 Introduction ........................................................................................................... 35 3.2 Neologisms: types and definition.......................................................................... 36 3.2.1 Types of neologisms ...................................................................................... 36 3.2.2 Definition of neologism ................................................................................. 37 3.3 General problems with observation....................................................................... 40 3.3.1 Example: bouncebackability .......................................................................... 41 3.3.2 Example: weblog............................................................................................ 43 3.4 Attitudes towards neologisms ............................................................................... 47 3.5 Lexicographic interest in new words .................................................................... 50 3.5.1 Print collections of neologisms ...................................................................... 50 3.5.2 Internet word hunting..................................................................................... 52 3.6 Morphological interest in new words.................................................................... 53 3.6.1 Morphological background ............................................................................ 54 3.6.2 Morphological productivity ..........................................................................