Symposium I Anvendt Statistik 2020
Total Page:16
File Type:pdf, Size:1020Kb
Symposium i anvendt statistik 2020 Medarrangører: Institut for Økonomi, Aarhus BSS, Aarhus Universitet Det Nationale Forskningscenter for Arbejdsmiljø SYMPOSIUM I ANVENDT STATISTIK 27.-28. januar 2020 Redigeret af Peter Linde på vegne af organisationskomiteen for Symposium i Anvendt Statistik Støttet af SAS Institute Inc. Institut for Økonomi, Aarhus BSS, Aarhus Universitet og Det Nationale Forskningscenter for Arbejdsmiljø Forord Det er symposiets formål at fremme information om såvel anvendt statistik som statistisk databehandling. Symposiet er tværfagligt med særlig vægt på metodik, formidling og fortolkning af statistiske analyser. I år er Institut for Økonomi, Aarhus BSS, Aarhus Universitet vært for symposiet, hvilket vi gerne vil takke for. Symposiet arrangeres af Symposium i Anvendt Statistik og Det Nationale Forskningscenter for Arbejdsmiljø og Økonomisk Institut, Københavns Universi- tet er medarrangør. Den faglige forening Symposium i Anvendt Statistik er an- svarlig for det faglige program og økonomien. Denne publikation indeholder foredragene fra det 42. Symposium i Anvendt Sta- tistik. Dette års indlæg kommer fra mange forskellige fagområder og lægger vægt på forskellig metoder og problemstillinger. Som det er normalt ved viden- skabelige indlæg, er bidragsyderne ansvarlige for indholdet af indlæggene, og spørgsmål herom kan rettes direkte til forfatterne. Med symposiet tilstræbes det at skabe et forum for tværfaglig inspiration og kri- tik blandt andet for at udbygge kommunikationen mellem personer, der arbejder med beslægtede metoder inden for forskellige fagområder. Peter Linde, Organisationskomiteen ISBN 978-87-989370-0-5 Trykt hos PRinfoTrekroner i 150 eksemplarer Organisationskomiteen for Symposium i Anvendt Statistik 2020 Lisbeth la Cour Peter Linde Økonomisk Institut Det Nationale Forskningscenter Copenhagen Business School for Arbejdsmiljø Porcelænshaven 16A Lersø Parkallé 105 2000 Frederiksberg 2100 København Ø [email protected] [email protected] Anders Milhøj Esben Høg Økonomisk Institut Institut for Matematiske Fag Københavns Universitet Aalborg Universitet Øster Farimagsgade 5, bygning 26 Skjernvej 4A 1353 København K 9220 Aalborg Ø [email protected] [email protected] Gorm Gabrielsen Birthe Lykke Thomsen Institut for Finansiering, CBS Ferring Solbjerg Plads 3 Kay Fiskers Plads 11 2000 Frederiksberg 2300 København S [email protected] [email protected] Helle M. Sommer Niels Kærgaard SEGES Fødevare- og Ressourceøkonomi Landbrug & Fødevarer Københavns Universitet Axeltorv Rolighedsvej 25 1609 København V 1958 Frederiksberg [email protected] [email protected] Mogens Dilling-Hansen Klaus Rostgaard Institut for Økonomi Statens Serum Institut Århus Universitet Artillerivej 5 8000 Århus C 2100 København Ø [email protected] [email protected] Jørgen Lauridsen Kristina Birch Økonomisk Institut SAS Institute Syddansk Universitet Købmagergade 7-9 Campusvej 55 1050 København K 5230 Odense M [email protected] [email protected] Sören Möller Faculty of Health Sciences Syddansk Universitet J. B. Winsløws Vej 19 5000 Odense C [email protected] Indholdsfortegnelse Tidsserier og statistisk efficiens Mikkeller and Weather Data Lisbeth la Cour, Dep. of Economics, CBS, Anders Milhøj, Dep. of Economics, University of Copenhagen, and Ravi Vatrapu, Dep. of Digitalization, CBS .................. 1 Survival after cancer for twins aged 70+ Martin D. Villumsen, Dep. of Epidemiology and Biostatistics, SDU, Kaare Christensen, Dep. of Epidemiology and Biostatistics and The Danish Twin Registry, SDU, and Marianne Ewertz, Oncology Unit, Dep. of Clinical Research, Odense University Hospital ....................................................................................................... 17 Behaviour changes associated with diarrhoea and respiratory diseases in Danish pre- weaned dairy calves Medianens varians og efficiens – et simulationsstudie Centre, Aarhus University, & Margit Bak Jensen, Bioinformatics Research Centre, Steen Andersen, Institut for Økonomi, BSS, Aarhus Universitet .................................. 27 Samfundsforhold Is it possible to reduce smoking by increasing taxes? Anders Milhøj, Dep. of Economics, University of Copenhagen ................................... 38 Recent Developments in Danish Inequality Mette Franck, Department of Economics, CBS ............................................................ 52 Statistik på økonomiuddannelserne: Forandring fryder - eller? Nils Karl Sørensen, Institut for Virksomhedsledelse og Økonomi ............................... 66 Paneldesign og SAS Repræsentativitet i paneler med løbende udskiftning. En løsning, der virker universelt, når populationen ikke er statisk Peter Linde, Det Nationale Forskningscenter for Arbejdsmiljø ................................... 82 A vine copula panel model for day-ahead electricity prices Janus Sejersbøll Valberg-Madsen, Institut for Matematiske Fag, Aalborg Universitet. A joint work with Esben Høg, Troels S. Christensen and Anca Picalabu .................... 88 Nyheder i SAS Analytics Anders Milhøj, Dep. of Economics, University of Copenhagen ................................... 95 Sundhed og statistiske metoder Primary Care health technology and hospitalizations: the effects of Point-of-care testing of HbA1c on ambulatory care and hospitalizations among type 2 diabetes patients in General practice Troels Kristensen, Kim Rose-Olsen and Christian Volmar Skovsgaard, Danish Centre for Health Economics (DaCHE), Dep. of Public Health, SDU ...................... 106 Når lungebetændelse rammer i marts: Monitorering af antibiotikaforbrug Jens Thusgård Hørlück, DEFACTUM ....................................................................... 121 Ranking systems - a discussion Gorm Gabrielsen, CBS, and G.G. Consulting Aps ..................................................... 125 Statistiske metoder Likelihoodprincippet og den klassiske p-værdi Tom Engsted, Institut for Økonomi, Aarhus Universitet ........................................... 137 Inferens i mixed models i R - hinsides det sædvanlige likelihood ratio test Søren Højsgaard, Institut for Matematiske Fag, Aalborg Universitet ...................... 155 Outlier Detection in Categorical Data Mads Lindskou, Institut for Matematiske Fag, Aalborg Universitet .......................... 165 Den Socialøkonomiske Investeringsmodel - SØM Tine Hjernø Lesner og Kenneth Lykke Sørensen, Socialstyrelsen ............................. 172 Anvendt statistik og metode Sexual crime against children with disabilities: a nationwide prospective birth cohort-study Mogens Nygaard, VIVE ............................................................................................ 175 Gails bias: Kuriosum eller relevant fejlkilde? Sören Möller, OPEN – Open Patient data Explorative Network Odense Universitetshospital og Klinisk Institut, Syddansk Universitet ................................. 186 The Pizza Margherita Index Sara Armandi, SAS Institute ....................................................................................... 189 Økonomi og samfund Innovation og kreativitets effekt på økonomisk performance. Analyse af robusthed af resultater eller om at sælge elastik i metermål? Mogens Dilling-Hansen, Dep. of Economics and Business Economics, Aarhus University .................................................................................................................... 205 Hvem er uddannelseshjælpsmodtagerne? Lisbeth Palmhøj Nielsen, Chris Cornelia Friis Christiansen og Anna Hansen, Viden og Analyse, STAR ........................................................................................................ 215 Application of a spatial Difference-in-Difference approach on a Danish tax exemption reform Jørgen Lauridsen and Morten Skak, Dep. of Business and Economics, SDU ........... 232 Mikkeller and Weather Data Lisbeth la Cour, Dep. ofEconomics, CBS Anders Milhøj, Dep. ofEconomics, KU Ravi Vatrapu, Dep. ofDigitalization, CBS 1. Introduction. The present study is a continuation ofthe analyses presented in Buus Lassen et. al. (2017a), la Cour et al (2018) and la Cour et al (2019) in that it still focuses on how to model and predict series of interest to the management of a private firm using social media data. Our case company is as before: Mikkeller (a microbrewery). As in la Cour et al (2018) and la Cour et al (2019), we focus main ly on investigating the predictive power ofFacebook data (FB) with respect to sales. However in the present case we will also add weather data to try and increase the accuracy of our models and predictions. As mentioned in the paper above: "The main advantage ofusing social media data as predictors lies in the speed with which such data can be extracted and employed in the forecasting process. Once a firm has leamed how to collect and pre process their social media data, the information is available almost in real time and this implies that such data in combination with a good predictive model will provide a very useful tool for the management ofthe firm." In the present study we have decided to change the frequency ofthe data from daily to weekly. Such an operation will remove some ofthe noise in the data and still leave us with enough observations to run our time series models. W e will still try various transformations ofthe social media variables and also add dummies for specific types ofweather events. The sales data comes from Mikkeller's bar in Viktoriagade (Vik) and FB data comes both from the pages ofthis bar but also from the Mikkeller Headquarters (HQ). 2. Briefly