<<

Små tal sett frå statistikaren sitt perspektiv

Karl Ove Hufthammer Korfor samlar me data? To grunnar til å samla data

Seia noko om fortida (sånn var det)

Seia noko om framtida (sånn vert det) Om fortida

Bokholderi Om framtida

Kan ta styring! Illustrasjonsfoto: Colourbox Eksempelstudie

Medisin A: 1-års overleving på 20 %

Medisin B: 1-års overleving på 80 % Små tal – eksempel Augeskadar ved fyrverkeri

https://www.vg.no/nyheter/innenriks/i/02xz2/tolv- personer-fikk-oeyeskader-nyttaarsaften-fire-alvorlige Eit lite tal

Nyttårsaftanen 2017–2018: 9 augeskadar

Seier dette noko om korleis det vil gå til neste år? Historiske data

«Dette er andre år på rad med en nedgang i antallet øyeskader.»

https://www.dagbladet.no/nyheter/tallene-som-bekymrer- antifyrverkerilegen---de-passes-ikke-pa/69227235 Augeskadar over tid

Talet på augeskadar over tid

30 28.1

20

16.1

10

4.0

0

2005/ 2006/ 2007/ 2008/ 2009/ 2010/ 2011/ 2012/ 2013/ 2014/ 2015/ 2016/ 2017/ 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 Beste estimat på nivået

Totalt 209 augeskader på 13 år.

Nivåestimat: 209/13 ≈ 16 Uvisse i estimata

To moglege tilfelle for same estimat (16).

1 år med data, observerer 16 augeskadar: 95 %-konfidensintervall: (9–25)

13 år med data, observerer 16 augeskadar/år: 95 %-konfidensintervall: (14–18) Estimat på augeskadar neste år

Talet på augeskadar over tid

30 28.1

20

16.1

10

4.0

0

2005/ 2006/ 2007/ 2008/ 2009/ 2010/ 2011/ 2012/ 2013/ 2014/ 2015/ 2016/ 2017/ 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 Det var to år med nedgang Fasiten og jeg trodde vi var inne på en god trend, men nå er vi tilbake på nivået vi lå på i mange år. Personskadar fyrverkeri Forbud mot rakettar Talet på personskadar over tid med styrepinne

160 161.3

127.4 120

93.5

80

40

98/99 99/00 00/01 01/02 02/03 03/04 04/05 05/06 06/07 07/08 08/09 09/10 10/11 11/12 12/13 13/14 14/15

http://stat.dsb.no//Dialog/varval.asp?ma=050102&ti=Antall+skader+ved+bruk+av+fyrverkeri+i%2Ef%2Em%2E+nytt%E5rs feiring%2E+Ulykkeskategori%2E+1998%2F1999+%2D++2014%2F2015&path=../Database/DSB/5_Fyrverkeri/&lang=5 Å måla det som ikkje finst Nivåforskjell?

P < 0,001

30 % 23 %

20 % 17 %

10 %

0 %

2017 2018 Nivåforskjell?

30 %

20 %

10 %

0 %

jan. mar. mai. jul. sep. nov. jan. mar. mai. jul. sep. nov. 2017 2017 2017 2017 2017 2017 2018 2018 2018 2018 2018 2018 Samhandlingsbarometeret Mandeloperasjonar Mandeloperasjonar Mandeloperasjonar

Askvoll Eid 11.5 20 12 12 14 11.0 20 10.5 15 9 10 12 10.0 10 6 8 10 9.5 10 6 8 9.0 5 3 8.5 4 Flora Førde 15 15 17.5 20 20 17.5 15.0 15 15.0 10 15 10 12.5 10 10.0 12.5 5 10 5 5 7.5 10.0 5 5.0 Høyanger Jølster Luster Lærdal 12.5 17.5 20 20 10.0 15 10.0 15.0 15 15 12.5 9.5 7.5 10 10 10.0 9.0 10 5.0 5 5 7.5 5 2.5 15 10.0 35 10 16 15 12 7.5 30 12 10 8 9 5.0 25 8 20 5 6 6 2.5 4 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 Vågsøy Årdal 16 20

12 15 10 8 5 4 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 Pussige Balestrand? Pussige alle? Manglande verdiar

Askvoll Aurland Balestrand Bremanger Eid Fjaler 11.5 20 12 12 14 11.0 20 10.5 15 9 10 12 10.0 10 6 8 10 9.5 10 6 8 9.0 5 3 8.5 4 Flora Førde Gaular Gloppen Gulen Hornindal 15 15 17.5 20 20 17.5 15.0 15 15.0 10 15 10 12.5 10 10.0 12.5 5 10 5 5 7.5 10.0 5 5.0 Hyllestad Høyanger Jølster Leikanger Luster Lærdal 12.5 17.5 20 20 10.0 15 10.0 15.0 15 15 12.5 9.5 7.5 10 10 10.0 9.0 10 5.0 5 5 7.5 5 2.5 Naustdal Selje Sogndal Solund Stryn Vik 15 10.0 35 10 16 15 12 7.5 30 12 10 8 9 5.0 25 8 20 5 6 6 2.5 4 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 Vågsøy Årdal 16 20

12 15 10 8 5 4 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 Manglande verdiar eller 0? Fiksa datasett (og lik skala)

Askvoll Aurland Balestrand Bremanger Eid Fjaler

30 20 10 0 Flora Førde Gaular Gloppen Gulen Hornindal

30 20 10 0 Hyllestad Høyanger Jølster Leikanger Luster Lærdal

30 20 10 0 Naustdal Selje Sogndal Solund Stryn Vik

30 20 10 0 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 Vågsøy Årdal

30 20 10 0 2010 2012 2014 2016 2018 2010 2012 2014 2016 2018 Stabil (predikerbar prosess)?

Askvoll Aurland Balestrand Bremanger Eid Fjaler

20

10

0 Flora Førde Gaular Gloppen Gulen Hornindal

20

10

0 Hyllestad Høyanger Jølster Leikanger Luster Lærdal

20

10

Value

0 Naustdal Selje Sogndal Solund Stryn Vik

20

10

0 2014 2015 2016 2017 20182014 2015 2016 2017 20182014 2015 2016 2017 20182014 2015 2016 2017 2018 Vågsøy Årdal

20

10

0 2014 2015 2016 2017 20182014 2015 2016 2017 2018 Samanliknar dei ein kan

Førde 2.7 4.4 6.1 Flora Sogndal Eid P = 0,17 Vågsøy Gloppen Luster Bremanger Jølster Gaular Fjaler Naustdal Askvoll Selje Vik Leikanger Gulen Lærdal Aurland Hornindal Hyllestad Balestrand 0.0 2.5 5.0 7.5 10.0 Rate Stikkord

Statistisk prosesstyring (SPC)

Shewhart-diagram

Traktdiagram Kva ein ikkje bør gjera Naiv rangering (andre data)

Aurland Vågsøy Leikanger Hyllestad Korfor på Jølster Naustdal Høyanger topp/botn: Gaular Selje Førde signal + støy Årdal Balestrand Flora Askvoll Stryn Solund Gloppen Små kommunar: Sogndal Fjaler Luster stor uvisse Bremanger Eid Vik (mykje støy) Gulen Lærdal Hornindal 0 10 20 30 Rate (per 1000) Naiv rangering

Aurland Folketal Vågsøy (0–18 år) Små kommunar Leikanger Hyllestad Jølster dominerer nesten Naustdal 3000 Høyanger Gaular Selje alltid øvre/nedre del Førde Årdal Balestrand av slike rangeringar. Flora 2000 Askvoll Stryn Solund Gloppen Sogndal Og er typisk (veldig) Fjaler Luster 1000 Bremanger over-/underestimering Eid Vik Gulen av sanne verdiar. Lærdal Hornindal 0 10 20 30 Rate (per 1000) Dårleg mål på variasjon

Aurland Folketal Vågsøy (0–18 år) Ser av og til: Høgaste Leikanger Hyllestad Jølster rate delt på lågaste rate. Naustdal 3000 Høyanger Gaular Selje Førde Basert på tala som Årdal Balestrand Flora 2000 1) er aller mest usikre Askvoll Stryn Solund 2) har mest over- Gloppen Sogndal /underestimering Fjaler Luster 1000 Bremanger 3) har dårlege statistiske Eid Vik Gulen eigenskapar i ein slik Lærdal Hornindal formel 0 10 20 30 Rate (per 1000) Dårleg mål på variasjon

Aurland Folketal Vågsøy (0–18 år) Ser av og til: Høgaste Leikanger Hyllestad Jølster rate delt på lågaste rate. Naustdal 3000 Høyanger Gaular Selje Førde Er her Aurland/Hornindal: Årdal Balestrand Flora 2000 33/7 = 4,7 Askvoll Stryn Solund Gloppen Sogndal Fjaler Luster 1000 Bremanger Eid Vik Gulen Lærdal Hornindal 0 10 20 30 Rate (per 1000) Rettare analyse

Førde 0.10 0.16 0.23 Flora Sogndal Stryn Eid Vågsøy Gloppen Luster Årdal Høyanger Bremanger Jølster Gaular Fjaler Naustdal Askvoll Selje Vik Leikanger Gulen Lærdal Aurland Hyllestad Hornindal Balestrand Solund 0 10 20 30 40 Rate (per 1000) Kjapp fiks

Viss ein oppdagar ein tilsynelatande forskjell:

I år I fjor Aurland: 33 (per 1000) Aurland: 12 (per 1000) Hornindal: 7 (per 1000) Hornindal: 27 (per 1000) P = 0,02 P = 0,16 Meir avanserte statistiske metodar «Betre» estimat

Kan bruka data frå fleire kommunar til å estimera variasjonen mellom kommunar.

Kan så bruka såkalla statistiske «krympe- metodar» som tar omsyn til denne variasjonen, for å få estimat med mindre over-/underestimering. «Betre» estimat

Byggjer på føresetnaden om at kommunar liknar (mykje eller lite) på kvarandre.

Ein «lånar» data frå kvarandre. Eller «lånar» styrke/presisjon. «Betre» estimat

Eksempel på slike krympemetodar er mixed effects-modellar og bayesianske modellar.

Fungerer stabiliserande når ein har lite data.

(Fjernar støy, men kan òg glatta over signal.) Rettare analyse

Førde 0.10 0.16 0.23 Flora Sogndal Stryn Eid Vågsøy Gloppen Luster Årdal Høyanger Bremanger Jølster Gaular Fjaler Naustdal Askvoll Selje Vik Leikanger Gulen Lærdal Aurland Hyllestad Hornindal Balestrand Solund 0 10 20 30 40 Rate (per 1000) Oppsummert Oppsummert

Bruk data til å seia noko om framtida (og gjer noko dersom ho ikkje ser lys ut).

Små data kan kanskje gjerast store ved å låna data (i tid og rom).

Ikkje prøv å måla ting som ikkje finst! SLUTT