Proyecto Fin de M´asteren T´ecnicasEstad´ısticas

Estimaci´onen ´areaspeque˜nas: el ingreso medio mensual por comarca en los hogares gallegos

Autor: Roberto Dom´ınguezG´omez

Directores: Mar´ıaJos´eLombard´ıaCorti˜na Wenceslao Gonz´alezManteiga

Fecha: Junio 2009 Estimaci´onen ´areaspeque˜nas:el ingreso medio 0 mensual por comarca en los hogares gallegos ´Indice

1 Introducci´on 3

2 An´alisisdescriptivo 5 2.1 Dise˜nomuestral ...... 5 2.2 Informaci´onmuestral ...... 7 2.3 Informaci´onauxiliar ...... 11 2.4 Correlaci´on ...... 12 2.5 Normalidad ...... 13

3 Metodolog´ıa 15 3.1 Estimadores del ingreso medio mensual ...... 15 3.2 Estimaci´ondel MSE ...... 17 3.2.1 MSE de los estimadores ...... 17 3.2.2 Estimaci´onanal´ıticadel MSE ...... 18 3.2.3 Estimaci´onbootstrap del MSE ...... 19

4 Simulaci´on 21 4.1 Generaci´onde la poblaci´onfinita ...... 21 4.2 Resultados ...... 28

5 Caso real 35 5.1 Resultados ...... 35

6 Conclusiones 40

Referencias 41

Estimaci´onen ´areaspeque˜nas:el ingreso medio 1 mensual por comarca en los hogares gallegos Estimaci´onen ´areaspeque˜nas:el ingreso medio 2 mensual por comarca en los hogares gallegos 1 Introducci´on

El Instituto Galego de Estat´ıstica (IGE), consciente de la creciente demanda de estad´ısticasde calidad cada vez m´asdesagregadas, incluy´oen el programa anual del a˜no2007 una actividad estad´ıstica titulada ”Investigaci´ony desarrollo de m´etodos de estimaci´onde ´areas peque˜nas”que tiene como objetivo mejorar las predicciones o estimaciones de variables y par´ametrosde inter´esen las encuestas realizadas por el IGE, considerando un nivel de desagregaci´onmayor de aquel para el que se dise˜n´ola encuesta. Para llevar a cabo esta actividad estad´ıstica el IGE firm´oun convenio de colaboraci´oncon el Departamento de Estad´ısticae Investigaci´onOperativa de la Universidad de de Compostela. El trabajo que aqu´ıse presenta se realiz´oen el marco de este convenio y hace referencia a la Encuesta de condiciones de vida de las familias, encuesta llevada a cabo por el IGE desde el a˜no1999. El estudio se centrar´aen la estimaci´ona nivel de comarcas del ingreso medio mensual y el ingreso equivalente por hogar.

Debido a la novedad y complejidad metodol´ogicaque suponen este tipo de tra- bajos, este documento tiene como objetivo fundamental describir de forma por- menorizada los estimadores y modelos utilizados, tanto para los valores totales como para los errores cuadr´aticosmedios.

Teniendo en cuenta que el IGE quiere seguir investigando en la metodolog´ıauti- lizada en este trabajo es necesario destacar que los datos estad´ısticos presentados en este documento tienen el car´acterde datos experimentales y por lo tanto no se pueden considerar como estad´ısticaoficial.

El ingreso medio mensual por hogar es un indicador de la situaci´onsocioecon´omica y por lo tanto es de principal inter´espara la sociedad en general, y en particular para la administraci´onlocal y regional que necesitan la informaci´onpara diferentes programas econ´omicosy sociales. La efectividad de estos programas depende del conocimiento de la situaci´onsocioecon´omicaa trav´esde informaci´onestad´ıstica fiable. En consecuencia, hoy en d´ıalos estudios y las investigaciones a nivel re- gional y local son de gran inter´es.

El problema surge cuando a partir de una encuesta se quiere ofrecer datos con un nivel de desagregaci´oninferior a provincia o agrupaci´oncomarcal. En parti- cular, el IGE realiza encuestas para dar estimaciones directas para las provincias o agrupaciones comarcales pero no es habitual ofrecer datos con un nivel de des- agregaci´oninferior, debido a que las encuestas no est´andise˜nadaspara dar esti- maciones directas para este nivel de desagregaci´on. Un ´area es considerada como ´areapeque˜nacuando la muestra en el ´areano es suficientemente grande para con- seguir estimaciones directas fiables. Ejemplos de ´areaspeque˜naspueden ser ´areas geogr´aficas(estados, provincias, municipios, comarcas, distritos escolares), grupos socio-demogr´aficos(grupos espec´ıficospor edad-sexo-raza) y otras subpoblaciones como un conjunto de firmas de empresas.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 3 mensual por comarca en los hogares gallegos Un modo de afrontar el problema en ´areaspeque˜nases aumentar el tama˜nomues- tral. Sin embargo, un aumento de tama˜node muestra lleva, entre otras cosas, a un aumento en el coste del estudio, una mayor carga de respuesta a los informantes y mayores errores ajenos al muestreo, lo que, en general, se trata de evitar. Otra alternativa es utilizar t´ecnicasm´ascomplejas, asistidas y basadas en modelos. Las estimaciones basadas en el modelo est´ansiendo de gran inter´esen los ´ultimosa˜nos por sus buenos resultados. Una propiedad importante de estos estimadores es su bajo error cuadr´aticomedio (MSE) comparado con los estimadores directos. No- tamos que es importante que el modelo est´ebien especificado y que las variables auxiliares contengan informaci´onrelevante. La inclusi´onde efectos aleatorios de ´areaen el modelo es com´unen la estimaci´onpara ´areaspeque˜nas.Estos efectos recogen la variaci´onen las ´areasque no est´aexplicada por las variables auxiliares.

En general se dispone de la informaci´onauxiliar a trav´esdel censo u otras fuentes administrativas. Si se cuenta con informaci´onauxiliar relevante para cada unidad de la poblaci´on,entonces los modelos se pueden definir a nivel de individuo. Sin embargo, existen casos donde la informaci´ona nivel de individuo no est´aactuali- zada u otros donde no se dispone de informaci´ona nivel de individuo por razones de privacidad. Normalmente en estos casos es posible conseguir datos agregados por ´area,lo que nos llevar´ıaa un modelo de ´area.

El objetivo en este trabajo es la estimaci´ondel ingreso medio mensual por hogar en las 53 comarcas de . En este caso las ´areaspeque˜nasson las comarcas, pues existen algunas con muy poca informaci´onmuestral, en particular se cuenta con 5 comarcas con un tama˜nomuestral de s´olo16 hogares. Para compensar la falta de informaci´onmuestral se necesita informaci´onauxiliar de alguna fuente externa, en este caso se va a utilizar informaci´onrelacionada con el impuesto so- bre la renta de las personas f´ısicas(IRPF) a nivel comarcal.

El documento est´aorganizado de la siguiente forma. En la secci´on2 se describe la metodolog´ıade la Encuesta de condiciones de vida de las familias, se mues- tran resultados de un estudio descriptivo previo y se presentan los estimadores del ingreso medio mensual y de su error cuadr´aticomedio. En la secci´on3 se presenta el estudio de simulaci´onpara evaluar los estimadores propuestos en la secci´onanterior y en la secci´on4, se describe la aplicaci´onde los estimadores al caso real. Finalmente, se presentan algunas conclusiones del estudio.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 4 mensual por comarca en los hogares gallegos 2 An´alisis descriptivo

El objetivo del estudio es la estimaci´ondel ingreso medio mensual por hogar y el ingreso equivalente mensual por hogar en las 53 comarcas de Galicia, aplicando t´ecnicasde estimaci´onen ´areaspeque˜nas.Hay que tener en cuenta las siguientes definiciones: • Hogar: persona o conjunto de personas que ocupan en com´ununa vivienda principal o parte de ella, y que consumen y/o comparten alimentos o bienes con cargo a un mismo presupuesto. • Ingreso medio mensual del hogar: la media mensual de los ingresos netos monetarios de todos los miembros del hogar en el a˜noanterior al de la encuesta.

• Ingreso equivalente mensual del hogar: el ingreso medio mensual del hogar dividido por la ra´ızcuadrada del n´umerode miembros del hogar. A continuaci´onse explica el dise˜nomuestral empleado, seguidamente se definen los estimadores apropiados para el estudio y finalmente se da una estimaci´ondel error cuadr´aticomedio (MSE) de estos estimadores dentro de las comarcas.

2.1 Dise˜nomuestral La muestra disponible proviene de la Encuesta de Condiciones de Vida de las familias (ECV) del a˜no2005. La ECV es una operaci´onestad´ısticaanual que realiza el IGE desde 1999. Se trata de una encuesta dirigida a los hogares gallegos con el objetivo de obtener informaci´onsobre sus caracter´ısticassocioecon´omicas.

Algunos aspectos t´ecnicosdel trabajo: • Areas´ geogr´aficas: Las provincias gallegas est´andivididas en las siguientes ´areasgeogr´aficas:

Provincia de A Coru˜na – A Coru˜naoriental: representada por las comarcas de Arz´ua,Betan- zos, Eume, Melide, y . – A Coru˜naoccidental: representada por las comarcas de A Barcala, A Barbanza, Berganti˜nos,, , , , y . – Comarca de Santiago. – Comarca de A Coru˜na. – Comarca de .

Estimaci´onen ´areaspeque˜nas:el ingreso medio 5 mensual por comarca en los hogares gallegos Provincia de

– Lugo sur: representada por las comarcas de A Ulloa, , , , , y . – Comarca de Lugo. – Lugo norte: representada por las comarcas de Terra Ch´a,A Mari˜na Central, A Mari˜naOriental, A Mari˜naOccidental y .

Provincia de

– Ourense occidental: representada por las comarcas de Allariz e Maceda, , , O Carballi˜no, y . – Comarca de Ourense. – Ourense oriental: representada por las comarcas de , , Ver´ın, y .

Provincia de

– Pontevedra occidental: representada por las de comarcas O Morra- zo, O Baixo Mi˜no, y O Saln´es. – Pontevedra oriental: representada por las comarcas de Tabeir´os- Terra de Montes, , Deza y . – Comarca de Pontevedra. – Comarca de .

• Estratos: Cada ´areageogr´aficaest´adividida en estratos de acuerdo con la siguiente clasificaci´on:

– Estrato 0: ayuntamientos autorrepresentados. – Estrato 1: ayuntamientos de m´asde 20.000 habitantes. – Estrato 2: ayuntamientos de 15.000 a 20.000 habitantes. – Estrato 3: ayuntamientos de 10.000 a 15.000 habitantes. – Estrato 4: ayuntamientos de 5.000 a 10.000 habitantes. – Estrato 5: ayuntamientos de menos de 5.000 habitantes.

En algunas ´areasgeogr´aficases necesario unir estratos para evitar la exis- tencia de estratos con poca representatividad. Los ayuntamientos autorre- presentados son A Coru˜na,Ferrol, Santiago, Lugo, Ourense, Pontevedra y Vigo. Estos ayuntamientos son autorrepresentados pues dada su categor´ıa dentro de la provincia deben tener siempre secciones en la muestra.

• Secci´oncensal: Subdivisi´onde los t´erminosmunicipales empleada, habitualmente, para aque- llos trabajos para los que es necesaria una divisi´oninframunicipal.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 6 mensual por comarca en los hogares gallegos • Tipo de muestreo: Dentro de cada ´areageogr´afica, definidas anteriormente, el muestreo es biet´apicocon estratificaci´onprevia de las unidades de primera etapa. Las unidades de primera etapa son las secciones censales y las unidades de se- gunda etapa son los hogares.

– 1a etapa: dentro de cada estrato, definidos anteriormente, las secciones muestrales se seleccionan con probabilidad proporcional a su tama˜no. – 2a etapa: en cada una de estas secciones muestrales, los hogares se seleccionan mediante muestreo sistem´aticocon arranque aleatorio. • Tama˜node muestra: La muestra resultante consta de 394 secciones censales repartidas por las provincias de la siguiente forma: – A Coru˜na:162 secciones – Lugo: 56 secciones – Ourense: 52 secciones – Pontevedra: 124 secciones En cada secci´onmuestral se seleccionan 16 hogares, lo que resulta en una muestra total de 6304 hogares. Dentro de cada hogar seleccionado se entre- vista a todos sus miembros.

M´asdetalles sobre la metodolog´ıaempleada en la encuesta y dise˜nomuestral est´an disponibles en: http://www.ige.eu/estatico/pdfs/s3/metodoloxias/met ecv 2006 gl.pdf

2.2 Informaci´onmuestral En la ECV fueron entrevistadas 18669 personas pertenecientes a 6304 hogares. Despu´esde explorar las variables en la base de datos, las variables de inter´espara el estudio son:

• cod comarca: c´odigode la comarca. • nome comarca: nombre de la comarca. • estrato: c´odigo del estrato.

• ftotPersoa: ingreso total mensual por persona. • frep: factor de elevaci´oncalibrado del hogar al que pertenece la persona. Todas las dem´asvariables incluidas en la base de datos son variables de car´acter personal, por ejemplo grupo de edad, sexo y nivel de estudios. No es posible agregar estas variables adecuadamente para los hogares, que es precisamente lo que nos interesa.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 7 mensual por comarca en los hogares gallegos Se agregan adecuadamente los datos de la encuesta para los 6304 hogares y de paso se construyen nuevas variables: • ftotPersoa hogar: ingreso total mensual por hogar. • pers hogar: n´umerode personas por hogar.

• ftot equiv hogar: ingreso equivalente mensual por hogar:

ftotP ersoa hogarj ftot equiv hogarj = p , j = 1,..., 6304 pers hogarj

• w: factor de elevaci´onte´oricodel hogar:

Mh wj = 1j∈h, j = 1,..., 6304, h = 1,..., 39 mh

siendo Mh y mh respectivamente el total poblacional y el total muestral de personas por estrato h. Nuestro objetivo es dar una estimaci´onpara el ingreso medio mensual por hogar para la comarca d:

PNd j=1 ftotP ersoa hogarj Y 1d = , d = 1 ... 53, Nd y el ingreso equivalente mensual por hogar para la comarca d:

PNd j=1 ftot equiv hogarj Y 2d = , d = 1 ... 53, Nd siendo Nd el total poblacional de hogares para la comarca d.

Para dar alg´unresultado para las comarcas se agregan los datos adecuadamente por comarca. En la siguiente Tabla 2.1 se muestran los datos resultantes.

c´odigo nombre comarca ingreso medio ingreso equiv. nd 1501 Arz´ua 1178.81 681.44 64 1502 Barbanza 1525.12 856.79 144 1503 A Barcala 1595.86 767.23 32 1504 Berganti˜nos 1677.87 922.45 176 1505 1624.06 960.64 80 1506 A Coru˜na 1673.39 993.30 736 1507 Eume 1822.74 1020.34 80 1508 Ferrol 1606.08 990.86 416 1509 Fisterra 1235.21 725.82 32 1510 Muros 1328.37 787.47 16 1511 Noia 1593.37 872.80 144 1512 Ordes 1674.45 869.13 128 1513 Ortegal 1293.78 845.21 48 1514 Santiago 1804.99 1030.86 352

Estimaci´onen ´areaspeque˜nas:el ingreso medio 8 mensual por comarca en los hogares gallegos c´odigo nombre comarca ingreso medio ingreso equiv. nd 1515 O Sar 1325.31 729.36 32 1516 1065.80 631.86 16 1517 Terra de Soneira 1638.89 855.22 48 1518 Xallas 1638.56 808.30 48 2701 Os Ancares 1856.24 1038.65 32 2702 Chantada 1630.42 892.96 48 2703 A Fonsagrada 0 0 0 2704 Lugo 1839.48 1082.14 256 2705 A Mari˜naCentral 1688.65 990.35 80 2706 A Mari˜naOccidental 1564.72 865.37 80 2707 A Mari˜naOriental 1655.04 953.01 48 2708 Meira 1546.56 899.13 32 2709 Quiroga 1144.13 792.20 16 2710 Sarria 1601.95 839.74 48 2711 Terra Ch´a 1514.68 868.78 112 2712 Terra de Lemos 1204.23 780.74 96 2713 A Ulloa 1322.67 735.30 48 3201 Allariz-Maceda 1662.74 1088.04 16 3202 Baixa Limia 999.84 675.01 64 3203 O Carballi˜no 1367.73 828.90 48 3204 A Limia 1113.60 700.74 112 3205 Ourense 1631.29 963.91 352 3206 O Ribeiro 1257.10 785.95 32 3207 Terra de Caldelas 1068.83 702.01 32 3208 Terra de Celanova 1126.11 693.77 48 3209 Terra de Trives 0 0 0 3210 Valdeorras 1237.55 787.07 48 3211 Ver´ın 1252.45 783.95 64 3212 Viana 1468.25 869.74 16 3601 O Baixo Mi˜no 1384.16 777.34 80 3602 Caldas 1585.64 891.13 80 3603 O Condado 1360.79 786.71 80 3604 Deza 1558.39 881.08 128 3605 1562.97 879.70 160 3606 A Paradanta 1124.23 685.46 32 3607 Pontevedra 1868.91 1059.16 256 3608 O Saln´es 1683.66 936.27 224 3609 Tabeir´os-Terra de Montes 1510.35 859.51 80 3610 Vigo 1784.64 1038.91 864

Tabla 2.1: Informaci´onmuestral por comarca

En la Tabla 2.1 est´andefinidas las siguientes variables: • ingreso medio: la media muestral comarcal de los ingresos totales mensu- ales por hogar, es decir P ftotP ersoa hogar j∈sd j ingreso mediod = nd

Estimaci´onen ´areaspeque˜nas:el ingreso medio 9 mensual por comarca en los hogares gallegos • ingreso equiv.: la media muestral comarcal de los ingresos equivalentes mensuales por hogar, es decir

P ftot equiv hogar j∈sd j ingreso equivd = nd

• nd: el tama˜nomuestral de hogares por comarca, X nd = pers hogarj

j∈sd

A continuaci´onse muestra el tama˜node la muestra de hogares por comarcas:

Figura 2.1: Tama˜nomuestral.

Se observa en la Figura 2.1 que no se cuenta con informaci´onmuestral disponible en las comarcas de A Fonsagrada y Terra de Trives. Por lo tanto el estudio se centra en las 51 comarcas restantes.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 10 mensual por comarca en los hogares gallegos Se observa tambi´enque se cuenta con poca representatividad muestral (≤ 48) para las comarcas pintadas de color blanco. Precisamente es en estas comarcas donde el estudio ser´ade inter´es. Las comarcas con mayor tama˜nomuestral son las de Vigo y A Coru˜nacon una muestra de 864 y 736 hogares, respectivamente.

2.3 Informaci´onauxiliar Cada a˜no la Agencia Estatal de la Administraci´onTributaria (AEAT) recoge las rentas anuales declaradas por sus contribuyentes y las proporciona a nivel muni- cipal, por razones de privacidad, al IGE. Esta informaci´onser´ala utilizada como informaci´onrelacionada con las variables a estudiar en este trabajo.

Se trabaja con las siguientes variables auxiliares, ya agregadas por comarca:

• No decla.: n´umerode declarantes de la renta por comarca.

• Renta imponible: total de renta declarada por comarca.

• Porcent. trabajo: porcentaje de la renta declarada procedente de trabajo.

• Porc. activ. econo. direc.: porcentaje de la renta declarada procedente de actividades empresariales.

• Porc. activ. econo. objetiva.: porcentaje de la renta declarada proce- dente de actividades profesionales.

• Porc. otros: porcentaje de la renta declarada procedente de otras activi- dades.

• Poblaci´on: n´umerode habitantes por comarca.

• Remun asalar: remuneraci´onde asalariados por comarca.

• Prestaci´on social: prestaciones sociales por comarca.

• Renda dispo bruta: dinero del que disponen los individuos en cada co- marca para gastar a lo largo del a˜no.

De las 10 variables se calculan las siguiente 8 variables auxiliares que representan medias comarcales:

• Rendi medio: renta media anual declarada por individuo

Renta imponible Rendi medio = No decla

• Rendi medio trabajo: renta media anual procedente de trabajo

Renta imponible x Porc. trabajo Rendi medio trabajo = No decla

Estimaci´onen ´areaspeque˜nas:el ingreso medio 11 mensual por comarca en los hogares gallegos • Rendi medio empres: renta media anual procedente de actividades em- presariales Renta imponible x Porc. empresa Rendi medio empres = No decla

• Rendi medio prof: renta media anual procedente de actividades profe- sionales Renta imponible x Porc. prof Rendi medio prof = No decla

• Rendi medio otras: renta media anual procedente de otras actividades Renta imponible x Porc. otras Rendi medio otras = No decla

• RBFD media: media de dinero del que dispone el individuo para gastar a lo largo del a˜no Renda dispo bruta RBFD media = Poblaci´on

• Remun asalar media: media de la remuneraci´onde asalariados Remun asalar Remun asalar media = Poblaci´on

• Prest social media: media de las prestaciones sociales Prestaci´on social Prest social media = Poblaci´on

En la siguiente secci´onse lleva a cabo un estudio de correlaci´onpara quedarse s´olocon las variables auxiliares m´asinformativas.

2.4 Correlaci´on Hay 10 variables de inter´es,las 2 variables objetivas y las 8 variables auxiliares de la secci´onanterior. Se estudia si existe alguna correlaci´onentre ellas (Tabla 2.2).

ingreso medio ingreso equiv Rendi medio 0,611 0,670 Rendi medio trabajo 0,542 0,636 Rendi medio empres 0,271 0,119 Rendi medio prof -0,145 -0,335 Rendi medio otras 0,352 0,429 RFBD media 0,615 0,698 Remun asalar media 0,657 0,691 Prest social media -0,261 0,009

Tabla 2.2: Correlaci´onentre las variables

Estimaci´onen ´areaspeque˜nas:el ingreso medio 12 mensual por comarca en los hogares gallegos Se observa, en la Tabla 2.2, que las variables auxiliares que m´ascorrelaci´ontienen con nuestras variables objetivas son: • Rendi medio • Rendi medio trabajo

• RFBD media • Remun asalar media De estas 4 variables auxiliares se escoge el rendimiento medio declarado como ´unicavariable auxiliar de inter´esen el estudio. Se tom´oesta decisi´onpues esta variable proviene de una fuente con informaci´onm´asactualizada y fiable que las dem´as.

2.5 Normalidad Existen estimadores en el estudio que requieren la condici´onde normalidad para las variables objetivas, por tanto es necesario estudiar esta caracter´ıstica.

estad´ıstico gl nivel significaci´on ingreso medio 0,140 51 0,014 ingreso equiv 0,085 51 0,200*

Tabla 2.3: Test de normalidad

Nota*: 0, 200 es el valor m´aximoque nos proporciona SPSS del p-valor del es- tad´ısticode contraste, el p-valor verdadero es m´asalto.

En la Tabla 2.3 se muestran los resultados del test de normalidad de Kolmogorov- Smirnov. Seg´unestos valores podemos aceptar que existe normalidad bajo un nivel de significaci´onde 0, 01.

A continuaci´onse grafican los histogramas y los gr´aficosQ-Q normales para las 2 variables.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 13 mensual por comarca en los hogares gallegos Histograma Histograma

10 Media =858,08 Media =1480,02 Desviación típica =117,536 Desviación típica =237,253 N =51 N12,5 =51

8 10,0

6 7,5 Frecuencia Frecuencia 4 5,0

2 2,5

0,0 0 600,00 700,00 800,00 900,00 1000,00 1100,00 1000,00 1200,00 1400,00 1600,00 1800,00 ftot_equiv_hogar_mean ftotPersoa_hogar_mean (a) ingreso medio (b) ingreso equivalente

Figura 2.2: Histogramas variables objetivas

Gráfico Q-Q normal de ftotPersoa_hogar_mean Gráfico Q-Q normal de ftot_equiv_hogar_mean

3 3

2 2

1 1

0 0

-1 -1 Normal esperado Normal esperado

-2 -2 Page 1 Page 1

-3 -3

800 1.000 1.200 1.400 1.600 1.800 2.000 600 700 800 900 1.000 1.100 1.200 Valor observado Valor observado (a) ingreso medio (b) ingreso equivalente

Figura 2.3: Gr´aficasQ-Q normal variables objetivas

En la Figura 2.3 se nota m´asel ajuste a una normal que en la Figura 2.2. Por ejemplo, se ve que hay m´asrazones para favorecer la distribuci´onde la Figura 2.3b sobre la de la Figura 2.3a con respecto a la normalidad. En la Figura 2.2 esto no se ve tan claro.

Page 1 Page 1

Estimaci´onen ´areaspeque˜nas:el ingreso medio 14 mensual por comarca en los hogares gallegos 3 Metodolog´ıa

Los estimadores se pueden clasificar basicamente en 3 grupos: • Estimadores basados en el dise˜no: estimadores que s´olotienen en cuenta la informaci´onmuestral. • Estimadores asistidos por el modelo: estimadores construidos a par- tir de un modelo pero que para hacer inferencia s´olotienen en cuenta la informaci´onmuestral. • Estimadores basados en el modelo: estimadores que conf´ıantotalmente en el modelo asumido. Dentro de esta ´ultimaclase, los modelos pueden ser de dos tipos: • Modelos de tipo individuo: modelos que utilizan variables auxiliares, disponibles para cada individuo en el estudio. • Modelos de tipo ´area: modelos que utilizan variables auxiliares, disponibles a nivel de ´area. Las variables auxiliares en el estudio son proporcionadas a nivel municipal, por tanto los estimadores basados en el modelo van a ser de tipo ´area.

Adem´ascabe se˜nalarque en el estudio no est´aincluido ning´unestimador asis- tido por el modelo, esto es debido a la imposibilidad de construcci´onde este tipo de modelos con la informaci´onauxiliar disponible.

3.1 Estimadores del ingreso medio mensual Para una muestra dada s se consideran los siguientes estimadores de la media del ingreso mensual Y d para las comarcas d = 1,...,D.

Estimaci´onbasada en el dise˜no: • Estimador Horvitz-Thompson: P HT ωjyj Yb = sd , d = 1,...,D d P ω sd j

donde sd es la muestra perteneciente a la comarca d, yj el ingreso mensual del hogar j y ωj el peso muestral asignado al hogar j. • Estimador postestratificado sint´etico:

H P OST,S 1 X HT Yb d = MdhYb h , d = 1,...,D Md h=1

denotando por h los postestratos relevantes, Md el total poblacional de las personas en la comarca d y Mdh el total poblacional de las personas que

Estimaci´onen ´areaspeque˜nas:el ingreso medio 15 mensual por comarca en los hogares gallegos pertenecen a la intersecci´onde la comarca d con el estrato h. Adem´asdefi- HT nimos Yb h como el estimador de Horvitz-Thompson de la media mensual en el estrato h. • Estimador compuesto:

COMP,P HT P OST,S Yb d = γdYb d + (1 − γd)Yb d , d = 1,...,D

donde γd son pesos dependientes del tama˜nomuestral en la comarca d, definidos como:  HT  1 si Mcd ≥ δMd γ = HT d Mcd  en caso contrario δMd HT con Mcd la estimaci´onde Horvitz-Thompson del total de las personas Md en la comarca d. Para el par´ametro δ se pueden tomar distintos valores, δ ∈ {1, 3/2, 2} (Eustat, 2008).

Estimaci´onbasada en el modelo: • Estimador Fay-Herriot:

se basa en el siguiente modelo lineal mixto (Fay and Herriot, 1979):

HT Yb d = β0 + Xdβ1 + ud + εd, d = 1,...,D O en forma matricial: HT Yb = Xβ + u + ε con  HT    Yb 1 1 X1 HT    .  . . β0 Yb =  .  , X =  . .  , β =     β1  HT  1 XD Yb D y     u1 ε1  .   .  u =  .  , ε =  .  uD εD

Este modelo asume que los efectos aleatorios de ´area ud son independientes 2 e id´enticamente distribuidos seg´un ud ∼ N(0, σu) y los errores de muestreo 2 εd son independientes y distribuidos seg´un εd ∼ N(0, σd), con ud indepen- dientes de εd.

2 Tambi´ense asume que la varianza σu de los efectos aleatorios es desconocida 2 y que las varianzas σd de los errores muestrales son conocidas, estim´andolas a partir de la informaci´onmuestral como:

2 2 sd σd = , d = 1,...,D nd

Estimaci´onen ´areaspeque˜nas:el ingreso medio 16 mensual por comarca en los hogares gallegos 2 siendo sd y nd la cuasivarianza muestral de la variable objetivo y el tama˜no muestral en la comarca d, respectivamente.

Adem´as,como covariable Xd se toma la renta media anual declarada por individuo en la comarca d (datos del IRPF).

Bas´andoseen este modelo, se define el estimador Fay-Herriot:

EBLUP ˆ ˆ Yb d = β0 + Xdβ1 +u ˆd, d = 1,...,D

Los par´ametrosse estiman por m´aximaverosimilitud restringida (REML). Para m´asdetalle, v´easeRao (2003, Cap.6 y 7). Hay que se˜nalarque las expresiones para los estimadores del ingreso equivalente mensual son id´enticas a las expresiones para los estimadores del ingreso medio mensual cambiando la variable yj por el ingreso equivalente mensual del hogar j.

3.2 Estimaci´ondel MSE Una parte muy importante en la estimaci´onen ´areaspeque˜nases la estimaci´on del error del estimador, en particular se trabaja con el MSE. Se estudia el MSE de los estimadores propuestos anteriormente y algunas t´ecnicasde remuestreo que se presentan como alternativa a las expresiones anal´ıticasdel estimador del MSE. Hoy en d´ıalos m´etodos de remuestreo son importantes ya que nos pueden dar estimaciones m´asprecisas que los m´etodos anal´ıticos. Esto se ve reflejado en el uso masivo en los estudios realizados ´ultimamente en ´areaspeque˜nasen otros institutos e instancias, por ejemplo Eustat (2008). Adem´as,los m´etodos de re- muestreo son de f´acilaplicaci´one interpretaci´ongracias a los avances en el mundo inform´atico.

A continuaci´onse muestran las expresiones del MSE de los estimadores, despu´es se definen los estimadores anal´ıticosdel MSE y m´asadelante nos centramos en la estimaci´ondel error aplicando t´ecnicasde remuestreo.

3.2.1 MSE de los estimadores Las expresiones de los MSE te´oricosde los estimadores son las siguientes: • Estimador Horvitz-Thompson:

HT 1 X 2 MSE(Yb d ) = (ωj − 1)(yj − Y d) Nd j∈Pd

donde Nd es el n´umerototal de hogares en la poblaci´on Pd de la comarca d.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 17 mensual por comarca en los hogares gallegos • Estimador postestratificado sint´etico:

2 P,S H ! H 2 1 X 1 X Mdh X 2 MSE(Yb d ) = Mdh(Y h − Y dh) + 2 2 (ωj−1)(yj−Y h) Md Md Nh h=1 h=1 j∈Ph

donde Nh es el n´umerototal de hogares en la poblaci´on Ph del estrato h y Y h la media poblacional del igreso en el estrato h. • Estimador compuesto:

COMP,P HT P,S 2 2 MSE(Yb d ) = γdMSE(Yb d ) + (1 − γd) MSE(Yb d ) HT P OST,S + 2γd(1 − γd)E(Yb d − Y d)(Yb d − Y d)

• Estimador Fay-Herriot:

EBLUP 2 2 2 MSE(Yb d ) = g1d(σu) + g2d(σu) + g3d(σu)

2 2 2 donde g1d(σu), g2d(σu) y g3d(σu) son expresiones que fueron estudiadas por Prasad and Rao (1990).

3.2.2 Estimaci´onanal´ıticadel MSE Se comienza con los estimadores de los errores que proporcionan las expresiones anal´ıticas: • Estimador Horvitz-Thompson:

HT HT 1 X 2 mse(Yb d ) = ωj(ωj − 1)(yj − Yb d ) N bd j∈sd donde X Nbd = ωj

j∈sd es un estimador del n´umerode hogares en la comarca d. • Estimador postestratificado sint´etico:

P OST,S P OST,S HT H 2 HT 2 1 X Mdh X 2 mse(Yb ) = (Yb −Yb ) + ωj(ωj−1)(yj−Yb ) d d d 2 2 h Md N h=1 bh j∈sh donde X Nbh = ωj

j∈sh es un estimador del n´umerode hogares en el estrato h. • Estimador compuesto:

COMP,P HT P OST,S 2 2 mse(Yb d ) = γdmse(Yb d ) + (1 − γd) mse(Yb d )

Estimaci´onen ´areaspeque˜nas:el ingreso medio 18 mensual por comarca en los hogares gallegos • Estimador Fay-Herriot:

EBLUP 2 2 2 mse(Yb d ) = g1d(ˆσu) + g2d(ˆσu) + 2g3d(ˆσu)

2 2 2 donde las funciones g1d(ˆσu), g2d(ˆσu) y g3d(ˆσu) est´andefinidas como:

2 2 2 σˆuσd • g1d(ˆσu) = 2 2 σd +σ ˆu  2 2 2 σd t t −1 −1 • g2d(ˆσu) = 2 2 xd X V X xd σd +σ ˆu

donde V es una matriz diagonal y xd un vector, definidos como:  σ2 +σ ˆ2 0  1 u   . 1 V =  ..  , xd =   Xd 2 2 0 σD +σ ˆu

D !−1 σ4 X 2 • g (ˆσ2) = d 3d u (ˆσ2 + σ2)3 (ˆσ2 + σ2)2 u d d=1 u d

3.2.3 Estimaci´onbootstrap del MSE Los m´etodos de remuestreo se basan en la evaluaci´onde los estad´ısticosen re- muestras o submuestras obtenidas a partir de los datos originales. En el m´etodo bootstrap, las submuestras se obtienen mediante muestreo aleatorio simple de la muestra original. Una ventaja del m´etodo bootstrap es la sencillez para dar esti- maciones del MSE, incluso para estimadores complejos. Un ejemplo es el Bootstrap Naive, t´ecnicaque en este estudio se aplica a los estimadores Horvitz-Thompson, postestratificado sint´eticoy compuesto. Para el estimador Fay-Herriot se utiliza un m´etodo Bootstrap param´etricodise˜nadopara el modelo.

Bootstrap Naive: 1. Generaci´onde B muestras bootstrap: Para cada estrato h = 1,...,H seleccionar una muestra aleatoria simple con reemplazamiento de nh hogares entre los nh hogares que aparecen en la muestra perteneciente al estrato h. A continuaci´onse calculan los tama˜nos muestrales por comarca nd. Repetir B veces. 2. C´alculode los estimadores: ∗(b) Para cada muestra generada b = 1,...,B calcular los estimadores Yb d igual que en la muestra s. 3. Estimaci´ondel error cuadr´aticomedio (MSE):

B 1 X ∗(b) mse (Yb ) = (Yb − Yb )2 B d B − 1 d d b=1

Estimaci´onen ´areaspeque˜nas:el ingreso medio 19 mensual por comarca en los hogares gallegos Para estimar el MSE del estimador Fay-Herriot se aplica un m´etodo Bootstrap param´etrico(Gonz´alez-Manteiga et al., 2008) dise˜nadoespecialmente para este modelo:

Bootstrap param´etrico:

HT HT 2 2 ˆ ˆ 2 2 1. Calcular estimacionesσ ˆu =σ ˆu(Yb ) y βE = β(ˆσu, Yb ) de σu y β res- pectivamente.

2. Generar D copias independientes de una variable W1 ∼ N(0, 1). Construir ∗ ∗ ∗ 0 ∗ el vector u = (u1, . . . , uD) con los elementos ud =σ ˆuW1, d = 1,...,D.

3. Generar D copias independientes de una variable W2 ∼ N(0, 1), indepen- ∗ ∗ ∗ 0 diente de W1. Construir el vector ε = (ε1, . . . , εD) con los elementos ∗ εd = σdW2, d = 1,...,D. 4. Construir el modelo bootstrap:

∗ ˆ ∗ ∗ Yb = XβE + u + ε

∗ ˆ ∗ Bajo este modelo bootstrap, se define el BLUP de µ = XβE + u como:

∗ ∗ 2 ˆ∗ ∗ µˆB = µˆ(ˆσu, Yb ) = XβB + uˆB

∗ ∗ ∗ ˆ∗ ˆ 2 ∗ 2 2∗ 2 siendo βB = β(ˆσu, Yb ) y uˆB = uˆ(ˆσu, Yb ). Ahora seaσ ˆu =σ ˆu(Yb ) el esti- ∗ 2 mador de σu obtenido de Yb . Usando esta informaci´on,se consigue el estimador bootstrap EBLUP: ∗ ∗ 2∗ ˆ∗ ∗ µˆE = µˆ(ˆσu , Yb ) = XβE + uˆE ∗ ∗ ˆ∗ ˆ 2∗ ∗ 2∗ siendo βE = β(ˆσu , Yb ) y uˆE = uˆ(ˆσu , Yb ).

Por ´ultimo,

∗(b) 5. Generar B vectores bootstrap Yb , b = 1,...,B del modelo bootstrap ∗(b) definido en el paso 4. De cada vector Yb se calcula su media real µ∗(b) ∗(b) y su estimador EBLUP µˆE . Finalmente calculamos el estimador del error cuadr´aticomedio para cada comarca:

EBLUP B 1 X ∗(b) ∗(b) mse (ˆµ ) = mse (Yb ) = (ˆµ − µ )2 B E,d B d B − 1 E,d d b=1

Estimaci´onen ´areaspeque˜nas:el ingreso medio 20 mensual por comarca en los hogares gallegos 4 Simulaci´on

Para evaluar el sesgo y el MSE de los estimadores se genera una poblaci´onficticia imitando la distribuci´ondel ingreso por hogar de la poblaci´ongallega. Para esto se ha analizado la muestra disponible y seg´unsu distribuci´onse intenta reproducir las variables de inter´es. Este paso es importante ya que aqu´ıes donde se puede valorar la calidad de cada uno de los estimadores de inter´es.

4.1 Generaci´onde la poblaci´onfinita El tama˜nopoblacional N con el que se trabaja, se estima con los datos de la muestra real s de la siguiente forma: X N = frepj ≈ 943991 j∈s

donde frepj es el peso calibrado en la muestra real asignado al hogar j. De esta forma tambi´ense calculan los tama˜nospoblacionales por comarca Nd y los tama˜nospoblacionales por estrato Nh: X X Nd = frepj Nh = frepj, d = 1, . . . , D, h = 1,...,H

j∈sd j∈sh siendo sd y sh respectivamente la muestra real en la comarca d y la muestra real en el estrato h. Adem´as D = 51 y H = 39.

Con esta informaci´onse crean las siguientes variables para todos los hogares de la poblaci´on,es decir para j = 1,...,N:

• Comarcaj: N´umerode comarca a la que pertenece el hogar j.

• Estratoj: N´umerode estrato al que pertenece el hogar j. La siguiente variable que se genera, es:

• Ingresoj: Ingreso mensual del hogar j.

Para generar esta variable es necesario estudiar la distribuci´onde las variables ftot hogar (ingreso mensual del hogar) y ftot equiv hogar (ingreso equivalente mensual del hogar) en cada comarca para la muestra real.

En la siguiente Tabla 4.1 se muestran los resultados del test de normalidad de Kolmogorov-Smirnov. Se intenta averiguar si la distribuci´onen cada comarca de ambas variables se aproxima a una normal.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 21 mensual por comarca en los hogares gallegos Ingreso Ingreso equivalente Comarca estad´ıstico gl p-valor estad´ıstico gl p-valor Arz´ua 0,13 64 0,009 0,149 64 0,001 Barbanza 0,116 144 0 0,092 144 0,004 A Barcala 0,105 32 0,200* 0,181 32 0,009 Berganti˜nos 0,102 176 0 0,093 176 0,001 Betanzos 0,15 80 0 0,19 80 0 A Coru˜na 0,098 736 0 0,11 736 0 Eume 0,105 80 0,029 0,11 80 0,018 Ferrol 0,108 416 0 0,1 416 0 Fisterra 0,113 32 0,200* 0,108 32 0,200* Muros 0,204 16 0,074 0,245 16 0,011 Noia 0,143 144 0 0,16 144 0 Ordes 0,114 128 0 0,113 128 0 Ortegal 0,216 48 0 0,304 48 0 Santiago 0,139 352 0 0,119 352 0 O Sar 0,181 32 0,009 0,176 32 0,013 Terra de Melide 0,294 16 0,001 0,243 16 0,012 Terra de Soneira 0,2 48 0 0,195 48 0 Xallas 0,143 48 0,015 0,123 48 0,066 Os Ancares 0,164 32 0,028 0,217 32 0,001 Chantada 0,115 48 0,133 0,167 48 0,002 Lugo 0,142 256 0 0,146 256 0 A Mari˜naC. 0,125 80 0,003 0,179 80 0 A Mari˜naOcc. 0,168 80 0 0,153 80 0 A Mari˜naOr. 0,156 48 0,005 0,145 48 0,013 Meira 0,118 32 0,200* 0,164 32 0,029 Quiroga 0,245 16 0,011 0,231 16 0,023 Sarria 0,186 48 0 0,189 48 0 Terra Ch´a 0,145 112 0 0,143 112 0 Terra de Lemos 0,165 96 0 0,154 96 0 A Ulloa 0,172 48 0,001 0,154 48 0,006 Allariz-Maceda 0,379 16 0 0,411 16 0 Baixa Limia 0,171 64 0 0,124 64 0,015 O Carballi˜no 0,13 48 0,04 0,123 48 0,067 A Limia 0,13 112 0 0,126 112 0 Ourense 0,117 352 0 0,111 352 0 O Ribeiro 0,132 32 0,17 0,15 32 0,063 Terra de Caldelas 0,224 32 0 0,195 32 0,003 Terra de Celanova 0,108 48 0,200* 0,083 48 0,200* Valdeorras 0,122 48 0,071 0,172 48 0,001 Ver´ın 0,227 64 0 0,231 64 0 Viana 0,168 16 0,200* 0,226 16 0,028 O Baixo Mi˜no 0,132 80 0,001 0,114 80 0,012 Caldas 0,121 80 0,005 0,127 80 0,003 O Condado 0,097 80 0,061 0,114 80 0,012 Deza 0,143 128 0 0,165 128 0

Estimaci´onen ´areaspeque˜nas:el ingreso medio 22 mensual por comarca en los hogares gallegos Ingreso Ingreso equivalente Comarca estad´ıstico gl p-valor estad´ıstico gl p-valor O Morrazo 0,114 160 0 0,103 160 0 A Paradanta 0,191 32 0,004 0,236 32 0 Pontevedra 0,103 256 0 0,137 256 0 O Saln´es 0,097 224 0 0,115 224 0 T.-T. de Montes 0,159 80 0 0,144 80 0 Vigo 0,1 864 0 0,09 864 0

Tabla 4.1: Test de normalidad

Nota*: 0, 200 es el valor m´aximoque nos proporciona SPSS del p-valor del es- tad´ısticode contraste, el p-valor verdadero es m´asalto.

Seg´unestos valores se puede rechazar que existe normalidad para la mayor´ıade las 51 comarcas (41 rechazos para el ingreso medio mensual y 46 rechazos para el ingreso equivalente mensual) con un nivel de significaci´onde α = 0, 05 ya que para ´estasel p-valor es menor que α = 0, 05.

A continuaci´onse muestran los histogramas y los gr´aficosQ-Q normales para las 2 variables que sirven para representar graficamente su distribuci´on. Cabe se˜nalarque las variables est´anrepresentadas para la muestra entera. Veamos si se ajustan a una distribuci´onnormal.

Histograma Histograma

1.000 1.200 Media =1613,97 Media =936,21 Desviación típica = 1117,849 Desviación típica =559,91 N =6.304 N =6.304

1.000 800

800

600

600 Frecuencia Frecuencia 400 400

200 200

0 0 0,00 2000,00 4000,00 6000,00 8000,00 10000,00 12000,00 0,00 2000,00 4000,00 6000,00 ftot_hogar ftot_equiv_hogar

(a) ingreso (b) ingreso equivalente

Figura 4.1: Histogramas variables objetivo

Estimaci´onen ´areaspeque˜nas:el ingreso medioPage 1 23 Page 1 mensual por comarca en los hogares gallegos Gráfico Q-Q normal de ftotPersoa_hogar Gráfico Q-Q normal de ftot_equiv_hogar

10,0 15

7,5

10

5,0

5 2,5 Normal esperado Normal esperado 0,0 0

-2,5

-5

-2.000 0 2.000 4.000 6.000 8.000 10.000 12.000 -2.000 0 2.000 4.000 6.000 8.000 Valor observado Valor observado (a) ingreso (b) ingreso equivalente

Figura 4.2: Gr´aficasQ-Q normal variables objetivo

Se ve claramente en las Figuras 4.1 y 4.2 que las variables no se ajustan a una normal. Por tanto es necesario hacer una transformaci´onde las variables, en con- creto se aplica una transformaci´onde potencia.

La idea es encontrar la potencia para la cual la distribuci´onde la variable transfor- mada se aproxima lo m´aximoposible a una distribuci´onnormal.Page 1 Esto es precisa- Page 1 mente lo que intenta conseguir el m´etodo de transformaciones Cox-Box, resultando ser una potencia ´optimael valor λ ≈ 0, 22.

Se muestran ahora los resultados para las variables transformadas:

Ingreso0,22 Ingreso equivalente0,22 Comarca estad´ıstico gl p-valor estad´ıstico gl p-valor Arz´ua 0,085 64 0,200* 0,089 64 0,200* Barbanza 0,038 144 0,200* 0,043 144 0,200* A Barcala 0,109 32 0,200* 0,111 32 0,200* Berganti˜nos 0,05 176 0,200* 0,041 176 0,200* Betanzos 0,057 80 0,200* 0,105 80 0,03 A Coru˜na 0,031 736 0,089 0,028 736 0,200* Eume 0,058 80 0,200* 0,045 80 0,200* Ferrol 0,041 416 0,086 0,046 416 0,037 Fisterra 0,152 32 0,057 0,21 32 0,001 Muros 0,118 16 0,200* 0,196 16 0,101 Noia 0,039 144 0,200* 0,065 144 0,200* Ordes 0,064 128 0,200* 0,043 128 0,200* Ortegal 0,097 48 0,200* 0,168 48 0,002 Santiago 0,038 352 0,200* 0,042 352 0,200* O Sar 0,099 32 0,200* 0,103 32 0,200* Terra de Melide 0,202 16 0,08 0,172 16 0,200* Terra de Soneira 0,121 48 0,077 0,132 48 0,036 Xallas 0,097 48 0,200* 0,065 48 0,200* Os Ancares 0,092 32 0,200* 0,137 32 0,135 Chantada 0,065 48 0,200* 0,097 48 0,200*

Estimaci´onen ´areaspeque˜nas:el ingreso medio 24 mensual por comarca en los hogares gallegos Ingreso0,22 Ingreso equivalente0,22 Comarca estad´ıstico gl p-valor estad´ıstico gl p-valor Lugo 0,046 256 0,200* 0,057 256 0,046 A Mari˜naC. 0,058 80 0,200* 0,093 80 0,086 A Mari˜naOcc. 0,095 80 0,068 0,079 80 0,200* A Mari˜naOr. 0,057 48 0,200* 0,07 48 0,200* Meira 0,106 32 0,200* 0,159 32 0,038 Quiroga 0,187 16 0,139 0,162 16 0,200* Sarria 0,098 48 0,200* 0,112 48 0,17 Terra Ch´a 0,052 112 0,200* 0,081 112 0,068 Terra de Lemos 0,083 96 0,097 0,081 96 0,132 A Ulloa 0,071 48 0,200* 0,136 48 0,027 Allariz-Maceda 0,22 16 0,037 0,289 16 0,001 Baixa Limia 0,077 64 0,200* 0,07 64 0,200* O Carballi˜no 0,075 48 0,200* 0,072 48 0,200* A Limia 0,081 112 0,068 0,065 112 0,200* Ourense 0,039 352 0,200* 0,067 352 0,001 O Ribeiro 0,11 32 0,200* 0,087 32 0,200* Terra de Caldelas 0,129 32 0,187 0,118 32 0,200* Terra de Celanova 0,106 48 0,200* 0,123 48 0,066 Valdeorras 0,065 48 0,200* 0,103 48 0,200* Ver´ın 0,12 64 0,023 0,139 64 0,004 Viana 0,118 16 0,200* 0,196 16 0,1 O Baixo Mi˜no 0,06 80 0,200* 0,074 80 0,200* Caldas 0,05 80 0,200* 0,06 80 0,200* O Condado 0,07 80 0,200* 0,072 80 0,200* Deza 0,057 128 0,200* 0,067 128 0,200* O Morrazo 0,055 160 0,200* 0,049 160 0,200* A Paradanta 0,158 32 0,042 0,143 32 0,094 Pontevedra 0,038 256 0,200* 0,056 256 0,054 O Saln´es 0,041 224 0,200* 0,048 224 0,200* T.-T. de Montes 0,088 80 0,193 0,092 80 0,09 Vigo 0,023 864 0,200* 0,031 864 0,052

Tabla 4.2: Test de normalidad para las variables transformadas

Nota*: 0, 200 es el valor m´aximoque nos proporciona SPSS del p-valor del es- tad´ısticode contraste, el p-valor verdadero es m´asalto.

Analizando la Tabla 4.2 se puede aceptar que las variables transformadas provienen de una distribuci´onnormal en practicamente todas las 51 comarcas (s´olo3 rechazos para el ingreso medio mensual y 11 rechazos para el ingreso equivalente mensual), con un nivel de significaci´onde α = 0, 05.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 25 mensual por comarca en los hogares gallegos A continuaci´onse grafican los histogramas y los gr´aficosQ-Q normales para las 2 variables transformadas:

Histograma Histograma

500 Media =4,89 Media =4,39 Desviación típica =0,73 Desviación típica =0,539 N =6.304 N =6.304 600 400

300 400 Frecuencia Frecuencia 200

200

100

0 0 2,00 3,00 4,00 5,00 6,00 7,00 8,00 2,00 3,00 4,00 5,00 6,00 7,00 ftot_hogar_tr ftot_equiv_hogar_tr

(a) ingreso0,22 (b) ingreso equivalente0,22

Figura 4.3: Histogramas variables transformadas

Gráfico Q-Q normal de ftot_hogar_tr Gráfico Q-Q normal de ftot_equiv_hogar_tr

5,0 5,0

2,5 2,5

0,0 0,0 Normal esperado Normal esperado -2,5 -2,5 Page 1 Page 1

-5,0 -5,0

2 4 6 8 2 4 6 8 Valor observado Valor observado (a) ingreso0,22 (b) ingreso equivalente0,22

Figura 4.4: Gr´aficasQ-Q normal variables transformadas

Las Figuras 4.3 y 4.4 nos muestran que la distribuci´onde las variables transfor- madas se aproximan a una distribuci´onnormal. Vemos adem´asen la Figura 4.4 que los valores peque˜nosde las variables transformadas no se aproximan a los valores normales esperados. Esto se debe a que para estos hogares su ingreso mensual (< 100 euros) est´amuy por debajo dePage la1 media global (1614 euros) y por Page 1 tanto se pueden considerar como valores at´ıpicos.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 26 mensual por comarca en los hogares gallegos Una vez analizada la normalidad de las variables, se genera una variable auxiliar temp con una distribuci´onnormal de la siguiente manera:

2 tempj ∼ N(zd, sd(z)), j ∈ Pd, d = 1,..., 51 donde  P   P 0,22  s zj s ftot hogarj   1 1 z1  n   n   1   1   .   .   .  z =  .  =  .  =  .   P   0,22  z51 zj P ftot hogar  s51   s51 j  n51 n51

2 siendo nd, zd y sd(z) respectivamente el tama˜nomuestral real, la media muestral real y la cuasivarianza muestral real de la variable transformada para la comarca d. Adem´asdefinimos Pd como el conjunto de todo los hogares de la comarca d en la poblaci´onficticia.

De esta forma hemos generado una variable temp con aproximadamente la misma distribuci´onnormal que la variable transformada ftot hogar0,22. Ahora se crea la variable de inter´es ingreso, haciendo una transformaci´onde la variable auxiliar temp con potencia inversa:

(1/0,22) 4,55 ingresoj = tempj = tempj , j ∈ Pd, d = 1,..., 51 Se ha generado la variable ingreso para todos los hogares de la poblaci´onde tal forma que existe variabilidad entre las comarcas seg´unla informaci´onobtenida de la muestra real.

La siguiente variable que se genera:

• Pers hogarj: N´umerode miembros del hogar j. La generaci´onde esta variable es m´ascomplicada que las otras ya que debe tener una cierta correlaci´oncon la variable ingreso; se define de la siguiente manera:

pers hogarj ∼ P oisson(λj − 1) + 1, j ∈ Pd, d = 1,..., 51

donde ! temp − z λ = 1/4 j d + ρ , j ∈ P , d = 1,..., 51 j p 2 d d sd(z)

siendo ρd la media muestral real de personas por hogar para la comarca d. Se usa la distribuci´onde Poisson con este par´ametroya que:

E(pers hogarj) = λj − 1 + 1 = λj

y de esta forma se consigue el hecho de que no se genera ning´unhogar con 0 miembros. Tambi´encabe se˜nalarque el par´ametro λj est´arelacionado con el ingreso mensual del hogar j.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 27 mensual por comarca en los hogares gallegos Finalmente se construye la variable:

• Ingreso equivj: Ingreso equivalente mensual del hogar j. La generaci´onde esta variable es f´aciluna vez definidas las variables ingreso y pers hogar:

ingresoj ingreso equivj = p , j = 1,...,N pers hogarj Resumiendo, se ha generado una poblaci´onde N = 943991 hogares con las si- guientes variables: • Comarca: n´umerode comarca a la que pertenece el hogar. • Estrato: n´umerode estrato al que pertenece el hogar. • Ingreso: ingreso mensual del hogar. • Pers hogar: n´umerode miembros del hogar. • Ingreso equiv: ingreso equivalente mensual del hogar.

4.2 Resultados Sobre la poblaci´ongenerada se calcula el sesgo relativo absoluto (SRA) y la ra´ız cuadrada del error cuadr´aticomedio relativo (RECMR) de la siguiente manera: 1. Generar K = 10.000 muestras independientes de nuestra poblaci´on. 2. Para cada muestra k = 1,...,K calcular el estimador del ingreso mensual (k) (k) Yb d y el estimador del MSE del ingreso mensual mse(Yb d) . 3. Calculamos el SRA:

(k) K 1 X Yb d − Y d SRAd(Yb d) = × 100 K Y k=1 d

K (k) 1 X mse(Yb d) − MSE(Yb d) SRA (mse(Yb )) = × 100 d d K k=1 MSE(Yb d) 4. Calculamos el RECMR:

1/2  (k) 2 K   1 X Yb d − Y d RECMRd(Yb d) =     × 100 K Y  k=1 d

 21/2 K (k) ! 1 X mse(Yb d) − MSE(Yb d) RECMR (mse(Yb )) = × 100 d d K  k=1 MSE(Yb d)

Estimaci´onen ´areaspeque˜nas:el ingreso medio 28 mensual por comarca en los hogares gallegos Los estimadores usados en el estudio son los siguientes: • HT: Estimador Horvitz-Thompson. • POST sint: Estimador postestratificado sint´etico.

• COMP1: Estimador compuesto con par´ametro δ = 1. • COMP2: Estimador compuesto con par´ametro δ = 3/2. • COMP3: Estimador compuesto con par´ametro δ = 2. • FH: Estimador Fay-Herriot.

Hay que se˜nalarque el estimador compuesto del ingreso medio mensual con par´ametro δ = 3/2 es el que mejor resultados obtiene de los 3 compuestos. Se presentan a continuaci´onlos resultados de los estimadores con respecto al SRA y RECMR.

SRA ingreso medio en %

HT POST sint COMP2 FH 30

25

20

15

10

5

0 15 17 19 31 32 34 36 42 46 48 49 49 64 73 78 83 85 104 117 128 148 179 256 352 416 864 Tamaño muestral

Figura 4.5: SRA (en %) de los estimadores del ingreso medio mensual.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 29 mensual por comarca en los hogares gallegos RECMR ingreso medio en %

HT POST sint COMP2 FH 30

25

20

15

10

5

0 15 17 19 31 32 34 36 42 46 48 49 49 64 73 78 83 85 104 117 128 148 179 256 352 416 864 Tamaño muestral

Figura 4.6: RECMR (en %) de los estimadores del ingreso medio mensual.

En las Figuras 4.5 y 4.6 se observa que el estimador con peores resultados seg´un los valores del SRA y el RECMR es el estimador sint´etico.En cuanto al RECMR hay que destacar en la Figura 4.6 que en las comarcas con menor tama˜nomues- tral (≤ 48) existe una diferencia notable entre los estimadores. Los estimadores con mejores resultados seg´unel RECMR son el compuesto y el Fay-Herriot, los SRA son parecidos en ambos casos. Adem´ascabe se˜nalarque el estimador Fay- Herriot se comporta mejor que el estimador compuesto para las ´areascon tama˜no muestral m´aspeque˜no(≤ 48). Estos resultados llevan a considerar al estimador Fay-Herriot como principal candidato en la aplicaci´onal caso real.

Los estimadores del MSE del ingreso medio mensual que se usan son los siguientes:

• mse HT anal´ıtico: mse anal´ıticodel estimador Horvitz-Thompson.

• mse HT B: mse bootstrap del estimador Horvitz-Thompson.

• mse POST sint anal´ıtico: mse anal´ıticodel estimador postestratificado sint´etico.

• mse POST sint B: mse bootstrap del estimador postestratificado sint´etico.

• mse COMP2 anal´ıtico: mse anal´ıticodel estimador compuesto con par´ametro δ = 3/2.

• mse COMP2 B: mse bootstrap del estimador compuesto con par´ametro δ = 3/2.

• mse FH anal´ıtico: mse anal´ıticodel estimador Fay-Herriot.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 30 mensual por comarca en los hogares gallegos • mse FH B: mse bootstrap del estimador Fay-Herriot. A continuaci´on,en la Tabla 4.3, se muestra el promedio de SRA y RECMR de las 51 comarcas para cada estimador del MSE:

estimador SRA RECMR mse HT anal´ıtico 2,75 34,07 mse HT B 2,41 34,56 mse POST sint anal´ıtico 108,81 242,23 mse POST sint B 56,09 60,00 mse COMP2 anal´ıtico 35,27 92,85 mse COMP2 B 35,05 42,80 mse FH anal´ıtico 22,00 32,68 mse FH B 21,58 32,70

Tabla 4.3: Promedio en la estimaci´ondel MSE.

Se observa en la Tabla 4.3 que para cualquier estimador postestratificado sint´etico su promedio del SRA y del RECMR es elevado comparado con los valores de los dem´asestimadores. A consecuencia de esto queda descartado el estimador postes- tratificado sint´etico para el resto del estudio.

Adem´asse observan valores parecidos en las estimaciones anal´ıticasy bootstrap para los estimadores Horvitz-Thompson y Fay-Herriot. Para el estimador com- puesto se tiene un valor del RECMR mucho m´asbajo en la estimaci´onbootstrap. A continuaci´onse puede ver con m´asdetalle:

SRA mse HT ingreso medio en %

HT analítico HT B 14

12

10

8

6

4

2

0 16 16 16 32 32 32 32 48 48 48 48 48 64 80 80 80 80 96 112 128 144 176256 352 416 864 Tamaño muestral

Figura 4.7: SRA (en %) de los mse del estimador Horvitz-Thompson.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 31 mensual por comarca en los hogares gallegos RECMR mse HT ingreso medio en % HT analítico HT B 100

90

80

70

60

50

40

30

20

10

0 16 16 16 32 32 32 32 48 48 48 48 48 64 80 80 80 80 96 112 128 144 176 256 352 416 864 Tamaño muestral

Figura 4.8: RECMR (en %) de los mse del estimador Horvitz-Thompson.

SRA mse COMP ingreso medio en %

COMP analítico COMP B 140

120

100

80

60

40

20

0 16 16 16 32 32 32 32 48 48 48 48 48 64 80 80 80 80 96 112 128 144 176 256 352 416 864 Tamaño muestral

Figura 4.9: SRA (en %) de los mse del estimador compuesto.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 32 mensual por comarca en los hogares gallegos RECMR mse COMP ingreso medio en %

COMP analítico COMP B 350

300

250

200

150

100

50

0 16 16 16 32 32 32 32 48 48 48 48 48 64 80 80 80 80 96 112 128 144 176 256 352 416 864 Tamaño muestral

Figura 4.10: RECMR (en %) de los mse del estimador compuesto.

SRA mse FH ingreso medio en %

FH analítico FH B 100

90

80

70

60

50

40

30

20

10

0 16 16 16 32 32 32 32 48 48 48 48 48 64 80 80 80 80 96 112 128 144 176 256 352 416 864 Tamaño muestral

Figura 4.11: SRA (en %) de los mse del estimador Fay-Herriot.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 33 mensual por comarca en los hogares gallegos RECMR mse FH ingreso medio en %

FH analítico FH B 100

90

80

70

60

50

40

30

20

10

0 16 16 16 32 32 32 32 48 48 48 48 48 64 80 80 80 80 96 112 128 144 176 256 352 416 864 Tamaño muestral

Figura 4.12: RECMR (en %) de los mse del estimador Fay-Herriot.

Se observa en las Figuras 4.7, 4.8, 4.9, 4.10, 4.11 y 4.12 que es m´asdif´ıciles- timar el te´oricoMSE para las comarcas con menor tama˜nomuestral, como era de esperar. Adem´asen las Figuras 4.7, 4.8, 4.11 y 4.12 se ve que existe poca diferencia entre la estimaci´onanal´ıticay bootstrap del MSE para los estimadores Horvitz-Thompson y Fay-Herriot. En estos casos hay que destacar que el esti- mador bootstrap es una buena alternativa al estimador anal´ıtico. La diferencia entre la estimaci´onanal´ıticay bootstrap del MSE del estimador compuesto es notable, la Figura 4.10 muestra que en este caso el estimador bootstrap obtiene mejores resultados que el estimador anal´ıtico. Por estas razones, a partir de ahora se utiliza s´oloel estimador bootstrap del MSE de los estimadores.

Hay que se˜nalarque no est´anincluidos los resultados para la estimaci´onrela- tiva al ingreso equivalente mensual, pues son parecidos a los resultados de esta secci´on.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 34 mensual por comarca en los hogares gallegos 5 Caso real

Hay que destacar, en primer lugar, que teniendo en cuenta el proceso de mejora de estimaci´onde datos en ´areaspeque˜nasen el que se encuentra el IGE, los datos que se presentan a lo largo de esta secci´ontienen el car´acterde datos experimentales, con lo que no se pueden considerar estad´ısticaoficial.

Como se vi´oen la secci´onanterior, no se puede dar el MSE estimado del esti- mador postestratificado con garant´ıas. En el estudio de simulaci´onse obtienen valores elevados en la estimaci´ondel MSE (en cuanto al SRA y RECMR). Por lo tanto, nos quedamos con los estimadores Horvitz-Thompson, compuesto y Fay- Herriot.

Se dan las estimaciones de las variables objetivo para cada comarca y su coe- ficiente de variaci´onestimado (CV): q mse(Yb d) CVd = × 100, d = 1,..., 51 Yb d Hay que se˜nalarque para las estimaciones por bootstrap del MSE, se toman B = 5000 remuestras bootstrap.

5.1 Resultados Se muestran ahora los resultados acerca de la estimaci´ondel ingreso medio men- sual:

Ingreso medio en €

HT COMP2 FH 1950

1850

1750

1650

1550

1450

1350

1250

1150

1050

950 Vigo Noia Lugo Deza Verín Meira Viana O Sar O Ferrol Arzúa Eume Sarria Xallas Ordes Muros Caldas A Ulloa A Ortegal A Limia A Fisterra Quiroga Ourense Santiago O Salnés O Betanzos O Ribeiro O A Coruña A Barbanza A Barcala A Chantada Terra Chá Terra O Morrazo O Valdeorras BaixaLimia Condado O Pontevedra Os Ancares Os A Mariña A Or Bergantiños O Carballiño O A Paradanta A O Baixo Miño O A Mariña A Occ T. deCaldelas T. Allariz-Maceda T. deCelanova T. Terra deTerraMelide Terra deTerraLemos A Mariña A Central Tabeirós-Montes Terra deTerraSoneira

Figura 5.1: Estimaci´ondel ingreso medio mensual en las comarcas de Galicia. Nota: datos experimentales.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 35 mensual por comarca en los hogares gallegos CV ingreso medio en %

HT B COMP2 B FH B 45

40

35

30

25

20

15

10

5

0 Vigo Noia Lugo Deza Verín Meira Viana O Sar O Ferrol Eume Arzúa Sarria Xallas Ordes Muros Caldas A Ulloa A Ortegal A Limia A Fisterra Quiroga Ourense Santiago O Salnés O Betanzos O Ribeiro O A Coruña A Barbanza A Barcala A Chantada Terra Chá Terra O Morrazo O Valdeorras O Condado O BaixaLimia Pontevedra Os Ancares Os Bergantiños A Mariña A Or O Carballiño O A Paradanta A O Baixo Miño O A Mariña A Occ T. deCaldelas T. Allariz-Maceda T. deCelanova T. Terra deTerraMelide Terra deTerraLemos A Mariña A Central Tabeirós-Montes Terra deTerraSoneira

Figura 5.2: Estimaci´ondel CV (en %) de los estimadores del ingreso medio men- sual en las comarcas de Galicia. Nota: datos experimentales.

A continuaci´onse muestran los resultados de la estimaci´ondel ingreso equivalente mensual:

Ingreso equivalente en €

HT COMP3 FH 1100

1050

1000

950

900

850

800

750

700

650

600 Vigo Noia Lugo Deza Verín Meira Viana O Sar O Ferrol Arzúa Eume Sarria Xallas Ordes Muros Caldas A Ulloa A Ortegal A Limia A Fisterra Quiroga Ourense Santiago O Salnés O Betanzos O Ribeiro O A Coruña A Barbanza A Barcala A Chantada Terra Chá Terra O Morrazo O Valdeorras BaixaLimia Condado O Pontevedra Os Ancares Os A Mariña A Or Bergantiños O Carballiño O A Paradanta A O Baixo Miño O A Mariña A Occ T. deCaldelas T. Allariz-Maceda T. deCelanova T. Terra deTerraMelide Terra deTerraLemos A Mariña A Central Tabeirós-Montes Terra deTerraSoneira

Figura 5.3: Estimaci´ondel ingreso equivalente mensual en las comarcas de Galicia. Nota: datos experimentales.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 36 mensual por comarca en los hogares gallegos CV ingreso equivalente en %

HT B COMP3 B FH B 40

35

30

25

20

15

10

5

0 Vigo Noia Lugo Deza Verín Meira Viana O Sar O Ferrol Eume Arzúa Sarria Xallas Ordes Muros Caldas A Ulloa A Ortegal A Limia A Fisterra Quiroga Ourense Santiago O Salnés O Betanzos O Ribeiro O A Coruña A Barbanza A Barcala A Chantada Terra Chá Terra O Morrazo O Valdeorras O Condado O BaixaLimia Pontevedra Os Ancares Os Bergantiños A Mariña A Or O Carballiño O A Paradanta A O Baixo Miño O A Mariña A Occ T. deCaldelas T. Allariz-Maceda T. deCelanova T. Terra deTerraMelide Terra deTerraLemos A Mariña A Central Tabeirós-Montes Terra deTerraSoneira

Figura 5.4: Estimaci´ondel CV (en %) de los estimadores del ingreso equivalente mensual en las comarcas de Galicia. Nota: datos experimentales.

Las comarcas en las Figuras 5.1, 5.2, 5.3 y 5.4 est´anordenadas seg´unsu tama˜no muestral. Se observa en las Figuras 5.1 y 5.3 que los valores m´asaltos de las variables objetivo se obtienen en las comarcas con mayor tama˜nomuestral. Pontevedra es la comarca con los valores m´asaltos con un ingreso medio mensual de cerca de 1.900 euros y un ingreso equivalente mensual de aproximadamente 1.075 euros. A Baixa Limia es la comarca con los valores m´asbajos con un in- greso medio mensual de aproximadamente 1.000 euros y un ingreso equivalente mensual entorno a los 675 euros.

En las Figuras 5.2 y 5.4 se observa que el estimador Fay-Herriot obtiene mejores resultados en cuanto al CV, sobre todo para las comarcas con menor tama˜no muestral. Por ejemplo, en las Figuras 5.2 y 5.4 hay una diferencia del 25% en- tre los CV de los estimadores en la comarca de Allariz-Maceda. Adem´as,en la Figura 5.1 existe una gran diferencia (de aproximadamente 400 euros) entre las estimaciones (utilizando el estimador de HT y el de FH) del ingreso medio mensual para la comarca de Os Ancares. En la estimaci´ondel ingreso equivalente mensual (Figura 5.3) hay una diferencia a´unm´asnotable (de casi 300 euros). Esto es de- bido a que en esta comarca el estimador Fay-Herriot da m´aspeso a la informaci´on auxiliar que a la informaci´onmuestral, los estimadores basados en el dise˜nos´olo usan la informaci´onmuestral. Para estas comarcas se coge el estimador con menor coeficiente de variaci´onque es el estimador Fay-Herriot.

En las Figuras 5.2 y 5.4 se ve que el estimador compuesto tambi´enobtiene buenos resultados. Sin embargo, el estimador Fay-Herriot es un estimador m´asestable que el estimador compuesto. En la estimaci´ondel ingreso medio mensual (Figura 5.2)

Estimaci´onen ´areaspeque˜nas:el ingreso medio 37 mensual por comarca en los hogares gallegos el estimador Fay-Herriot consigue coeficientes de variaci´onestimados inferiores al 10% para todas las comarcas. En la estimaci´ondel ingreso equivalente mensual (Figura 5.4) los coeficientes de variaci´onson inferiores al 7%.

Representamos geogr´aficamente la estimaci´onFay-Herriot del ingreso medio men- sual:

Figura 5.5: Ingreso medio mensual por hogar (Fay-Herriot). Nota: datos experimentales.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 38 mensual por comarca en los hogares gallegos A continuaci´onla estimaci´onFay-Herriot del ingreso equivalente mensual:

Figura 5.6: Ingreso equivalente mensual por hogar (Fay-Herriot). Nota: datos experimentales.

En las Figuras 5.5 y 5.6 las comarcas est´anpintadas seg´ununa escala de color azul, en donde el color blanco indica el valor m´asbajo y el azul oscuro el m´asalto. Las comarcas A Fonsagrada y Terra de Trives est´anrepresentadas en rojo ya que para ellas no se dispone de datos muestrales.

De las 4 provincias gallegas se observa que los valores m´asbajos est´anen las comarcas de la provincia de Ourense y los valores m´asaltos en las comarcas de las 7 grandes ciudades gallegas y la comarca de Eume. Se observan tambi´enva- lores altos en la variable objetivo en muchas de las comarcas occidentales de las provincias de A Coru˜nay Pontevedra y las comarcas da Mari˜naLucense.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 39 mensual por comarca en los hogares gallegos 6 Conclusiones

Los modelos de ´areaspeque˜nasdescritos en este documento permiten obtener estimaciones del ingreso medio y el ingreso equivalente de la Encuesta de condi- ciones de vida a nivel comarcal. Los resultados obtenidos son satisfactorios con car´actergeneral, dado que los coeficientes de variaci´onobtenidos son moderados. De todos modos, el estimador Fay-Herriot es el que obtiene los mejores resultados, con coeficientes de variaci´onen la estimaci´ondel ingreso medio mensual inferiores al 10% y en la estimaci´ondel ingreso equivalente mensual inferiores al 7% para todas las comarcas. En las comarcas con menor tama˜nomuestral (≤ 48) existe mucha diferencia entre los estimadores, esta llega a un 25% en favor del estimador Fay-Herriot en la comarca de Allariz-Maceda.

No se puede considerar mejor ning´unestimador (anal´ıticoo bootstrap) del MSE en los casos Horvitz-Thompson y Fay-Herriot, pues los valores del SRA y RECMR est´ancercanos. En el caso del estimador compuesto funciona mejor el estimador bootstrap del MSE.

Respecto al estimador postestratificado sint´etico,queda abierta la b´usquedade otros estimadores sint´eticosque nos den menor error de precisi´onen la estimaci´on de las variables objetivo. De esta manera se podr´amejorar la estimaci´ondel es- timador compuesto ya que se vi´oque se obten´ıanbuenos resultados en el estudio de simulaci´on.

El IGE sigue estudiando el uso de la metodolog´ıade ´areaspeque˜nascon el objetivo de continuar su aplicaci´onen otras encuestas y otras ´areasde inter´es.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 40 mensual por comarca en los hogares gallegos Referencias

Efron, B. and Tibshirani, R. J. (1993), An Introduction to the Bootstrap, Chapman and Hall, New York. Eustat (2008), “Estimaci´onde ´areaspeque˜nasen la encuesta de poblaci´onen relaci´oncon la actividad de la C.A. de Euskadi”, Eustat .

Fay, R. E. and Herriot, R. A. (1979), “Estimates of income for small places: An application of James-Stein procedures to census data”, Journal of the American Statistical Association , Vol. 74, pp. 269–277. Gonz´alez-Manteiga, W., Lombard´ıa, M. J., Molina, I., Morales, D. and Santa- mar´ıa,L. (2008), “Analytic and bootstrap approximations of prediction errors under a multivariate Fay-Herriot model”, Computational Statistics and Data Analysis , Vol. 52, pp. 5242–5252. Jiang, J. and Lahiri, P. (2006), “Mixed model prediction and small area estima- tion”, Test , Vol. 15, pp. 1–96. Lombard´ıaCorti˜na,M. J. and Morales Gonz´alez,D. (2008), Estimaci´onen ´areas peque˜nas, Curso de estimaci´onen ´areaspeque˜nas. L´opez Pa˜nos, R. (2000), “Estimaci´on para ´areas peque˜nas(1)”, Estad´ıstica Espa˜nola , Vol. 42, pp. 291–338. Morales, D., Esteban, M. D., S´anchez, A., Santamar´ıa,L., Marhuenda, Y., P´erez, A., Saralegui, J. and Herrador, M. (2007), “Estimaci´onen ´areaspeque˜nascon datos de la encuesta de poblaci´onactiva en Canarias”, Estad´ıstica Espa˜nola , Vol. 49, pp. 301–332. Prasad, N. G. N. and Rao, J. N. K. (1990), “The estimation of the mean squared error of small-area estimators”, Journal of the American Statistical Association , Vol. 85, pp. 163–171.

Rao, J. N. K. (2003), Small Area Estimation, Wiley, New York. S¨arndal,C. E., Swensson, B. and Wretman, J. (1992), Model Assisted Survey Sampling, Springer. Ugarte Mart´ınez, D., Militino, A. F., Gonz´alezRamajo, B., Goicoa Mangado, T. and L´opez Sagaseta, M. (2005), Estimaci´ondel desempleo por comarcas en Navarra, Sexto Congreso de Econom´ıade Navarra.

Estimaci´onen ´areaspeque˜nas:el ingreso medio 41 mensual por comarca en los hogares gallegos Estimaci´onen ´areaspeque˜nas:el ingreso medio 42 mensual por comarca en los hogares gallegos