A Political Survey
Total Page:16
File Type:pdf, Size:1020Kb
Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif 1 Analyse d’une enquˆete pr´eelectorale Sommaire 1.1 Description .............................................. 1 1.2 Enonc´e ................................................. 2 1.1 Description Ce sondage ´etudie les liens entre la lecture d’un journal ou d’un magazine et les intentions de vote pour les ´elections pr´esidentielles de 2002 d’un panel d’´electeurs. Pour chacun des journaux ´etudi´es, on a interrog´e100 personnes lisant r´eguli`erement ce journal, et on leur a pos´ela question suivante, pour qui voteriez vous ? Le fichier http://www.math.unicaen.fr/~kauffman/data/candidats-journaux.txt contient les r´esultats de cette enquˆete. Les colonnes correspondents aux r´esultats par journaux, les lignes correspondent `ades candidats. Ce fichier contient 14 colonnes et 18 lignes. La premi`ere colonne contient les noms des candidats. La derni`ere colonne est la somme des pourcentage de lecture. Toutes les autres colonnes sont les pourcentage de lecture pour un journal pour chacun des candidats. Les journaux sont : La Croix, Le Figaro, Lib´eration, Le Monde, Le Parisien, Le Canard enchain´e, l’Express, Marianne, Le Nouvel Observateur, Paris Match, T´el´erama, Le point. table LACR LEFI LIBE LEMO LEPA LECA LEXP MARI NOUV PARI TELE LEPO TOTAL Laguiller 0 2 6 5 4 8 4 6 4 4 4 2 49 Besancenot 2 2 8 6 3 7 2 6 7 2 8 2 55 Hue 2 0 3 2 4 5 1 2 2 1 5 1 28 Jospin 3 7 41 26 12 29 15 19 35 15 28 7 237 Taubira 2 1 5 3 2 2 2 3 3 0 4 3 30 Chevenement 2 2 5 5 4 7 4 15 5 2 7 2 60 Mamere 4 1 10 7 6 9 5 4 8 2 13 1 70 Lepage 5 3 0 2 1 2 2 2 1 2 2 2 24 Sain.Joss 3 1 1 1 1 4 3 3 1 3 0 1 22 Bayrou 20 8 2 5 6 4 8 10 6 7 10 8 94 Madelin 2 9 2 4 2 2 9 5 3 4 3 9 54 Chirac 29 35 9 18 23 8 22 9 14 29 9 41 246 Boutin 8 3 0 1 2 0 1 1 1 2 2 2 23 Megret 2 3 0 2 2 2 5 3 0 2 0 1 22 Le.pen 14 22 7 12 27 10 16 10 9 22 3 16 168 Blanc 2 1 1 1 1 1 1 2 1 3 2 2 18 Somme 100 100 100 100 100 100 100 100 100 100 100 100 1200 Table 1 – R´esultats enquˆetes Christine Boutin FRS divers droite Corinne Lepage CAP21 Ecolgiste Jean-Marie Le Pen FN Extr`eme droite Fran¸cois Bayrou UDF Olivier Besancenot LCR Extr`eme gauche Jean-Pierre Chevenement MDC gauche Jacques Chirac RPR Daniel Gluckstein Parti des travailleurs Robert Hue PCF Lionel Jospin PS Arlette Laguiller LO Lutte Ouvri`ere Alain Madelin DL Noel Mam`ere Les verts Brno M´egret MNR Ectr`eme droite Jean Saint-Josse CNPT Chasse Nature Peche et Tradition Christianne Marie Taubira-Delannon PRG Table 2 – Candidats d´eclar´es http://www.math.unicaen.fr/~kauffman/cours 1 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif 1.2 Enonc´e 1. Charger la librrarie ade4 et cr´eer la table X en lisant le fichier de donn´ees et ayant comme noms de colonnes les journaux et comme nom de lignes les candidats. Supprimer la derni`ere ligne et la derni`ere colonne. Faire une repr´esentation graphique du tableau brut `al’aide de la fonction ade4::table.value. require(ade4) DATA="http://www.math.unicaen.fr/~kauffman/data/" X=read.table(paste(DATA,"candidats-journaux.txt",sep=""),sep=";",header=TRUE,row.names=1) X=X[-dim(X)[1],-dim(X)[2]] table.value(X) LA.CROIX LE.FIGARO LIBE LE.MONDE LE.PARISIEN LE.CANARD L.EXPRESS MARIANNE NOUVEL.OBS PARIS.MATCH TELERAMA LE.POINT Laguiller Besancenot Hue Jospin Taubira Chevenement Mamere Lepage Sain.Joss Bayrou Madelin Chirac Boutin Megret Le.pen Blanc 5 15 25 35 45 Figure 1 – Tableau brut 2. Est ce que le tableau de donn´ees est un tableau de contingence? apply(X,2,sum) # tous les journaux sont `apoids ´egaux 100 3. On consid`erera dans toute la suite que x est un tableau de contingence. Faire une analyse factorielle des corres- pondances de X `al’aide de la fonction dudi.afc en ne conservant que les trois premiers axes principaux. afc=dudi.coa(X,nf=3,scannf=FALSE) 4. Quel est le poids de la ligne Laguiller? de la colonne La Croix ? Calculez les poids des lignes ou frequences marginales des lignes, le poids des colonnes ou fr´equences marginales des colonnes ? afc$lw["Laguiller"] # poids Laguiller 49/1200 afc$cw["LA.CROIX"] # La Croix 100/1200 poids ´egal sur colonne cbind(apply(X,1,sum)/sum(X),afc$lw) # poids des lignes cbind(apply(X,2,sum)/sum(X),afc$cw) # poids des colonnes 5. Quelles sont les dimensions de la table X ? Combien va t-il y avoir de valeurs singuli`eres. Tracez l’´eboulis des valeurs propres. Quelle est l’inertie totale ? dim(X) length(afc$eig) barplot(afc$eig, names.arg=paste("lambda",1:length(afc$eig),sep=""), main='Eboulis des valeurs propres') sum(afc$eig) http://www.math.unicaen.fr/~kauffman/cours 2 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif Eboulis des valeurs propres 0.00 0.05 0.10 0.15 0.20 lambda1 lambda2 lambda3 lambda4 lambda5 lambda6 lambda7 lambda8 lambda9 lambda10 Figure 2 – Eboulis des valeurs propres 6. Dans cette question, on ´etude la matrice de liaison entre les intentions de votes et le choix du journal. transform´ee `apartir du tableau de contingence). (a) Calculez de deux mani`eres diff´erentes l’indice de liaison entre les sympatisants de Besancenot et les lecteurs du Canard Enchain´e. Expliquez. (p.besancenot=sum(X["Besancenot",])/sum(X)) # 0.046 (p.LE.CANARD=sum(X[,"LE.CANARD",])/sum(X)) # 0.083 X["Besancenot","LE.CANARD"]/sum(X)/p.besancenot/p.LE.CANARD-1 # 0.53 afc$tab["Besancenot","LE.CANARD"] #0.53 (b) Tracez les profils colonnes de la matrice de liaison. Quels sont les profils semblables, oppos´es ? par(mfrow=c(3,4)); for (i in 1:ncol(afc$tab)) barplot(t(afc$tab)[i,],names.arg=rep("",16),main=dimnames(afc$tab)[[2]][i]) par(mfrow=c(1,1)) LA.CROIX LE.FIGARO LIBE LE.MONDE −0.4 0.0 0.2 −1 0 1 2 3 −1.0 0.0 0.5 1.0 −1.0 0.0 0.5 1.0 LE.PARISIEN LE.CANARD L.EXPRESS MARIANNE −0.4 0.0 0.4 0.8 −0.5 0.5 1.5 −0.5 0.5 1.5 −1.0 0.0 0.5 1.0 NOUVEL.OBS PARIS.MATCH TELERAMA LE.POINT −0.5 0.0 0.5 1.0 −1.0 −0.5 0.0 0.5 −1.0 0.0 0.5 1.0 −1.0 0.0 0.5 1.0 Figure 3 – Profils lignes (c) Tracez sur une mˆeme figure les profils colonnes des deux journaux Le Figaro et Le canard enchain´e. http://www.math.unicaen.fr/~kauffman/cours 3 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif colonnes=c(LE.FIGARO='blue',LE.CANARD='red') barplot(t(as.matrix(afc$tab[,names(colonnes)])), beside=TRUE, names.arg=dimnames(afc$tab)[[1]], col=colonnes, main="Profils colonnes") legend("topright",names(colonnes),fill=colonnes) Profils colonnes −1.0 −0.5 0.0 0.5 1.0 Laguiller Hue Taubira Lepage Bayrou Chirac Megret Blanc Figure 4 – Profils colonnes oppos´es (d) Tracez sur une mˆeme figure les profils lignes de la matrice de liaison. Quels sont les profils semblables, oppos´es ? par(mfrow=c(4,4)); for (i in 1:nrow(afc$tab)) barplot(as.matrix(afc$tab[i,]),names.arg=rep("",ncol(afc$tab)),main=dimnames(afc$tab)[[1]][i par(mfrow=c(1,1)) http://www.math.unicaen.fr/~kauffman/cours 4 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif Laguiller Besancenot Hue Jospin −0.5 1.0 −0.4 0.4 −1.0 0.5 −1.0 0.5 Taubira Chevenement Mamere Lepage −0.5 1.0 −0.5 1.0 −1.0 0.5 −1.0 0.5 Sain.Joss Bayrou Madelin Chirac −0.5 1.0 −0.4 0.6 −0.5 0.5 −1.0 0.5 Boutin Megret Le.pen Blanc −0.5 0.5 −0.2 0.6 −1 1 3 −1.0 0.5 Figure 5 – Profils lignes (e) Calculez les correlations entre les profils lignes de la matrice de liaison. Puis afficher la correlation entre les profils lignes des sympatisants de Chevenement et les autres candidats. Interpr´etez. correlation.lignes=cor(t(afc$tab)) barplot(correlation.lignes["Chevenement",], main=c("corr´elation entre les indices de liaisons de lecture", "des sympatisants de Chevenement et des autres candidats"),cex.main=0.5) corrélation entre les indices de liaisons de lecture des sympatisants de Chevenement et des autres candidats −0.5 0.0 0.5 1.0 Laguiller Hue Taubira Lepage Madelin Boutin Le.pen Figure 6 – Correlations Chevenement avec les autres 7. Afficher la matrice de corr´elations entre les profils lignes de la matrice ligne `al’aide de la fonction ade4::table.value.