Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif

1 Analyse d’une enquˆete pr´eelectorale

Sommaire 1.1 Description ...... 1 1.2 Enonc´e ...... 2

1.1 Description Ce sondage ´etudie les liens entre la lecture d’un journal ou d’un magazine et les intentions de vote pour les ´elections pr´esidentielles de 2002 d’un panel d’´electeurs. Pour chacun des journaux ´etudi´es, on a interrog´e100 personnes lisant r´eguli`erement ce journal, et on leur a pos´ela question suivante, pour qui voteriez vous ? Le fichier http://www.math.unicaen.fr/~kauffman/data/candidats-journaux.txt contient les r´esultats de cette enquˆete. Les colonnes correspondents aux r´esultats par journaux, les lignes correspondent `ades candidats. Ce fichier contient 14 colonnes et 18 lignes. La premi`ere colonne contient les noms des candidats. La derni`ere colonne est la somme des pourcentage de lecture. Toutes les autres colonnes sont les pourcentage de lecture pour un journal pour chacun des candidats. Les journaux sont : La Croix, Le Figaro, Lib´eration, , Le Parisien, Le Canard enchain´e, l’Express, Marianne, Le Nouvel Observateur, Match, T´el´erama, Le point.

table LACR LEFI LIBE LEMO LEPA LECA LEXP MARI NOUV PARI TELE LEPO TOTAL Laguiller 0 2 6 5 4 8 4 6 4 4 4 2 49 Besancenot 2 2 8 6 3 7 2 6 7 2 8 2 55 Hue 2 0 3 2 4 5 1 2 2 1 5 1 28 Jospin 3 7 41 26 12 29 15 19 35 15 28 7 237 Taubira 2 1 5 3 2 2 2 3 3 0 4 3 30 Chevenement 2 2 5 5 4 7 4 15 5 2 7 2 60 Mamere 4 1 10 7 6 9 5 4 8 2 13 1 70 Lepage 5 3 0 2 1 2 2 2 1 2 2 2 24 Sain.Joss 3 1 1 1 1 4 3 3 1 3 0 1 22 Bayrou 20 8 2 5 6 4 8 10 6 7 10 8 94 Madelin 2 9 2 4 2 2 9 5 3 4 3 9 54 Chirac 29 35 9 18 23 8 22 9 14 29 9 41 246 Boutin 8 3 0 1 2 0 1 1 1 2 2 2 23 Megret 2 3 0 2 2 2 5 3 0 2 0 1 22 Le.pen 14 22 7 12 27 10 16 10 9 22 3 16 168 Blanc 2 1 1 1 1 1 1 2 1 3 2 2 18 Somme 100 100 100 100 100 100 100 100 100 100 100 100 1200

Table 1 – R´esultats enquˆetes

Christine Boutin FRS divers droite Ecolgiste Jean-Marie Le Pen FN Extr`eme droite Fran¸cois Bayrou UDF LCR Extr`eme gauche Jean-Pierre Chevenement MDC gauche RPR Parti des travailleurs PCF PS LO Lutte Ouvri`ere DL Noel Mam`ere Les verts Brno M´egret MNR Ectr`eme droite Jean Saint-Josse CNPT Chasse Nature Peche et Tradition Christianne Marie Taubira-Delannon PRG

Table 2 – Candidats d´eclar´es

http://www.math.unicaen.fr/~kauffman/cours 1 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif

1.2 Enonc´e 1. Charger la librrarie ade4 et cr´eer la table X en lisant le fichier de donn´ees et ayant comme noms de colonnes les journaux et comme nom de lignes les candidats. Supprimer la derni`ere ligne et la derni`ere colonne. Faire une repr´esentation graphique du tableau brut `al’aide de la fonction ade4::table.value. require(ade4) DATA="http://www.math.unicaen.fr/~kauffman/data/" X=read.table(paste(DATA,"candidats-journaux.txt",sep=""),sep=";",header=TRUE,row.names=1) X=X[-dim(X)[1],-dim(X)[2]] table.value(X) LA.CROIX LE.FIGARO LIBE LE.MONDE LE.PARISIEN LE.CANARD L.EXPRESS MARIANNE NOUVEL.OBS PARIS.MATCH TELERAMA LE.POINT

Laguiller Besancenot Hue Jospin Taubira Chevenement Mamere Lepage Sain.Joss Bayrou Madelin Chirac Boutin Megret Le.pen Blanc

5 15 25 35 45

Figure 1 – Tableau brut

2. Est ce que le tableau de donn´ees est un tableau de contingence? apply(X,2,sum) # tous les journaux sont `apoids ´egaux 100 3. On consid`erera dans toute la suite que x est un tableau de contingence. Faire une analyse factorielle des corres- pondances de X `al’aide de la fonction dudi.afc en ne conservant que les trois premiers axes principaux. afc=dudi.coa(X,nf=3,scannf=FALSE) 4. Quel est le poids de la ligne Laguiller? de la colonne La Croix ? Calculez les poids des lignes ou frequences marginales des lignes, le poids des colonnes ou fr´equences marginales des colonnes ? afc$lw["Laguiller"] # poids Laguiller 49/1200 afc$cw["LA.CROIX"] # La Croix 100/1200 poids ´egal sur colonne cbind(apply(X,1,sum)/sum(X),afc$lw) # poids des lignes cbind(apply(X,2,sum)/sum(X),afc$cw) # poids des colonnes 5. Quelles sont les dimensions de la table X ? Combien va t-il y avoir de valeurs singuli`eres. Tracez l’´eboulis des valeurs propres. Quelle est l’inertie totale ? dim(X) length(afc$eig) barplot(afc$eig, names.arg=paste("lambda",1:length(afc$eig),sep=""), main='Eboulis des valeurs propres') sum(afc$eig)

http://www.math.unicaen.fr/~kauffman/cours 2 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif

Eboulis des valeurs propres 0.00 0.05 0.10 0.15 0.20 lambda1 lambda2 lambda3 lambda4 lambda5 lambda6 lambda7 lambda8 lambda9 lambda10

Figure 2 – Eboulis des valeurs propres

6. Dans cette question, on ´etude la matrice de liaison entre les intentions de votes et le choix du journal. transform´ee `apartir du tableau de contingence). (a) Calculez de deux mani`eres diff´erentes l’indice de liaison entre les sympatisants de Besancenot et les lecteurs du Canard Enchain´e. Expliquez. (p.besancenot=sum(X["Besancenot",])/sum(X)) # 0.046 (p.LE.CANARD=sum(X[,"LE.CANARD",])/sum(X)) # 0.083 X["Besancenot","LE.CANARD"]/sum(X)/p.besancenot/p.LE.CANARD-1 # 0.53 afc$tab["Besancenot","LE.CANARD"] #0.53 (b) Tracez les profils colonnes de la matrice de liaison. Quels sont les profils semblables, oppos´es ? par(mfrow=c(3,4)); for (i in 1:ncol(afc$tab)) barplot(t(afc$tab)[i,],names.arg=rep("",16),main=dimnames(afc$tab)[[2]][i]) par(mfrow=c(1,1))

LA.CROIX LE.FIGARO LIBE LE.MONDE −0.4 0.0 0.2 −1 0 1 2 3 −1.0 0.0 0.5 1.0 −1.0 0.0 0.5 1.0

LE.PARISIEN LE.CANARD L.EXPRESS MARIANNE −0.4 0.0 0.4 0.8 −0.5 0.5 1.5 −0.5 0.5 1.5 −1.0 0.0 0.5 1.0

NOUVEL.OBS PARIS.MATCH TELERAMA LE.POINT −0.5 0.0 0.5 1.0 −1.0 −0.5 0.0 0.5 −1.0 0.0 0.5 1.0 −1.0 0.0 0.5 1.0

Figure 3 – Profils lignes

(c) Tracez sur une mˆeme figure les profils colonnes des deux journaux Le Figaro et Le canard enchain´e. http://www.math.unicaen.fr/~kauffman/cours 3 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif

colonnes=c(LE.FIGARO='blue',LE.CANARD='red') barplot(t(as.matrix(afc$tab[,names(colonnes)])), beside=TRUE, names.arg=dimnames(afc$tab)[[1]], col=colonnes, main="Profils colonnes") legend("topright",names(colonnes),fill=colonnes)

Profils colonnes −1.0 −0.5 0.0 0.5 1.0 Laguiller Hue Taubira Lepage Bayrou Chirac Megret Blanc

Figure 4 – Profils colonnes oppos´es

(d) Tracez sur une mˆeme figure les profils lignes de la matrice de liaison. Quels sont les profils semblables, oppos´es ? par(mfrow=c(4,4)); for (i in 1:nrow(afc$tab)) barplot(as.matrix(afc$tab[i,]),names.arg=rep("",ncol(afc$tab)),main=dimnames(afc$tab)[[1]][i par(mfrow=c(1,1))

http://www.math.unicaen.fr/~kauffman/cours 4 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif

Laguiller Besancenot Hue Jospin −0.5 1.0 −0.4 0.4 −1.0 0.5 −1.0 0.5

Taubira Chevenement Mamere Lepage −0.5 1.0 −0.5 1.0 −1.0 0.5 −1.0 0.5

Sain.Joss Bayrou Madelin Chirac −0.5 1.0 −0.4 0.6 −0.5 0.5 −1.0 0.5

Boutin Megret Le.pen Blanc −0.5 0.5 −0.2 0.6 −1 1 3 −1.0 0.5

Figure 5 – Profils lignes

(e) Calculez les correlations entre les profils lignes de la matrice de liaison. Puis afficher la correlation entre les profils lignes des sympatisants de Chevenement et les autres candidats. Interpr´etez. correlation.lignes=cor(t(afc$tab)) barplot(correlation.lignes["Chevenement",], main=c("corr´elation entre les indices de liaisons de lecture", "des sympatisants de Chevenement et des autres candidats"),cex.main=0.5)

corrélation entre les indices de liaisons de lecture

des sympatisants de Chevenement et des autres candidats −0.5 0.0 0.5 1.0

Laguiller Hue Taubira Lepage Madelin Boutin Le.pen

Figure 6 – Correlations Chevenement avec les autres

7. Afficher la matrice de corr´elations entre les profils lignes de la matrice ligne `al’aide de la fonction ade4::table.value. table.value(correlation.lignes,cex=0.75)

http://www.math.unicaen.fr/~kauffman/cours 5 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif

Laguiller

Besancenot

Hue

Jospin

Taubira

Chevenement

Mamere

Lepage

Sain.Joss

Bayrou

Madelin

Chirac

Boutin

Megret

Le.pen

Blanc

−0.75 −0.25 0.25 0.75

Figure 7 – Profils lignes

8. Dans cette question on ´etudie si le fait de se d´eclarer sympatisant d’un candidat est ind´ependant du choix d’un quotidien. (a) Donnez la formule permettant de calculer le chi2 observ´e. Quel sont les degr´es de libert´es associ´es `ace chi2 ? Calculez de deux mani`eres diff´erentes le test d’ind´ependance. df=(dim(X)[1]-1)*(dim(X)[2]-1) # degr´ede libert´e chi2.obs=sum(afc$eig)*sum(X) proba=1-pchisq(chi2.obs,df=df) # 0!! chisq.test(X) # plus simple (b) Dessiner la densit´ede la loi du χ2(df) `al’aide de la fonciton dchisq. Quel est la probabilit´epour qu’une variable al´eatoire suivant une loi du χ2(df) soit plus petite que 397 ? x.chisq=seq(from=0,to=500,by=0.1) y.chisq=dchisq(x.chisq,df=df) plot(x.chisq,y.chisq,type="l",main="densit´ede la loi du chi2(165)") points(chi2.obs,0,col="red",pch="X") text(chi2.obs,0,"chi2 observe",pos=3)

http://www.math.unicaen.fr/~kauffman/cours 6 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif

densité de la loi du chi2(165) y.chisq

chi2 observe X 0.000 0.005 0.010 0.015 0.020

0 100 200 300 400 500

x.chisq

Figure 8 – Densit´ede χ2(df)

9. Dans cette question, on ´etudie les diff´erentes d´ecomposition de l’inertie. (a) Calculez les d´ecompositions de l’inertie inertie=inertia.dudi(afc,row.inertia=TRUE,col.inertia=TRUE) (b) Combien de valeurs singuli`eres faut -il retenir pour expliquer 80 % de l’inertie ? inertie$TOT

inertia cum ratio 1 0.21 0.21 0.62 2 0.05 0.25 0.76 3 0.03 0.29 0.86 4 0.02 0.31 0.92 5 0.01 0.31 0.95 6 0.01 0.32 0.97 7 0.00 0.33 0.99 8 0.00 0.33 0.99 9 0.00 0.33 1.00 10 0.00 0.33 1.00 11 0.00 0.33 1.00

Table 3 – D´ecomposition de l’inertie en somme des carr´es des valeurs singuli`eres

(c) Dans cette question, on ´etudie la d´ecomposition `al’aide de la norme des vecteurs colonnes. La table des cosinus carr´es est la table des 10000 ∗ cos2(Ii,U j), elle est g´en´erallement donn´ee cumul´ee : c’est `adire que l’on a 2 1 2 1 cos (Ii,U )+ ··· + cos (Ii,U j )= cos(Ii, RU + ··· RU j ) c’est le cosinus carr´eentre le i-`eme vecteur de la matrice de liaison avec le j-i`eme sous espace principal de l’espace des colonnes RU 1 + ··· RU j . inertie$col.cum

http://www.math.unicaen.fr/~kauffman/cours 7 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif

Comp1 Comp2 Comp3 remain LA.CROIX 5058.00 9626.00 9789.00 211.00 LE.FIGARO 8872.00 9510.00 9511.00 489.00 LIBE 8806.00 9127.00 9790.00 210.00 LE.MONDE 6742.00 8076.00 8365.00 1635.00 LE.PARISIEN 1957.00 2728.00 2730.00 7270.00 LE.CANARD 7487.00 7501.00 8128.00 1872.00 L.EXPRESS 2663.00 3719.00 6021.00 3979.00 MARIANNE 1650.00 2410.00 8903.00 1097.00 NOUVEL.OBS 7701.00 7774.00 9027.00 973.00 PARIS.MATCH 5854.00 7121.00 7121.00 2879.00 TELERAMA 6399.00 8482.00 8995.00 1005.00 LE.POINT 7271.00 7827.00 8213.00 1787.00

Table 4 – Table des cosinus carr´es cumul´es de l’espace des colonnes

Quels sont les journaux les mieux approxim´es par le premier plan principal, les moins bien approxim´es par le premier principal. Le premier plan principal explique quel pourcentage de l’inertie du journal Le Figaro ? (d) Qu’est ce que le cercle des corr´elations ? G.co=t(as.matrix(afc$tab))%*%diag(afc$lw)%*%as.matrix(afc$tab) normes.co=sqrt(diag(G.co)) s.corcircle(afc$co/normes.co)

LA.CROIX

TELERAMA

MARIANNE

LE.CANARD NOUVEL.OBS LIBE LE.POINT LE.PARISIEN LE.FIGAR L.EXPRESS LE.MONDE PARIS.MATCH

Figure 9 – Cercle des corr´elations

(e) Dans cette question, on ´etudie la qualit´ed’approximation des lignes. inertie$row.cum

http://www.math.unicaen.fr/~kauffman/cours 8 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif

Axis1 Axis2 Axis3 remain Laguiller 6284.00 7398.00 9068.00 932.00 Besancenot 9349.00 9494.00 9565.00 435.00 Hue 4407.00 5276.00 5336.00 4664.00 Jospin 9088.00 9367.00 9680.00 320.00 Taubira 4607.00 4879.00 5601.00 4399.00 Chevenement 3379.00 3907.00 8660.00 1340.00 Mamere 7552.00 8093.00 8722.00 1278.00 Lepage 4030.00 8319.00 8402.00 1598.00 Sain.Joss 176.00 449.00 4465.00 5535.00 Bayrou 2832.00 9777.00 9795.00 205.00 Madelin 3067.00 4704.00 5242.00 4758.00 Chirac 8775.00 9155.00 9716.00 284.00 Boutin 4269.00 9082.00 9614.00 386.00 Megret 2253.00 2415.00 7539.00 2461.00 Le.pen 5685.00 7393.00 7488.00 2512.00 Blanc 1020.00 2024.00 2054.00 7946.00

Table 5 – Table des cosinus carr´ecumul´es des lignes

(f) Quel le candidat dont le profil ligne est le mieux approxim´epar le premier plan princiapl de l’espace des lignes, le moins bien approxim´epar le premier plan principal. (g) Interpr´etez le cercle des corr´elations de l’espace des lignes. G.li=as.matrix(afc$tab)%*%diag(afc$cw)%*%t(as.matrix(afc$tab)) normes.li=sqrt(diag(G.li)) s.corcircle(afc$li/normes.li)

Bayrou

Boutin Lepage

Hue Blanc Mamere Chevenement Sain.Joss Taubira Besancenot

Megret Jospin Chirac

Laguiller Madelin Le.pen

Figure 10 – Cercle des corr´elations

10. Dans cette question, on r´ealise le biplot isom´etrique lignes scatter.dudi(afc,xax=1,yax=2,method=1,posieig="bottom",sub="biplot isometrique individu 1x2")

http://www.math.unicaen.fr/~kauffman/cours 9 francois.kauff[email protected] Universit´ede CAEN 24 septembre 2012 M2-MASS Marketing quantitatif

d = 0.2

Madelin LE.FIGARO PARIS.MATCH Le.pen LE.POINTS L.EXPRESS LIBE Laguiller LE.PARISIEN

LE.MONDE Jospin Megret Chirac NOUVEL.OBS LE.CANARD

Besancenot Taubira Sain.Joss Mamere Blanc Chevenement Hue MARIANNE

Lepage TELERAMA

Bayrou

Boutin LA.CROIX biplot isometrique individu 1x2

Figure 11 – Biplot isom´etrique lignes plan 1x2

isométrique individu Pr([candidat|journal])

15 10 Madelin L_EXPRESS1010 LE_POINTS Le_pen 15 Laguiller 5 10 5 LE_FIGARO Jospin 9 Megret Chirac LE_PARISIEN10 15 LIBE LE_MONDE 10 NOUVEL_OBS10 10 LE_CANARD10

5 8 8 10 Besancenot 0 Taubira 10 5 5 Sain_Joss 5 Mamere 5 TELERAMA Blanc Chevenement Hue 10 7 0 15 a2 5

6 0 6

0 15 MARIANNE Lepage LA_CROIX 5 20

Bayrou 5

4

4 25

−0.6 −0.420 −0.2 0.0 0.2

0

15 Boutin

−0.5 0.0 0.5

a1

Figure 12 – Biplot isom´etrique lignes gradu´eplan 1x2

11. Faire un commentaire de ce tableau de contingence.

http://www.math.unicaen.fr/~kauffman/cours 10 francois.kauff[email protected]