Analyse Factorielle des Correspondances
A titre d'exemple, on utilise ici un tableau de données issu d'un questionnaire réalisé sur des françaises en 1974.
Chargez le tableau de données ici
Présentation du tableau de données
1724 femmes ont répondu à différentes questions à propos du travail des femmes, parmi lesquelles :
- Quelle est selon vous la famille parfaite ?
- L'homme et la femme travaillent
- L'homme travaille plus que la femmee
- Seul l'homme travaille
- Quelle activité est la meilleure pour une mère quand les enfants vont à l'école ?
- Rester à la maison
- Travailler à mi-temps
- Travailler à temps complet
- Que pensez-vous de la phrase suivante : les femmes qui ne travaillent pas se sentent coupées du monde ?
- Complètement d'accord
- Plutôt d'accord
- Plutôt en désaccord
- Complètement en désaccord
Le tableau de données est formé de deux tableaux de contingence wui croisent les réponses de la première question à celles des deux autres.
Chaque valeur correspond au nombre de femmes ayant donné la réponse en ligne et la réponse en colonne.
Pour charger le package et le tableau de données, écrivez la ligne de code suivante :
library(FactoMineR)
women_work=read.table("http://factominer.free.fr/classical/datasets/women_work.txt", header=TRUE, row.names=1, sep="\t")
Objectifs
Les objectifs de l'AFC sont similaires à ceux de l'ACP : obtenir une typologie des lignes et des colonnes et étudier le lien entre ces deux typologies.
Cependant, le concept de similarité entre les lignes et les colonnes est diférent. Ici, la similarité entre deux lignes ou deux colonnes est complètement symétrique. Deux lignes (resp. colonnes) sont proches l'une de l'autre si elles s'associent aux colonnes (resp. lignes) de la même façon.
On recherche les lignes (resp. colonnes) dont la distribution est la plus différente de celle de la population. Celles qui semblent le plus ou le moins semblables.
Chaque groupe de lignes (resp. colonnes) est caractérisé par les colonnes (resp. lignes) auxquelles il est particulièrement ou particulièrement peu associé.
AFC
On utilisera les trois première colonnes (correspondant aux réponses de la deuxième question) comme variables actives et les quatre dernières (correspondant à la troisième question) comme variables illustratives.
Lignes et colonnes actives seulement
Pour voir les nuages des lignes et des colonnes séparément, tapez :
res.ca.rows = CA(women_work[,1:3], invisible="col")
res.ca.col = CA(women_work[,1:3], invisible="row") #women_work: le tableau de données utilisé
#invisible: les éléments que l'on ne veut pas voir apparaître sur le graphique
Le nuage des colonnes montre que le premier axe oppse "Stay at home" et "Full-time work", ce qui signifie qu'il oppose deux profils de femmes.
Les femmes qui ont répondu "Stay at home" ont répondu "Only husband works" plus souvent que l'ensemble de la population et "Both husband and wife work" moins souvent que l'ensemble de la population.
De même, les femmes qui ont répondu "Full-time work" ont répondu "Only husband works" moins souvent que l'ensemble de la population et "Both husband and wife work" plus souvent que l'ensemble de la population. Le premier axe ordonne les modalités de la deuxième question de la moins à la plus en faveur du travail des femmes.
La même interprétation peut être faite pour le premier axe du nuage des lignes. Les modalités sont triées de la moins ("Only husband works") à la plus ("Both husband and wife work") en faveur du travail des femmes.
Pour représenter à la fois les lignes et les colonnes, tapez :
res.ca = CA(women_work[,1:3])
#women_work: le tableau de données utilisé
"Stay at home" est associé à "Only husband works" et peu associé aux deux autres modalités.
"Both husband and wife work" est associé à "Full-time work" et opposé à "Stay at home".
Addition de colonnes illustratives
On ajoute les colonnes qui correspondent à la troisième question en tant que variables illustratives. Tapez :
res.ca = CA(women_work, col.sup=4:ncol(women_work))
#women_work: le tableau de données utilisé
#col.sup: vecteur des index des colonnes illustratives
"Totally agree" et "Quite agree" pour "Women who do not work feel cut off from the world" sont proches des modalités en faveur du travail des femmes.
"Quite disagree" et "Totally "disagree" sont proches des modalités opposées au travail des femmes.