Description des dimensions

La fonction dimdesc() aide à interpréter les dimensions d'une ACP, ACM, AFC, AFM ou AFMH.
Elle permet de décrire les dimensions à la fois par des variables qualitatives et des variables continues.

Objectifs

Cette fonction est très utile quand le nombre de variables est élevé.
Elle permet de voir à quelles variables les axes sont le plus liés : quelles variables continues sont les plus corrélées à chaque axe et quelles variables qualitatives et quelles modalités décrivent le mieux chaque axe.

On va réaliser la fonction dimdesc() sur les axes d'une ACM du tableau de données "tea".

dimdesc

Premièrement, chargez le package et le tableau de données en écrivant : library(FactoMineR)
data(tea)

Puis réaliser l'ACM : res.mca = MCA(tea, quanti.sup=19, quali.sup=c(20:36))

Et lancez la fonction dimdesc() : res = dimdesc(res.mca, axes=1:2, proba=0.05) #res.mca: le resultat de l'analyse factorielle dont on veut caractériser les axes
#axes: le vecteur des dimensions à décrire
#proba: le seuil de significativité considéré pour caractériser les dimensions (par défaut 0.05)

Description par des variables continues

Le coefficient de corrélation entre chaque variable continue et chaque dimension de l'ACM est calculé. Les coefficients de corrélation significativement différents de zéro sont gardés et triés.

Dimensions description: description of axis 1 by continuous variables Cliquez pour voir Dimensions description: description of axis 2 by continuous variables

La seule variable continue du tableau de données est la variable "age".
Cette variable n'est pas significativement corrélée à la première composante principale mais elle est significativement corrélée à la deuxième.

Description par des variables qualitatives et des modalités

Pour les variables qualitatives, un modèle d'analyse de variance à un facteur est réalisé pour chaque dimension ; les variables à expliquer sont les coordonnées des individus et la variable explicative est une des variables qualitatives.
Un test F permet de voir si la variable a un effet significatif sur la dimension et des tests T sont réalisés modalité par modalité (avec le contraste somme des alpha_i=0). Cela montre si les coordonnées des individus de la sous-population définie par une modalité sont significativement différentes de celles de l'ensemble de la population (i.e. différentes de 0). Les variables et modalités sont triées par probabilité critique et seules celles qui sont significatives sont gardées dans le résultat.

Dimensions description: description of axis 1 by categorical variables Cliquez pour voir Dimensions description: description of axis 1 by categorical variables

La première composante principale est caractérisée par "where" puis " tea room" puis "how" etc... Quelques variables illustratives, comme le sexe, sont également liées à cet axe. "tea room" a une coordonnée positive sur l'axe alors que celle de "not tea room" est négative. Cela donne la direction de l'axe : les individus qui ont des coordonnées élevées sur la première composante principale ont tendance à aller dans des salons de thé.

Dimensions description: description of axis 2 by categorical variables Cliquez pour voir Dimensions description: description of axis 2 by categorical variables

La deuxième composante principale est caractérisée par "where" puis "price" puis "how" etc... Les individus qui ont des coodonnées élevées sur cet axe ont tendance à acheter du thé en vrac dans des magasins de thé.