Le package missMDA

Le package missMDA est complémentaire de FactoMineR. Il permet de gérer les données manquantes pour les méthodes d'analyses factorielles (ACP, AFC, ACM, AFDM, AFM). Il permet de faire de l'imputation simple et multiple.

L'imputation simple consiste à remplacer les valeurs manquantes par des valeurs plausibles. Cela revient à compléter le jeu de données qui peut ensuite être analysé par n'importe quelle méthode d'analyse factorielle.

missMDA impute les valeurs manquantes de sorte que les valeurs imputées n'ont aucune influence sur les résultats de l'aalyse factorielle (pas d'influence dans le sene où les valeurs imputées n'ont aucun poids, et donc les résultats de l'analyse factorielle sont obtenues uniquement avec les valeurs observées.

missMDA utilise des méthodes de réduction de données, ce qui lui permet d'imputer de façon satisfaisante de gros jeux de données contenant des variables quantitatives et/ou qualitatives. En effet, il impute par ACP (ou ACM, ou AFDM ou AFM) en prenant en compte à la fois les similarités entre individus et les liens entre variables.

Voir cette vidéo si vous voulez comprendre le principe de missMDA quelque soit les jeux de données (qunatitatifs et/ou qualitatifs).

Les imputations sont très bonnes comparées aux méthodes classiques permettant d'imputer des tableaux incomplets (forêts aléatoires par exemple).

  • missMDA gère les données manquantes dans:
    • les jeux de données avec variables quantitatives grâce à l'ACP (Voir la vidéo)
    • les jeux de données avec variables qualitatives grâce à l'ACM (Voir la vidéo)
    • les tableaux de contingence grâce à l'AFC
    • les données mixtes grâce à l'AFDM
    • les jeux de données où les variables sont structurées par groupe grâce à l'AFM
  • missMDA permet de faire de l'imputation multiple:
    • pour les variables quantitatives grâce à l'ACP: Voir la vidéo
    • pour les variables qualitatives grâce à l'ACM

    Voir ce blog qui montre comment générer des tableaux multiples.

  • missMDA permet de visualiser l'incertitude liée aux données manquantes:
    • en ACP
    • en ACM
  • missMDA donne des clés pour répondre à la question: Peut-on croire dans les valeurs imputées ? Voir le post de ce blog.