Imputation multiple avec missMDA

missMDA permet de faire de l'imputation multiple et donc de générer plusieurs tableaux complétés, quand les données sont quantitatives (en utilisant un modèle d'ACP) ou qualitatives (en utilisant un modèle d'ACM).

Imputation multiple en ACP

missMDA permet de faire de l'imputation multiple pour des jeux de données quantitatifs en utilisant le modèle d'ACP.

Voir cette vidéo.

Etapes pour générer 1000 jeux de données avec missMDA

  1. estimer le nombre de dimensions nécessaires pour utiliser la formule de reconstitution grâce à la fonction estim_ncpPCA
  2. générer les 1000 tableaux imputés avec la fonction MIPCA

Exemple library(missMDA)
data(orange)
nb = estim_ncpPCA(orange,ncp.max=5)
res.comp = MIPCA(orange, ncp = nbdim$ncp, nboot = 1000)

Visualiser l'incertitude due aux données manquantes

missMDA permet de visualiser l'incertitude de prédiction des valeurs manquantes grâce à l'imputation multiple.

Exemple library(missMDA)
data(orange)
nb = estim_ncpPCA(orange,ncp.max=5)
res.comp = MIPCA(orange, ncp = nbdim$ncp, nboot = 1000)
plot(res.comp)

Imputation multiple en ACM

De même, missMDA permet de faire de l'imputation multiple pour les variables qualitatives grâce à la fonction d'imputation d'ACM.

Etapes pour faire de l'imputation multiple sur des jeux de données qualitatifs

  1. estimer le nombre de dimensions nécessaires pour utiliser la formule de reconstitution grâce à la fonction estim_ncpMCA
  2. générer les 1000 tableaux imputés avec la fonction MIMCA
  3. (facultatif) visualiser les résultats pour voir l'incertitude liée aux données manquantes

Example library(missMDA)
data(vnf)
nbdim = estim_ncpMCA(vnf,ncp.max=5) ## Time-consuming, nb = 4
res = MIMCA(vnf, ncp=4,nboot=10)
plot(res)