Imputation multiple avec missMDA
missMDA permet de faire de l'imputation multiple et donc de générer plusieurs tableaux complétés, quand les données sont quantitatives (en utilisant un modèle d'ACP) ou qualitatives (en utilisant un modèle d'ACM).
Imputation multiple en ACP
missMDA permet de faire de l'imputation multiple pour des jeux de données quantitatifs en utilisant le modèle d'ACP.
Etapes pour générer 1000 jeux de données avec missMDA
- estimer le nombre de dimensions nécessaires pour utiliser la formule de reconstitution grâce à la fonction estim_ncpPCA
- générer les 1000 tableaux imputés avec la fonction MIPCA
Exemple
library(missMDA)
data(orange)
nb = estim_ncpPCA(orange,ncp.max=5)
res.comp = MIPCA(orange, ncp = nbdim$ncp, nboot = 1000)
Visualiser l'incertitude due aux données manquantes
missMDA permet de visualiser l'incertitude de prédiction des valeurs manquantes grâce à l'imputation multiple.
Exemple
library(missMDA)
data(orange)
nb = estim_ncpPCA(orange,ncp.max=5)
res.comp = MIPCA(orange, ncp = nbdim$ncp, nboot = 1000)
plot(res.comp)
Imputation multiple en ACM
De même, missMDA permet de faire de l'imputation multiple pour les variables qualitatives grâce à la fonction d'imputation d'ACM.
Etapes pour faire de l'imputation multiple sur des jeux de données qualitatifs
- estimer le nombre de dimensions nécessaires pour utiliser la formule de reconstitution grâce à la fonction estim_ncpMCA
- générer les 1000 tableaux imputés avec la fonction MIMCA
- (facultatif) visualiser les résultats pour voir l'incertitude liée aux données manquantes
Example
library(missMDA)
data(vnf)
nbdim = estim_ncpMCA(vnf,ncp.max=5) ## Time-consuming, nb = 4
res = MIMCA(vnf, ncp=4,nboot=10)
plot(res)