load('/Hdma.rda') print(names(Hdma)) # ---- 1 ---- # dir : paiement de la dette / revenu total # hir : dépenses logement / revenu # lvr : taille du prêt / valeur imposable des biens # ---- 2 ---- train <- Hdma[Hdma$self=='yes',c(1,2,3,13)] ; attach(train) # variables 1,2,3, 13 : dir, hir, lvr, deny & tri sur les indépendants (apprentissage) test <- Hdma[Hdma$self=='no',c(1,2,3,13)] # variables 1,2,3 : dir, hir, lvr & tri sur les non indépendants (test) LR <- glm(deny~dir+hir+lvr,data=train,family=binomial(lin='logit')) print(summary(LR)) #---- 3 ---- plot(train[,1:3],col=as.factor(train[,4])) # ---- 4 ---- pred <- predict(LR,new=test) pr_classe_2 <- 1/(1+exp(pred)) # voir cours print(pr_classe_2) # ---- 5 ---- decision <- NULL # pour savoir à quelle classe (refus/non refus) correpondent les classes estimées 1/2, interprétez le modèle decision[pr_classe_2 < 0.5]='yes' # refus decision[pr_classe_2 >= 0.5]='no' # non refus (acceptation) print(decision) # ---- 6 ---- cat('table de confusion classe réelle x classe estimée pour l\'échantillon de test','\n') cat('[yes:refus/no:acceptation(non_refus)]','\n') print(table(test[,4],decision))