Résumé :
|
[BDSP. Notice produite par INIST rTR0xe8x. Diffusion soumise à autorisation]. Position du problème : E3N, "Etude Epidémiologique auprès de femmes de la Mutuelle Générale de l'Education Nationale", est une étude de cohorte (100 000 femmes) prospective, ayant pour objectif l'étude des facteurs de risque de cancer chez la femme. Même si l'incidence des données problématiques (manquantes, incohérentes, etc.) est faible, une analyse statistique multivariée, se fondant uniquement sur les sujets à données complètes, ne porterait que sur un nombre insuffisant d'individus, et non nécessairement représentatif de la population étudiée, d'où des résultats potentiellement biaisé. Méthodes : La gestion des données problématiques mise en oeuvre inclut : 1) l'identification des données problématiques : repérage, recherche de la source de l'existence de ces données et différenciation selon leur processus d'existence, 2) la définition de la méthodologie, et 3) l'application des méthodes retenues : méthode déductive, cold-deck, et imputation multiple pour les données "Missing At Random". Résultats : Le bilan présenté ici a été effectué en termes d'individus exploitables pour une analyse particulière portant sur 19 variables. Ce travail de gestion des données problématiques a permis de gagner un quart de la cohorte, en passant de 50,5% d'individus exploitables à 74,6%. Et 89,0% des individus ne présentent alors qu'une variable à donnée manquante sur les 19 variables présélectionnées. (...)
|