Résumé :
|
[BDSP. Notice produite par ORSLR pk8R0xE9. Diffusion soumise à autorisation]. Le modèle de Poisson est souvent retenu pour expliquer une variable quantitative discrète positive ou nulle, correspondant à un compte. Une surdispersion des observations peut remettre en cause l'utilisation de ce modèle, par une sous-estimation des variances des paramètres du modèle. Notre objectif était d'évaluer l'intérêt de prendre en compte la surdispersion en l'illustrant sur les données d'une étude évaluant l'impact de la recherche d'information de santé sur Internet sur le nombre de consultations. Trois méthodes de prise en compte de la surdispersion (modèle de quasi-Poisson, modèle de Poisson avec calcul d'une variance robuste, modèle binomial négatif) ont été retenues pour modéliser le nombre de consultations Y. Nous avons testé la surdispersion dans le modèle de Poisson en décrivant la moyenne et la variance de Y et en rapportant le khi2 de Pearson aux degrés de liberté du modèle (khi2/ddl). Nous avons ensuite ajusté les trois modèles et comparé les estimations des paramètres de régression aux estimations du modèle de Poisson. La variance du nombre de consultations (Var[Y]=21,03) était supérieure à la moyenne (E[Y]=5,93) et le rapport kkhi2/ddl du modèle de Poisson était de 3,26 confirmant la surdispersion. Par rapport au modèle de Poisson, les erreurs standards des paramètres de régression variaient de manière importante pour les trois modèles, avec des conséquences sur l'interprétation des résultats pour deux variables explicatives (recherche d'information de santé sur Internet et parent seul) dont les degrés de signification étaient respectivement de 0,06 et 0,002 (Poisson), de 0,29 et 0,09 (quasi-Poisson), de 0,29 et 0,13 (variance robuste) et de 0,45 et 0,13 (binomial négatif). L'utilisation de méthodes appropriées permet de tenir compte de la surdispersion dans un modèle de Poisson et d'éviter de conclure à tort à l'existence d'une association significative. Parmi les modèles présentés, le modèle binomial négatif semble le plus pertinent et le plus facile d'utilisation grâce à la loi de distribution théorique sur laquelle il repose et à sa programmation facile avec les logiciels usuels. (R.A.).
|