Résumé :
|
[BDSP. Notice produite par ORSRA NoR0xf7d. Diffusion soumise à autorisation]. L'objectif de cette étude est d'évaluer la performance de la détermination du statut vital par croisement de données hospitalières et des données de mortalité de l'Institut national de la statistique et des études économiques (Insee), après avoir rendu ces informations anonymes, en conformité avec la législation. L'ensemble des patients, domiciliés en France métropolitaine ou dans les départements d'outre-mer, hospitalisés pour la première fois pour une tumeur maligne entre 1998 et 2000 à l'institut Gustave-Roussy ont été inclus. Les données de mortalité de l'Insee des années 1998 à 2004 ont été utilisées. Les données ont été anonymisées par une technique de hachage irréversible. Les fichiers de mortalité et de morbidité hospitalière ont été chaînés sur le nom, le premier prénom, la date de naissance et le code de la commune de naissance, en utilisant la méthode probabiliste de Jaro. Dix mille quatre-vingt-neuf patients ont été inclus. Les résultats du chaînage étaient très satisfaisants pour l'ensemble des patients inclus ; la proportion de bien classés était de 97,2%, la sensibilité de 94,8% et la spécificité de 99,5%. La performance de cette méthode était particulièrement satisfaisante pour les patients nés en France, avec une sensibilité de 96,8% et une spécificité de 99,8%. Les résultats étaient moins bons pour les patients nés à l'étranger (sensibilité à 82,8% et spécificité à 97,7%), mais les performances de la méthode sont améliorées par l'ajout d'une étape de validation manuelle. L'utilisation du chaînage probabiliste sur des données anonymisées permet d'obtenir des informations sur le statut vital d'un nombre important de patients à un moindre coût, et tout en respectant les exigences de la Commission nationale de l'informatique et des libertés. (RA).
|