1
Fichier de microdonnées du recensement de 2006
• 1. Facteurs de changement
• 2. Scénarios : caractéristiques• 3. Contenu analytique : ajouts et/ou pertes
Sommaire
Formation IDD Ontario, Université Ryerson, 13 décembre, 2007Martine Grenier, Mokili Mbuluyo, Jean René Boudreau, Statistics Canada
2
1. Facteurs de changement
Amélioration du contenu analytique des trois fichiers pour une plus grande utilisation au niveau national et international
Plus grande accessibilité aux données du recensement
Contraintes liées à la confidentialité des données • Taille du fichier• Géographie restreinte• Variable « âge »• Variable « revenu »
Diffusion tardive des FMGD : • Délai causé par le travail considérable de sélection, de
certification et de dérivation des variables ainsi que du contrôle de qualité des fichiers,
3
Contenu
1.Taille de l'échantillon Particuliers : 800 000 enregistrements
Familles: 310 000 enregistrements
Ménages et logements : 350 000 enregistrements
2. Géographie Provinces, Territoires, RMR
3. Variables Variables extraites de la base de données de la diffusion
Nombre important de variables dérivées Variables à catégories réduites pour les provincesmaritimes et les territoires du nord
Variables répétées dans les 3 fichiers
Réduction des risques dedivulgation
Contrôle important de la confidentialité par le comitéde révision des fichiers de microdonnéesApplication distincte des règles de confidentialité àchaque fichier
3 ans , diffusion prévue en 2010?
Durée de production Travail considérable des analystes spécialisés pour lacertification des variables dérivées
2. Scénario n°1: statu quo avec un contenu restreint
4
Contenu
1.Taille de l'échantillon Fichier unique: 800 000 enregistrements.
Certaines personnes vont représenter une famille ou un ménage.
2. Géographie Canada, 5 régions, 5 RMR avec une population d’au moins un million d'habitants
3. Variables Variables du questionnaire 2 B de la base de données de la diffusion
Variables dérivées de niveau de complexité 4, ou celles qui demandent l’utilisation des données restreintes
Réduction des risquesde divulgation
Éliminer les valeurs dont la fréquence canadienne est
inférieure à 100 000 hab. Regrouper partiellement ou
totalement les âges; Arrondir ou générer un bruit dans les
des revenus
Durée de production Diffusion prévue : été 2009Certification réduite
2. Scénario n°2: fichier unique
5
Contenu
1.Taille de l'échantillon Fichier hiérarchique: 350 000 ménages privés.
Toutes les familles et personnes sont insérées et identifiés dans le ménage (environ 800 000 personnes).
2. Géographie Canada, régions avec une population d’au moins dede 2 millions d'habitants
3. Variables Variables du questionnaire 2 B de la base de données de laDiffusion
Variables dérivées de niveau de complexité 4, ou celles qui demandent l’utilisation des données restreintes
Réduction des risquesde divulgation
Éliminer les valeurs dont la fréquence canadienne est
inférieure à 100 000 hab. Regrouper les âges; Arrondir
ou générer un bruit dans les composantes des revenus
Durée de production Certification réduiteDiffusion prévue : été 2009
2. Scénario n°3: fichier hiérarchique
6
FMGD-2006 (statut quo ) FMGD-2006 (Fichier unique) FMGD-2006 (Fichier hiérarchique)
Contenu
Taille : 2,7 % de la population Taille : 2,7 % de la population Taille : 2,7 % des ménages
Échantillonnages indépendants des trois univers
Certaines personnes représentent une famille ou un ménage
Toute les familles et personnes des ménages échantillonnées sont incluses
Géographies diversifiées au niveau des provinces et des RMR
Géographie restreinte auniveau des provinces et des principales RMR ( 1 000 000 habitants)
Géographie plus restreinte au niveau des régions
Familles et ménages bien représentés mais la hiérarchie est très limitée
Perte des attributs des partenaires ou soutients du ménage.
Fichier représentatif des ménages; plus grande richesse du contenu comprenant toutes les données.
Répétitions de variables entre les 3 univers; variables dérivées et complexes
Variables tirées du questionnaire permettant aux utilisateurs de créer leurs propres variables dérivées
Variables tirées du questionnaire permettant aux utilisateurs de créer leurs propres variables dérivées
Contenu analytique des familles et ménages limité aux partenaires et soutiens
Contenu analytique des familles et manages limité aux personnes qui les représentent.
Contenu analytique élargi aux trois univers. Potentiel analytique supérieur et de comparaison internationale
Exigences de la production
Certification et production prévue en été 2010
Production prévue à l’été 2009
Production prévue à l’ été 2009
ConfidentialitéNiveau de suppression plus élevé qu’en 2001
Niveau de suppression plus petit qu’en 2001 (moins de géographie)
Même niveau de suppression qu’en 2001 (moins de géographie)
3. Contenu analytique : ajouts et pertes
7
Merci!
Top Related