CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6...
-
Upload
eloise-bourgeois -
Category
Documents
-
view
109 -
download
0
Transcript of CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6...
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/1
CREPUQ - Sous-groupe de travail sur les fichiers de données numériques
Les données numériques: Atelier d’information et de démystification
EXTRACTION & UTILISATION DES DONNÉES
Anastassia KhouriService de données & resources électroniques
Université McGill
http://www.library.mcgill.ca/edrs/
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/2
EXTRACTION & UTILISATION DES DONNÉES
1. Introduction
2. Processus d’extraction et utilisation
3. Rôle de la documentation
4. Pré-extraction et Extraction
5. Utilisation
6. Conclusion
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/3
PROCESSUS D’EXTRACTION &
UTILISATION DES DONNÉES
IDENTIFICATION
ACCÈS
CONSULTATION
EXTRACTION TESTING
ANALYSE
ARCHIVAGE RAPPORT
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/4
IDENTIFICATION PROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES
Identification des besoins
Identification des données
& Documentaion
Données brutes à organiser
Données Pré - organisées
Information& documentation
connexe
Guide d’utilisation(Code book)
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/5
ROLE DE LA DOCUMENTATIONIMPRIMÉE - ÉLECTRONIQUE (Suite) Complémentarité
Similarité et duplication
Exhaustivité
Disponibilité
Accessibilité
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/6
ROLE DE LA DOCUMENTATIONIMPRIMÉE vs ÉLECTRONIQUE (Suite)
Format unique
Format double Politique d’accès Politique de disponibilité / prêt
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/7
ROLE DE LA DOCUMENTATIONCONNEXE ET PÉRIPHÉRIQUE (Suite)
Facilite la recherche en général Piste de recherche préliminaire Source d’information spécifique sur:
Localisation Type Source Discipline, etc
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/8
ROLE DE LA DOCUMENTATION SPÉCIFIQUE - GUIDE “Code Book”
(Suite)
Clef de lecture, de compréhension et d’utilisation d’un fichier de données
Description des éléments et du contenu du fichier
Source d’information exclusive et exhaustive sur le fichier
Source d’information générale, spécifique et complémentaire
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/9
PRÉ - EXTRACTION (Données brutes)
Source d’information à extraire du guide ( Code book)
1. Structure des données
2. Variables indentifiées & choisies
3. Information supplémentaire
4. Etiquette d’identification
5. Eléments marginaux de base pour les tests
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/10
PRÉ - EXTRACTION (Données brutes)
Source d’information à extraire du guide ( Code book)(Suite)
1. Structures des données Structure rectangulaire (cliché d’enregistrement logique) Structure “Card image” (cliché d’enregistrement multiple) Structure hiérarchique Structure relationelle
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/11
2. Variables identifiées & choisies Localisation (colonne) Type (alpha / numérique) Formatage (decimal / vide “blank”)
3. Information supplémentaire Identification spécifique Poids
PRÉ - EXTRACTION (Données brutes) Source d’information à extraire du guide ( Code book)
(Suite)
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/12
4. Etiquettes d’identification
Etiquette de chaque variable Valeur individuelle d’extraction
5. Eléments marginaux de base pour les tests
PRÉ - EXTRACTION (Données brutes)Source d’information à extraire du guide ( Code book)
(Suite)
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/13
1. Choix de l’outil en fonction du type d’analyse à effectuer
Extraction seulement Extraction et analyse Extraction, analyse et rapport
PRÉ - EXTRACTION (Données brutes)
Outils d’extraction & éléments de transfert
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/14
2. Stratégies de transfert des données Commande d’archivage de chaque
“record” Commande de lecture Commande de sauvegarge Commande d’intégration des
différents niveaux de données Commande de compression, etc
PRÉ - EXTRACTION (Données brutes) Outils d’extraction & éléments de transfert
(Suite)
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/15
Exemple: Programme d’extraction SAS
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/16
Exemple: Programme d’extraction SAS (Suite)
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/17
Exemple: Programme d’extraction SAS (Suite)
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/18
Exemple: Programme d’extraction SAS (Suite)
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/19
OUTILS D’ANALYSE
Les “plateformes” Gros ordinateur (Mainframe) PC / réseaux Macintosh Unix
Logiciels SAS SPSS STATA, etc
Tableurs électroniques Lotus Excel, etc.
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/20
PROGRAMMATION, TEST & EXTRACTIONPARTENAIRES
Programmeur
Assistant de recherche Etudiant / Professeur / Chercheur Autre
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/21
UTILISATION
Utilisation multiple Utilisation diversifiée Utilisation illimitée
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/22
DONNÉES PRÉ-ORGANISÉES PROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES
Données Pré-organisées
Imprimés
•Internet•CD•Disk
Copier Données•qq variables•Tableau
Papier
Analyse Utilisation
•Rapport imprimés•V. éléctronique•Archivage
Tableur éléctronique
Accès Extraction
•Tableaux•Graphiques
Rapport imprimé
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/23
DONNÉES PRÉ-ORGANISÉESPROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES
Données Pré-organisées
Accès
•Internet•CD•Disk
Extraction
Différents formats
Différentes méthodes
Analyse Utilisation
•Rapport imprimés•V. éléctronique•Archivage
Tableur éléctronique
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/24
DONNEÉS BRUTES PROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES
Données brutes à organiser
Methodologie d’extraction
Logiciels d’extraction Programmation
Extraction
Transfert des donnéesArchivage
Analyse des données
Rapport
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/25
UTILISATIONExemples
Ferret - Census USA http://ferret.bls.census.gov/egi-bin/ferret/
Cansim - Université de Toronto http://datacentre.chass.utoronto.ca:5680/cansim/cansim.html UNESCO - Stathttp://unescostat.unesco.org/
FAO - Stat http://apps.fao.org/
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/26
CONCLUSION
La compréhension du processus de recherche, de
programmation, d’extraction, d’analyse et d’utilisation sont les éléments préliminaires de base d’un Service de données