Collecte et visualisation de données législatives...

François Briatte

Collecte et visualisation dedonnées législatives avec__

Données législatives

● Nature des données : amendements, lois, votes… et parlementaires

● Attributs des documents législatifs : date d’introduction, vote, mots-clés…

● Attributs des parlementaires : âge, sexe, groupe politique, carrière…

Angles d’analyse

● Unités de référence : chambres parlementaires, parlementaires individuels

● Mesures classiques : productivité, efficacité (probabilité d’adoption)…

● Mesures relationnelles : liens entre chambres et entre parlementaires

Thématique

1. Disponibilité des données non systématique

… avec plusieurs formats et/ou modalités de collecte selon les sources

● Sites Internet officiels des parlements

● Portails ‘open data’ (officiels ou pas)

2. Peu de littérature sur la collecte des données

… alors que les incitations à publier des données brutes augmentent

● dans les appels à financement

● dans les processus d’évaluation

Problème

Contraintes

1. Cadrage comparatif : collecte de données dans plusieurs chambres parlementaires, sur plusieurs pays

Échantillon : 33 pays européens

2. Méthode programmatique : aussi peu de récupération manuelle que possible, 100% sources publiques

Langage privilégié : R

● Interfaces avec C, Python, SQL, etc.

● Modélisation de données réseaux

Cadrage

1. Parlements nationaux● Chambres basses (assemblées) et hautes (sénats)

● Parlementaires nationaux ou fédérés

Ex. Suisse : Conseil national, Conseil des États

2. Propositions de loi● Contrainte légale en cas d’adoption

● Signatures nominatives individuelles

Ex. France : signatures de groupes parlementaires

Méthodes

1. Scraping1.1. Données sur les propositions de loi

1.2. Données sur les parlementaires

Note : dumps non automatisés – pas de mise à jour automatique des bases comme avec Python ou Ruby via Morph.io

2. Réseaux2.1. Extraction de variables standardisées

2.2. Construction et visualisation des réseaux

Note : standardisation limitée – certains attributs des parlementaires et/ou des propositions de loi sont difficilement comparables

github.com/briatte/parlnet

1. one submodule per country

— replication code

— network data

— codebook and notes

2. additional documentation

— network measures

— links to article preprints

— link to raw data dump

Scraping

● Download● utils::download.file

● httr::GET

● psql # interfaçable avec dplyr via RPostgreSQL

● Parsing● rvest::read_html # xml2::read_html

● rvest::read_xml # xml2::read_xml

● jsonlite::fromJSON

● XML # supplanté par xml2 + rvest

1. download raw HTML files

2. parse HTML and get variables

using CSSSelect or XPath

to back them up later

3. save to intermediary CSV file

to save time on re-run

Réseaux

● Assemblage● base::expand.grid # créer les liens

● base::aggregate # pondérer les liens

● network::network # résultat : objet de classe network

● Attributs● sna::degree # centralité

● tnet::degree_w # centralité pondérée

● igraph::modularity # modularité

1. buid directed edge list

2. compute edge weights

(see paper appendix)

(possibly redundant)

3. verify edge weights

(non-redundant)

Visualisation

● Statique● Syntaxes idiosyncrasiques : igraph, network, sna

● Syntaxes ggplot2 : geomnet, ggraph, ggnet, ggnetwork

# voir github.com/sctyner/ggnet-paper

● Interactive● Avec R + d3.js : networkD3, ndtv

● Avec Gephi : format GEXF # exportable avec rgexf

● Avec JavaScript + PHP : Sigma # lit le GEXF

visualisation

Résumé

HTML, JSON, SQL, XML

httr, jsonlite,rvest, XML

HTML (raw)CSV (processed)

dplyr, igraph, network, sna

network (objects)d3Network, ggplot2, ggnetwork, rgexf

GEXF (Gephi)JavaScript, PHP,

HTML/CSS

scraping

réseaux

‘dataviz’

goo.gl/E96b9M

Merci pour votre attention

Collecte et visualisation de données législatives...

Documents

Transcript of Collecte et visualisation de données législatives...

SEMIN ,EÉTNIÉ SEMIN E, ÉTANCHÉITÉ À L’AIR · 2019. 11. 20. · SEMIN E SEMIN ,EÉTNIÉ SEMIN E, ÉTANCHÉITÉ À L’AIR] ÉTANCHÉITÉ À L’AIR Les murs extérieurs, plancher,

Impact d’une tranchée routière sur l’écoulement de la ...actions-incitatives.ifsttar.fr/fileadmin/uploads/recherches/semin... · GÉOTECHNIQUE Impact d’une tranchée routière

rJava : utilisation parallèle et communication entre …rug.mnhn.fr/semin-r/PDF/semin-R_rjava_JTroudet_100616.pdf∗rJava (Appel de Java dans un script R) ∗Utilisation des Interfaces

ORSI I2V (2010-2014) - IFSTTAR Actions incitatives ...actions-incitatives.ifsttar.fr/fileadmin/uploads/recherches/semin... · • Environnement urbain / interurbain (inspiré de l’approche

Avis sur l’utilisation de Sabl’IMPHY en remblaiactions-incitatives.ifsttar.fr/fileadmin/uploads/recherches/semin... · 3 Contexte Client : entreprise DTP terrassement Proposition

ACADÉMIE INTERNATIONALE D’HÉRALDIQUEaih-1949.com/userfiles/memorial1999.pdf1 ACADÉMIE INTERNATIONALE D’HÉRALDIQUE MÉMORIAL DU JUBILÉ 1949 - 1999 (attention ! toutes les données

Page 1 Page 2 - SEMIN ARIO) DE ACQUES LACAN | luos ...

Package’‘diversitree’rug.mnhn.fr/semin-r/PDF/semin-R_diversitree_NChazot...Pseudoscada erruca Pseudoscada florula Pseudoscada timna Greta andromica Greta annette Godyris zavaleta

MNHN USM 503 Régulation et Dynamique des …rug.mnhn.fr/semin-r/PDF/semin-R_bootstrap_LPonger_060508.pdfBootstrap et Jackknife Méthodes statistiques basées sur un rééchantillonnage

Fiche competence fourmentraux olivier pdf1

Envoie du LOURD - Semin

Journées techniques Ouvrages d’Art 2013actions-incitatives.ifsttar.fr/fileadmin/uploads/recherches/semin... · Traitement d’une non conformité : non respect de l’enrobage

Valorisation de co produits industriels en géotechnique ...actions-incitatives.ifsttar.fr/fileadmin/uploads/recherches/semin... · GÉOTECHNIQUE Valorisation de co produits industriels

FONCTIONS ECONOMIQUES ETPOLITIQUES DU …madarevues.recherches.gov.mg/IMG/pdf/terre-mg20_4_.pdf1-INTRODUCTION AulendemaindelaréorganisationduFokonolonaàtraverslequelle ... parleG.O.P.R.

Le calcul parallèle pour non-spécialistes, c'est maintenant!rug.mnhn.fr/semin-r/PDF/semin-R_calcul-parallele_VMiele_160617.pdf · «calculparallèle»,pourquoitantdebuzz? Jusquevers2005,laperformanced’unemachineétaitdirectementliéau

Valorisation de sédiments issus de dragages de …actions-incitatives.ifsttar.fr/fileadmin/uploads/recherches/semin... · Référence au guide méthodologique « Acceptabilité de

Une chaîne de traitement automatisée sous R : Du chargement de …rug.mnhn.fr/semin-r/PDF/semin-R_Bilodeau&Thommeret_240513... · 2013-06-15 · Une chaîne de traitement automatisée

Lissage et estimation fonctionnelle avec R - rug.mnhn.frrug.mnhn.fr/semin-r/PDF/semin-R_smooth_CPouzat_120209.pdf · Lissage et estimation fonctionnelle avec R Christophe Pouzat Pr

Journées techniques Ouvrages d’Art 2012actions-incitatives.ifsttar.fr/fileadmin/uploads/recherches/semin... · Arbres de défaillance. Méthode des branches et bornes. Méthode

Journées Techniques - IFSTTAR Actions incitatives ...actions-incitatives.ifsttar.fr/fileadmin/uploads/recherches/semin... · •Etudes financées par le SETRA . Journées Techniques