Premium
Towards Unrestricted Public Use Business Microdata: The Synthetic Longitudinal Business Database
Author(s) -
Kinney Satkartar K.,
Reiter Jerome P.,
Reznek Arnold P.,
Miranda Javier,
Jarmin Ron S.,
Abowd John M.
Publication year - 2011
Publication title -
international statistical review
Language(s) - French
Resource type - Journals
SCImago Journal Rank - 1.051
H-Index - 54
eISSN - 1751-5823
pISSN - 0306-7734
DOI - 10.1111/j.1751-5823.2011.00153.x
Subject(s) - microdata (statistics) , humanities , political science , welfare economics , census , economics , sociology , demography , philosophy , population
Résumé Dans la plupart des pays, les instituts nationaux de statistique ne publient pas les micro‐données relatives aux entreprises. Les publier présente en effet un risque trop élevé de rupture de confidentialité. Ce risque peut être évité par un recours à des données synthétiques‐‐‐des données simulées à partir de modèles statistiques reproduisant la loi des véritables micro‐données. Dans cet article, nous décrivons une application de cette stratégie à la création d'une telle base de données à partir des résultats du recensement économique annuel des entreprises américaines. Cette base de donnée comprend plus de 20 millions d'entreprises sur une période remontant à 1976. L'U.S. Bureau of Census et l'Internal Revenue Service ont récemment approuvé la publication sous forme synthétique de ces micro‐données, faisant ainsi de la Longitudinal Business Database le premier ensemble de micro‐données de ce type accessible au public aux Etats‐Unis. Nous expliquons la façon dont cette base de données synthétiques a été créée, comment sa validité a été testée, et comment son risque de rupture de confidentialité a étéévalué.