France
"Le projet POPP : Projet d’Océrisation des recensements de la Population Parisienne", intervention de Sandra Brée and Thierry Paquet.
Le projet POPP (Projet d’Océrisation des recensements de la Population Parisienne) vise à élaborer une vaste base de données (12 millions d’individus) à partir des recensements nominatifs de Paris de 1926, 1931, 1936 et 1946 qui sont les seuls recensements de la population parisienne existant avant la fin du 20e siècle. Ce projet a deux intérêts principaux : méthodologique et scientifique. Au niveau de l’enrichissement de la connaissance scientifique, l’analyse de ces recensements permettrait de connaître la population parisienne pendant l’Entre-deux-Guerres dans son intégralité. L’analyse quantitative et statistique des populations est rendue particulièrement difficile en histoire en raison du manque de bases de données et l’indexation des recensements de Paris de 1926, 1931, 1941 et 1946, offre l’opportunité d’un pas important dans la connaissance de la population urbaine européenne jusqu’alors très peu étudiée. Sur le plan des sciences du traitement de l’information, ce projet bénéficie des dernières avancées en reconnaissance d’écriture manuscrite en exploitant des modèles sans segmentation (ni des lignes d’écritures ni des mots) pour transcrire automatiquement les données manuscrites tabulaires archivées dans les registres de recensement. Nous présenterons les modèles, la chaîne de traitement mis en œuvre et les résultats, ainsi que la méthodologie de travail adoptée entre les deux équipes mobilisées. Ce projet ouvre des perspectives de collaboration fructueuses.
Thierry Paquet (LITIS, Université de Rouen Normandie) research interests concern machine learning, statistical pattern recognition, deep learning, for sequence modelling, with application to document image analysis and handwriting recognition. He contributed to many collaborative projects with academic or industrial partners. He is a member of the governing board of the French Association for Pattern Recognition (AFRIF), and a French representative at the IAPR governing board. He was the president of the French association Research Group on Document Analysis and Written Communication (GRCE)from 2002 to 2010. He was a member of the editorial board of the International Journal of Document Analysis and Recognition, and he is regularly invited in program committees of international conferences such as the International Conference on Frontiers in Handwriting Recognition, the International Conference on Document Analysis and Recognition, the International Conference on Pattern Recognition. From 2004 to 2012 he was in charge of the Master degree Multimedia Information Processing at the University of Rouen Normandie. He was the director of LITIS Laboratory from 2012 to 2019.
Sandra Bree (LARHRA - UMR 5190 CNRS) est historienne démographe et travaille depuis quinze ans sur des données quantitatives historiques pour ses recherches sur le déclin de la fécondité à Paris au XIXe siècle, la transition démographique urbaine ou encore l’évolution de la nuptialité et de la divortialité en France depuis la Révolution. Elle utilise très régulièrement des publications statistiques telles que les Annuaires statistiques de la ville de Paris ou de la France, les recensements de population ou encore les mouvements de la population dont elle recopie les données à la main. Elle a donc pleinement conscience du temps consacré à ce type de recueil et du temps qui serait gagné et pourrait être consacrer à l’analyse si les données étaient déjà disponibles dans des bases de données. Elle est également chargée des médias sociaux de la Société de Démographie Historique et des Annales de Démographie Historique et chargée de l’animation du département « données historiques, économiques et financières » de Progedo. Cette inscription dans le réseau des historiens quantitativistes lui permettra de promouvoir le projet et s’entourer des spécialistes en démographie historique, histoire de la famille, histoire sociale, histoire économique pour analyser la base de données créée et en tirer un colloque puis un ouvrage particulièrement complet et riche sur la population parisienne de l’Entre-deux-guerres.