Les Archives de France et l'INED finalisent la publication d'un siècle de données numérisées issues des recensements de la population

Les données des recensements de la population française de 1836 à 1936 seront bientôt disponibles en libre accès, après avoir été numérisées grâce à l'IA. Cette première mondiale est une mine d'informations pour les généalogistes, les économistes et les chercheurs.

Article rédigé par Nicolas Arpagian
Radio France
Publié
Temps de lecture : 2min
6 Français sur 10 ont déjà effectué des recherches généalogiques. (VANESSA MEYER / MAXPPP)
6 Français sur 10 ont déjà effectué des recherches généalogiques. (VANESSA MEYER / MAXPPP)

6 Français sur 10 auraient déjà effectué des recherches sur leur généalogie. L’arrivée d’Internet a bouleversé les pratiques des particuliers, et aussi des chercheurs qui travaillent à reconstituer des parcours de vie à partir des fichiers de l’état civil. La numérisation de ces bases de données permet de consulter des informations sans se déplacer dans les mairies ou les archives départementales.

Cette mise à disposition va connaître une nouvelle dimension avec la finalisation d’ici le mois de mars 2026 du projet SocFace : un travail monumental conduit par l’Institut national d’études démographiques (INED), l’École d’économie de Paris, le service interministériel des Archives de France et la société française Teklia.

Ce sera la mise à disposition d’un siècle de recensements de la population sur la période qui s’étend de 1836 à 1936. Le chantier, entamé en 2021, représente une première mondiale : disposer dans un format numérisé de toutes les coordonnées des personnes ayant vécu en France au cours d’un siècle.

L'intelligence artificielle pour déchiffrer l'écriture manuscrite

Les équipes scientifiques qui ont conduit ce chantier ont dû faire face à plusieurs défis.

D’une part, le nombre de personnes concernées. Car il s’agit d’environ 500 millions d’entrées nominatives, avec les noms, prénoms, années de naissance, professions, les situations maritales, les liens de parenté, les adresses…

D’autre part, il a fallu déployer des technologies d’intelligence artificielle permettant de reconnaître l’écriture manuscrite des registres, avec des styles graphiques différents. Et déchiffrer l’emploi d’abréviations ou de formulations qui varient selon les municipalités, par exemple pour désigner les activités professionnelles.

La collecte matérielle des fichiers a pris un peu plus de temps que prévu, ce qui explique que la mise en ligne interviendra d’ici mars 2026. Soit un décalage d’une petite année par rapport au calendrier initial.

Des informations riches d'enseignements

Ces informations, qui seront en accès libre, intéressent les généalogistes professionnels ou amateurs, mais également les économistes, les démographes et les historiens. On peut ainsi, avec ces recensements qui surviennent tous les 5 ans, suivre le parcours de vie de personnes avec leurs différents changements familiaux, professionnels et leurs déplacements à travers le pays. Cela renseigne les chercheurs, par exemple, sur l’évolution du marché du travail, les mouvements migratoires ou les compositions familiales.

Commentaires

Connectez-vous ou créez votre espace franceinfo pour commenter.