Uniquement disponible pour exploitation non commerciale
© CNRS - 2025
Numéro de notice
8243
Quand l'IA redonne vie aux archives
Grâce à l'intelligence artificielle, les archives de l'entre-deux-guerres livrent un nouveau regard sur Paris. L'exposition "Les Gens de Paris 1926-1936", au musée Carnavalet, s'appuie sur l'analyse de neuf millions de lignes de recensement pour retracer le portrait social et démographique des habitants de la capitale.
Ces données, patiemment rassemblées et décodées par l'historienne Sandra Brée et son équipes de recherche, révèlent une ville jeune, mobile et profondément diverse. En croisant méthodes historiques et outils numériques, l'exposition montre comment la science des données permet aujourd'hui de faire parler les archives et de redonner chair aux anonymes du passé.
Durée
Année de production
Définition
Couleur
Son
Version(s)
Support Original
L’utilisation des médias visibles sur la Plateforme CNRS Images peut être accordée sur demande. Toute reproduction ou représentation est interdite sans l'autorisation préalable de CNRS Images (sauf pour les ressources sous licence Creative Commons).
Aucune modification d'une image ne peut être effectuée sans l'accord préalable de CNRS Images.
Aucune utilisation à des fins publicitaires ou diffusion à un tiers d'une image ne peut être effectuée sans l'accord préalable de CNRS Images.
Pour plus de précisions consulter Nos conditions générales
Transcription
[00:00:04]
Qui étaient les Parisiennes et les Parisiens pendant l'entre-deux-guerres ? C'est le thème de l'exposition « Les Gens de Paris, 1926-1936 » au musée Carnavalet, qui dresse un portrait des habitants de la capitale à une époque où la ville comptait près d'un million de personnes de plus qu'aujourd'hui.
[00:00:21]
« Les Gens de Paris » repose notamment sur les travaux de Sandra Brée, historienne-démographe du CNRS et co-commissaire de l'exposition.
[00:00:29]
« C'est une ville très jeune, peuplée de beaucoup de jeunes adultes, car il y a beaucoup de gens qui ne sont pas nés à Paris et viennent y vivre. Il y a très peu d'enfants. Le fait qu'il y ait beaucoup de personnes qui migrent vers Paris en étant jeunes fait qu'il y a aussi beaucoup de célibataires. »
[00:00:46]
Cette démographie singulière a fait l'objet de recensements tout aussi singuliers. En 1926, 1931 et 1936, pour la première fois, des listes nominatives ont été dressées pour la capitale, indiquant les noms, prénoms, adresses, années et lieux de naissance, états matrimoniaux, positions dans le ménage et professions des Parisiennes et Parisiens.
[00:01:01]
Ces documents ont servi de fil rouge à l'exposition. « Les bureaux de l'administration étaient naturellement embouteillés par cette avalanche de documents. »
[00:01:11]
C'est cette avalanche de documents — 9 millions de lignes — que Sandra Brée et son équipe ont réussi à rassembler pour la première fois dans une grande base de données informatiques.
[00:01:22]
Première étape de ce travail titanesque : récupérer les recensements auprès des Archives de Paris. « Ces listes nominatives sont extrêmement riches. On a les noms de famille, les prénoms, l'année de naissance, le lieu de naissance, l'état matrimonial, la position dans le ménage ainsi que la profession. »
[00:01:48]
Exemples : « Une employée dactylographe au Bon Marché, un apprenti dessinateur, une marchande ambulante, un employé des postes. »
[00:01:59]
« Ce que j'aime énormément dans ce genre d'archives administratives, c'est qu'il y a tout le monde, presque tout le monde. On se fait recenser, on recense toute la population. Ce ne sont pas des archives qui concernent qu'une catégorie de la population. »
[00:02:14]
L'accès facilité à toutes ces informations sera particulièrement précieux pour les travaux de recherche de Sandra Brée, spécialisée notamment dans la thématique des relations de couple. « Pierre Roussel vit avec Marcelle Witt, donc ils sont deux. Pierre est le chef de ménage, il est divorcé, et il vit avec son amie, elle-même divorcée. »
[00:02:41]
« Ce n'est pas clairement indiqué comme "concubinage" ou "compagne", mais on peut émettre l'hypothèse — ce sont des hypothèses de recherche — qu'il est probable que Marcelle et Pierre soient un couple concubin divorcé. »
[00:03:04]
Aujourd'hui, pour des raisons pratiques et de conservation, ce ne sont plus les archives papier qui sont consultées, mais leurs versions numérisées. Pour transformer cette profusion de documents en base de données indexée, consultable et exploitable statistiquement, Sandra Brée s'est associée à des chercheurs en intelligence artificielle, spécialistes d'algorithmes capables d'extraire les données de documents scannés.
[00:03:30]
« Il a appris à lire tout seul, de gauche à droite, de haut en bas, et à suivre. » Le travail de décodage des listes de recensement est achevé pour les informaticiens. Ils entament une nouvelle étape en créant des algorithmes capables de lire les actes de mariage, où l'information n'est pas déjà classée par colonnes.
[00:03:59]
« Il faut trouver un autre moyen pour identifier l'information à lire. Par exemple, le fait que ce mot est une profession et que c'est la profession du père du marié. Eh bien là, il n'y a pas d'autre moyen que d'apprendre la langue, le français. »
[00:04:23]
« Leur intelligence artificielle est composée de plusieurs briques technologiques : une rétine qu'il faut entraîner à poser son attention sur l'image, puis les prédictions de l'algorithme, c'est-à-dire les mots qui sont lus et compris dans leur contexte. »
[00:04:46]
« Sur la partie droite de l'interface, on obtient le résultat final : les mots extraits du texte et classés dans les différentes catégories — noms des époux, date, profession… »
[00:05:03]
« Le temps qu'on y passe à optimiser cette IA devient supportable, car derrière, on va offrir aux sciences humaines la possibilité de traiter des corpus qu'elles n'avaient jamais eu la possibilité de traiter. »
[00:05:21]
Une fois ce travail informatique réalisé, il reste encore de nombreuses heures de travail pour les scientifiques en sciences humaines et sociales : vérification, correction et adaptation à l'analyse statistique.
[00:05:35]
Les fruits de ces recherches, entre histoire, démographie et recherche informatique de pointe, commencent déjà à être partagés avec le grand public. La base de données est consultable en partie sur le site des Archives de Paris ainsi que sur les bornes interactives de l'exposition « Les Gens de Paris » au musée Carnavalet.
[00:05:55]
L'occasion de refaire connaissance avec les Parisiennes et les Parisiens du passé.