Je suis ingénieure d’études dans un laboratoire de linguistique et de traitement automatique des langues.
Je collabore à divers projets en humanités numériques. Le travail à effectuer selon les projets peut être dans un premier temps de numériser les données quand elles ne sont pas numériques (Projet Paris Time Machine, numérisation des Annuaires de propriétaires parisiens), de permettre l’interrogation et la valorisation de ces données.
Pour le projet Oupoco, j’ai participé à l’extraction de poèmes spécifiques (sonnets) dans une masse de données semi-structurée. J’ai collaboré à la mise en forme de ces sonnets et leur intégration dans une plateforme d’interrogation en ligne. La plateforme permet de composer des sonnets à l’aide de contraintes.
Pour le projet Paris Time Machine, il s’agit de valoriser une ressource de type annuaire selon 2 axes : le premier est l’identification dans le texte des adresses de propriétaires et leur projection sur une carte, le second est une réflexion sur la mise en ligne de la source (de la version papier à la structuration xml-tei du texte).