Je suis ingénieur en développement informatique, je travaille avec des linguistes depuis plus de 15 ans maintenant.
Mon activité porte essentiellement sur des données textuelles, pas ou peu structurées. J’utilise, le cas échéant j’adapte, des outils de traitement automatique des langues (TAL) pour traiter ces données. Pour les projets de recherche, je développe ou je participe au développement d’un site web pour exposer les résultats.
Entre la linguistique, le TAL et les humanités numériques la frontière est parfois ténue. La nature des données peut faire basculer les projets dans une discipline ou l’autre. Travailler avec des données littéraires par exemple nous oblige à adapter les outils de TAL dont les modèles n’ont généralement pas été entraînés sur de la littérature.
La question de la visualisation des résultats de l’analyse automatique est également souvent au cœur des projets d’humanités numériques. Les outils de TAL sont efficaces mais jamais à 100%. Les erreurs d’analyse automatique sont souvent un enjeu pour les chercheurs en humanités, il faut réussir à les repérer, les mettre au jour pour pouvoir les discuter et si possible les corriger.
Je participe au Groupe de travail humanités numériques (GTHN) de l’EUR Translitterae.